ю свойств!» — машина «Урал-4» выполняет за 5–6 секунд, просматривая пакет, содержащий 40 названий. Сплошной перебор всего информационного массива неорганической химии и извлечение из него нужных справок отнимает 20–25 минут.
Проектируется ИПС по математической теории эксперимента (В. В. Налимов, Ю. П. Адлер, Ю. В. Грановский).
Будут, непременно будут машинные информаторы, всеохватывающие, емкие по содержанию, универсальные и специальные, с оперативными службами поиска нужных сведений, с электронными референтами и переводчиками.
…«Машина для автоматического производства нуждающихся только в литературной обработке готовых печатных переводов с одного языка одновременно на ряд других языков» — так назвал свое изобретение преподаватель истории техники Петр Петрович Троянский. Патентную заявку он подал 5 сентября 1933 года. И вскоре получил авторское свидетельство за № 40995. Оно удостоверяло, что сконструировано устройство «для подбора и печатания слов при переводе с одного языка на другой», то есть для механизированного поиска русских эквивалентов каждому члену переводимого предложения с тем, чтобы оттиснутую на бумаге заготовку просмотрел еще и выправил корректор. По идее Троянского, человеку не нужно было самому копаться в словаре; ему оставалось только подогнать друг к другу по форме и ПО смыслу найденные машиной существительные, глаголы и прочие части речи.
Детище Троянского представляло собой скорее автоматизированный словарь. Бесспорно, богатый: в нем умещалось 80 тысяч корней — в несколько раз больше, чем употребляли Пушкин и Толстой. Но словарь еще не толмач. К тому же агрегат являлся механической системой, не электронной, так что по быстродействию, естественно, не смог бы тягаться с нынешними своими потомками. Тем не менее он по праву вошел в историю как первая попытка освободить переводчика от чисто механических операций, не требующих интеллектуальных усилий, зато пожирающих немало времени и мешающих сосредоточиться на творческой стороне дела.
Интересный замысел советского изобретателя опередил эпоху — его дальнейшее развитие стало возможным лишь много лет спустя на базе радиоэлектроники и кибернетики.
В декабре 1955 года быстродействующая электронная счетная машина (БЭСМ) дала вполне удовлетворительный подстрочник к одной английской научной книге. Инициаторами эксперимента были сотрудники Института точной механики и вычислительной техники И. С. Мухин, Л. Н. Королев, С. Н. Разумовский.
Машина держала в памяти 952 английских слова и 1073 их русских «двойника». При поиске русских эквивалентов точное их соответствие оригиналу по форме и по смыслу контролировалось самой машиной. Ею же из слов, подобранных на основе такого анализа, синтезировалось русское предложение с естественным для нашего языка строем и даже со знаками препинания.
В июне 1956 года появился первый автоматический перевод с французского на русский. Его выполнила машина «Стрела» по программе, составленной коллективом ученых (О. С. Кулагина, Г. В. Вакуловская и другие) под общим руководством одного из пионеров кибернетики — А. А. Ляпунова, ныне члена-корреспондента АН СССР. Электронный «толмач» располагал запасом в 1156 самых употребительных французских слов. Кстати, в своих первых экспериментах с машинным переводом на английский (январь 1954 года) американцы ограничились набором в 250 русских слов.
Впрочем, дело не в богатстве лексикона. В житейских разговорах мы запросто обходимся несколькими сотнями слов. Если их список возрастет до 2500, то, как установили сотрудники Таллинского научно-исследовательского института педагогики, он покроет наши потребности в 80 случаях из 100. Остальные десятки тысяч русских слов гораздо менее употребительны и встречаются куда реже. Главное в другом.
Никому не известен психофизиологический механизм творческого процесса, благодаря которому переводчик расшифровывает чужеземные письмена и передает на своем языке заложенные в них мысли.
Машине же нужна исчерпывающая инструкция, предусматривающая каждый ее шаг.
Вся процедура автоматического перевода расчленяется на элементарные логические операции.
Программа для «Стрелы» состояла из 17 сложно взаимосвязанных блоков (разделов), включавших 8500 команд. Целый устав! И преподробнейший. Тем не менее он давал правила поведения лишь в простейших ситуациях, да и то не во всех.
Вот, к примеру, омография, когда разные понятия записываются абсолютно одинаково: коса, лук, пол, нота, гол. Еще Троянский в своем механизированном словаре приводил все их толкования: скажем, коса может оказаться женской прической, песчаной отмелью, сельскохозяйственным орудием. То же явление свойственно и другим языкам. Нужный вариант должен был выбрать корректор. «Стрела» в подобных случаях печатала все русские значения французского омонима; оставить лишь одно, единственно нужное, отбросив остальные, она не умела. Вот если бы она понимала смысл фразы, сама чувствовала контекст, тогда другое дело, но…
«Электронный мозг» еще только учится этому искусству.
Сейчас автоматическим переводом и математической лингвистикой у нас занимаются сотни людей, десятки лабораторий и групп как в Москве (МГУ, ВИНИТИ, Математический институт имени В. А. Стеклова, Институт прикладной математики, Институт языкознания АН СССР, Центральный научно-исследовательский институт патентной информации, другие учреждения), так и в других городах — в Киеве, Новосибирске, Ленинграде, Тбилиси, Ереване, Горьком, Саратове, Ташкенте, Таллине…
Творец и робот в едином строю наступают на разбушевавшуюся стихию информации, отводя от здания науки далеко не мифическую угрозу.
«На всей земле был един язык и одно наречие» — так начинается ветхозаветное предание о пресловутом вавилонском столпотворении. Пока люди понимали друг друга, строительство якобы продвигалось настолько успешно, что доисторический небоскреб достиг колоссальных размеров. Это был вызов самому господу. Но всевышний сразу же смекнул, как пресечь предерзостное посягательство сынов человеческих на его престиж. Нет, он не наслал на возгордившихся своих рабов ни мор, ни потоп, ни пожар.
Просто он взял да и учинил разноязыкость.
Мешанина наречий тотчас разъединила тысячеликую семью строителей, посеяла бестолковщину, распри. И хоть Вавилонскую башню включили потом в список чудес света, представление о ней ассоциируется не столько с величественной монументальностью, символом людского могущества, сколько с беспомощностью, вызванной языковыми барьерами.
Языковая разобщенность давно уже мешает ученым. Особенно сейчас, когда выдвигаются и реализуются проекты, куда более грандиозные, нежели
Вавилонский «столп» и все чудеса древнего мира, вместе взятые. Проекты, которые требуют тесного международного сотрудничества и взаимопонимания.
Гигантские ускорители… Центры ядерных исследований… Трансконтинентальные энергетические, телевизионные, радиоастрономические системы… Глобальная сеть спутников связи или космических метеостанций…
Сверхглубокие скважины…
Без обмена информацией вообще немыслимо создание никаких технических «чудес» — ни сущих, ни грядущих.
«Нужно выработать радикально лучшее средство общения, — считает английский ученый-марксист профессор Джон Бернал, — особенно ныне, когда мир становится действующим научным и экономическим комплексом, в котором вавилонская мешанина языков является ужасающими путами».
Поможет ли робот создать «радикально лучшее средство общения»?
Специалисты осторожны в своих оценках.
«Достижения машинного перевода пока еще достаточно скромны, — признает академик Аксель Иванович Берг, председатель Научного совета по комплексной проблеме „Кибернетика“ АН СССР, — трудно ожидать серьезных, имеющих значение для практики результатов ранее чем через 8–10 лет».
Анализируя возникающие здесь трудности, профессор Колумбийского университета (США) Мортимер Таубе касается и экономического аспекта: «Кодирование печатного текста — дорогая операция. Даже самые пылкие машинопоклонники не отрицали, что автоматический перевод останется экономически невыгодным до тех пор, покуда не будет создано читающее устройство, способное автоматически преобразовывать печатный текст в последовательность отверстий на перфокартах или иной код, легко воспринимаемый машиной. Имеются читающие устройства, которым доступны шрифты стандартной формы и стандартного размера при строго определенном положении букв. Но никто еще не придумал устройства, способного правильно считывать любой шрифт».
Над технической задачей, о которой упоминает Таубе, много лет подряд бились ведущие кибернетики США (Оливер Селфридж, Фрэнк Розенблат) и других стран. Проблема оказалась не из легких.
Соотечественник Таубе, математик Уолтер Питтс, как-то заметил: «Даже определение абсолютно точных и строгих правил узнавания буквы А во всех видах, встречающихся хотя бы в печатном тексте, — грандиозная задача». И тут же выразил сомнение, что ее вообще удастся когда-нибудь решить.
7 февраля 1962 года собрание Академии наук заслушало доклад директора Института автоматики и телемеханики академика В. А. Трапезникова о работе советского ученого Э. М. Бравермана, предложившего весьма перспективный подход к проблеме.
Видеть букву, понимать дух!
Когда мы разглядываем какой-нибудь вензель, его изображение проецируется хрусталиком на глазное дно, которое похоже на соты — оно состоит из великого множества тесно примыкающих друг к другу клеток (палочек и колбочек). Каждый из этих зрительных рецепторов воспринимает лишь кусочек общей картины. Если ячейка оказалась затененной, от нее в мозг по нервному волокну идет иной сигнал, чем от незатененной.
Сетчатку можно моделировать мозаикой, составленной из фотоэлементов. Допустим, их 60 (это несравненно меньше, чем светочувствительных клеток на внутренней стенке глаза, но принципиальной разницы тут нет). И расположены они 10 горизонтальными рядами друг под другом, по 6 штук в каждом ряду. Получилась прямоугольная сетка. Представьте, что на нее упало изображение плоской черно-белой фигуры. Пятерка, не правда ли? Неказистая, но все же не тройка, не семерка, не иная цифра. Мы сразу узнали ее выразительный абрис. А вот машине надо втолковать: мол, данный орнамент