Лингвисты, пришедшие с холода — страница 27 из 63

сачкование – есть отдых без отрыва от работы; государство – это не я; и др.); специалист по языку хауса (Напрасно в годы хаоса искать конца благого. Не изучайте хауса и ничего другого).

– В Лабораторию пришло сильное подкрепление в лице знаменитого Игоря Мельчука, – вспоминает Леонтьева, – они с Ольгой Кулагиной реализовали первый в стране эксперимент машинного перевода с французского языка на русский («ФР-1», система машинного перевода первого поколения). Реализация была выполнена в Институте прикладной математики на компьютере «Стрела» вскоре после знаменитого Джорджтаунского эксперимента в США. Игорь стал, по сути, теневым научным руководителем части ЛМП, он увлек Алика Жолковского идеей глубинного синтаксиса, и Алик вскоре защитил кандидатскую диссертацию по синтаксису языка сомали. Вместе они ввели понятие «лексической функции».

– Я был страшно увлечен тем, чтобы раскрыть смысловые тайны языка, семантические множители, сколько множителей, – рассказывает Жолковский. – Мы занимались открытием тайн языка. У Мельчука это было еще радикальней: он был уверен в абсолютной истинности своих открытий и, как я острил, в сущности, полагал, что в конце концов, когда вскроют мозг, все увидят, что на соответствующей извилине написано типа «СЕМП [семантическое представление] номер пять». Он верил абсолютно в буквальность того, что надо открыть, – потому что там в действительности всё вот так и так.

В Лаборатории машинного перевода Мельчук не работал. Я писал алгоритмы сведения синонимичных предложений к одному смыслу. Этим завоевал любовь Мельчука, и мы стали заниматься системой перифразирования (лексическими функциями) уже с ним вдвоем. В идеале должно было быть так, чтобы потом на машине где-то там у Кулагиной провести эксперимент, и машина переведет одно в другое… И что-то такое иногда делалось.

– Отсюда выросла основная идея модели «Смысл ↔ Текст», – говорит Апресян, – всемирно известной лингвистической теории И.А. Мельчука: смысл предложения – это инвариант множества его перифраз. Тогда понять предложение значит уметь предложить его перифразу или перифразы.

– В 1961 году был опубликован своеобразный семантический «Манифест» Лаборатории машинного перевода, – продолжает он, – статья А.К. Жолковского, Н.Н. Леонтьевой и Ю.С. Мартемьянова «О принципиальном использовании смысла при машинном переводе». В ней была предложена первая версия метаязыка для описания значений любых единиц естественного языка. В фокусе внимания оказывались средства образования синонимических высказываний, или перифрастические средства языка.

Эта статья – «манифест» – была напечатана в сборнике «Машинный перевод», изданном в Институте точной механики и вычислительной техники АН СССР.

«Ряд высказанных в ней идей, – пишет З.М. Шаляпина167, – не просто получили в дальнейшем широкое распространение, но стали своего рода аксиоматикой данной области лингвистики. Заслуга Жолковского, Леонтьевой и Мартемьянова в том, что в их статье впервые был предложен аппарат семантического представления – семантической записи, позволяющей отображать в ней синтаксические деревья, и предложен целый ряд принципов построения такой записи, ставших в дальнейшем классическими. <…> авторы не просто ввели новые, более мощные и более адекватные решаемой задаче средства формализованного лингвистического описания, но выявили и поставили целый ряд лингвистических проблем, которые до того оставались “за кадром”, а также предложили принципы их решения, до сих пор сохранившие свою научную значимость. В результате статья послужила фундаментом и источником целого ряда школ и направлений в исследованиях по синтаксису и семантике в современной теоретической и компьютерной лингвистике»168.

Лаборатория машинного перевода, а точнее – работа с Мельчуком над тем, чем занимается Мельчук, привлекала к себе все новых и новых людей. Некоторые не задерживались, другие же оставались надолго.

– Мельчук привык работать в команде, – говорит Поливанова, – или любил работать в команде. Ему хотелось командовать. Одного Жолковского ему не хватало, потому что Жолковский – лентяй и праздный гуляка. А Мельчуку нужны люди под стать его темпераменту – работяги. Поэтому эта тройка – Апресян, Мельчук, Жолковский – сложилась очень естественно.

Эти трое составляли и ядро разработки ТКС – Толково-комбинаторного словаря.

«На шумные вечерние семинары по нашему толково-комбинаторному словарю, которыми дирижировал Мельчук, стекались толпы болельщиков, – писал Жолковский. – Реальной работы делалось немного, зато это больше, чем что-либо в моем опыте, походило на описания jam-sessions американских джазистов. Компания складывалась отличная, но – сугубо “своя”.

Однажды Мельчук делал доклад на “чужом” семинаре, делал с обычным харизматическим блеском, а когда затруднился с примером, обратился ко мне, сидевшему среди публики. Я сказал, что уже и предыдущий пример был неправильный, но Игорь радостно объявил:

– Какая разница?! Они все равно не поймут!

Раскол между “нами” и “ими” меня травмировал, ибо шел вразрез с позывом к общению. Постепенно размежевание “наших” и “не наших” становилось все четче»169.

«Нашими» были те, кто разделял интересы Мельчука, работал вместе с ним и, стало быть, занимался тем, что он считал единственно осмысленной лингвистикой, а также те, кто способен был разобраться в его модели, хотя по какой-то нелепой причине и занимался чем-то другим.

– Я вышла замуж за Алика [Жолковского], – рассказывает Татьяна Корельская, – и Мельчук приходил к нам, они работали вместе у нас дома. И когда он видел, чем я занимаюсь, он начинал кипятиться и говорить, какая это все собачья чушь. И когда он потом в Америку приехал и его приглашали во все университеты, он приезжал и говорил: «Чем вы тут занимаетесь? Это же ерунда собачья! Вот смотрите, как нужно: “Смысл ↔ Текст”!»

«Что касается лингвистов, – вспоминает о тех временах О.С. Кулагина, – то даже у тех из них, кто хотел работать по-новому и готов был разрабатывать лингвистические проблемы в нужном МП аспекте, не всегда был достаточно четко и правильно налаженный контакт с математиками, что приводило к отсутствию у лингвистов ясного понимания процессов и алгоритмов, для которых они должны были дать лингвистический материал. Отсюда возникла неясность в том, какие именно лингвистические данные и под каким углом зрения им надо собрать и в какую общую схему их следует уложить. В свою очередь отсутствие общей картины и неразработанность слишком большого числа проблем приводили к тому, что иногда лингвисты начинали увлекаться решением частных вопросов, отходя на позиции, близкие к традиционно лингвистическим, забывая о целях МП и еще больше ослабляя контакт с математиками.

Что касается математиков, то и здесь не все обстояло просто, поскольку математики столкнулись с совершенно новым, чрезвычайно сложно организованным, трудно поддающимся осмыслению и формализации объектом. Работа с ним требовала создания новых математических подходов и методов, тогда как у некоторых математиков возникала тенденция перенести в эту новую сферу какой-либо привычный им математический аппарат, причем без достаточно глубокого проникновения в суть и специфику лингвистических феноменов»170.

– Ольга Сергеевна Кулагина сделала первую систему, – говорит Л.Л. Иомдин, – написала книгу о машинном переводе, она называется «Исследования по машинному переводу», такая советская классика. Мельчук и в мыслях не имел сделать действующую систему машинного перевода, ему было просто интересно, как можно автоматически – с помощью машины или без нее, неважно, – описать язык171.

– Мельчук тоже, но особенно Апресян, мне так кажется, – противоречит Иомдину Поливанова, – они мыслили всю эту затею как некоторый такой поход с ощутимым материальным результатом – вот реально построить машинный перевод и довести до инженерного воплощения. У Нины Леонтьевой тоже были такие инженерные замыслы, мелькали уже попытки альтернативного французского перевода, то есть, по-видимому, у нее эта самая романтика машинерии тоже была.

– Перевод Мельчук разделил на две процедуры: анализ языка и его синтез, – продолжает Иомдин. – Имеется текст на входном языке, его надо проанализировать, понять, что там говорится, получить что-то вроде представления. Это все постепенно вырабатывалось, понятие семантического представления или семантической структуры далеко не сразу появилось и вовсе не в результате работы над машинным переводом, а скорее независимо. Но тем не менее Мельчук написал две толстых книги «Алгоритм автоматического синтаксического анализа». Это был абсолютно лобовой алгоритм, никаких компьютеров не предполагалось, все было написано от руки. То есть Мельчук как бы симулировал действие машины. А потом эти системы машинного перевода стали плодиться и размножаться.

– В 1969-м Мельчук посоветовал Розенцвейгу взять меня в лабораторию, – рассказывает Николай Перцов, – а в 1970 году, в феврале, Мельчук организовал так называемую зимнюю лингвистическую школу в здании Института русского языка. Она продолжалась три дня и была посвящена разработке формальной модели русской морфологии (словоизменения). Это была рабочая школа. Мельчук тогда занимался разработкой формальной модели русского словоизменения. В 1967-м вышла книга Зализняка «Русское именное словоизменение», но она касалась только имени – существительного и прилагательного. А Мельчук имел в виду сделать полную модель русского словоизменения в направлении синтеза, охватить все части речи, включая глагол.

Я хорошо помню, как это проходило. В разных комнатах Института русского языка сидели люди, и Мельчук давал конкретные задания: проверять парадигмы тех или иных классов слов, – а потом всех обходил. Это была рабочая сессия, то, чего сейчас уже не бывает. Там были обсуждения, но докладов не было. После этой школы был опубликован препринт «Модель русского словоизменения» – выходили в Институте русского языка такие препринты ПГЭПЛ (Проблемной группы по экспериментальной прикладной лингвистике). Несколько десятков их вышло, по-моему.