Понимание предложения — это одна из вышеупомянутых тяжелых легких проблем. Чтобы общаться с компьютерами нам все еще приходится учить их языки, сами они недостаточно умны, чтобы выучить наши. Вообще, это слишком легко — думать, что компьютеры понимают больше, чем они на самом деле способны понять.
Недавно был учрежден ежегодный конкурс, какая компьютерная программа лучше всего введет в заблуждение пользователя, заставив думать, что он общается с человеком. Целью этого конкурса на премию Лобнера (Loebner Prize) было воплотить предположение, сделанное Аланом Тьюрингом в знаменитой работе 1950 г. Он предложил использовать для ответа на философский вопрос «Может ли машина мыслить?» имитационную игру, где арбитр разговаривает с человеком через один терминал и с компьютером, запрограммированным на имитацию человека — через другой. Если арбитр не может отличить, кто где, то, по мысли Тьюринга, нет оснований отрицать, что компьютер может думать. Если отбросить философию, то для конкурсной комиссии было очевидно, что ни одна программа не сможет и близко подойти к выигрыванию премии в 100 000 долларов, поэтому ее размер был уменьшен до 1 500 долларов, что было честнее по отношению к машине. Каждый из арбитров должен был придерживаться одной темы беседы, выбранной программистом или конкурирующим с компьютером человеком, кем бы он ни был, и арбитру не позволялось использовать никаких «хитростей или уловок», например, повторять вопрос десять раз или спрашивать, носят ли зебры нижнее белье; беседа должна была быть «естественной». После примерно семи минут общения с каждой из нескольких программ и их соперников-людей, арбитры указали на то, что все люди более «человекоподобны», чем любой из компьютеров. Тем не менее, около половины арбитров спутали выигравшую программу с человеком.
Это достижение является менее впечатляющим, чем кажется. Правила связали арбитрам руки: «неестественные хитрости и уловки» — это иное название любой попытки установить, разговариваешь ты с человеком или с машиной, что и является смыслом конкурса! Кроме того, программист-победитель тонко использовал возможность выбирать тему беседы для своей программы. Он выбрал «эксцентричную беседу», которая является сомнительным примером «темы» и сама по себе может быть полна непоследовательностей:
Арбитр: Как долго тянется этот день! Но теперь, мне кажется, я готов немного поразвлечься. Погода сегодня не очень хорошая. Знаешь ли ты какие-нибудь шутки, которые могли бы разогнать облака?
Компьютер: Все говорят о погоде, но, похоже, никто ничего с ней не делает. Почему тебе обязательно нужно было мне сказать, что теперь ты готов немного поразвлечься? О-о-о-ох…
Арбитр: Ты хочешь запутать меня, да? Я просто объяснил, что готов поразвлечься!
Компьютер: Не лучше ли сказать, если бы это была неправда, что я пытаемся[97] запутать тебя, да? Я просто объяснил, что готов поразвлечься! Я, следовательно, я вычисляю… Почему ты думаешь, что я пытаюсь запутать тебя, не правда ли?
Арбитр: Не могу сказать, что понимаю вопрос… Но эксцентричность поэта — это одно, а эксцентричность большинства из нас — другое.
Компьютер: Откуда ты знаешь, что не можешь сказать, что понял вопрос… Но эксцентричность поэта — это одно, а эксцентричность большинства из нас — другое.
По сути программист просто усовершенствовал технологию, изобретенную в 1965 г. ученым-компьютерщиком Джозефом Вейценбаумом. Вейценбаум написал туповатую программу, названную ELIZA в честь героини Бернарда Шоу; эта программа искала несколько ключевых слов во вводимой строке, извлекала фиксированный ответ из списка и вставляла фрагменты вводимой строки в ответ (с некоторыми небольшими изменениями, например «ты» вместо «я»). Таким образом в примитивной форме имитировалась беседа. Один вариант программы под названием Doctor копировал поведение психотерапевта — приверженца философии Карла Роджерса, считавшего, что терапевт должен повторять пациенту его же собственные утверждения для их осмысливания. Эта версия программы позже продавалась как компьютерная игра в магазинах «Рейдио Шэк»[98], а другая версия поступает в комплекте с моим текстовым редактором GNU Emacs. (В документации сказано: «Если при использовании Emacs что-то не получается, и ни один из указанных выше приемов не решает проблему, Emacs все же может вам помочь. Наберите: „M-x doctor RET“».) Вот типичный диалог:
Пользователь: В последнее время я чувствую себя порядком подавленным.
Компьютер: Вы часто чувствуете себя подавленным?
Пользователь: Да, почти все время.
Компьютер: Почему вы говорите «да, почти все время»?
Пользователь: Вот сейчас я чувствую, что готов заплакать.
Компьютер: Вы пришли ко мне потому, что сейчас чувствуете, что готовы заплакать?
К ужасу Вейценбаума, однажды он увидел, как его секретарша припала к терминалу и изливает душу программе.
У большинства ученых-компьютерщиков конкурс на премию Лобнера вызывает раздражение. Они считают его не имеющим научной ценности рекламным трюком, задача которого — обвести вокруг пальца непрофессионала, а не научить компьютер речи. (Разработчикам искусственного интеллекта и другим профессионалам, разбирающимся в проблемах языка, не разрешили быть арбитрами, но ни один из них и не рвался участвовать в конкурсе, заявки поступали от любителей.) Этот конкурс примерно так же продуктивен, как будет продуктивна реклама биологических исследований, если на премию выдвинуть создателя искусственного цветка из шелка, самого похожего на естественный; или как будет продуктивна работа над космической программой, где высадка на Луну осуществится на съемочной площадке Голливуда. Была проведена интенсивная работа по созданию компьютерных систем, понимающих язык, но ни у одного серьезного инженера не хватит дерзости утверждать, что система, дублирующая языковые способности человека, появится в недалеком будущем.
В действительности, с точки зрения ученого, люди не имеют права так хорошо понимать предложения, как они это делают. Они не просто решают до абсурда сложную задачу, но еще и делают это быстро. Понимание, как правило, происходит в режиме «реального времени». Слушающий действует синхронно с говорящим, а не ждет конца отрезка речи, чтобы истолковать его через соразмерный промежуток времени, подобно критику, пишущему рецензию на книгу. А временной промежуток между тем, что произнес говорящий, и тем, что воспринял слушающий, чрезвычайно короток: один или два слога за половину секунды. Некоторые люди могут понимать и повторять предложения, следуя за речью говорящего с отставанием на четверть секунды!
Понимание процесса понимания имеет и иное практическое применение, помимо создания машин-собеседников. Понимание предложений людьми происходит быстро и эффективно, но не идеально. Оно работает, когда воспринимаемый поток речи или текст определенным образом структурирован. В противном случае процесс может забуксовать, пойти в обратном направлении, и возникнет неправильное понимание. Исследуя понимание языка в этой главе, мы выясним, какие виды предложений могут путаться в сознании человека, воспринимающего речь. Один из практических источников информации — это набор рекомендаций для написания ясной прозы, научное руководство по стилистике, например то, что написано Джозефом Уильямсом в 1990 г., — «Стиль: как добиться ясности и изящества», в нем содержатся многие лингвистические находки, которые мы будем рассматривать.
Другое практическое применение связано с областью права. Судьи часто сталкиваются с тем, что им приходится гадать, как среднестатистический человек воспримет двусмысленный отрывок текста, например, при изучении клиентом контракта, заслушивании инструкций присяжными и чтении представителем общественности потенциально клеветнической характеристики. Многие из человеческих привычек толкования текста были определены благодаря лабораторным исследованиям, а лингвист и юрист Лоренс Солэн объяснил связь между языком и правом в своей интересной книге 1993 г. «Язык судей», к которой мы еще обратимся.
Как происходит понимание предложения? Первый этап — это синтаксический разбор. Он не имеет отношения к тем упражнениям, которые вы, стиснув зубы, делали в начальной школе, и о которых у Дейва Барри, ведущего газетной рубрики «Спроси у Господина Языка», осталось такое воспоминание:
Вопрос: Пожалуйста, объясните, как составить схему предложения.
Ответ: Прежде всего расположите предложение на чистой ровной поверхности, например, на гладильной доске. Затем, используя остро отточенный карандаш или скальпель, вычлените «сказуемое», которое показывает, где произошло действие, и обычно расположено прямо за жабрами. Например, в предложении «ЛаМонт никогда не привести в порядок лесникам» действие, очевидно, происходит в лесу. Таким образом, ваша схема будет напоминать по форме деревце, с ветвями, выпирающими из него, чтобы указать на расположение различных частиц речи, таких как ваши герундии, провербы, второстепенности и т.д.
Но понимание действительно включает сходный с этим процесс нахождения подлежащего, сказуемого, дополнения и т.д., который происходит бессознательно. Если только вы не Вуди Аллен, в ускоренном темпе читающий «Войну и Мир», вам нужно сгруппировать слова в синтаксические группы, определить, что является группой подлежащего при каком сказуемом, и так далее. Например, чтобы понять предложение The cat in the hat came back ‘Кошка в шляпе вернулась’ нужно объединить в одну группу слова the cat in the hat ‘кошка в шляпе’, чтобы понять, что это кошка вернулась, а не шляпа. Чтобы отличить предложение Dog bites man ‘Собака кусает человека’ от Man bites dog ‘Человек кусает собаку’ нужно найти подлежащее и объект. А чтобы различить предложения