out of, bring ‘принес сюда’ требует up ‘наверх’, a what требует for (словосочетание what for означает ‘зачем’). Другой, еще лучший пример взят из реальной жизни (из письма в журнал «ТВ-гайд»[37]):
How Ann Salisbury can claim that Pam Dawber’s anger at not receiving her fair share of acclaim for Mork and Mindy’s success derives from a fragile ego escapes me.
‘To, как Энн Сэлисбери может заявлять, что гнев Пэм Добер, вызванный неполучением честной доли от вознаграждения за успех «Морка и Минди», происходит от уязвленного самолюбия, остается мне не понятным’.
В том месте предложения, которое начинается сразу после слова not, автор письма должен был держать в памяти четыре грамматически обязательных положения: 1) not требует -ing (her anger at not receiving acclaim ‘гнев, вызванный неполучением’) требует распространения в виде причастного оборота — гнев, вызванный; 2) at требует существительного или герундия (her anger atnotreceiving acclaim); 3) подлежащее в единственном числе Pam Dawber’s anger требует, чтобы глагол, стоящий четырнадцатью словами дальше, согласовывался с подлежащим в числе (Dawber’s anger… derives from ‘гнев Пэм Добер… происходит от’); 4) подлежащее в единственном числе, начинающееся с How требует от глагола, стоящего от него через двадцать семь слов согласования в числе (How… escapes me ‘То, как… остается мне непонятным’). Подобно автору, читатель должен держать все эти зависимости в памяти для того, чтобы понять предложение. Теперь, говоря технически, можно было бы соорудить модель цепочки слов, которая могла бы работать даже с такими предложениями, поскольку существует какой-то реальный лимит числа зависимостей, которые говорящему нужно держать в памяти (например, четыре). Но уровень избыточности в генераторе будет абсурдным: для каждой из тысяч комбинаций зависимостей в генераторе придется дублировать идентичную цепочку. Пытаясь поместить в памяти такую суперцепочку, можно легко сойти с ума.
Разница между искусственной комбинаторной системой, которую мы рассматриваем на примере генератора цепочек слов, и естественной системой, которую мы рассматриваем на примере человеческого мозга, обобщена в строке стихотворения Джойса Килмера: «Только Бог может создать дерево»[38]. Предложение — это дерево, а не цепочка. В грамматике человеческого языка слова сгруппированы в синтаксические группы, подобно веточкам присоединенным к ветви. Синтаксической группе присвоено имя — ментальный символ — и маленькие синтаксические группы могут быть объединены в бо́льшие. Возьмем предложение: The happy boy eats ice-cream ‘Этот радостный мальчик ест мороженое’. Оно начинается двумя словами, выступающими вместе как единое целое — это именная группа the happy boy ‘этот радостный мальчик’. В английском именная группа (NP) состоит из имени существительного (N), которому иногда предшествует артикль или «детерминатор» (сокращенно: «det») и любое количество адъективных слов (А). Все это можно обобщить в правиле, которое определяет как выглядят английские именные группы вообще. В стандартном лингвистическом обозначении стрелка означает: «состоит из», скобки означают: «присутствующий факультативно», а звездочка обозначает: «любое желаемое количество этих элементов», но я привожу это правило только для того, чтобы показать, что вся заключенная в нем информация может быть ясно выражена в нескольких символах; можно не обращать внимание на обозначения, а смотреть только на перевод, обычными словами приведенный ниже:
NP —> (det) A* N
«Именная группа состоит из присутствующего факультативно детерминатора, за которым следует любое количество адъективных слов, за которыми следует существительное».
Это правило определяет строение перевернутой вверх ногами ветви дерева:
А вот — два других правила, одно из которых дает определение английскому предложению (S), а другое дает определение предикативной или глагольной группе (VP), оба они используют как составную часть символ NP:
S —> NP VP
«Предложение состоит из именной группы, за которой следует глагольная группа»
VP —> V NP
«Глагольная группа состоит из глагола, за которым следует именная группа».
Теперь нам потребуется ментальный словарь, который бы уточнил, какое слово принадлежит к какой части речи (имя существительное, глагол, прилагательное, предлог, детерминатор):
N —>boy ‘мальчик’, girl ‘девочка’, dog ‘собака’, cat ‘кошка’, ice-cream ‘мороженое’, candy ‘конфеты’, hot dogs ‘сосиски’
«Существительные могут быть извлечены из следующего списка: boy ‘мальчик’, girl ‘девочка’…»
V —>eats ‘ест’, likes ‘любит’, bites ‘кусается’
«Глаголы могут быть извлечены из следующего списка: eats ‘ест’, likes ‘любит’, bites ‘кусается’»
А —>happy ‘радостный’, lucky ‘счастливый’, tall ‘высокий’
«Адъективные слова могут быть извлечены из следующего списка: happy ‘радостный’, lucky ‘счастливый’, tall ‘высокий’»
det —>a, the, one
«Детерминаторы могут быть извлечены из следующего списка: a, the, one»
Набор правил, подобных тем, которые я привел — «грамматика непосредственно составляющих» — задает предложение, нагружая словами ветви на растущем сверху вниз дереве:
Та невидимая сверхструктура, что удерживает слова на месте, — это могущественное изобретение, устраняющее проблемы, которые были у генераторов цепочек слов. Основная суть древесного представления в том, что дерево модулярно, как и гнездо телефонного коммутатора, или муфта садового шланга. Символ типа «NP» подобен разъему или креплению определенной формы. Он позволяет одному компоненту (синтаксической группе) заскочить в любую из нескольких позиций внутри других компонентов (бо́льших синтаксических групп). Как только тип синтаксической группы задан правилом и ему присвоен свой символ-соединитель, ему никогда более не нужно быть определенным снова, синтаксическая группа может быть подключена в любом месте, где есть соответствующая розетка. Например, в той маленькой грамматике, которую я продемонстрировал, символ «NP» используется и как подлежащее в предложении (S —> NP VP), и как дополнение в глагольной группе (VP —> V NP). В более приближенной к жизни грамматике он также будет использоваться как объект, на который направлено действие предлога near the boy ‘рядом с мальчиком’, в конструкции со значением принадлежности the boy’s hat ‘шапка радостного мальчика’, как косвенное дополнение give the boy a cookie ‘дай печенье мальчику’ и в нескольких других позициях. Такая организация вида «вилка-розетка» объясняет, как люди могут использовать одну и ту же синтаксическую группу во многих разных позициях в предложении, включая:
[The happy happy boy] eats ice-cream ‘[Этот радостный-радостный мальчик] ест мороженое’.
I like [the happy happy boy] ‘Я люблю [этого радостного-радостного мальчика]’.
I gave [the happy happy boy] a cookie ‘Я дал [этому радостному-радостному мальчику] печенье’.
[The happy happy boy]’s cat eats ice-cream ‘Кошка [этого радостного-радостного мальчика] ест мороженое’.
Нет необходимости выучивать, что прилагательное скорее предшествует существительному (чем наоборот) в позиции подлежащего, затем выучивать то же самое для позиции прямого дополнения, косвенного дополнения и наконец — для позиции обладателя.
Заметьте также, что возможность разнородного соединения любой синтаксической группы с любым гнездом делает грамматику независимой от того, что подсказывает нам здравый смысл, задаваемый значениями слов. Этим объясняется, почему мы можем писать и признавать грамматически правильную бессмыслицу. Наша маленькая грамматика допускает существование всех видов бесцветных зеленых предложений, как например: The happy happy candy likes the tall ice-cream ‘Эти радостные-радостные конфеты любят это высокое мороженое’, одновременно сообщая такие неизвестные доселе факты, как: The girl bites the dog ‘Эта девочка кусает эту собаку’.
Любопытнее всего, что ветви синтаксического дерева с метками действуют в роли всеобъемлющей памяти или плана для всего предложения. Это позволяет без затруднений справляться с находящимися в гнездах удаленными зависимостями типа: if… then ‘если… то’ и either… or ‘или… или’. Все, что при этом требуется — это правило, которое задает синтаксическую группу, содержащую копию точно такого же вида синтаксической группы, например:
S —>either S or S
«Предложение может состоять из слова either ‘или’, за которым следует предложение, за которым следует слово or ‘или’, за которым следует другое предложение».
S —>if S then S
«Предложение может состоять из слова if ‘если’, за которым следует предложение, за которым следует слово then ‘то’, за которым следует другое предложение».
Эти правила включают один представитель некоторого символа внутрь другого представителя того же самого символа (в данном случае — предложение внутрь предложения); это удобный способ (называющийся в логике «рекурсией») создавать бесконечное количество структур. Части большего предложения упорядоченно соединены вместе как группа ветвей, произрастающих из одного узла. Этот узел удерживает вместе каждое