Синтаксические структуры — страница 5 из 22

4.2.

В § 3 мы рассмотрели языки, названные «языками с конечным числом состояний», которые порождаются посредством марковских процессов с конечным числом состояний. В настоящей главе мы рассматриваем терминальные языки, порождаемые системами вида [Σ,F]. Эти два типа языков связаны друг с другом следующим образом.

Теорема: Каждый язык с конечным числом состояний есть терминальный язык, но существуют терминальные языки, не являющиеся языками с конечным числом состояний[16]. Важно в этой теореме то, что описание в терминах модели непосредственно составляющих оказывается существенно более сильным, чем описание в терминах элементарной теории, рассмотренной выше в § 3. Примерами терминальных языков, не являющихся языками с конечным числом состояний, могут служить языки (10 I) и (10 II), рассмотренные в § 3. Так, язык (10 I), состоящий из всех цепочек вида ab, aabb, aaabbb,.. и только этого вида, может порождаться [Σ,F]-грамма- тикой (18):


(18) Σ: Z

F: Z—>ab

Z—>aZb


Эта грамматика имеет начальную цепочку Z [как,(13) имеет в качестве начальной цепочки символ Sentence] и два правила. Нетрудно заметить, что каждая завершенная деривация, построенная согласно (18), оканчивается цепочкой языка (10 I) и что этим способом порождаются все такие цепочки. Подобным образом языки вида (10 II) также могут порождаться [Σ,F]-грамматиками. Язык (10 III), однако, не может порождаться грамматикой этого типа.

В § 3 мы указали, что языки (10 I) и (10 II) соответствуют определенным частям английского языка и что поэтому модель марковского процесса с конечным числом состояний не адекватна английскому языку. Мы убедились теперь, что модель непосредственно составляющих не оказывается несостоятельной в таких случаях. Мы не доказали адекватности этой модели, но нам удалось показать, что значительные части английского языка, которые в буквальном смысле не могут быть описаны в терминах модели с конечным числом состояний, описываются в терминах модели непосредственно составляющих.

Можно сказать, что в случае (18) в цепочке aaabbb языка (10 I) ab, например, есть Z, aabb есть Z и aaabbb само есть Z[17]. Таким образом, эта конкретная цепочка содержит три группы, каждая из которых есть Z. Это, разумеется, весьма тривиальный язык. Важно отметить, что при описании данного языка мы ввели символ Z, который не содержится в предложениях указанного языка. Это существенная черта модели непосредственно составляющих, обусловливающая ее «абстрактный» характер.

Заметим также, что в случае (13) и (18) (как вообще в случае любой системы непосредственно составляющих) всякая терминальная цепочка имеет несколько представлений. Так, например, в случае (13) терминальная цепочка The man hit the ball «Человек ударил мяч» представляется цепочками Sentence, NP+VP, T+N+VP и вообще любой из строк системы (14), равно как и цепочками типа NP+Verb+NP, T+N+hit+NP, которые могут выступать в деривациях, эквивалентных (14) в определенном выше смысле. На уровне непосредственно составляющих, следовательно, каждое предложение определенного языка представляется множеством цепочек, а не одной цепочкой, как это имеет место на уровнях фонем, морфем или слов. Таким образом, структура непосредственно составляющих, рассматриваемая как лингвистический уровень, имеет радикально иной и нетривиальный характер, что, как мы видели в § 3.3, необходимо для некоторых лингвистических уровней. Мы не можем установить иерархию среди различных представлений предложения The man hit the ball «Человек ударил мяч»; мы не можем разбить систему непосредственно составляющих на конечное множество уровней, упорядоченных от верхнего до нижнего так, чтобы каждое предложение имело одно представление на каждом из этих подуровней. Например, нет способа установить очередность по вертикали для элементов NP и VP. В английском языке именная группа может содержаться в глагольной, а глагольная — в именной. Структура непосредственно составляющих должна рассматриваться как единый уровень с множеством представлений для каждого предложения языка. Существует взаимно однозначное соответствие между правильно выбранными множествами представлений и схемами типа (15).

4.3.

Допустим, что с помощью [Σ,F]-грамматики мы можем порождать все грамматически правильные последовательности морфем какого-то языка. Для завершения грамматики мы должны установить фонемную структуру этих морфем, с тем чтобы грамматика производила грамматически правильные последовательности фонем данного языка. Но и эта часть грамматики (которую мы назовем морфофонемикой языка) также может быть задана в виде набора правил типа «подставить Y вместо X», то есть, для английского языка, в виде системы


(19) (I) walk—>/wok/

(И) take+past—>/tuk/

(III) hit+past—>/hit/

(IV) /...D/+past—>/...D/+/id/ (где D=/t/ или /d/)

(V) /...Cunv/+past—>/...Cunv/+/t/ (где Cunv — глухая согласная)

(VI) past—>/d/

(VII) take—>/teyk/ и т. д.


или чего-либо в этом роде. Заметим, в частности, что между этими правилами должна быть установлена очередность. Так, правило (II) должно предшествовать правилу (V) или правилу (VII), иначе мы получим такие формы, как /teykt/ для прошедшего времени от глагола take «брать». Для этих морфофонемных правил уже не является обязательным требование, чтобы в результате применения каждого правила заменялся только один символ.

Теперь мы можем прибавить к деривациям модели непосредственно составляющих систему (19); в результате мы получим единый процесс порождения последовательностей фонем из начальной цепочки Sentence. Это может создать впечатление, что граница между уровнем непосредственно составляющих и более низкими уровнями произвольна. В действительности это не так. Во-первых, как мы видели, формальные свойства правил X—>Y, относящихся к модели непосредственно составляющих, отличаются от свойств правил морфофонемики, поскольку в первом случае мы должны требовать, чтобы заменялся только один символ. Во-вторых, элементы, фигурирующие в правилах (19), могут быть разбиты на конечное число уровней (например, фонемы и морфемы; или, может быть, фонемы, морфофонемы и морфемы), каждый из которых является элементарным в том смысле, что лишь единственная цепочка элементов этого уровня служит представлением для каждого предложения на данном уровне (если исключить случаи омонимии) и что каждая такая цепочка представляет лишь одно предложение. Элементы же, появляющиеся в правилах, относящихся к модели непосредственно составляющих, не могут быть разбиты на более высокие и более низкие уровни указанным способом.

Ниже мы увидим, что существует более глубокое основание для того, чтобы различать правила модели непосредственно составляющих, носящие характер более высокого уровня, и правила, носящие характер более низкого уровня, превращающие цепочки морфем в цепочки фонем.

Формальные свойства модели непосредственно составляющих представляют предмет интересного исследования, и легко доказать, что дальнейшая разработка этого типа грамматики необходима и возможна. Нетрудно обнаружить, что весьма выгодно расположить правила множества F так, чтобы некоторые из правил могли применяться только после того, как другие правила уже были применены. Например, определенно необходимо, чтобы правила типа (17) применялись раньше любого правила, позволяющего нам подставить NP+Preposition+NP вместо NP и т. п.; в противном случае грамматика будет порождать такие непредложения, как The men near the truck begins work at eight. Однако такая разработка связана с проблемами, уводящими нас за рамки этого исследования.

5. ОГРАНИЧЕННОСТЬ ОПИСАНИЯ ПО НЕПОСРЕДСТВЕННО СОСТАВЛЯЮЩИМ

5.1.

Мы рассмотрели две модели структуры языка: теоретико-коммуникационную модель, основанную на представлении о языке как о марковском процессе, являющуюся в некотором смысле минимальной лингвистической теорией, и модель, основанную на анализе по непосредственно составляющим. Мы убедились, что первая из них, безусловно, не адекватна задачам грамматики и что вторая является более сильной, чем первая, оставаясь пригодной в тех случаях, когда первая оказывается несостоятельной. Вместе с тем существуют, разумеется, языки, которые не могут быть описаны в терминах модели непосредственно составляющих ((10 III) — один из них). Я не знаю, является ли английский язык таким языком, который в буквальном смысле находится вне сферы компетенции анализа подобного рода. Я думаю, однако, что существуют другие основания для того, чтобы отклонить теорию анализа по непосредственно составляющим как не адекватную целям лингвистического описания.

Самое сильное из возможных доказательств неадекватности лингвистической теории состоит в том, чтобы показать, что она вообще не может быть применена к некоторому естественному языку. Более слабым, но вполне достаточным доказательством было бы показать, что эту теорию можно применить лишь громоздким, неизящным способом; другими словами — показать, что любая грамматика, которую можно построить на основе этой теории, будет чрезвычайно сложной, эмпиричной, ad hoc, и не «наглядной», что некоторые весьма простые способы описания грамматически правильных предложений не могут быть формализованы в терминах грамматики и что некоторые фундаментальные формальные свойства естественного языка нельзя использовать для упрощения грамматик. Мы в состоянии привести большое число свидетельств подобного рода в пользу того положения, что описанный выше тип грамматики, а также лежащая в его основе лингвистическая теория принципиально неадекватны.