Синтаксические структуры — страница 4 из 22

Короче говоря, метод анализа выдвигаемого здесь понятия степени грамматической правильности в терминах марковского процесса с конечным числом состояний, порождающего предложения слева направо, заводит в тупик в той же мере, как и гипотезы, отклоненные выше (см. § 2). Если грамматика подобного типа порождает все английские предложения, она произведет на свет также много и непредложений. Если она порождает только английские предложения, то мы можем быть уверены, что найдется бесконечное число истинных предложений, ложных предложений, правильно поставленных вопросов и т. д., которые она просто не в состоянии породить.

Отклоненная только что концепция грамматики представляет собой простейшую лингвистическую теорию, заслуживающую серьезного рассмотрения. Грамматика с конечным числом состояний — это простейший тип грамматики, которая с конечным набором средств способна порождать бесконечное число предложений. Мы видели, что такая ограниченная лингвистическая теория не адекватна; мы вынуждены искать какой-то более сильный тип грамматики и какую-то более «абстрактную» форму лингвистической теории. Понятие «лингвистического уровня представления», введенное в начале настоящей главы, должно быть видоизменено и усовершенствовано. По крайней мере один уровень не может иметь такой простой структуры. Другими словами, на некотором уровне оказывается невозможным представлять каждое предложение просто как конечную последовательность элементов определенного рода, порождаемых слева направо некоторым простым механизмом. Если этого не сделать, то нельзя надеяться найти конечное множество уровней, упорядоченных сверху вниз, таких, чтобы можно было породить все высказывания путем задания допускаемых последовательностей элементов самого высокого уровня, разложения каждого элемента высшего уровня на элементы второго уровня и т. д. и, наконец, задания фонемного состава элементов предпоследнего уровня[11]

В Начале § 3 мЬі предложили для упрощения описания грамматически правильных последовательностей фонем устанавливать уровни таким способом. Если язык можно описать элементарным образом (через порождение слева направо) с помощью единственного уровня (т. е. если это язык с конечным числом состояний), то такое описание действительно можно упростить, построив более высокие уровни; но для порождения таких неконечных языков, как английский, необходимы коренным образом отличные методы и более общая концепция «лингвистического уровня».

4. МОДЕЛЬ НЕПОСРЕДСТВЕННО СОСТАВЛЯЮЩИХ[12]

4.1.

Обычно лингвистическое описание на синтаксическом уровне формулируется в терминах анализа по непосредственно составляющим. Спросим себя, какова та форма грамматики, из которой исходят при описании такого рода? Мы увидим, что эта новая форма грамматики является существенно более сильной, чем отброшенная выше модель с конечным числом состояний, и что отвечающая ей концепция «лингвистического уровня» коренным образом отлична от предыдущей концепции.

В качестве простого примера того вида грамматик, который связан с анализом по непосредственно составляющим, рассмотрим следующую систему:


(13) (1) Sentence—>NP+VP

(II) NP—>T+N

(III) VP—>Verb+NP

(IV) T—>the

(V) N—>man, ball и т. д.

(VI) Verb—>hit, took и т. д.


Пусть каждое правило вида X—>Y системы (13) означает предписание: «вместо X подставить К». Систему (14) мы можем назвать деривацией предложения The man hit the ball «Человек ударил мяч». Номер справа от Каждой строки деривации показывает, какое правило «грамматики» (13) используется для получения данной строки из предыдущей[13].


(14) Sentence

NP+VP (I)

T+N+VP (II)

T+N+Verb+NP (III)

the+N+Verb+NP (IV)

the+man+Verb+NP (V)

the+man+hit+NP (VI)

the+man+hit+T+N (II)

the+man+hit+the+N (IV)

the+man+hit+the+ball (V)


Таким образом, вторая строка (14) получается из первой подстановкой NP+VP вместо Sentence по правилу (1) системы (13); третья строка получается из второй подстановкой T+N вместо NP по правилу (II) и т. д. Мы можем наглядным образом представить деривацию (14) с помощью следующей схемы:


(15)


Схема (15) несет меньше информации, чем деривация

(14) , поскольку она не показывает, в каком порядке применяются правила. Имея (14), мы можем построить (15) только одним способом, но не обратно, так как можно построить деривацию, сводящуюся к (15), но имеющую иной порядок применения правил. Схема (15) содержит именно то, что есть существенного в (14) для определения структуры непосредственно составляющих предложения- деривата The man hit the ball «Человек ударил мяч». Некоторая последовательность слов в этом предложении есть составляющая типа Z, если на схеме (15) мы можем возвести эту последовательность к некоторой одной точке, и эта точка обозначена Z. Так, hit the ball «ударил мяч» можно возвести к VP в (15); следовательно, в предложении-деривате hit the ball есть VP. Но man hit нельзя возвести ни к какой одной точке на схеме (15); значит, man hit — вообще не составляющая.

Мы называем две деривации эквивалентными, если они сводятся к одной и той же схеме типа (15). В некоторых случаях грамматика позволяет построить неэквивалентные деривации заданного предложения. В таких условиях можно говорить о «конструкционной омонимии»[14]. Если наша грамматика правильна, данное предложение должно быть двусмысленным. Ниже мы вернемся к этому важному понятию конструкционной омонимии.

Очевидна необходимость следующего обобщения системы (13). Мы должны иметь возможность ограничивать применение некоторого правила определенным контекстом. Так, вместо Т можно подставить а, если следующее существительное стоит в единственном числе, но не во множественном; точно так же вместо Verb можно подставить hits, если ему предшествует существительное man, но нельзя — если ему предшествует men. Вообще, если мы хотим ограничить подстановку Y вместо X контекстом Z—>W, мы можем задать в грамматике правило


(16) Z+X+W—>Z+Y+W


Например, в том случае, когда рассматривается единственное и множественное число глаголов, мы должны вместо того, чтобы добавлять к (13) правило Verb—>hits, добавить правило


(17) NPsing+Verb —> Npsing+hits.


показывающее, что hits подставляется на место Verb только в контексте NPsing—. Соответственно, правило (13 II) должно быть сформулировано так, чтобы можно было учесть NPsing и NPpl[15]. Это прямое обобщение правила (13). Одна черта системы (13) должна быть сохранена, однако, как это имеет место в (17): при применении одного правила только один элемент может подвергаться подстановке; другими словами, в (16) X должен представлять собой один символ, например Т или Verb, а не последовательность символов, как, скажем, T+N. Если это условие не соблюдено, мы не можем надлежащим образом восстановить структуру непосредственно составляющих предложений-дериватов по соответствующим схемам вида (15) , как мы делали выше.

Теперь мы в состоянии дать более общее описание того типа грамматики, который связан с теорией лингвистической структуры, основанной на анализе по непосредственно составляющим. Всякая такая грамматика определяется конечным множеством Σ начальных цепочек и конечным множеством F «формул-команд» вида X—>Y, означающих: «подставить Y вместо X». Хотя X не обязательно должно быть одним символом, только один символ из состава X может быть заменен при образовании Y. В грамматике (13) множество Σ начальных цепочек состоит из единственного символа Sentence, a F состоит из правил (I) —(VI); но мы можем потребовать расширения множества Σ, с тем чтобы оно включало, например, Declarative Sentence, Interrogative Sentence в качестве дополнительных символов. Обладая грамматикой [Σ,F], мы определяем деривацию как конечную последовательность цепочек, начинающуюся с одной из начальных цепочек Σ, такую, что каждая цепочка в ней получается из предыдущей цепочки в результате применения одной из формул-команд множества F. Так, (14) есть деривация; пятичленная последовательность цепочек, состоящая из первых пяти строк (14),также есть деривация. Некоторые деривации являются завершенными в том смысле, что нет такого правила в F, с помощью которого можно было бы преобразовать их последнюю цепочку. Так, (14) — завершенная деривация, а последовательность первых пяти строк (14) — незавершенная. Если какая-то цепочка является последней цепочкой завершенной деривации, мы называем ее терминальной.Так, the+man+hit+the+ball есть терминальная цепочка грамматики (13). Некоторые грамматики типа [Σ,F] могут не иметь терминальных цепочек, но мы интересуемся только теми грамматиками, которые их имеют, то есть описывающими некоторые языки. Множество цепочек называется терминальным языком, если это множество является множеством терминальных цепочек некоторой грамматики [Σ,F]. Таким образом, каждая такая грамматика определяет некоторый терминальный язык (в частности, «пустой» язык, не содержащий ни одного предложения), и каждый терминальный язык порождается некоторой грамматикой типа [Σ,F], Имея терминальный язык и его грамматику, мы можем реконструировать структуру непосредственно составляющих каждого предложения этого языка (каждой терминальной цепочки грамматики), рассматривая соответствующие схемы типа (15), как мы делали это выше. Мы можем также определить грамматические отношения в этих языках формальным образом в терминах соответствующих схем.