языком с конечным числом состояний; самую машину мы можем назвать грамматикой с конечным числом состояний. Грамматику с конечным числом состояний можно представить в виде «диаграммы состояний»[7]. Например, грамматика, порождающая равно два предложения — The man comes «Человек приходит» и The men come «Люди приходят»,— может быть представлена следующей диаграммой состояний:
(7)
Мы можем усовершенствовать эту грамматику, с тем чтобы она порождала бесконечное число предложений путем добавления к ней замкнутых петель. Так, грамматика части английского языка, содержащей, кроме упомянутых, еще предложения The old man comes «Старый человек приходит», The old old man comes «Старый-старый человек приходит», .., The old men come «Старые люди приходят», The old old men come «Старые-старые люди приходят», .., представляется диаграммой состояний (см. стр. 424).
Имея диаграмму состояний, мы порождаем предложение, совершая путь от начальной точки слева до конечной точки справа и каждый раз передвигаясь в направлении стрелок. По достижении некоторой точки диаграммы мы можем следовать по любому пути, исходящему из этой точки независимо от того, проходили ли мы по этому пути когда-либо прежде при построении данного предложения или нет. Каждый узел диаграммы, таким образом, соответствует некоторому состоянию машины. Мы можем допустить переход из состояния в состояние по нескольким путям и иметь некоторое число петель любой длины.
(8)
Машина, порождающая языки таким способом, известна в математике под именем «марковского процесса с конечным числом состояний». Для завершения этой элементарной теоретико-коммуникационной модели языка припишем некоторую вероятность каждому переходу из одного состояния в другое. Мы можем теперь вычислить «неопределенность», связанную с каждым состоянием, и определить количество информации в данном языке как взвешенное среднее неопределенностей, причем весовым коэффициентом для каждого состояния будет вероятность нахождения системы в этом состоянии. Поскольку мы изучаем здесь грамматическую, а не статистическую структуру языка, это обобщение не должно нас интересовать.
Данная концепция языка обладает очень большой силой и общностью. Приняв ее, мы можем рассматривать говорящего, по существу, как машину описанного типа. Производя предложение, говорящий начинает с начального состояния, произносит первое слово предложения и тем самым переключается во второе состояние, которое ограничивает выбор второго слова и т. д. Каждое состояние, через которое он проходит, соответствует грамматическим условиям, ограничивающим выбор следующего слова в этой точке высказывания[8].
Учитывая общий характер этой концепции языка и ее значимость для таких смежных дисциплин, как теория коммуникации, важно установить следствия приложения ее к синтаксическому изучению таких языков, как английский, или к формализованной системе математики. Всякая попытка построить грамматику с конечным числом состояний для английского языка с первых же шагов наталкивается на серьезные затруднения и сложности, которые читатель легко может себе представить. Однако нет необходимости иллюстрировать это примерами, поскольку существует следующее более общее утверждение, относящееся к английскому языку:
(9) Английский язык не является языком с конечным числом состояний. Это значит, что невозможно, а не только трудно построить механизм описанного выше типа (диаграмма вида (7) или (8)), который порождал бы все грамматически правильные предложения английского языка, и только их. Чтобы убедиться в справедливости утверждения (9), необходимо определить синтаксические свойства английского языка более точно. Ниже мы опишем некоторые синтаксические свойства английского языка, благодаря чему станет ясно, что при любых разумных ограничениях множества предложений языка утверждение (9) может считаться теоремой для английского языка. Возвращаясь к вопросу, поставленному в § 3.2[9], мы можем сказать, что утверждение (9) равносильно утверждению о невозможности установления морфемной структуры предложений непосредственно с помощью таких механизмов, как диаграмма состояний, и о неприемлемости, по крайней мере для целей грамматики, концепции языка, основанной на марковском процессе, описанном выше.
3.2.
Язык определяется путем задания его «алфавита» (т. е. конечного множества символов, из которых строятся его предложения) и его грамматически правильных предложений. Прежде чем приступить непосредственно к исследованию английского языка, рассмотрим несколько языков, алфавит которых содержит всего две буквы a и b и предложения которых определяются правилами (10 I—III):
(10) (I) ab, aabb, aaabbb и вообще все предложения, состоящие из n вхождений a, за которыми следуют n вхождений b, и только такие предложения;
(II) аа, bb, abba, baab, аааа, bbbb, aabbaa, abbbba,.. и вообще все предложения, состоящие из цепочки X, за которой следует «зеркальное отражение» X (т. е. Х в обратном порядке), и только такие предложения;
(III) аа, bb, abab, baba, аааа, bbbb, aabaab, abbabb,.. и вообще все предложения, состоящие из цепочки X (содержащей в некоторой комбинации буквы а и Ь), за которой следует точно такая же цепочка X, и только такие предложения.
Легко доказать, что каждый из этих трех языков не является языком с конечным числом состояний. Сходным образом и языки типа (10), в которых буквы а и b не следуют друг за другом, а включены в другие цепочки, также не являются языками с конечным числом состояний при весьма общих условиях[10].
Но ясно, что существуют части английского языка, имеющие структуру вида (10 I) и (10 II). Пусть S1, S2, S3,.. — повествовательные предложения английского языка. Тогда мы можем записать английские предложения так:
(11) (I) If S1, then S,.
„Если S1 то S2“.
(II) Either S3, or S4.
„Либо S,, либо S4“.
(III) The man who said that S5, is arriving today.
„Человек, который сказал, что S5, прибывает сегодня".
В (11 I) мы не можем поставить or вместо then, в (11 II) нельзя заменить or словом then, в (11 III) мы не можем поставить are на место is. В каждом из этих случаев существует некоторая зависимость между словами, стоящими по обе стороны запятой (т. е. if — then, either — or, man — is). Однако между взаимозависимыми словами мы можем вставить повествовательное предложение S1, S3, S5, и это повествовательное предложение может, разумеется, иметь вид одного из (11 I—III). Так, если принять, что в (11 I) S1 есть (11 II), a S3 есть (11 III), мы получим предложение:
(12) if, either (11 III), or S4 then S2
«если, либо (11 III), либо S4, тогда S2»,
a S5 в (11 III) может оказаться снова одним из предложений (11). Отсюда ясно, что в английском языке можно найти предложение a+S1+b, в котором существует зависимость между a и b, затем в качестве S1 выбрать другое предложение типа c+S2+d, в котором существует зависимость между с и d, а затем в качестве S2 выбрать еще одно из предложений такого типа и т. д. Множество предложений, образуемых таким способом (а мы видели из примера (11), что существует несколько возможных вариантов построения, причем (11) далеко не исчерпывает этих возможностей), обладает всеми зеркальными свойствами множества (10 II), исключающими его из совокупности языков с конечным числом состояний. Следовательно, в английском языке можно обнаружить различные модели, не отвечающие условиям конечного числа состояний. Все сказанное здесь является общим указанием на путь, следуя по которому можно представить строгое доказательство утверждения (9), если принять, что такие предложения, как (11) и (12), принадлежат английскому языку, а предложения, противоречащие указанным зависимостям (11) (например, either S1, then S2 «либо S1, то S2» и т. п.), не имеют места в этом языке. Заметим, что многие предложения типа (12) и т. п. выглядят весьма странно и необычно (их часто можно сделать менее странными, подставив вместо if «если» выражения whenever «всякий раз, когда», on the assumption that «в допущении, что», if it is the case that «если верно, что» и т. п. без изменения существа наших замечаний). Все это тем не менее грамматически правильные предложения, построенные по правилам настолько простым и элементарным, что самая примитивная грамматика английского языка непременно должна включать эти предложения. Их можно понять, и мы даже можем весьма просто определить условия, при которых они представляют собой истинные высказывания. Трудно представить себе сколько-нибудь основательные мотивы для исключения их из числа грамматически правильных предложений английского языка. Кажется, таким образом, весьма очевидным, что никакая теория лингвистической структуры, основанная исключительно на марковской и подобных ей моделях, не в состоянии объяснить способность говорящего по-английски производить и понимать новые предложения и вместе с тем отбрасывать некоторые новые последовательности как не принадлежащие языку.
3.3.
Предположим, что процессы построения английских предложений, подобные рассмотренным, могут осуществляться не более n-ного количества раз при некотором фиксированном n. Тем самым английский язык превратится, разумеется, в язык с конечным числом состояний (к тому же результату приведет, например, ограничение длины английского предложения миллионом слов). Такие произвольные ограничения не приносят, однако, никакой пользы. Важно то, что существуют процессы построения предложений, которые грамматики с конечным числом состояний в принципе не способны истолковать. Если эти процессы не имеют конечного предела, мы можем доказать буквальную неприложимость данной элементарной теории. Если процессы имеют предел, то построение грамматики с конечным числом состояний не является в буквальном смысле слова немыслимым, поскольку предложения можно перечислить, а список и есть по существу тривиальная грамматика с конечным числом состояний. Но такая грамматика окажется настолько сложной, что не будет представлять интереса и не принесет никакой пользы. Вообще допущение о бесконечности языка делается для упрощения его описания. Если грамматика не содержит рекурсивных механизмов (замкнутых петель, как в (8), для случая грамматики с конечным числом состояний), она оказывается недопустимо сложной. Если же в ней появляются некоторого рода рекурсивные механизмы, она порождает бесконечное число предложений.