Естественный язык и язык жестов в коммуникативной деятельности человека — страница 13 из 24

15.1. Постановка задачи. Назначение и содержательное наполнение базы данных

В настоящем разделе представлены идеология, структура и содержательное наполнение экспериментальной компьютерной базы данных «Тело и телесность в языке и культуре». Эта база была создана в Институте лингвистики РГГУ (Москва) небольшим исследовательским коллективом[140]. Она явилась одним из результатов работы над двумя связанными между собой научно-исследовательскими проектами[141]. Первый из них под названием «Части тела в русском языке и русской культуре» был закончен в 2010 году, и тогда же программистами Е. А. Клыгиной и Э. Е. Заришевой был разработан первоначальный макет представляемой здесь базы данных. При работе над вторым проектом — «Тело и его части в разных языках и культурах: типологическое описание» — выявилась необходимость корректировки и дополнения инструментария базы с целью приспособить ее к типологическим и контрастивным изысканиям.

Описываемая база задумана как компьютерная система, предназначаемая для ответа в автоматическом режиме на ряд вопросов, которые относятся к семиотической концептуализации тела и телесности. Мы стремились к тому, чтобы эта система была гибкой. Сказанное означает, во-первых, что в ней должны храниться сведения о теле, телесных объектах и о разных явлениях телесности применительно ко всем включенным в нее естественным языкам и языкам тела, а во-вторых, что систему можно сравнительно легко приспособить к новым языкам и соответствующим им языкам тела.

Информационные вопросы[142], которые разрешается задавать нашей базе данных, делятся на несколько групп.


1. Группа вопросов о соматических объектах

Она подразделяется на ряд подгрупп в зависимости от темы вопроса. В принципе, тема может быть достаточно произвольной, и поскольку в системе хранится информация, полностью описывающая каждый соматический объект, теоретически мы можем получить ответ на любой вопрос, заданный о том или ином объекте. Между тем мы считаем, что разумно задавать системе только вопросы строго определенной тематики, а именно те, которые сообщают человеку сведения, пополняющие его знания о семиотической концептуализации тела. Например, не имеет смысла задавать системе метаинформационные вопросы типа Что такое соматический объект? Каких признаков не бывает у соматических объектов? или Какие есть соматические объекты, обозначаемые пятибуквенными словами? Зато наша система умеет отвечать на вопросы, относящиеся к группе классификационных, в частности на вопрос Какие соматические объекты относятся к хранящимся в системе типам соответствующих объектов?, или на вопросы об именах соматических объектов, например Как называются соматические объекты, принадлежащие имеющимся в системе типам? Кроме того, в базе имеются средства, позволяющие отвечать на ряд других содержательных вопросов о телесных объектах или об их именах, например Какие значимые части выделяются в данном языке (или: в соответствующем языке тела) у данного соматического объекта? Как называются значимые части данного телесного объекта? Сюда же примыкает вопрос Какие соматические объекты принадлежат типу «части тела»?, или, проще, Какие имеются<в памяти системы> части тела?

Ответы на все подобные вопросы построенная база выдает в виде множества соматических объектов {рука, нога, голова…}. В то же время на вопросы Каковы имена соматических объектов из типа «части тела»? или Как называются части тела? ответы предполагаются в виде множества имен: {рука, ручонка, ручище, нога, ножка, голова, головушка…}[143].

Наша система приспособлена и к тому, чтобы отвечать на, так сказать, «противоположные» вопросы, то есть на вопросы о принадлежности данного соматического объекта тому или иному типу (или на аналогичные вопросы об их именах), ср. Какому типу соматических объектов принадлежит хрящ? Как называется тип соматических объектов, которому принадлежит кровь? Слово «волосики» — это название соматического объекта какого типа? или Каково имя типа соматических объектов, к которому относится объект с именем «пупок»? Первый из перечисленных вопросов — это вопрос о телесном объекте. Второй — об имени класса, в который входит указанный объект (в данном случае — кровь), а третий — об отнесении объекта с данным именем к конкретному типу соматических объектов. Наконец, четвертый вопрос — это вопрос об имени телесного объекта.

2. Вторая группа вопросов касается соотношения соматических объектов и их признаков. Это вопросы о том, какими признаками обладают те или иные объекты (аналогичные вопросы могут задаваться и об именах объектов), а также противоположные вопросы типа У каких соматических объектов есть данный признак? (то же — про названия объектов и признаков). Наша система отвечает, в частности, на вопросы Какими признаками обладает щека? Какие соматические объекты могут издавать звуки? или В каких соматических объектах звуки распространяются?

3. Третью группу составляют вопросы, темой которой являются значения признаков и имена этих значений. Наша система отвечает на вопросы типа Какие значения имеет признак «форма глаз»? или, более общо, Какие значения может иметь признак «форма соматического объекта»?[144]

Система знает, что значения некоторых телесных признаков делятся на содержательные группы. Так, мы уже писали (см. § 3 гл. II т. 1) о том, что различаются геометрические и негеометрические значения признака «форма» (например, одним из геометрических значений признака «форма щек» является /круглые/, а одним из негеометрических — /надутые/). Система умеет отвечать на вопросы типа Какие геометрические (или негеометрические) значения имеет форма щек? Точно так же, поскольку система знает, что у глаз бывает постоянный цвет (значения этого признака: /карие/, /голубые/, /черные/…) и переменный цвет (например, одно из его значений: /красный/), она отвечает на вопросы о значениях постоянного и переменного цвета глаз.

В ближайшем будущем мы надеемся обучить нашу систему отвечать на разнообразные вопросы о семантически и культурно выделенных значениях признаков, в частности на вопросы Какие значения данного признака являются семантически выделенными? Какие значения являются культурно выделенными? Какие из указанных значений могут выражаться в данном естественном языке или в данном языке тела?

4. Наконец, наша система отвечает на вопросы, связанные с характером, то есть с формой, смыслом, особенностями употребления, стилистическими свойствами и др. языковых и телесных знаковых выражений, которые отображают соматические объекты, их признаки и значения признаков. Поскольку значения многих признаков соматических объектов в разных языках выражаются прилагательными, в памяти системы хранится большое число сочетаний существительных с синтаксически подчиненными им прилагательными, которые обозначают значение признака или характеризуют сам признак. Впрочем, нередко выражения, которые характеризуют признак, и выражения, которые передают значение признака, бывают синонимичными. Ср. сочетания большой живот и большой размер живота; круглые глаза и глаза круглой формы — хотя в сочетаниях большой размер живота и глаза круглой формы прилагательные большой и круглый синтаксически присоединяются к именам признаков, семантически они выражают значения этих признаков. Иными словами, семантические и синтаксические сферы предикатов, выраженных прилагательными, здесь расходятся.

Завершая данный раздел, отметим важное свойство открытости обсуждаемой базы данных. Под открытостью мы имеем в виду возможность пополнения базы информацией, которая позволит системе отвечать на новые содержательные вопросы, относящиеся к телу человека и телесности. Например, здесь мы ничего не говорили о типах гипотетических вопросов, которые касаются жестов разных семиотических классов и в реализации которых участвуют те или иные соматические объекты.

В перспективе предполагается дополнить нашу базу данных другими (по сравнению с уже имеющимися) видами информации. Например, мы хотим (1) добавить к имеющимся в базе текстовым иллюстрациям графические, схематические или рисуночные, в частности ввести в базу изображения жестов, (2) снабдить построенную базу системой разнообразных стилистических помет и (3) пополнить ее удобными для доступа модулями, в которых бы описывались тело и телесные объекты отдельно мужчин и отдельно женщин, отдельно взрослых и отдельно детей и пр.

Разумеется, пока еще сложно сказать, какие в принципе могут понадобиться информационные блоки. Важно, однако, уже сегодня обеспечить ту степень гибкости и свободы, которая бы позволяла при необходимости пополнять систему без существенной перестройки ее внутренней структуры.

15.2. Компьютерная обработка запросов и возможности пользователя системы

Наша база данных расположена в Интернете на закрытом сайте[145]. Однако при обращении к системе с вопросами, или запросами, требуется знать особый пароль и ввести в систему имя пользователя.

При входе пользователю открывается меню с пятью типами запросов: (1) «определение типа соматических объектов, к которому данный объект относится»; (2) «поиск всех соматических объектов, обладающих данным признаком»; (3) «поиск всех признаков, которыми обладает данный соматический объект»; (4) «поиск всех значений для каждого из признаков, которыми обладает данный соматический объект» и (5) «установление соответствия между языковым выражением, содержащим имя данного соматического объекта, и определенным значением некоторого признака этого соматического объекта».

Поясним более подробно, как эти типы запросов обрабатываются системой.

1. Телесные объекты группируются в содержательные классы, или типы, по разным — структурным, физическим и функциональным — признакам. Примерами вопросов о типах телесных объектов являются предложения К какому типу телесных объектов относится палец руки? и К какому типу телесных объектов относятся ногти? Поскольку, как мы уже говорили, соматические объекты относятся к разным типам, но при этом деление на типы не является классификацией, ответов на вопрос о типе соматического объекта может быть несколько. Так, глаз — это и часть лица (то есть часть части тела), и орган <зрения>. Иными словами, глаз относится сразу к двум типам телесных объектов: первый характеризует глаз, так сказать, со структурной (морфологической) точки зрения, а второй — с функциональной. В построенной нами системе предусмотрены оба вида ответов на этот и подобные вопросы. Однако она может давать и дифференцированные ответы — в случае, если пользователь указывает в запросе вид признаков, по которым выделяется тип[146]. В данном случае, если запрос имеет примерно такой вид: К какому типу относится глаз со структурной точки зрения?, то ответ будет Часть части тела, а если К какому типу относится глаз с функциональной точки зрения?, то ответ будет Орган.

2. Пользователь может задать некоторый признак соматического объекта, например признак «форма», и обратиться к системе с просьбой выдать ему все соматические объекты, обладающие данным признаком. В ответ на вопрос о форме система выдает множество соматических объектов, которые обладают этим признаком: {рука, нога, голова, лицо, нос, …}, но в это множество не попадут, например, объекты из класса «телесные жидкости», потому что телесные жидкости формы не имеют.

3. Пользователь может, наоборот, попросить систему выдать ему все признаки, которыми обладает телесный объект «щека». В ответ система выдаст ему такое множество признаков: {«форма щек», «размер щек», «функция щек»,…}.

4. Человек может захотеть, чтобы система выдала ответ на вопрос Какие значения имеет признак «форма щек»?, и тогда он получит: {/круглые/, /надутые/, /впалые/, /втянутые/…}. На вопрос пользователя Какими значениями обладает признак «размер щек»? система сообщит ему: {/большие/, /огромные/…}.

5. Наконец, пользователь может обратиться к системе, задав ей некоторое языковое выражение, содержащее имя соматического объекта (в частности, войти в систему просто с одним-единственным словом, обозначающим соматический объект). Грамматическая форма выражения, подаваемого на вход, существенна, поскольку в систему пока еще не встроены блоки синтаксического и морфологического анализа. Поэтому система выдает только наиболее частотные способы выражения значения признака соматического объекта и при этом накладывает существенные языковые ограничения на вид запроса. Так, имя соматического объекта, если он непарный[147], должно быть в форме единственного числа именительного падежа (а в случае, если объект парный, такой как глаза, уши, ноздри и т. п., — в форме множественного числа). Глагол при этом должен быть в форме инфинитива несовершенного вида и т. п.

При реакции на запрос об установлении соответствия между языковым выражением, содержащим имя данного соматического объекта, и определенным значением какого-то признака этого объекта наша система ищет в памяти нужное языковое выражение, но находит его только в том случае, если оно отражает значение признака данного объекта. Тогда система ставит в соответствие вводимому языковому выражению множество значений признака данного объекта (в минимальном случае — одноэлементное множество). В случае, если системе задается просто имя соматического объекта, она ставит ему в соответствие множество всех значений всех признаков объекта — референта данного имени.

Приведем пример подобного запроса системе и ответа на него. Предположим, что некто обратился к системе с выражением сухая рука. Поскольку в памяти системы имеется признак «каритивность <руки>»[148], одним из значений которого является /сухой/, система установит соответствие между выражением сухая рука и этим значением признака.

15.3. Общая архитектура системы и ее внутреннее устройство

Поскольку обычный пользователь системы не обязан знать, как она устроена, данный раздел главы мы адресуем прежде всего тем людям, которым интересны технология построения и программирование баз данных.

С формальной точки зрения наша система представляет собой совокупность связанных друг с другом таблиц (их число на сегодняшний день — более 25). Каждая из таблиц имеет свою структуру и наполнение. Чтобы описать внутреннее устройство базы данных, следует, таким образом, охарактеризовать все таблицы по отдельности и эксплицитно указать связи между ними.

Чтобы не усложнять техническими деталями описание системы в целом, мы приведем здесь только основные таблицы, которые демонстрируют центральные элементы архитектуры системы, и раскроем некоторые важные связи между этими таблицами.

15.3.1. Внутреннее устройство таблиц

Среди основных таблиц есть та, в которой хранятся имена телесных объектов, причем не все возможные, а только стандартные, типовые. Другими словами, в этой таблице есть, например, слово голова (часть тела), но нет его словообразовательных производных, то есть слов головушка, головка и др. Имеется таблица, в которой хранятся имена признаков соматических объектов. Есть таблицы с информацией о наиболее частотных значениях каждого из признаков и о семантически и культурно выделенных значениях тех же признаков. Среди других таблиц системы отметим ту, в которой указаны возможные признаки обладателей соматических объектов.

Входом в каждую таблицу является кортеж, то есть упорядоченная последовательность, из нескольких элементов. Обязательными элементами каждого такого кортежа являются имя таблицы и идентификатор. Формально говоря, идентификатор — это множество, состоящее из трехэлементных кортежей (троек). В тройку входит порядковый номер элемента таблицы (это первый элемент кортежа), имя некоторой языковой или жестовой единицы, которая содержательно характеризует данную тройку (второй элемент кортежа), и название таблицы (третий элемент кортежа).

Пусть таблица имеет заголовок «имя соматического объекта». Ее идентификатором является множество троек следующего вида: <1, голова, имя соматического объекта>, <2, рука, имя соматического объекта>, <3, нога, имя соматического объекта>… [149]

Связи между таблицами также явным образом фиксируются в системе. Например, таблица с номером 1, которая называется «имя соматического объекта», связана с таблицей с номером 2 — «признаки соматического объекта», и связь этих таблиц эксплицитно отмечается при каждой из них.

15.3.2. Интерфейс

То, о чем мы говорили в предыдущем пункте, касается исключительно разработчиков системы. Обычный же пользователь обращается к интерфейсу, то есть к совокупности технических средств, которыми обладает система, для обеспечения взаимодействия пользователей с различными ее устройствами и программами.

Чтобы диалог человека с системой протекал более комфортно, нами были составлены инструкции с указанием того, что должен делать пользователь при появлении на экране определенных изображений. Эти изображения в нашей системе имеют вид особых бланков, обладающих в общем случае иной структурой, чем таблицы внутри системы. Эти бланки и проще, и нагляднее.

Каждая инструкция, в свою очередь, имеет вид последовательности команд, которые должен выполнить человек, желающий получить ответ на свой вопрос. Результаты поиска тоже помещаются в бланках, но другого рода, а именно в бланках запроса, каждый из которых состоит из двух столбцов. Левый, или первый, столбец у каждого бланка одинаковый и представляет собой меню запросов (меню включает в себя все те группы запросов, о которых мы говорили ранее). Правый, или второй, столбец у каждого бланка запроса в общем случае свой: его структура и наполнение зависят от выбранного типа запроса. В этом столбце пользователь формулирует свой запрос, после чего ждет от системы ответа.


Рис. 9. Бланк запроса


Рис. 10. Результаты поиска


Вот как примерно выглядит бланк запроса. Допустим, что человеку нужно найти некоторый соматический объект по определенному набору признаков. Он заходит в систему, и перед ним открывается страница с бланком запроса, как на рис. 9 выше[150]:

Как показывает правый столбец бланка, пользователь остановился на запросе «поиск всех признаков, которыми обладает соматический объект „язык“». Продемонстрируем кратко, что он увидит в пункте «Результаты» (столбец с таким пунктом имеет каждый бланк запроса).

Информация, которую получит пользователь (см. фрагмент бланка на рис. 9), читается следующим образом: объект «язык» обладает признаками «звук <языка>» (действительно, язык щелкает, цокает), «ориентация <языка>» (ср. показать язык 1 (имя жеста; кончик языка ориентирован на адресата)), показать язык 2 (свободное сочетание; например, человек показывает язык в кабинете врача; язык ориентирован на адресата), «размер <языка>» (длинный язык), «каритивность <языка>» (сухой язык), «избыточность <языка>» (влажный язык), «текстура <языка>» (шершавый язык), «толщина <языка>» (ср. сочетание толстый язык в предложении (1237) На стене ванной показывала толстый язык нарисованная смешная рожа (А. Лазарчук. Все, способные держать оружие…)[151]), «цвет <языка>» (малиновый язык; белый язык).

* * *

Выше была представлена компьютерная вопросно-ответная система, содержащая информацию о человеческом теле и различных явлениях телесности. Определено ее назначение, охарактеризовано внутреннее устройство и показаны информационные возможности системы. Построенная система является моделью семиотической концептуализации тела, причем моделью, относящейся не только к русскому языку и русской культуре, но и к другим языкам и культурам.

Принципиальными достоинствами системы являются, на наш взгляд, ее открытость и связанная с нею возможность ее коррекции и пополнения. В то же время она обладает по меньшей мере одним очевидным недостатком, а именно отсутствием встроенного грамматического анализатора, что резко ограничивает языковую свободу пользователя при формулировке запросов к системе.

Заключение