ких (требуется память менее чем на 300 звукосочетаний типа СГ и ГС и около 100 звукосочетаний со сложными консонансами).
Несколько моделей машинок, пишущих с голоса, сконструировал научный сотрудник Женевского университета Дрейфус-Граф. Текст читают в микрофон. Звуки, из которых состоят слова, анализируются электронным "мозгом", и каждый звук превращается в электрический сигнал. Эти сигналы приводят в действие рычаги электрической пишущей машинки. Как утверждает изобретатель, последнюю модель его пишущей машинки можно "научить" писать со скоростью стенографистки высшей квалификации.
Над созданием пишущих машинок, печатающих под диктовку, работают и советские ученые ряда научно-исследовательских организаций. Достигнутые в последние годы успехи в этой области позволяют надеяться, что в ближайшее время появятся сначала промышленные образцы фонетических машинок, затем будет организован серийный выпуск пишущих машинок-автоматов, обеспечивающих правильную орфографию. А отсюда уже один шаг до устройств, которые станут составной частью переводческих машин. Когда же наши машины в достаточной степени обогатят свой словарный запас — а это время, надо полагать, недалеко, — они смогут производить синхронный перевод на несколько иностранных языков.
Впрочем, автомату-переводчику придется различать не только чужую речь, но и говорить самому.
Однажды Норберт Винер сказал:
"Вполне возможно, чтобы человек разговаривал с машиной, машина — с человеком и машина — с машиной".
С тех пор прошло около 20 лет. Первая часть предвидения ученого близка к осуществлению. А что делается или что уже сделано ныне для реализации второй части предсказания отца кибернетики о возможности разговора между машиной и человеком?
"Я спросил:
— Были вы рады дождю, который прошел сегодня после полудня? Он ответил:
— Нет, я люблю больше солнечную погоду.
— В жаркую погоду человеку нужна по крайней мере одна ванна в день, — заметил я.
— Да, я как раз был на улице и изнемогал от жары, — последовал ответ.
— Когда придет рождество, будет холодная погода, — глубокомысленно заметил я, пытаясь поддержать разговор.
— Холодная погода? — переспросил мой собеседник. — Да, обычно в декабре морозно.
— Сегодня ясная погода, — гнул я свою линию. — Как вы думаете, долго ли она будет продолжаться?
— Позвольте мне не лгать, — взмолился мой собеседник, сбитый с толку столь противоречивыми высказываниями. Как же дождливая погода может быть ясной? "
Говорят, этот разговор состоялся в Университете в Торонто между канадским ученым Берклеем и электронной вычислительной машиной. В ее "память" ввели триста английских слов и научили поддерживать несложную беседу.
За достоверность приведенного диалога мы не ручаемся. Но если бы вы, читатель, лет пять назад заглянули в одну из комнат Института электроники, автоматики и телемеханики Академии наук Грузинской ССР, то вы бы увидели оригинальную экспериментальную машину, которую ученые назвали "синтезатором человеческой речи". Машина сама формировала отдельные звуки речи — фонемы — и, строго придерживаясь законов фонетики, составляла из них отдельные слова и даже целые фразы. И несмотря на младенческий возраст, она научилась говорить разными голосами — мужским, женским, детским. Она одинаково легко и внятно произносила одно слово "мама" и целую фразу на грузинском языке, которая в переводе означала: "Будь внимательна, дорогая Нона!" Этими словами машина напутствовала молодую грузинскую шахматистку Нону Гаприндашвили, когда та собиралась на международный турнир. Экспериментаторы научили машину четко произносить также несколько фраз на русском языке, например: "Наша машина училась, она узнала жизнь". Хоть все эти фразы были заложены в память машины в виде шутки, но за достоверность того, что она их внятно и четко произносила, мы ручаемся.
Аналогичные устройства, но со значительно большим словарным запасом разрабатываются сейчас в США и ряде других стран с использованием методов синтеза речи из слоговых и из фонемных сегментов. Оба метода пока конкурируют друг с другом. Для передачи фонемных сегментов служит созданное для применения в технике дальней связи устройство "Вокодер", в котором место микрофона занимает "пишущая машинка" для подачи электрических импульсов. Специально обученная машинистка нажимает на клавиши, соответствующие определенным фонетическим знакам. Скорость "печатания" должна быть равна скорости речи. Получается своеобразный "разговор руками". Для передачи слоговых сегментов применяют специальную перфорированную ленту с кодированными номерами сегментов. Эта лента подготавливается на буквопечатающем аппарате со слоговым анализатором, группирующим буквы в слоги и выдающим соответствующий номер сегмента. На приемном конце по сигналам, приходящим из памяти, выдаются в усилитель соответствующие сегменты, и синхронизатор объединяет их в слова. Качество речи пока получается недостаточно высоким из-за стыковых явлений.
Рис. 8. Видиограмма записи гласных у, о, а, э, ы, и (по А. Митронович-Моджеевской). Видны отдельные верхние тона
Применяются также синтезаторы речи, построенные на принципе синтеза речи по формантам и использующие электрический эквивалент речевого аппарата. Для их построения требуется устройство для перевода печатного текста в кодовые комбинации для управления эквивалентом речевого аппарата. Если повторяющиеся импульсы генератора подать на цепочку контуров, каждый из которых может настраиваться на соответствующую частоту, то удается создать довольно разборчивую искусственную речь.
Весьма распространенным является анализ звуков по данным динамических спектров видимой речи.
Принцип метода состоит в следующем. Изменение спектральных характеристик речевого потока исследуется при помощи динамических спектрографов "видимой речи". Анализатор "видимой речи" изображает речь в виде динамической картины изменения интенсивности во времени в частотных полосах — как распределение оптической плотности на фотографической пленке. Формантные области выделяются как области интенсивного почернения. Электроакустический анализ гласных при помощи динамического спектрографа "видимой речи" показан на рис. 8.
Если применить фотоэлемент, преобразующий изменения светового потока в изменения электрического тока, то можно получить электроакустическую картину изменения спектра во времени.
Рис. 9. Схема звукового спектрографа
На рис. 9 показана схема звукового спектрографа К. Поттера (1945 г.). Голос, поступивший в микрофон, пропускается через набор полосовых фильтров, и выходные напряжения каждой полосы используются для управления яркостью маленьких лампочек, излучение которых оставляет следы на движущейся светочувствительной ленте. В полученной записи по оси ординат — частота, по оси абсцисс — время, а интенсивность звука выражена плотностью почернения светочувствительной эмульсии.
Процесс обучения машины нередко сравнивают с обучением ребенка. Но ребенок, как известно, первым делом начинает понимать слова, потом учится говорить и лишь много позже — читать. С машинами пока что все происходит наоборот. "Работоспособные" читающие автоматы уже созданы, автоматы, умеющие слушать и распознавать человеческую речь, находятся в зените эксперимента, а вот говорящие машины пребывают еще в зачаточном состоянии. Сегодня диалог человека с машиной еще невозможен.
А для чего, собственно, нужен такой разговор?
Как уже говорилось выше, операторы и диспетчеры имеют ныне дело с большим количеством разнообразных сигналов, подаваемых на пульт управления. Одновременное наблюдение за многими приборами становится подчас затруднительным. Снижается быстрота реакции на сигналы, совокупность которых (ее принято называть, как вы знаете, информацией от машины к человеку) представляет собой определенный код, который приходится расшифровывать. А куда проще узнать прямо от говорящего пульта, например, о режиме работы какого-нибудь агрегата, машины, системы или о причинах и точном месте аварии, чем определять все это по оптическим и акустическим сигналам. Кроме того, "говорящие автоматы" могут войти составной частью в вычислительные машины, выступающие на производстве в роли советчика мастера или оператора. Оператор обратится с вопросом к такой машине, а та быстро вычислит необходимые данные и тут же голосом даст ответ либо отпечатает его на машинке. А оператор, в зависимости от обстановки, примет решение, как лучше, оптимальнее вести процесс.
Мы уже привыкли к тому, что, набрав по московскому телефону номер 100, слышим монотонный голос: "Десять часов две минуты". Это простейший говорящий автомат точного времени — автоответчик со сменными записями на магнитной ленте. Но скоро на помощь человеку придут справочные быстродействующие электронные машины — звуковые энциклопедии. По устному запросу человека (например, по телефону) машина мгновенно отыщет нужную информацию и ответит на вопрос из области науки, культуры, быта...
В дальнейшем, по-видимому, говорящие машины найдут широкое применение и в связи. Если из речи автоматически выделять на входе характерные признаки фонем и передавать только эти признаки, а на выходе по ним восстанавливать речь, то ширину канала связи можно сократить в несколько сот раз. Значит, по одной и той же линии сможет вести переговоры значительно большее число людей.
Пройдут годы, и к таинственным планетам солнечной системы устремятся пилотируемые космические корабли. Немало опасностей будет поджидать космонавтов, которые первыми увидят новые, неизвестные миры, и, вполне возможно, что разведчиками, предупреждающими людей о грозящих опасностях, будут говорящие роботы, роботы-друзья... "Здесь температура — 105°... Сюда можете ступать смело... Здесь зыбкая поверхность, обойдите..." — нечто подобное смогут услышать космонавты от передвигающихся впереди роботов и своевременно предпринять те или иные действия. Это пока еще фантастика. Но не так уж далеко то время, когда умеющие слушать и говорить машины будут помогать нам быстро и на большом расстоянии голосом управлять движением поездов и самолетов, подводных и надводных кораблей, тракторов и комбайнов, будут подавать команды автоматическим станкам, цехам-автоматам с единого диспетчерского пункта завода. Все это — завтрашний день нашей науки и техники.