«Великолепный синтезатор речи от создателей знаменитого Dragon NaturallySpeaking, просто не умеющих халтурно работать, -- что и отразилось на общем уровне продукта. Электронные персонажи разговаривают почти естественно, и если бы не слабый эффект надрыва речи, иногда "всплывающий" на длинных фразах, то их вполне можно было бы спутать с живыми людьми. Вот что значит солидный словарь и запас фонем! Языков тоже поддерживается более чем достаточно -- целых 21, включая даже такие экзотические, как китайский, норвежский и корейский.
ScanSoft Katerina - один из лучших синтезаторов русской речи. Работает на основе SAPI5. Построен на базе женского голоса "Katerina". Обладает интонацией и разборчивостью речи. Поддерживает ускоренную запись в аудиофайл. Может читать и англоязычные тексты, однако произношение на редких словах может не соответствовать правильному.
Взято с сайта http://speech-soft.ru
Russian Milena
Она еще лучше чем её старшая сестренка Послушать, как она говорит, а за одно и как установить и где скачать можно в видео: Голосовой движок Russian Milena (Text-to-Speech Voice)
Бесплатные.
UkrVox
.
Ярослав Козак из Львова создал украинский синтезатор речи UkrVox.
Единственный известный мне украинский синтезатор речи. Т.к. я живу в\на Украине, то для меня существование синтезатора, который может преобразовывать украинский текст в член разборные звуки весьма важен. Возможно, для кого-то, актуальный, другие языки: белорусский, китайский, французский, чукотский и т.д. Не знаю, существуют, и если есть, то, какие синтезаторы на этих языках, если что ищите.
UkrVox – сделан, на удивление качественно. И по секрету говоря, является даже полиглотом, умеющим худо-бедно произносить не только украинский, но и русский, да и английский текст. К тому же он, насколько я понял, является бесплатным. Хотя, были какие-то нюансы при его создании…
Впрочем, вот описание с одного из сайтов:
«За основу украинского голоса взят голос знаменитого диктора украинского радио Игоря Мурашко.
От других украиноязычных читалок UkrVox отличается сильной лингвистической базой, десятками тысяч предустановленных базовых слов, поддержкой словообразования и морфологическим анализом текстов.
Основные свойства UkrVox:
— Интеграция в систему украинского голоса Speech API с возможностью его использования другими программами (читалками).
— Поддержка документов в форматах TXT и XML.
— Возможность регулирования скорости и громкости чтения.
— Возможность выбора качества генерируемого звука.
— Запись в аудио-файл в формате WAV, и проигрывания файлов WAV.
Дополнительные материалы
Рис. 45 как можно скачать UkrVox
http://programy.com.ua/ru/ukrvox/
Он идет вместе с простенькой программой по типу балаболки, так что, сразу же после установки, можно его и прослушать. Для скачивания нажать, не на «Скачать», а именно на UkrVox.
Надеюсь ссылка еще будет рабочая. Если нет, то можно скачать с других сайтов. Например http://softum.do.am/ . Вот прямая ссылка: «Скачати UkrVox — український Speech API для перетворення тексту в голос. - 3.83 MБ»
Рис. 46 Простенькая програмка которая идет вместе с UkrVox
RHVoice
Буквально, когда дописывал данную книгу, нашел этот синтезатор. В нем много разных голосов, есть как мужские, так и женские. Говорит он довольно сносно как на английском, так и на русском. А если учесть, что он бесплатный так и вовсе превосходно. Впрочем, вот описание с сайта и сслыки на скачивание. Цитирую:
«RHVoice — это многоязычный синтезатор речи с открытым исходным кодом, доступный в версиях для операционных систем Windows и Linux.
Разработчик синтезатора — Ольга Яковлева.
Дистрибутивы (Windows)
Синтезатор поставляется в двух видах — как SAPI5-совместимая самостоятельная версия и как модуль для бесплатной программы экранного доступа NVDA.
Последняя стабильная версия на данный момент — 0.2.161.
Обратите внимание, что начиная с версии 0.4 Alpha2 модуль для NVDA поставляется в новом формате (файл с расширением .nvda-addon).
Версия 0.2.161, установочный SAPI5-совместимый вариант
Версия 0.2.161, модуль для NVDA
Версия 0.4 Alpha 1, SAPI5-совместимый вариант
Версия 0.4 Alpha 1, модуль для NVDA
Версия 0.4 Alpha 2, SAPI5-совместимый вариант
Версия 0.4 Alpha2, модуль для NVDA» К. Ц.
Сейчас скачал одну из последних версий. Установил за пару секунд и наслаждаюсь прекрасным понятным и главное бесплатным голосом.
Рис. 47 Пример выбора одного из массы голосов NVDA в балаболке.
Кроссплатформенные.
Стоит помнить, что на самом деле, к сожалению, вряд ли есть кроссплатформенное ПО для синтеза речи. Т.е. программу, предназначенную именно для Windowsа, вряд ли удастся прямо и просто установить на андроид, не используя каких-то эмуляторов. Но есть компании, которые делают именно аналогичные голосовые синтезаторы для разных систем. Т.е. сам голос в них идентичен, а вот сборка и компиляция самой программы, в зависимости от операционной системы, разные.
Компании, занимающиеся синтезом речи.
Конечно, есть масса других голосовых движков разных фирм. Возможно, даже появились те, которые лучше используемых мною. Но, на то время, когда я искал, вышеописанные были оптимальными. Голос остальных существенно хуже. Хотя, отчасти это дело привычки.
Ссылки на сайты компаний, выпускающих коммерческие синтезаторы речи:
Acapela Group (Windows, Linux, Mac, а также для мобильных ОС Android u IOS.), Alfanum , Cepstral , CereProc , Innoetics , IVONA , NeoSpeech , Nuance (Windows, Linux, Mac, а также для мобильных ОС Android u IOS.), ESpeak (работает в Microsoft Windows, Mac OS X, Linux, RISC OS), Festival (Linux) безплатна , RHVoice (Windows и Linux) безплатна открытый код. Вполне понятный голос. Можно скачать прямо с сайта. Без регистрации.
Информация взята с сайта балаболки и сайта wd-x.ru.
Хочется еще раз отметить, что некоторые, а возможно и все, компании выпускают не только голосовые движки, под разные операционные системы, но и программы синтеза речи. Впрочем, как это ни странно, эти платные программы, как правило, значительно уступают по функционалу и гибкости настроек бесплатной балаболки. Так что целесообразнее использовать именно голосовые модули вышеперечисленных фирм в программе балаболка, или их бесплатные аналоги.
Тут должна быть табличка…
Резюмируя, вышенаписанное хотелось бы все токи его систематизировать и привести информацию в виде таблицы в столбцах, которых будет название компании, выпускающей синтезатор, название синтезатора, его платность\ бесплатность, качество произношения (условно), операционная система под которой он работает, размер файла при скачивании и после установки, и др.
Увы, пока нет времени делать такую табличку, может, кто найдет или сделает, по возможности, вставлю в книгу. А еще лучше, если бы она появилась в Википедии: таблица сравнения синтезаторов речи. Но еще погуглю, может уже, где-то и появилась.
Нюансы и мелкие хитрости.
Комбинации клавиш.
Если кто не знает, или до сих пор не понял, во многих операционных системах при нажатии ОДНОВРЕМЕННО нескольких определенных клавиш, может произвестись какое-то действие. Это бывает очень удобно и значительно ускоряет, а также упрощает работу. Работу не только с голосовыми синтезаторами, но и любыми программами на ПК. Помимо компьютеров, такие возможности есть и на смартфонах. К сожалению, не для любых программ удается настроить горячие клавиши. Тем не менее, настройку горячих клавиш условно можно разделить на две группы по двум основным критериям. Первый критерий — это то, где будут срабатывать клавиши и второй можно ли их настроить.
По срабатыванию
можно разделить на глобальные и локальные. Глобальные срабатывают в любой программе, а локальные только в той в которой они были настроены.
По возможности настройки.
Общепринятые. Те, которые по умолчанию работают на любой именно однотипной системе. Например, если я знаю, что Ctrl+C это комбинация для копирования на видновс, то она сработает на любом виндовсе. И у меня в дома и на работе, и у друга, и на 7 и на 10 и на хр.
Настраиваемые. Как правило, их можно настроить, используя какие-то свои уникальные комбинации. Например, у меня при нажатии Ctrl+D или Alt+Win+D после копирования произносится выделенный текст. На других компьютерах, где это сочетание не настроено, оно естественно не сработает. Критерии, описанные выше, могут комбинироваться. Рассмотрю лишь некоторые комбинации.
Глобальные. Общепринятые.
К сожалению, я не припомню общепринятых комбинаций клавиш, связанных непосредственно с голосовыми синтезаторами. Надо будет погуглит. Возможно, их и нет. Работа с синтезаторами речи, увы, до сих пор не сильно распространена. Тем не менее, есть универсальные комбинации для работы с текстом. Как уже писал, они срабатывают на разных операционных системах от Microsoft (хр, 7,10 и др.) и на большинстве линуксах. Правда, экзотичный Мака и подобные …, и тут, зачем-то выделились. Там какие-то другие, свои комбинации ((. Поэтому их трогать не буду. Разберу клавиши, которые должны сработать без всякой настройки на большинстве нормальных операционных систем. Раз они глобальные то будут работать, во всех нормальных программах (офис, интернет обозреватель, графический редактор, проводник и др.).
Как уже писал в самом начале, используя "Назад" (Alt-влево) и "Вперед" (Alt+вправо) можно произвести переход обратно, при нажатии на гиперссылку, в тексте ведущую на какое-то конкретное место в документе. Например, можете попробовать (если читаете с ворда на ПК) нажать на какой-то пункт в содержание, потом нажать Alt -влево. Если разработчики не надумают что-то поменять, и сделаете все верно, то должно сработать. Но это работает, если ссылка ведет на фрагмент текста внутри документа. Если она ведет на страницу интернета, или на другой документ, папку, то надо на самой ссылке, удерживая на клавиатуре клавишу «Ctrl», нажать на ссы