Код буквы и картинки – книга глазами ЭВМ.»
Пару слов о онлайн сервисах.
Решил влепить сюда небольшой подраздел, по теме распознания книг и конвертирования. Я не сторонник онлайн сервисов, но вдруг кому пригодиться. Или кто-то перед скачиванием программы что бы не тратить время захочет попробовать распознать пару страниц и переконвертировать. Так сказать, испытать свои силы.
Навскидку нашел пару неплохих статей, с обзорами нескольких онлайн сервисов распознания текста. В этой: «Онлайн распознавание текста — ТОП-3 сервиса», в конце есть видео. А в этой: «Онлайн-сервисы для распознавания текста», описано все довольно детально, хотя ссылки на картинки, по-видимому, уже битые. На первом месте, как офлайн, так и онлайн сервис компании файный ридер: FineReader Online. К сожалению, онлайн версии, как этой, так и других программ, аналогично многим сервисам онлайн, ограниченные и урезанные, по сравнению с теми, которые можно запустить с ПК. Поэтому если вам надо пару страничек распознать, попробовать, побаловаться, то все же лучше воспользоваться офлайн и желательно портативной версией. А это крайний случай, для самых ленивых и неумелых. Сервисы сегодня работают, а завтра могут оказаться не рабочими, либо добавят новые ограничения, которые вас неприятно удивят и сведут все ваши труды на нет. Хотя ради справедливости отмечу что мне удалось найти парочку онлайн сервисов, которые превзошли своих офлайн собратьев. Например, сервис по компиляции книг с FB2 в ворд, https://convertio.co/ru/fb2-docx/ с сохранением форматирования, закладок и т.д.. Но это уже другая тема. Раньше именно для конвертации, мне приходилось пользоваться ICE Book Reader (портативной версией). Крутая, навороченная программа, но по сути заточена для прочтения глазами с экрана, а функция конвертера лишь как дополнительная. Поэтому, как я не мучился перебирая все настройки, так и не удалось добиться, что бы она хорошо «вытягивала» текст с FB2, сохраняя всё форматирование, заголовки, картинки. А вот сервис, приведенный мною, выше оказался лучше программы. Конечно в современных дивайсах книги прорабатывают в основном именно в FB2, но, на сколько мне известно, этот формат не предназначен для редактирования и не так гибок, как гигант – ворд. Поэтому рекомендую сводить все книги именно к docx формату. Хотя, можно на всякий случай держать их и в pdf.
Общие моменты.
На том, как сбрасывать книги на мобильный, пока останавливаться не буду. Есть масса способов. Все зависит от дивайса и установленных программ. Я лично для этого использую блютус, чтобы ни расшатывать порты и лишний раз не дергать карту памяти. Хотя, если файлов много, и они большие, то целесообразнее воспользоваться картридером, и вытянуть карту. Вариантов масса. Надеюсь, трудностей не у кого не возникнет. Кроме счастливых обладателей новых дивайсов с андроидом, в которых появилось нововведение невозможности полноценно расшарить папки через блютус стандартными средствами. Вот вам, очередное доказательство «прогресса» технологий. Там приходится использовать по старинке кабель, или ставить доп. софт расшаривая вайфай.
Перейду непосредственно к программам синтеза речи. Благо они появляются на разных устройствах и работают под различными операционными системами.
Но прежде чем перейти отдельно к операционным системам стоит отметить, что практический во всех программах синтеза речи есть один существенный нюанс. А именно то, что, скорей всего, придётся установить отдельно программу, и отдельно синтезаторы речи.
Покажу на примере Windows, и надеюсь, что подобный хотя бы такой ДОРАБОТАННЫЙ софт появится и на линуксе. Что бы можно было назначать горячие клавиши и тукать на кнопочки, а не писать команды в консоле.
Синтезатор речи (голоса).
Собственно, сам синтезатор речи еще называют «голосовым движком», «голосовым модулем». Аналогия не случайна. Он, как и двигатель в машине, обеспечивает её работу, оставаясь скрытым под капотом. Так же и сам синтезатор не видно. Хотя конечно можно найти его файлы, но он, как правило, не имеет какого-то окна и иногда узнать, что он установлен правильно можно либо зайдя в программу для синтеза речи, либо зайдя в системные настройки и проверив. Иногда примитивный синтезатор речи уже встроен в систему (см. рис. ниже). Но в основном он умеет говорить только на английском и ужасно.
Рис. 34 Стандартное распознание речи в виндовс 7.
Рис. 35 Преобразование текста речи в виндовс 7.
Рис. 36 Настройки произношения в виндовс 7.
Программа синтеза речи.
Программа обеспечивает удобства работы синтезатора. Еще их называют TTS-программы от английского Text-To-Speech (дословно переводится как «текст в речь»). Как правило, такая программа имеет графический интерфейс, т.е. привычное окошко с кнопочками, разные настройки и функции: пауза, чтение с буфера обмена, таймер и многое другое. Программа синтеза речи — это как бы шкурка и одежка для голосового движка.
Рис. 37 Голосовые движки в программе синтеза речи на примере «Балаболки».
Почему бы не сделать синтезатор и программу в одном комплекте?
Меня не однократно мучал данный вопрос. Хотелось бы, что бы был просто один файл, желательно портативный. Что бы этот файл можно было бы настроить под себя и запускать с флешки практический на любом ПК. Увы, насколько я знаю, пока такого нет. Скорей всего это связано с тем, что создавать готовую программу с уже встроенным синтезатором не практично, т.к. синтезаторы бывают разные, да и программы. Зачем мне, к примеру, синтезатор польской или китайской речи. Чаще всего мне встречаются русские тексты, да и я пишу на русском, поэтому естественно нужен русский синтезатор речи. Хотя иногда пользуюсь и украинским, поэтому нужен и украинский. Возможно, кому-то нужен английский. А сама программа синтеза речи (внешняя оболочка) может работать с разными языками. К тому же разные синтезаторы имеют голоса разного качества и пола. Есть мужские, голоса. Т.е. текст, будет воспроизводиться мужским голосом или женские – женским. В хороших программах скорость, тон и др. характеристики голоса можно выбирать самому.
В общем, программы можно комбинировать с разными синтезаторами, возможно именно поэтому, и не делают один пакет. Т.е. используя отдельно движки и отдельно программы синтеза (шкурки), удается более гибко комбинировать и пользоваться разными возможностями любимой программы для синтеза речи, с тем языковым движком, который вам больше подходит, а не с тем, который бы шел в её комплекте.
Впрочем, все равно надеюсь можно хотя бы сделать портативный голосовой движок с настройками. Портативные программы для синтеза уже существуют. И носить эту пару программ на флешке. Но пока такого нет. Портабилизировать движок сложнее программы.
Резюмируя.
Это все может показаться сложным. Но на самом деле нет ничего сложного. Googlим в интернете программу (оболочку) для синтеза речи и голосовой движок: сам синтезатор, того языка, который вам нужен. Скачиваем. Устанавливаем, и то и другое. Открываем программу синтеза речи. Выбираем и при желании настраиваем в ней сам синтезатор. И все! Можно слушать ЛЮБОЙ текст, на котором говорит ваш синтезатор. Более того, появляются синтезаторы, которые без переключения могут говорить сразу на нескольких языках. Либо вы можете установить несколько голосовых модулей (движков).
Синтез речи в разных ОС
.
Windows
.
В принципе про него я достаточно написал выше, и еще упомяну в теме «Жесты мыши», так что, думаю, нет повода писать отдельный раздел. Хотя, наверно, упомяну коротко о программах. Т.к. из-за популярности данной системы наверно пока все еще хороших аналогов на других ОС нет.
Программы синтеза речи
.
Говорилка
- старенькая бесплатная программа для синтеза речи. Даже не знаю, она сейчас обновляется или нет.
Балаболка
- отличная, так же бесплатная программа. Я ею постоянно пользуюсь. Программа имеет, дружелюбный интерфейс и массу функций и настроек.
Рис. 38 окно программы «Балаболка».
Ссылки на балаболку и другие:
Страница с ссылками http://bolgarchukr.blogspot.com/2017/01/blog-post_29.html
Скачать Балаболку можно тут http://www.cross-plus-a.ru/bportable.html
Ссылка на сайт обсуждение программы http://mytts.forum2x2.ru/t7-topic
Программа для чтения субтитров.
Данные программы, не относятся непосредственно к прослушиванию цифровых книг, тем не менее, раз зашла речь о программах синтеза речи то стоит упомянуть и их. К тому же данная функция является весьма полезной и удобной, жаль, что ею мало кто пользуется.
ABM
Subtitles
Reader
Старая, но весьма удобная разработка. Конечно, для полноценной работы, возможно, придется немного попыхтеть, да и эстеты скорей всего все равно будут не в восторге, но простым сельским парням, которые смотрят научные видеоконференции и др. материал на буржуйских языках, желающих не читать, а слушать, вникая в суть на родном языке, возможно, будет весьма кстати.
Работать с ней не трудно. Интерфейс русский и понятный. Для начала нам потребуется видео файл и собственно файл субтитров.
Убеждаемся, что нужный голос установлен и отображается в программе.
Рис. 39 выбор голоса в ABMSubtitlesReader
Открываем файл субтитров. Для чего в программе жмем открыть.
Рис. 40 Открытие файла с субтитрами.
Как правило, у субтитров расширение str, но может быть и другое, скорей всего программа его поймет.
Если все получится, то в окне пустой таблицы появятся субтитры, которые и будет произносить программа с привязкой к времени. Время указанно в первой колонке таблицы.
Остается только запустить видео ОДНОВРЕМЕННО с произношением. Т.е. что бы то что произносит программа совпало с видеорядом.