Синтез речи из текста с помощью яндекс speechkit

Предыстория: «Проект PX»

Ещё в 1998 году в Принстонском университете проходил семинар «Проект PX» (Project PX), посвящённый высокой скорости чтения. Эта статья — выдержка сведений из того семинара и личный опыт ускорения чтения.

Итак, «Проект PX» — это трёхчасовой когнитивный эксперимент, который позволяет увеличить скорость чтения на 386%. Он проводился над людьми, разговаривающими на пяти языках, и даже страдающие дислексией обучались читать до 3 000 слов технического текста в минуту, 10 страниц текста. Страница за 6 секунд.

Для сравнения: средняя скорость чтения в США составляет от 200 до 300 слов в минуту. У нас в связи с особенностями языка — от 120 до 180. И вы вполне можете увеличить свои показатели до 700–900 слов в минуту.

Всё, что нужно, — это понять, по каким принципам работает зрение человека, на что попусту тратится время в процессе чтения и как перестать его тратить. Когда мы разберём ошибки и потренируемся их не делать, вы будете читать в несколько раз быстрее и не бездумно пробегая глазами, а воспринимая и запоминая всю прочитанную информацию.

ЛитРес

Крупная интернет‑библиотека с объёмной коллекцией книг: здесь больше миллиона изданий и 48 000 из них доступны бесплатно. Здесь и современная художественная литература, и классика, и пособия по саморазвитию и обучению — выбор огромен.

Свежие произведения, как несложно догадаться, находятся в разделе «Новинки». Правда, в мобильном приложении их нельзя рассортировать по жанрам — такая возможность присутствует только в веб‑интерфейсе.

Кстати, на «ЛитРес» вы можете получить книги в аренду на две недели бесплатно. Для этого вам понадобится специальный читательский билет с логином и паролем, который можно получить в районной библиотеке. Список учреждений, где это можно сделать, доступен здесь.

Загрузить

Цена: Бесплатно

Загрузить

Цена: Бесплатно

О преобразовании текстов в звук

Люди давно практикуют прослушивание текстов вместо их чтения. Причиной тому — и природная лень, и нежелание напрягаться, и забота о сохранении зрения, и русские романтические традиции, воспетые еще А. С. Пушкиным в своих детских воспоминаниях о няне из стихотворения Сон:

И шепотом рассказывать мне станет
О мертвецах, о подвигах Бовы…

Как и во многих отраслях современной промышленности, информационные технологии в деле чтения пришли на помощь продолжателям дела пушкинской няни. Сегодня с переводом текста в речь, кроме приложения Balabolka, справляются аналогичная по возможностям Govorilka, текстовый редактор Демагог, ридеры Tom, Cool и Ice Book.

Самым ленивым и требовательным к качеству воспроизведения речи читателям, точнее слушателям, лучше других бесплатных программ подойдет русская версия Balabolka. Эта программа не без недостатков, но все-таки самостоятельно почитает вслух как простой текст, так и более продвинутые форматы оцифрованных книг. Попробуйте последнюю версию Балаболки скачать с голосовыми движками, говорящими на русском языке, записать из программы MP3 и послушать на любом совместимом устройстве любимые произведения классиков или современную прозу по пути в офис, в спортзале, в очереди или перед сном. На мамину или нянину сказку на ночь это, конечно, похоже не будет, но воспринимается такая машинная декламация компьютерным голосом вполне нормально.

Текст Тотального диктанта, который читает Алиса

Часть 2. День

…За годы учительства, каждый из которых напоминал предыдущий и ничем особенным не выделялся, Якоб Иванович настолько привык произносить одни и те же слова и зачитывать одни и те же задачки, что научился при этом мысленно раздваиваться внутри своего тела: язык его бормотал текст очередного грамматического правила, рука зажатой в ней линейкой вяло шлепала по затылку чересчур говорливого ученика, ноги степенно несли тело по классу ‒ от кафедры к задней стене, затем обратно, туда-сюда. А мысль дремала, убаюканная его же собственным голосом и мерным покачиванием головы в такт неспешным шагам.

Немецкая речь была единственным предметом, во время которого мысль Баха обретала былую свежесть и бодрость. Начинали урок с устных упражнений. Ученикам предлагалось рассказать что-либо, Бах слушал и переводил: перелицовывал короткие диалектные обороты в элегантные фразы литературного немецкого. Двигались не спеша, предложение за предложением, слово за словом, будто шли куда-то по глубокому снегу – след в след. Копаться с азбукой и чистописанием Якоб Иванович не любил и, разделавшись с разговорами, торопливо стремил урок к поэтической части: стихи лились на юные лохматые головы щедро, как вода из лоханки в банный день.

Любовью к поэзии Баха обожгло еще в юности. Тогда казалось: он питается не картофельным супом и квашеной капустой, а одними лишь балладами и гимнами. Казалось, ими же сможет накормить и всех вокруг – потому и стал учителем. До сих пор, декламируя на уроке любимые строфы, Бах все еще чувствовал прохладное трепетание восторга в груди. Дети страсти педагога не разделяли: лица их, обычно шаловливые или сосредоточенные, с первыми же звуками стихотворных строк приобретали покорное сомнамбулическое выражение. Немецкий романтизм действовал на класс лучше снотворного. Пожалуй, чтение стихов можно было использовать для успокоения расшалившейся аудитории вместо привычных криков и ударов линейкой…

Текст взят с сайта Тотального Диктанта https://www.totaldict.ru/dictants/uchitel-slovesnosti/

Краткое описание и обзор навыка Алисы «Тотальный диктант»

14 апреля 2018 года Алисе было поручено читать 2-ю часть диктанта «Учитель словесности» в Новосибирском государственном университете. Приняло участие 227 325 чел. по всему миру

Алиса читает текст по частям (следует отметить, что речь голосового помощника практически не отличима от человеческой). Сначала голосовой ассистент начитывает предложение полностью, далее читает по-частям и в конце — повторяет снова все предложение для проверки. Скорость написания вы регулируете самостоятельно через команду «Дальше» или «Повтори».

Для тех, кто хочет проверить себя после диктанта, ищите текст, надиктовываемый Алисой, внизу данной статьи.

Программы для чтения текста голосом

1. IVONA Reader

Сайт разработчика: www.ivona.com/

Одна из самых лучших программ для озвучивания текста.Позволяет вашему ПК читать не только простые текстовые файлы в формате txt, но и новости, RSS, любые веб-страницы в интернете, электронную почту и пр.

Кроме того, позволяет преобразовать текст в mp3 файл (который вы потом можете загрузить на любой телефон или mp3 плеер и слушать в дороге, например). Т.е. вы можете самостоятельно создавать аудио-книги!

Голоса программы IVONA очень похожи на реальный голос, достаточно не плохое произношение, не запинаются. Кстати, программа может быть полезна для тех, кто изучает иностранный язык. Благодаря ней можно слушать правильное произношение тех или иных слов, оборотов.

Поддерживает SAPI5, плюс к этому хорошо кооперируется с внешними приложениями (например, Apple Itunes, Skype).

Пример (текст воспроизведения одной моей недавней статьи)

Из минусов: некоторые незнакомые слова читает с неправильным ударением и интонацией. В целом же весьма не плохо, чтобы прослушать, например, параграф из книги по истории, пока идешь на лекцию/занятие — даже более чем!

2. Балаболка

Сайт разработчика: www.cross-plus-a.ru/balabolka.html

Программа «Балаболка», главным образом, предназначена для чтения вслух текстовых файлов. Для воспроизведения текста нужны, помимо программы, голосовые движки (синтезаторы речи).

Воспроизведение речи можно контролировать при помощи стандартных кнопок, подобных тем, что присутствуют в любой мультимедийной программе («воспроизвести/приостановить/остановить»).

Пример воспроизведения (тот же):

Минусы: некоторые незнакомые слова читает не правильно: ударение, интонация. Иногда, пропускает знаки препинания и не делает паузы между словами. Но в целом слушать можно.

Кстати, качество звучания сильно зависит от речевого движка, поэтому, в одной и той же программе звук воспроизведения текста может отличаться в разы!

3. ICE Book Reader

Сайт разработчика: www.ice-graphics.com/ICEReader/IndexR.html

Отличная программа для работы с книгами: чтение, каталогизирование, поиск нужной и пр. Помимо стандартных документов, которые могут читать и другие программы (TXT-HTML, HTML-TXT, TXT-DOC, DOC-TXT, PDB-TXT, LIT-TXT, FB2-TXT и т.д.) ICE Book Reader поддерживает файлы форматов: .LIT, .CHM и .ePub.

К тому же ICE Book Reader позволяет не только читать, но и отличная настольная библиотека:

— позволяет хранить, обрабатывать, каталогизировать книги (до 250000 тысяч экземпляров!);

— автоматическое упорядочивание вашей коллекции;

— быстрый поиск книги из вашей «свалки» (особенно актуально, если у вас много не каталогизированной литературы);

— ядро базы данных ICE Book Reader превосходит большинство программ подобного рода.

Так же программа позволяет озвучивать тексты голосом.

Lkя этого нужно зайти в настройки программы и настроить две вкладки: «Режим»(выбрать чтение голосом) и «Режим синтеза речи» (выбрать непосредственно сам голосовой движок).

4. Говорилка

Сайт программы: www.vector-ski.ru/vecs/govorilka/index.htm

Основные возможности программы «Говорилка»:

  1. Чтение текста голосом (открывает документы txt, doc, rtf, html и пр.);
  2. Позволяет записывать текст из книги в форматы (*.WAV, *.MP3) с повышенной скоростью — т.е. по сути создание электронной аудио-книги;
  3. Хорошие функции по регулировке скорости чтения;
  4. Авто прокрутка читаемого текста;
  5. Возможность пополнения словарей произношения;
  6. Поддерживает старые файлы из времен DOS (многие современные программы не могут прочитать файлы в подобной кодировке);
  7. Размер файла, из которого программа может прочитать текст: до 2 гигабайт;
  8. Возможность делать закладки: при выходе из программы, она автоматически запоминает место остановки курсора.

5. Sakrament Talker

Сайт разработчика: sakrament.by/index.html

С помощью Sakrament Talker можно превратить свой компьютер в «говорящую» аудио книгу! Программа Sakrament Talker поддерживает форматы RTF и TXT,может автоматически распознавать кодировку файла (наверное, иногда замечали, что некоторые программы открывают файл с «крякозабрами» вместо текста, так вот в Sakrament Talker такое невозможно!).

Кроме того Sakrament Talker позволяет воспроизводить достаточно большие файлы, быстро находить те или иные файлы. Озвученный текст можно не только прослушать на компьютере, но и сохранить в mp3 файл (который в последствии можно скопировать на любой плеер или телефон и прослушивать вдалеке от ПК).

В целом довольно не плохая программа, которая поддерживает все популярные голосовые движки.

Онлайн-сервисы для озвучивания

Acapela

Acapela – это иностранный сервис, способный озвучить текст на 35 языках и диалектах. Примечательно, что портал озвучивает иностранные слова с характерным акцентом (например, русские слова читает англичанин). На сайте представлена демонстрационная версия продукта с ограниченным размером до 300 символов. Еще одним минусом послужит требования каждый раз соглашаться с условиями сайта. Для русской локализации предлагается один вариант озвучки текста – голосовой движок Alyona.

Linguatec

Сервис Linguatec предлагает ознакомиться с демонстрационной версией продукта. Здесь также имеется до 40 вариантов озвучки текста голосом. В сравнении с предыдущим сайтом на Linguatec представлено два голоса: женский «Милена» и мужской «Юрий». Ограничение на количество символом в демо-версии 250 знаков.

Text-to-Speech

Text-to-Speech – еще один портал, способный озвучить текст голосом онлайн. Обладает более продвинутыми настройками: скорость речи диктора, размер шрифта, машинный перевод. Для людей с ограниченными возможностями предоставлена экранная клавиатура. К сожалению, для русскоговорящего пользователя предоставлен всего один женский голос.

Google Translator

– фирменный переводчик от корпорации Google. Одной из функций сервиса является озвучивание переведенного или оригинального предложения. При наличии микрофона можно набирать слова голосом. Если вы желаете сохранить результат перевода и его звуковое сопровождение в «избранные», то авторизуйтесь в Gmail. Сервис Google Translator переводит и озвучивает тексты в пределах 5000 символов. Единственный минус – это голосовой движок, который больше походит на речь робота.

IVONA

Сайт IVONA – это презентационная страница, демонстрирующая голосовые движки. Данный сервис является польской разработкой и предлагает четыре варианта озвучки. Во всех язык по 2-3 голоса. В русском сегменте присутствует два голосовых движка «Максим» и «Татьяна». К сожалению, возможность опробовать сервис бесплатно отсутствует. Единственное, что может пользователь без покупки подписки – прослушать шаблонное приветствие голосовых движков.

Яндекс переводчик

Яндекс переводчик – отечественный аналог переводчика от Google. Имеет в распоряжении аналогичные инструменты: перевод, озвучивание перевода, генератор голоса, экранную клавиатуру и сохранение в избранное. Единственно, что отличает Яндекс переводчик от зарубежного аналога – максимальное количество символов, достигающие отметки в 10 000 знаков.

Oddcast

Портал Oddcast – наиболее интересный онлайн синтезатор речи для озвучивания с точки зрения интерфейса. Здесь помимо сухого звука присутствуют анимированные дикторы. Кроме того виртуальные дикторы следят за указателем мышки. Дополнительно на сайте регулируются эффекты речи. Имеется опция частичного изменения звучания. Русский язык в Oddcast представлен тремя движками: «Дмитрий», «Милина» и «Ольга». Из недостатков можно выделить ограничение на максимальное количество символов в 300 знаков и не самый удобный интерфейс для ввода.

ISpeech

Сайт ISpeech обладает минималистским интерфейсом, с которым разберется даже начинающий пользователь. Все что нужно сделать: ввести пару предложений и выбрать язык. Дополнительно регулируется скорость чтения текста голосом и выбор голосового движка. При желании озвученный результат можно сохранить на ПК. Максимальное число символов – 150.

2уха

2уха – интересный отечественный сайт, где помимо узконаправленного форума имеется раздел по преобразованию документа в аудио файл, который записывается в формате mp3 или awb. В настройках перед обработкой запроса настраиваются дополнительные параметры: скорость чтения, высота тона голоса, громкость, тип голосового движка и чтение знаков препинания. Результат конвертации высылается на электронную почту через несколько минут. Рекомендуем пройти авторизацию через социальные сети, чтобы не проходить ввод кода перед отправкой запроса (проверка на робота). Минус портала заключается в невозможность моментально озвучить текст в онлайн режиме.

Мобильные приложения

Перед описанием программ для озвучивания текста на смартфонах и планшетах хотелось бы уточнить одну деталь. Для того чтобы софт работал необходимо загрузить голосов движок Text-To-Speech для мобильных устройств. На новых гаджетах данная функция устанавливается вместе с операционной системой. Для старых устройств потребуется загрузка движка из Play Store. От пользователя нужно вбить их название в Play Store: Google TTS, Acapela, Ivona или SVOX TTS. Вы можете выбрать один из движков или загрузить их все сразу. Представленные движки являются абсолютно бесплатными для android пользователей.

SpeechText

SpeechText – приложение, позволяющее озвучивать введенный текст на любом из доступных языков. При желании библиотека языков расширяется самостоятельно. В SpeechText доступна функция сохранения озвученного текста в аудио формате на карте памяти.

Болтун

Болтун – отечественная программа для воспроизведения речи. Изначально утилита презентовалась, как карманный секретарь, способный записывать или озвучивать мысли. Однако благодаря обновлениям появилась функция перевода и озвучивания текста на многих языках. Дополнительно приложение может читать электронные письма, сообщения и воспроизводить любой выделенный фрагмент.

Речь в Текст — Текст в речь

Представленный мобильный сервис – удобная утилита, обладающая функцией обратной конвертации. Благодаря этой фишке вы можете не только слушать озвученный текстовый документ, но и надиктовать предложение для его преобразования в текст.

Voice Aloud Reader

Voice Aloud Reader – многофункциональная «говорилка», способная озвучивать текст из сторонних android приложений: браузеры, новостные статьи, полученные электронные письма и обрабатывать форматы программа для чтения EPUB, FB2, PDF и другие.

Мы живём в век информации.

Нас повсюду окружает интернет, телевиденье, СМИ, мы получаем множество общих и специальных знания в школе, университете, на всевозможных курсах и тренингах. Поэтому кому-то книга может показаться чем-то неактуальным, своеобразным анахронизмом.

Но это мнение ошибочно. У книг, которые в прошлом были практически единственным источником знаний, теперь существует много конкурентов. Но именно весь комплекс современных средств получения информации даёт возможность человеку сформировать адекватную и полную картину окружающего мира.

Важным поворотным моментом в истории развития печатного слова стало появление электронных книг. Они предоставили возможность, казалось бы, катастрофически теряющей популярность в современном мире книге обрести второе дыхание и вновь стать важным и востребованным источником знаний и развлечений.

Что такое электронная библиотека?

В виду того, что электронная книга превратилась в массовое явление, стали появляться так называемые электронные библиотеки — интернет-порталы, на которых собраны тысячи и даже десятки тысяч неаналоговых книг. Именно такой онлайн-библиотекой и является сайт knigger.com. Наш ресурс предоставляет любителям книг ряд возможностей:

— читать книги онлайн;

— купить и скачать книги в удобном электронном формате;

— слушать аудиокниги.

Как работать с сайтом?

Наш интернет-ресурс является свободным, поэтому вы можете заходить к нам и читать любые книги без регистрации. Но сейчас многие пользователи хотят не просто читать книги онлайн, а иметь под рукой различные полезные инструменты, такие как:

— корзина, в которой можно хранить все книги, которые вы хотите прочитать;

— всевозможные статистические плагины, которые показывают количество прочтённых книг, страниц в конкретном издании;

— оставлять отзывы и комментарии к книгам и статьям.

Всё это доступно после авторизации и на нашем сайте. Среди преимуществ портала можно также назвать удобный минималистический дизайн, быстрый поиск по авторам и названиям изданий и прочее.

Книги для всех

Хотелось бы обратит ваше внимание, что на сайте можно найти самую различную художественную литературу — от таких популярных направлений как фэнтези, любовный роман, триллер, детектив, до новых жанров, известных весьма узкому кругу читателей (например, ЛитРПГ или слэш).

Кроме того, в нашей электронной библиотеке вы найдёте множество учебной, дидактической и справочной литературы, книги по домоводству, религиозной тематике, эзотерике, юмор и многое другое.

В разделе «Блог» постоянно добавляются интересные актуальные статьи, из которых вы можете узнать биографии писателей, краткое содержание книг, новинки литературы, подборки рекомендованных для прочтения книг и т. д.

Связь с нами

— Вконтакте;

Мы с радостью ждём вас нашей свободной электронной библиотеке. Мечтайте, думайте, развивайтесь вместе с knigger.com. И главное — не забывайте, что читать всегда модно!

Лабиринт

Через сайт этого книжного магазина тоже можно отслеживать новинки. Учтите, правда, что «Лабиринт» торгует только бумажными изданиями. Но никто не запрещает находить через него названия свежих книг, а потом уже скачивать их в электронном виде где‑нибудь ещё.

Сервис выделяется благодаря хорошо настраиваемой системе фильтрации — здесь несложно отобрать только те жанры и произведения, которые будут интересны именно вам. Книги можно сортировать по жанрам, алфавиту, указывать, насколько они должны быть новыми (например, вышедшие за последние три дня, или неделю, или месяц). Помимо собственно литературы, тут есть также и комиксы с мангой.

Загрузить

Цена: Бесплатно

Загрузить

Цена: Бесплатно

В библиотеке BooksRead самые читаемые книги 2020 года

Читать бесплатно и без регистрации книги в онлайн режиме можно в электронной библиотеке. К наиболее популярным жанрам относятся следующие:

  • Любовные романы;
  • Детективы;
  • Триллеры.

Такими произведениями литературы увлекаются люди разного возраста. Теперь, чтобы прочесть увлекательный детектив либо роман о вечной любви, романтические стихотворения или детские сказки, не нужно выходить в книжный магазин – в любое время суток можно подключиться к интернету и просто выбрать книгу, которая наиболее всего придется по душе.

Благодаря хорошо продуманной поисковой системе читатель имеет возможность быстро и без проблем найти книги нужного автора, вписав в строку соответствующие имя и фамилию писателя либо название истории.

Кроме того, библиотека для чтения онлайн полных книг с телефона, планшета или ноутбука удобна в пользовании еще и тем, что у читателей отпадает необходимость тратить время на походы по книжным магазинам, а также на поиски сайтов, с которых можно скачать ту или иную книгу. Одним из важных преимуществ чтения онлайн является и то, что читатели могут отмечать страницы, чтобы в следующий раз сразу переходить на них.

Что такое синтезаторы речи

Синтезатор речи — это программное обеспечение, которое превращает текст в голос. Процесс преобразования проходит в несколько этапов:

  1. Подготовка текста: перевод чисел в слова, расшифровка сокращений, разделение на фразы.
  2. Составление фонетической конструкции на основании словарей, встроенных в систему.
  3. Расчет данных для достижения плавного перехода и создания правильной интонации.
  4. Воспроизведение звука.

Синтезаторы речи поддерживают разные языки, что позволяет их использовать в том числе для переводов. С их помощью можно научиться правильно произносить слова на иностранных языках, создавать аудиокниги, озвучивать видеоролики, презентации, документы, а также просто воспроизводить вслух любые тексты на родном языке, если есть проблемы с речью или зрением.

Работа синтезатора занимает доли секунды — стоит только набрать текст, как робот готов прочитать его вслух.

Синтезаторы превращают массивы текста в аудиопоток, воспроизведением которого можно управлять: ставить на паузу, перематывать, менять громкость и скорость чтения.

Бесплатный перевод текстов в звук

Как уже упоминалось, лучшие бесплатные синтезаторы речи – Гугл и Яндекс.  Но можно встретить и другие достойные сервисы.

как озвучить текст

Чем выделяется:

  • качественная, эмоционально окрашенная речь;
  • выбор диктора;
  • возможность создания списка озвучки;
  • коррекция ударений;
  • коррекция пауз;
  • возможность сохранения звукового файла.

Запускать синтезатор речи лучше в Хроме, иначе может не получиться скачивание файла.

Кстати, возможность сохранения результатов озвучивания текста имеется даже не у всех платных сервисов.  Для скачивания файла нужно нажать на значок настройки справа  от линейки.

сохранение звукового файла

Недостатки:

  • кошмарный дизайн;
  • избыток рекламы;
  • платный заказ озвучки больших текстов.

Этот сервис использует технологию TTS Яндекса, но настройки сделаны неплохо. Пранкеры бывают довольны.

Из зарубежных бесплатных онлайн синтезаторов речи нужно отметить Oddcast, который предоставляет прикольный интерфейс виртуальных дикторов и позволяет менять голос и скорость озвучки. Правда, качество текста на русском оставляет желать лучшего.

Онлайн озвучка текста на русском

Онлайн озвучка записанного текста на русском с помощью синтезаторов речи продолжает развиваться, так что качество компьютерной обработки звука будет расти с каждым годом.

Программы для озвучки текста

Если вам нужно постоянно озвучивать большие объемы текста из электронных документов, то самый удобный вариант — установить специальные приложения, которые умеют работать с файлами разного формата.

Балаболка

Балаболка — бесплатная программа озвучки для Windows от российских разработчиков. Она поддерживает работу с любыми голосовыми движками, установленными в системе. В ее интерфейсе есть стандартные инструменты для управления воспроизведением: пауза, остановка, перемотка, изменение скорости и громкости.

«Балаболка» умеет читать вслух текст из буфера обмена, произносить набираемые на клавиатуре фразы, озвучивать содержимое редактора или загруженных в нее файлов в форматах AZW, AZW3, CHM, DjVu, DOC, DOCX, EML, EPUB, FB2, FB3, HTML, LIT, MOBI, ODP, ODS, ODT, PDB, PDF, PPT, PPTX, PRC, RTF, TCR, WPD, XLS, XLSX.

Результат обработки «Балаболка» сохраняет как аудиофайл в форматах WAV, MP3, MP4, OGG и WMA. У нее также есть возможность сохранения текста внутри файлов MP3 для дальнейшего отображения в виде субтитров в медиапроигрывателе.

Govorilka

Govorilka — ещё одна программа для озвучки с минималистичным интерфейсом. Поддерживает голосовые движки устаревшего стандарта SAPI 4, в том числе на иностранных языках.

По умолчанию Govorilka озвучивает текст голосом стандартного движка Microsoft. В ее составе есть инструменты управления, традиционные для программ такого типа: воспроизведение, пауза, остановка, изменение скорости, громкости и высоты голоса. Одновременно в ней можно открыть до 8 вкладок с разными фрагментами текста.

Несмотря на простоту и устаревший интерфейс, «Говорилка» всё еще актуальна. Она умеет распознавать текстовые документы в разных форматах объёмом до 2 Гб и сохранять результат обработки в MP3 и WAV.

eSpeak

eSpeak — бесплатная программа для озвучки текста, доступная на Windows, macOS, Linux и Android. Она использует голосовые движки, установленные в системе, а также добавляет к ним несколько своих.

Версия этого приложения для Windows имеет максимально простой интерфейс и управление. Текст, который нужно прочитать, достаточно вставить в поле посредине окна, а затем нажать “Speak”.

Максимальный размер текста здесь явно не определен, но приложение справляется с большими объёмами. Также у него есть возможность читать тексты из файлов с расширением TXT, другие форматы не поддерживаются.

Для управления скоростью чтения в eSpeak используется ползунок Rate. Если вы хотите сохранить прочитанный текст в аудиофайл, нажмите на кнопку «Save to .wav» и задайте имя записи.

В мобильной версии приложения для Android аналогичная функциональность, разве что нет возможности сохранить текст в аудио.

Acapela TTS

Acapela Group разрабатывает программы для всех популярных операционных систем: Windows, macOS, Linux. Android, iOS. Среди главных достоинств этого софта — поддержка большого количества языков и отличное качество голоса. Мощные движки хорошо обучены и имеют развёрнутую справочную базу, которая позволяет им говорить правильно и выразительно.

Однако все продукты Acapela коммерческие. Установить приложение на компьютер или телефон можно бесплатно, но без купленного голосового движка в них нет никакого смысла. Стоимость одного пакета — 3,99 евро. Прежде чем оплачивать покупку, вы можете прослушать демо голоса с произвольным текстом, чтобы определить, подходит ли вам такое звучание.

ICE Book Reader Professional

Если вы ищите программу, которая будет озвучивать целые книги, то попробуйте ICE Book Reader Professional. Это приложение поддерживает различные форматы текстовых документов: TXT, HTML, XML, RTF, DOC и DOCX, PALM (.PDB и .PRC), PSION/EPOC (.TCR), Microsoft Reader (.LIT), Microsoft HELP files (.CHM) и FictionBook файлы (все версии) (.FB2, .XML). А для чтения в нем используются голосовые движки стандарта SAPI 4 и 5.

Программа умеет превращать книги в MP3/WAV-файлы. Это значит, что вы можете из любого произведения, доступного в текстовом формате, сделать аудиокнигу.

Скорость преобразования текста в голос в этом приложении увеличивается за счёт одновременного использования нескольких модулей синтеза речи.

Голосовые движки: мужские и женские

Движки синтеза речи — это специальное ПО, своего рода драйвера, необходимые для того, чтобы компьютер мог «заговорить» (т.е. для преобразования текста в речь). Движков сейчас в сети сотни: есть как платные, так и бесплатные. Наилучшее качество чтения, конечно же, показывают платные движки.

Важное замечание: движок синтеза речи не имеет никакого дизайна или интерфейса. После его установки в систему — вы не заметите ровным счетом никаких изменений! Чтобы работать с движком — вам нужна какая-нибудь программа для чтения текстов: Балаболка, Говорун, Ice Reader и пр., чуть выше я приводил те, которые «мне по душе» )

Вот поэтому, кстати, часто пользователи ругают ту или иную программу, что она не может прочитать русский текст (или вообще не может). Просто они забывают о необходимости установки речевого движка.

Пару слов про стандарты…

Голосовые движки могут быть выполнены в разных стандартах (так называемых), самые основные три: SAPI 4, SAPI 5 или Microsoft Speech Platform (примечание: почти в каждой программе для чтения, вы можете выбрать речевой движок).

SAPI 4

Добротный стандарт, был актуален десяток лет назад. На сегодняшний день устарел, и на современных компьютерах/ноутбуках его использование не оправдано.

SAPI 5

Почти все современные голосовые движки построены на этом стандарте (как платные, так и бесплатные). Наиболее популярный стандарт, можно найти движок с мужским, женским, детским голосами.

Microsoft Speech Platform

Microsoft Speech Platform – большой набор инструментов для разработчиков, которые позволяют реализовывать возможность преобразования текста в речь.

это набор инструментов, позволяющих разработчикам различных приложений, реализовывать в них возможность преобразования текста в голос.

Примечание! Чтобы синтезатор речи работал, необходимо:

Microsoft Speech Platform — Runtime – серверная часть платформы, предоставляющая API для программ;
Microsoft Speech Platform — Runtime Languages – языки для работы серверной части.

Более подробно об этом здесь — https://msdn.microsoft.com/en-us/library/hh361572.aspx

Несколько голосовых движков

Тext-to-speech engines Дигало // Николай

Сайт: http://www.digalo.com/index.htm

Очень популярный русский голосовой движок (голос мужской!). Подойдет для большинства программ, которые умеют читать текст голосом. На мой скромный взгляд, один из лучших общедоступных движков для синтеза речи (на русском языке). Кроме русского, кстати, на сайте разработчика доступны движки еще для нескольких языков. Минус: без регистрации работает всего две недели.

Acapela // Голосовой движок (модуль) Алена

Сайт: http://www.acapela-group.com/

Алёнка — относительно новый русский женский речевой движок от компании Acapela. Работает по стандарту SAPI-5 с частотой 22 КГц. Некоторые пользователи считают, что голос у «Алены» приятнее, чем у «Николая».

Голосовой движок (модуль) Катерина 2

Компания разработчик: ScanSoft RealSpeak 

Довольно неплохой речевой движок с женским голосом. После доработки движка, он стал сопоставим с «Николаем». Существенному обновлению подверглась фонетическая база движка, изменен алгоритм постановки ударений (что положительно сказалось на звучании), устранена проблема со скоростью произношения.

RHVoice

Сайт: http://tiflo.info/rhvoice/

RHVoice — это многоязычный синтезатор речи с открытым исходным кодом. Можно использовать в ОС  Windows и Linux. Синтезатор совместим с SAPI5. Разработчик синтезатора — Ольга Яковлева.

Кстати, движок основан на речевой базе, записанной дикторами. Русские голоса «Елена» и «Ирина» доступны для скачивания на официальном сайте.

IVONA Tatyana/Maxim

Сайт: https://www.ivona.com/us/about-us/voice-portfolio/

Станет ли движок самым используемым — не знаю, время покажет!

Кстати, как думаете, будет ли когда-нибудь разработан речевой движок, который не отличишь от голоса обычного человека? Или может он уже есть, а я о нем не слышал… (скиньте название!)

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector