Небольшой список синтезаторов речи, которые достойны внимания пользователя. Сейчас же, любой пользователь может скачать одну из Festival — это целая система распознавания и синтеза речи, которая.
Синтезатор голоса (он же «Text To Speech» или «TTS») - это программа, Качество речи у Festival я бы назвал приемлемым. речь. Послушать примеры и скачать Python-скрипт для выдергивания и склеивания.
Си́нтез ре́чи — в широком смысле — восстановление формы речевого Синтезатор речи — структура, способная переводить текст/образы в. Русскоязычный голос для системы Festival · Синтез речи в каталоге ссылок Open Directory Project (dmoz). Создать книгу · Скачать как PDF · Версия для печати.
Вот один из примеров использования качественного синтезатора речи специфика (технический надо читать не так, как художественную прозу или стихи), The Festival Speech Synthesis System - Festival is a general multi- lingual.
Синтезатор речи - чтение текста голосом. Описание программы.
Festival — синтезатор голоса под Linux, система синтеза речи, программа для чтения текста голосом. Festival получает на вход какой-либо текст или текстовый файл и произносит (проговаривает) его на английском или на любом другом доступном языке. В состав программы входит утилита text2wave, которая сохраняет голос в звуковой файл. Работа с программой осуществляется из командной строки. В состав Festival также входит плагин для Pidgin, который проговаривает входящие сообщения.
Краткий обзор синтезаторов речи | Записки программиста
Синтезатор голоса (он же «Text To Speech» или «TTS») — это программа, предназначенная для преобразования текста в человеческую речь. Таких программ сейчас много, но, к сожалению, качество большинства синтезаторов оставляет желать лучшего. В этой заметке вы найдете краткое описание некоторых синтезаторов. Заглянув в порты FreeBSD, я нашел пять программ для синтеза речи — espeak, flite, epos, rsynth и festival. Других программ не искал. Образ мышления был следующий — если программу не портировали под фряху, значит либо она никому не нужна, либо разработчик не позаботился должным образом об ее переносимости, либо хочет за нее много денег. Еще я решил включить в обзор translate.google.com и Microsoft Speech API, но о них — в самом конце. RSynth мне совершенно не понравился. В первую очередь расстроило отсутствие хоть какой-то документации. Ни man-страниц, ни малейшего намека, что для синтеза речи следует использовать утилиту say, а не rsynth (такой на диске вообще не оказалось). Программа аварийно завершала работу ровно через секунду после запуска независимо от входного текста. Если записывать результат в аудио-файл, то все хорошо, но мне не удалось выяснить, что это за формат такой «Sun/Next Audio». Качество речи довольно посредственное. Русский язык не поддерживается, если не считать транслит. Согласно информации на SourceForge, программа не обновлялась с июля 2009 года. Далее я попробовал Festival. Эта программа тоже не обновлялась с 2009 года, но на Хабре ее хвалили. Здесь также не обошлось без танцев с бубнами. Сначала я выяснил, что «из коробки» синтезатор не имеет ни одного языка. Ну да ладно, в портах их много, установил festvox-ked16. Потом оказалось, что для работы программе требуется NASd. В rc.d-скриптах я такого не нашел, пришлось запускать вручную: Качество речи у Festival я бы назвал приемлемым. Прикручивание русского (настоящего русского) и простого сохранения результата в аудио-файл я так и не осилил. Если вы — любитель сложных путей, можете потратить на это свое время (вот — про язык, и вот — про сохранение). Я же решил, что с меня на этом хватит. Следующим в моем списке оказался Epos. Программу писали чехи, в связи с чем синтезируемая ею речь очень приятна для русских ушей. Если вдобавок написать свой небольшой транслитератор, Epos’ом становится почти удобно пользоваться: Порадовала поддержка многих голосов, как мужских, так и женских. Имеется поддержка многих языков, но на данный момент в их число входит только чешский и словацкий. Из неприятных моментов — заброшенность проекта (не обновляется с 2009 года), а также проблемы со звуками Ч, Ш и Щ. Мне так и не удалось заставить Epos произносить их. В отличие от предыдущих синтезаторов FLite активно развивается, но, похоже, что он заточен только под английский язык. Кстати, он разрабатывается в том же Carnegie Mellon University, что и Festival. Хоть программа и не поддерживает русский язык, можно «обучить» ее великому и могучему, переведя русский текст в транслит: Если вам требуется безупречный (ну почти) русский язык, обратите внимание на translate.google.com. Это, конечно, не программа, а веб-сервис. Зато он позволяет получать практически безупречно синтезированную русскую (и не только русскую!) речь. Послушать примеры и скачать Python-скрипт для выдергивания и склеивания сгенерированных Гуглом mp3-файлов можно на ХабраХабре. Из недостатков скрипта следует отметить зависимость от выхода в интернет и, следовательно, медленную скорость работы. В заключение хотелось бы отметить, что в Windows имеется собственный набор API для синтеза речи. Сам я не удосужился его проверить (в последнее время я сильно интересуюсь кроссплатформенностью), так что оставляю вам это в качестве «домашнего задания». Всю необходимую информацию по Microsoft Speech API (SAPI) вы найдете на sources.ru и в MSDN. Скрипт translit.pl и примеры синтезированной с помощью названных утилит речи вы найдете в этом архиве. Дополнение: В хабрастатье про Python-скрипт для выдирания голоса из Google Translate все ссылки битые, но есть другой скрипт. Если сидим под Ubuntu: