Голоса для синтезатора речи. Синтезаторы речи онлайн: лучшие сервисы для озвучивания текста

Недавно передо мной встала проблема выбора голосового синтезатора речи. Основные требования — это поддержка русского языка и более-менее нормальное произношение.
Для тех, кто не в курсе того, что такое синтезатор речи, расскажу — это специальная программа, смысл работы которой заключается в преобразовании письменного текста в устную речь. Это и есть так называемый синтез.
Зачем это надо? Ну, например, когда надо записать голосовое сообщение чужим голосом. Иностранцам оно может быть полезно для того, чтобы услышать произношение того или иного слова. Синтезатор речи удобен для чтения, когда надо включить ребенку сказку, которой нет в аудиокнигах. Да и вообще, ситуации всякие бывают.
Так вот, в процессе выбора я нашел несколько очень полезных инструментов, среди которых работающих в режиме онлайн с поддержкой русского языка и сейчас я Вам о них и расскажу.

Переводчик Google

Вот поистине многоцелевой продукт, которых можно использовать совершенно по-разному. Главные преимущества:
— это совершенно бесплатный сервис;
— работа в режиме Онлайн без установки. Нужен только доступ в Интернет;
— на мой взгляд этот синтезатор речи имеет лучший голосовой модуль, самое близкое к натуральному;
— наверное самая лучшая команда разработчиков и техподдержка в мире;
— самое большое количество поддерживаемых языков.
К сожалению, вариант голоса только один — женский. Выбора я не нашел.

RHVoice

Отличный многоязычный синтезатор речи от российского разработчика — Ольги Яковлевой. Есть версии, как для операционных систем семейства Windows, так и для Linux. Разработчик синтезатора - Ольга Яковлева. Программа распространяется совершенно бесплатно и доступна на официальном сайте в двух вариантах: как SAPI5-совместимая самостоятельная версия и как модуль для бесплатной программы экранного доступа NVDA. Этот синтезатор голосовой речи умеет озвучивать русские тексты тремя голосами — Елена, Ирина и Александр.

Acapela

Acapela - это, пожалуй, один из самых популярных и распространенных голосовых синтезаторов в мире. Главная особенность — это озвучка текстов более чем на тридцати языках мира. Если рассматривать русский язык, то тут доступны два голоса - Николай и Алена. Причем последний более совершенен и естественен в плане произношения. В демонстрационном режиме на сайте доступен только голос Алена.
Программа доступна для скачивания на официальном сайте и поддерживает все популярные современные операционные системы — Windows, Linux, Mac. Есть даже версии для Android u iOS.

Vokalizer

Женских голос Milena — это ещё один очень популярный движок голосового синтезатора речи от компании Nuance — он очень высококачественный и естественно звучащий. Его Вы можете услышать в call-центрах и в различных сетевых речевых системах, а также в различных приложениях приложениях — таких как Moon+ Reader Pro, Full Screen Caller ID , Cool Reader, в навигационной программах TomTom, iGo Primo.
Среди плюсов можно отметить возможность установки различных словарей, регулировки громкости, ударения и скорости чтения.
Код программы открытый, скачать его бесплатно можно на официальном сайте, собственно как и инсталлятор самой программы.

Festival

Festival - это не просто очередной голосовой речевой синтезатор, а уже целая система распознавания и синтеза речи с различными API. Разработчик — Исследовательский Центр Речевых Технологий университета Эдинбурга.
Festival предназначен для поддержки нескольких языков. По умолчанию поддерживает английский, валлийский и испанский языки. Но есть возможность подключить голосовые пакеты других языков: чешский, финский, хинди, итальянский, маратхи, польский, русский и телугу.
Код программы открытый, сам голосовой синтезатор распространяется по лицензии open source и доступна только для операционных систем Linux. Правда есть портированная версия по Макинтош.

ESpeak

Последняя в моём обзоре система синтеза речи — программа ESpeak — разрабатывается уже около 8 лет. Последняя версия — 1.48.04 от 6 апреля 2014. Данный голосовой синтезатор речи кроссплатформенный — есть версии под Windows, Linux, Mac OS X, и даже под RISC OS, хотя последние две уже давно не поддерживаются.
Отдельно отмечу, что eSpeak используется в мобильных операционных системах Android, правда имеет при этом ряд существенных ошибок.
Программа поддерживает пятидесяти различных языков, поддержка которых указывается при установке программы.
Один из главных минусов это голосового синтезатора — генерирование голоса только в файл формата WAV. Скачать программу бесплатно можно на официальном сайте.

От себя добавлю лишь, что мне понравились RHVoice и Vokalizer, хотя тут во много дело индивидуальное и во многом зависит от того, что Вы хотите получить. Так что пробуйте, ставьте и смотрите. Я думаю, что один из представленных вариантов Вам обязательно должен подойти.

Современные приложения для синтеза речи значительно отличаются по качеству работы от своих первых аналогов десятилетней давности. Яркий пример тому - программа Балаболка. Данное приложение бесплатное, без каких-либо условий и ограничений. Обладает настолько большими возможностями, что создатели предпочли интегрировать в программу полноценный файл помощи, с подробным описанием всех функций.

Инсталляция и настройка программы балаболка.

Программу проще всего получить непосредственно с сайта разработчика. Там же можно скачать и дополнительное необходимое ПО. Процесс инсталляции незамысловат - приложение копируется в выбранный директорий, системные папки при этом не используются. Интерфейс поддерживает множество языков, в том числе и русский. А вот произношение текста пока будет только на английском. Для использования русского (или любого другого, даже украинского) языка необходимо дополнительно установить компьютерный голос. В сети доступно множество как бесплатных, так и коммерческих голосов. Устанавливаются они довольно просто и быстро.

Вполне может быть, что вам потребуется так же инсталлировать пакет Microsoft Speech Api 4.0

Приложение готово к работе сразу же после запуска. Если установлены бесплатные русские голоса, необходимо выбрать один из них на вкладке SAPI4. Теперь достаточно в окне набрать или вставить текст, и нажать клавишу F5 – начнется чтение вслух текстового фрагмента. Курсор при этом должен находиться в начале текста.

Возможности программы балаболка

Но озвучивание текста - не единственное предназначение программы. Например, с ее помощью можно создавать аудио книги. Произношение любого текста в программе Балаболка можно записать в звуковой файл. Приложение поддерживает следующие форматы: .wav, .mp3, .ogg, .wma, .mp4, .m4a, .m4b, .awb.

Таким образом, нужный вам текст легко преобразовывается в аудиокнигу.

Кстати, программа позволяет автоматически разбивать один большой файл аудиокниги на несколько небольших, в соответствии с выбранными настройками

Настройки сохранения файлов аудиокниг - далеко не единичная опция, доступная пользователю. Кроме этого, можно установить громкость, тембр голоса, скорость произношения. После установки дополнительных (бесплатных) модулей, возможна проверка орфографии; так же пользователь сам может корректировать произношение путем создания собственных «словарей».

Все чаще в повседневной жизни стали использовать синтезаторы речи. Синтезаторы речи, как становится видно уже по одному названию, осуществляют синтез речи, то есть форматируют письменный текст в устный.

Благодаря этому можно учить новые иностранные слова с правильным произношением, читать книги не отвлекаясь от своих дел или, например, находясь в транспорте. Изначально разработкой таких программ занимались организации, специализирующиеся на технике для людей с проблемами зрения.

Сейчас же, любой пользователь может скачать одну из программ, установить ее на свой компьютер или телефон и синтезировать речь, в том числе и русскую.

Для этого было разработано множество различных программ, приложенный и даже целых систем. К сожалению, не все из них предназначены для русскоязычной аудитории.

1. Acapela

Acapela — один из самых распространенных речевых синтезаторов во всем мире. Программа распознает и озвучивает тексты более, чем на тридцати языках. Русский язык поддерживается двумя голосами: мужской голос — Николай, женский — Алена.
Женский голос появился значительно позднее мужского и является более усовершенствованным.

Установка программы проходит без проблем. Разработаны версии для операционных систем Windows, Linux, Mac, а также для мобильных ОС Android u IOS.

Программа платная, скачать ее можно с официального сайта Acapela.

2. Vokalizer

Вторым в нашем списке, но не по популярности является движок Милена от разработчика программы Vocalizer компании Nuance.
Голос звучит очень естественно, речь чистая. Есть возможность установить различные словари, а также подкорректировать громкость, скорость и ударение, что не маловажно.
Как и в случае с Акапелой, программа имеет различные версии для мобильных, автомобильных и компьютерных приложений. Прекрасно подходит для чтения книг.

Скачать все версии Vokalizer и русскоязычный движок Милена можно на официальном сайте производителя программы.

3. RHVoice

Код синтезатора открыт для всех, программы же абсолютно бесплатны.
RHVoice выпущена в двух вариантах: как отдельная программа, так и как приложение к NVDA.
Все версии можно скачать с официального сайта разработчика.

4. ESpeak

Первая версия бесплатного синтезатора речи eSpeak была выпущена в 2006 году. С тех пор компания-разработчик постоянно выпускает все более усовершенствованные версии. Последняя версия была представлена в конце весны две тысячи тринадцатого года.

eSpeak можно установить под следующие операционные системы:

  • Microsoft Windows,
  • Mac OS X,
  • Linux,
  • RISC OS

Возможна также компиляция кода для Windows Mobile, но делать ее придется самостоятельно.
А вот с мобильной ОС Android программа работает без проблем, хотя русские словари еще не до конца разработаны. Русскоязычных голосов много, можно выбрать на свой вкус.

5. Festival

Festival — это целая система распознавания и синтеза речи, которая была разработана в эдинбургском университете.
Программы и все модули абсолютно бесплатно и распространяются по системе open source. Скачать их и ознакомиться с демо-версиями можно на официальном сайте университета Эдинбурга.

Синтезаторы речи, или преобразователи текста в голос, — специальные сервисы, позволяющие автоматически воспроизводить написанный текст на выбранном языке. Работать с такими сайтами просто, достаточно скопировать либо ввести вручную нужный текст в окно и выбрать язык – сервис автоматически преобразует написанное в звук.

Синтезаторы речи онлайн

Синтезаторы речи часто используются людьми, которые изучают иностранные языки. Довольно сложно найти в сети специальные материалы для аудирования, позволяющие научиться воспринимать устную иностранную речь на слух, куда проще вставить нужный отрывок текста на сайт и прослушать либо скачать преобразованный файл на компьютер.

Способ 1: Acapela

Довольно качественный сервис для синтеза речи с набором нескольких голосов мужского и женского типа. Поддерживает и воспроизводит русский язык. К достоинствам можно отнести отсутствие платы за использование. С сайтом вы легко сможете попрактиковаться в понимании нужного языка на слух. Готовый аудиофайл имеет довольно высокое качество.

Что касается недостатков, то один из них заключается в ограниченном объеме текста, который может быть прочитан синтезатором (всего 300 символов). Для доступа к дополнительным функциям и скачиванию файлов нужно пройти регистрацию на сайте.

Работать с сервисом довольно просто, даже в том случае, если вы не знаете английский язык.

Способ 2: Google Переводчик

Удобный сервис для воспроизведения написанного текста. Способен самостоятельно определять, на каком языке написан текст, кроме того, можно перевести нужный отрывок и воспроизвести его. Из достоинств — полная поддержка русского языка, а также понятный и минималистичный дизайн. Регистрации сервис не требует, синтез текста занимает считанные секунды. Синтезатор способен читать довольно длинные тексты, ограничение – 5000 символов.


В отличие от прошлого ресурса, в переводчике нельзя выбирать голос синтезатора. Воспроизведение ведется стандартным женским голосом.

Способ 3: Text to speech

Еще один ресурс, который позволит преобразовать написанный текст в устную речь. Сайт полностью на английском языке, однако разобраться в его функционале несложно. К достоинствам можно отнести возможность перевода текста, выбор нужного языка и настройку скорости чтения текста.

Недостатков при использовании обнаружено не было. Есть ограничения на размер текста в размере 100 символов.


Сайт работает быстро, без задержек и позволяет быстро преобразовать написанный текст в голос. Синтезатор иногда делает ошибки в словах и неправильно расставляет ударения. Логические паузы, как и на других подобных сайтах, отсутствуют.

Мы рассмотрели наиболее функциональные и удобные сервисы для преобразования текста в голосовые файлы. Если вы хотите порекомендовать какой-то другой сайт с синтезатором речи онлайн, обязательно напишите об этом в комментариях.

Синтезаторы речи - это программы, на вход которых подаётся текст, а на выходе синтезируется человеческая речь. Эти программы имеют широкое применение - в телефонии, электронных ассистентах-помощниках, для телефонного доступа к веб-приложениям, в образовательных целях, в кол-центрах и т.п. Основные голосовые движки для воспроизведения русской речи - Realspeak, Digalo и Sakrament от компаний Nuance, Acapela и Sakrament соответственно.

Синтезаторы речи, работающие под Windows-системами:

Digalo (Acapela ELAN TTS)
Синтезаторы речи Acapela доступны на 23 языках, в том числе, и на русском и могут разговаривать более чем 50 голосами. Есть возможность использования в нескольких программах одновременно (многоканальность). Качественное русское произношение, большой словарь русских слов и ударений, всевозможные настройки и параметры воспроизведения. Наиболее качественный голосовой пакет - «Николай».

Nuance RealSpeak (ранее ScanSoft)
Поддерживает более 20 языков включая китайский, норвежский и корейский и 30 голосов. Голос, звучащий на русском языке - «Катерина». По многим параметрам это даже гораздо более удачное решение для русского языка, чем Digalo. Полностью поддерживает SAPI5. Программа распространяется только на коммерческой основе.

Sakrament TTS Engine
Программа умеет воспроизводить тексты на русском языке. На русском есть и версия сайта компании. Линейка продуктов Sakrament включает в себя приложение для коммуникаторов и КПК, программа для озвучивания электронных учебников и документов. В пакете для русского языка можно выбирать из трех голосов («Ольга», «Ирина», «Вячеслав»). Поддерживает входные форматы RTF и TXT, автоматически распознает кодировку текста, полностью поддерживает SAPI Speech Tags и дополнительные тэги семантической разметки текста для улучшения звучания синтезированной речи. Посредством тэгов можно задавать ударение, тип фрагмента текста (дата, время, адрес, URL, e-mail, телефон, аббревиатура и т.д.), параметры воспроизведения (громкость, скорость, интонация), а также другие параметры.

CoolReader
Программа для комфортного чтения книг с экрана, чтения вслух, форматирования и конвертирования текстов. Функция чтения вслух разработана с использованием движков MS SAPI 4.0 × 5.1. Работает в том числе и с текстами на русском языке. Распознает форматы HTML, RTF, DOC (MS Word), TXT, FB2 (FictionBook). Автоматически распознает русские кодировки dos, win, koi-8, а также latin, utf-8 и unicode. Можно сохранить аудиокнигу в формате MP3 для прослушивания на MP3 плеере. Отдельно подключаются словари произношений с настройками для каждого голосового движка. Поддерживаемые операционные системы: Win9x/ME/NT4.0/Win2K/XP.

ToM Reader
Приложение представляет собой просмотрщик текстов и речевой синтезатор одновременно. Работает в том числе и на русском языке. Позволяет создавать из текстов MP3-файлы, есть возможность подключения словарей произношения, умеет работать с zip архивами. Поддерживаемые форматы файлов: HTML, RTF, MS Word, TXT, кодировки: ANSI, KOI, OEM. Максимальный размер открываемого файла - 12 Мб.

Speak Aloud - программа для чтения и сохранения в файл с конвертированием текста форматов TXT, PDF, HTML, RTF в аудио MP3, WAV, WMA, OGG, VOX, AU, AIFF, MP4, FLAC, SWF. Можно настраивать интонации, тембр звучащего голоса и качество воспроизведения звука. Поддерживается пакетная обработка файлов. Работает под операционными системами: Windows 2000/XP/Vista

Govorilka
Воспроизводит текст на русском языке. Возможна запись читаемого текста в звуковой файл (*.WAV, *.MP3), а также регулирование скорости чтения и высоты озвучивающего голоса. Можно добавлять словари произношений, и таким образом довольно легко корректировать произношение отдельных слов и словосочетаний. Может работать с большими файлами, открывает тексты из файлов.doc, HTML. Также запоминает позицию курсора при выходе из программы (чтобы потом начать чтения с того же самого места).