Содержание

Pico tts что это за программа

Обсуждения

Информация для тех пользователей, у кого не работает озвучка на Android

30 сообщений

Здравствуйте, уважаемые пользователи!

В данной теме мы размещаем информацию для тех пользователей, у которых возникли трудности с озвучкой в нашем приложении на устройствах под управлением операционной системы Android
**При этом у пользователей на экране устройства выводится сообщение «Для озвучивания необходимо установить компоненты английского языка English (United States)».**

Для настройки озвучки на Android-устройствах мы рекомендуем вам выполнить следующие действия:

1. Зайти в раздел «Настройки» («Settings») своего устройства.
2. В меню настроек выбрать пункт «Язык и ввод» («Language & Input») или «Язык и клавиатура» («Language & Keyboard»)
3. Далее в меню настроек языка найти раздел «Голосовой ввод» («Speech»). В данном разделе выбрать пункт «Синтез речи» («Text-to-speech output»).

**Примечание: если раздел «Голосовой ввод» («Speech») пуст, необходимо перейти к пункту 5.**

4. В меню настроек «Синтез речи» в разделе «Система по умолчанию» («Default system») выбрать пункт «Синтезатор речи Google».

**Примечание: в случае, если в меню настроек «Синтез речи» отсутствует пункт «Синтезатор речи Google», необходимо перейти к пункту 5.**

5. В магазине Google Play необходимо найти и скачать приложение «Синтезатор речи Google». Это приложение бесплатное, его разработчиком является компания Google.

6. После установки «Синтезатора речи Google» необходимо проделать шаги 1-4.

После выполнения данных действий озвучка должна заработать.

В случае, если у вас возникнут вопросы касательно данной инструкции или проблемы с настройкой, то просим Вас связаться с нами по эл. почте itadmin@noxx.ru или в данной теме для обсуждений, чтобы мы оперативно смогли помочь Вам в решении вопросов по настройке озвучки.

C уважением,
команда разработчиков «Партнера»!

Как добавить звук в движок Android pico TTS?

Я использую pico default android TTS engine с персонажами IPA, делающими это

Обычно он работает, но для некоторых букв ему не нравятся «ã» или «ɑ» и т. Д.

Поэтому мой вопрос: как добавить тезисы / звуки к этому движку TTS?

Эй, вы можете использовать addEarcon() для добавления звуков в ссылку testToSpeech . Это medthod используется для добавления earcons.It будет связывать текст с речевым звуковым файлом. Вы также можете найти пример.

Существует также очень хорошее объяснение addEarcon в книге Professional Android Sensor Programming от Greg Milette, Adam Stroud на странице № 366 и 367.

Вы также можете найти пример по этой ссылке .

Pico tts что это за программа

Если ваш родной язык не английский и вы не пишете приложения только для iPhone, то вам придется достаточно трудно, если вы захотите найти подходящий инструментарий для разработки т.н. мобильных «voice-enabled» приложений.

В данном обзоре приведена классификация и описаны самые достойные из рода mobile TTS engine[1].

Я занимаюсь исследованиями в области проектирования интерфейсов мобильных устройств для людей с ограниченными возможностями зрения. Для реализации одного из моих проектов мне потребовался движок генерации голоса с мультиязыковой поддержкой (как минимум два языка – английский и русский). Это и послужило причиной поиска синтезатора речи.

Для удобства разделим движки TTS на три класса:

коммерческие;
свободные (решения лицензированные по GPL, LGPL и более «мягким» лицензиям типа BSD License или wxWindows Licence, которые допускают коммерческую разработку продуктов);
встроенные (средства, предоставляемые самой операционной системой).

Коммерческие движки

SVOX Mobile TTS )

Цена: n/a
Языки: 26, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Android, Symbian, Windows CE / Windows Mobile, BREW
Возможность разработки коммерческих продуктов: есть

Компания SVOX имеет наиболее «вкусный» с технической точки зрения продукт —SVOX Mobile TTS.

Однако, поскольку компания работает в основном в B2B сегменте, на мои два письма с запросом цены они так и не ответили.

Acapela TTS (http://www.acapela-group.com/)

Цена: 2800€ плюс так называемая run-time license, за которую в самом лучшем случае придется платить по 49€ за каждое распространенное приложение
Языки: 23, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Symbian, Windows CE / Windows Mobile, Embedded Linux, iOS
Возможность разработки коммерческих продуктов: есть

Сотрудники Acapela Group оказались намного более общительными и ответили буквально через полчаса после заполнения вотсоответствующей заявки.

Цена, указанная в шапке, относится к таким операционным системам как Windows Mobile и Symbian, однако бизнес-модель Acapela разнится в зависимости от выбранной ОС. К примеру, наиболее сильно они продвигают направление iOS, для которого сделан отдельный сайтhttp://www.acapela-for-iphone.com/.

Там можно зарегистрироваться и бесплатно получить evaluation версию их движка. Цена голого SDK для бывшей iPhone OS составляет 250€. Также с каждого проданного Вами в App Store приложения снимаются немалые проценты.

Отмечу, что Acapela предоставляет «облачный» синтез речи, а также портирование SDK под любую платформу.

Loquendo Embedded TTS )

Цена: 3000€ плюс проценты с каждого проданного Вами мобильного приложения
Языки: 26, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Android, Symbian, Windows CE / Windows Mobile, Embedded Linux, iOS, Maemo, Moblin, MeeGo, PalmOS
Возможность разработки коммерческих продуктов: есть

Движок Loquendo обладает специальными тегами, позволяющими делать речь более естественной, подмешивая такие не совсем «речевые» фишки как кашель, смех и прочее.

Их движок отвечает спецификацииSSML 1.0, рекомендованной W3C.

Sakrament TTS (http://www.sakrament.com/)

Цена: 1500€ для одной ОС, при покупке пакета сразу для двух языков предоставляется скидка в размере 25%, что составляет 2250€
Языки: английский, русский
Субъективная оценка качества звучания: среднее
Мобильные ОС: Symbian, Windows Mobile
Возможность разработки коммерческих продуктов: есть

Качества синтеза речи Sakrament TTS вполне достаточно, что бы озвучивать короткие фразы типа номеров телефонов или названий приложений.[2]

Свободные движки

Цена: нет
Языки: английский плюс возможность компиляции языков FestVox
Субъективная оценка качества звучания: низкое
Мобильные ОС: Android, Windows CE / Windows Mobile, iOS, PalmOS
Возможность разработки коммерческих продуктов: есть (CMU licence

В мире настольных систем хорошо известен синтезатор речи Festival. Он имеет порт под названиемFlite для мобильных устройств и встраиваемых систем, который распространяется под их собственной X11-like лицензией, позволяющей свободно распространять данное ПО кому угодно, а так же строить на его основе как коммерческие, так и свободные приложения. Существуютпорты для Windows CE / Windows Mobile,PalmOS, AndroidиiOS.

eSpeak (http://espeak.sourceforge.net/)

Цена: нет
Языки: 39, включая русский
Субъективная оценка качества звучания: среднее
Мобильные ОС: Android, Windows CE / Windows Mobile [3]
Возможность разработки коммерческих продуктов: нет (GNU GPL

Инструкция для компиляции движка под WM включена в дистрибутив, однако на этой платформе eSpeak имеет одно существенное ограничение – генерация голоса возможна только в WAV файл. Собранный TTS engine для Windows Mobile можно получить по ссылкеhttp://www.efficasoft.com/download/eSpeak-1.29-wm.cab).

Самый простой способ его попробовать — это установить из Android Market’а приложение TTS Service Extended, которое позволяет переключаться между встроенным движком и eSpeak. Данный TTS движок распространяется на условиях GNU GPL.

Встроенные решения

Встроенные решения присутствуют только в Symbian и Android.[4]. По какой-то неизвестной причине Microsoft лишила свою мобильную ОС соответствующего программного интерфейса (MS SAPI).

Symbian (http://www.symbian.org/)

Цена: нет
Языки: английский
Субъективная оценка качества звучания: крайне низкое
Возможность разработки коммерческих продуктов: есть

Встроенный TTS от Symbian Foundation скрывается в классе CMdaAudioPlayerUtility. Хотяв его документации

ничего об этом не сказано, он все же позволяет синтезировать речь (см.http://wiki.forum.nokia.com/index.php/Text_to_speech_in_Symbian_2nd_and_3rd_edition_phones. К сожалению, русский язык не поддерживается.[5].

Качество генерации английской речи очень низкое. Без подготовки довольно трудно понять, что именно он произнес.

Дополнительные языковые пакеты можно загрузить по ссылке http://europe.nokia.com/support/download-software/text-to-speech, однако список поддерживаемых телефонов крайне мал.

Установка пакетов для русского языка на устройство под управлением Symbian OS S60 5th не дала ожидаемых результатов, встроенный TTS так и не заговорил по-русски.

Отмечу, что имеется достаточно удобное расширение API под названием NSS TTS Utility API, описание которого можно найти по ссылкеhttp://wiki.forum.nokia.com/index.php/CS001031_-_NSSTTS_Utility_API.

Android (http://www.android.com/)

Цена: нет
Языки: английский, французский, немецкий, итальянский, испанский
Субъективная оценка качества звучания: среднее
Возможность разработки коммерческих продуктов: есть

Встроенная функциональность синтеза речи в Android доступна с версии 1.6. Прекрасное введение в тему можно найтив блоге разработчиков. Android TTS API является не чем иным, как оберткой над SVOX Pico, русский язык, которым, к сожалению, не поддерживается.

Заключение

Выводы каждому придется делать в зависимости от требований к разрабатываемому продукту. Для коммерческих решений крайне важно качество синтеза речи, поэтому выбирать стоит из двух движков – Acapela TTS и Loquendo Embedded TTS. При выборе движка для open source проекта крайне важную роль будет играть список целевых ОС.

Лично для себя я выбрал eSpeak, поскольку мой проект академического толка и я могу себе позволить использование продукта лицензированного по GNU GPL.

Примечания

Приводимые ниже примечания не являются составной частью статьи. Мы сочли необходимым опубликовать их здесь, чтобы дополнить отдельные утверждения автора.

Приводимый обзор не является исчерпывающим. В частности в нём не отражены продукты компании Nuance, которые обладают достаточно высоким качеством синтезируемой речи (в том числе и русской) и используются на таких мобильных операционных системах как Android, BlackBerry, iOS, Symbian.
Вернуться к тексту
Как показывает практика, голоса от ООО «Сакрамент» пригодны и для большего, нежели озвучивание коротких фраз. В сфере адаптивных мобильных технологий для пользователей с нарушениями зрения они получили широкое признание. Например, данные TTS Engines использованы в качестве основных русских голосов в таких продуктах, как screenreader Mobile Speak, программа чтения текстов Мобильный рассказчик и тифлоорганайзер Pronto.
Вернуться к тексту
Помимо названных, eSpeak также портирован под мобильную операционную систему Maemo.
Вернуться к тексту
Здесь автор противоречит сам себе, так как встроенная технология Text-To-Speech имеется также в iOS.
Вернуться к тексту
На самом деле, встроенный синтез русской речи реализован в Symbian, начиная ещё с 8.1. В относительно новых версиях мобильных программ экранного доступа даже реализовано использование этого голоса в качестве основного. Вы можете загрузить запись русского голоса, читающего строку из стихотворения А. С. Пушкина (качество голоса как раз такое, чтобы проверить своё знание творчества великого русского поэта).
Вернуться к тексту

The picotts text-to-speech platform uses offline pico Text-to-Speech engine to read a text with natural sounding voices. This requires to install the pico tts library on the system, typically on debian just do sudo apt-get install libttspico-utils On some Raspbian release, this package is missing but you can just copy the arm deb package from debian.

On Debian Buster, the package is missing, use the following commands to install it:

Configuration

To enable text-to-speech with Pico, add the following lines to your configuration.yaml :

Configuration Variables

The language to use. Supported languages are en-US , en-GB , de-DE , es-ES , fr-FR and it-IT .

Full configuration example

The configuration sample below shows how an entry can look like:

Vocalizer TTS

вкл. 20 Февраль 2016 . Опубликовано в Другое

Vocalizer TTS — чтение текста голосом для других приложений без подключения к интернету.

Установка: Распаковать скачанный архив ( Голос Милены ), скопировать папку Nuance в любое удобное место карты памяти телефона, далее настройка телефона — Язык и ввод — Параметры TTS — активировать Vocalizer TTS и перезагрузить телефон, только после этого снова зайти в Параметры TTS нажать шестеренку выбранного модуля — зайти в настройки для Vocalizer TTS — выбрать папку с голосами например /storage/extSdCard/Nuance и снова перезагрузить телефон, после этого в модуле TTS, во вкладке Язык, выбрать любой язык например MilenaPremiumHigh
Скачать приложение Vocalizer TTS на Андроид вы можете по ссылке ниже.

Разработчик: Vocalizer Nuance
Платформа: Android 2.0 и выше
Язык интерфейса: Русский (RUS)
Состояние: Free (Бесплатно)
Root: Не нужен