yandex

Text to speech HD (TTS-HD) API

starstarstarstarstar

4.9/5

TTS HD — нейросеть, которая озвучивает любой написанный текст. Имеет поддержку русского языка, различные голоса и выдаёт очень чистый результат. Поддерживает интонации. Идеально подойдёт для озвучки видео и других материалов.

ID для подключения по API : tts-hd

Средняя скорость генерации ~ 19.65 сек
Дата выхода: 16/11/2023

Аудио

Генерация

Озвучка текста

Средняя

Запустить через API

Выберите язык:

Как работать с Text to speech HD (TTS-HD) через API?

Получение API ключа

Для начала получите ваш API ключ в личном кабинете, если ещё не сделали этого.

Это ваш API-ключ с помощью, которого вы можете генерировать. Не сообщайте его никому.

Запрос на выполнение задачи

Теперь необходимо создать задачу на генерацию. Результат вы можете получать по-разному, можно по системе Long-Pooling, либо вы можете задать callback_url и мы отправим вам результат по готовности. Подробнее с тем, как использовать эти способы можете ознакомиться в документации. В данном примере мы рассмотрим способ с получением результата на callback_url.

В этом запросе указаны лишь обязательные параметры, если вам необходимы дополнительные параметры, то можете ознакомится с ними здесь

Пример ответа

Получение результата

На указанный в первом запросе callback_url придёт следующий ответ.

Ознакомиться с другими способами получения результата можете в документации

Параметры для генерации

inputstring

Обязательно

Текст для генерации аудио.

Значение по умолчанию : Зимний вечер в городе, покрытом сверкающим снегом. Маленькая кофейня на углу улицы сияла уютом. Внутри было тепло, и аромат свежего кофе наполнял воздух. В углу сидела девушка с книгой в руках, погруженная в свой мир. Вдруг в кофейню вошел незнакомец, замерзший и уставший. Девушка, не раздумывая, предложила ему свое место и заказала горячий напиток. Они начали беседу, обмениваясь историями и смеясь. Зимний вечер стал теплым и запоминающимся благодаря неожиданному встречному доброте.

callback_urlurl

Это URL, на который будет отправлен ответ от нейросети.

is_syncboolean

Выбор режима выполнения запроса: синхронно или асинхронно.

Значение по умолчанию : false

voicestring

Обязательно

Голос.

Значение по умолчанию : echo

response_formatstring

Формат сгенерированного аудио файла.

Значение по умолчанию : mp3

speednumeric

Скорость произношения.

Значение по умолчанию : 1