yandex

Text to speech (TTS) API

starstarstarstarstar

5/5

TTS — нейросеть, которая озвучивает любой написанный текст. Имеет поддержку русского языка, различные голоса. Бюджетная версия TTS-HD. Поддерживает интонации. Идеально подойдёт для озвучки видео и других материалов.

ID для подключения по API : tts

Средняя скорость генерации ~ 18.66 сек
Дата выхода: 16/11/2023

Аудио

Генерация

Озвучка текста

Средняя

Запустить через API

Выберите язык:

Как работать с Text to speech (TTS) через API?

Получение API ключа

Для начала получите ваш API ключ в личном кабинете, если ещё не сделали этого.

Это ваш API-ключ с помощью, которого вы можете генерировать. Не сообщайте его никому.

Запрос на выполнение задачи

Теперь необходимо создать задачу на генерацию. Результат вы можете получать по-разному, можно по системе Long-Pooling, либо вы можете задать callback_url и мы отправим вам результат по готовности. Подробнее с тем, как использовать эти способы можете ознакомиться в документации. В данном примере мы рассмотрим способ с получением результата на callback_url.

В этом запросе указаны лишь обязательные параметры, если вам необходимы дополнительные параметры, то можете ознакомится с ними здесь

Пример ответа

Получение результата

На указанный в первом запросе callback_url придёт следующий ответ.

Ознакомиться с другими способами получения результата можете в документации

Параметры для генерации

inputstring

Обязательно

Текст для генерации аудио.

Значение по умолчанию : An expressive oil painting of a basketball player of South Asian descent, dunking a basketball. The scene captures the player mid-dunk, framed against a backdrop that symbolizes the nebulae. The vigor and energy of the player's motion are metaphorically shown as an exploding nebula, galaxies and stars streaming off his figure

callback_urlurl

Это URL, на который будет отправлен ответ от нейросети.

is_syncboolean

Выбор режима выполнения запроса: синхронно или асинхронно.

Значение по умолчанию : false

voicestring

Обязательно

Голос.

Значение по умолчанию : nova

response_formatstring

Формат сгенерированного аудио файла.

Значение по умолчанию : mp3

speednumeric

Скорость произношения.

Значение по умолчанию : 1