yandex

Maya API

starstarstarstarstar

5/5

Maya — синтез речи с AI: естественное звучание, поддержка эмоций, гибкие параметры голоса для озвучки контента

ID для подключения по API : maya

Средняя скорость генерации ~ 188.63 сек
Дата выхода: 15/01/2026

Аудио

Озвучка текста

Средняя

Запустить через API
SoTA

Выберите язык:

Как работать с Maya через API?

Получение API ключа

Для начала получите ваш API ключ в личном кабинете, если ещё не сделали этого.

Это ваш API-ключ с помощью, которого вы можете генерировать. Не сообщайте его никому.

Запрос на выполнение задачи

Теперь необходимо создать задачу на генерацию. Результат вы можете получать по-разному, можно по системе Long-Pooling, либо вы можете задать callback_url и мы отправим вам результат по готовности. Подробнее с тем, как использовать эти способы можете ознакомиться в документации. В данном примере мы рассмотрим способ с получением результата на callback_url.

В этом запросе указаны лишь обязательные параметры, если вам необходимы дополнительные параметры, то можете ознакомится с ними здесь

Пример ответа

Получение результата

На указанный в первом запросе callback_url придёт следующий ответ.

Ознакомиться с другими способами получения результата можете в документации

Параметры для генерации

callback_urlurl

Это URL, на который будет отправлен ответ от нейросети.

translate_inputboolean

Перевод входных данных.

Значение по умолчанию : true

textstring

Обязательно

Текст.

Значение по умолчанию : Hello evryone. I am AI to generate audio in GenAPI

promptstring

Обязательно

Промпт.

Значение по умолчанию : Реалистичный мужской голос 30-х годов с американским акцентом. Нормальная интонация, теплый тембр, разговорный ритм, нейтральная интонация при средней интенсивности.

temperaturenumeric

Температура.

Значение по умолчанию : 0.4

top_pnumeric

Разнообразие.

Значение по умолчанию : 0.9

max_tokensnumeric

Максимальное количество токенов.

Значение по умолчанию : 2000

repetition_penaltynumeric

Штраф за повторения.

Значение по умолчанию : 1.1

sample_ratestring

Частота дискретизации.

Значение по умолчанию : 48 kHz

output_formatstring

Формат выходного изображения.

Значение по умолчанию : mp3