yandex

EchoMimic V3 API

starstarstarstarstar

5/5

EchoMimic V3 оживляет статичное изображение, превращая его в видео: лицо говорит и двигается синхронно с аудио, сохраняя позу, фон и свет.

ID для подключения по API : echomimic-v3

Средняя скорость генерации ~ 181.20 сек
Дата выхода: 20/10/2025

Видео

Генерация аватаров

Анимация речи и движений

Генерация по картинке

Средняя

Запустить через API
SoTA

Выберите язык:

Как работать с EchoMimic V3 через API?

Получение API ключа

Для начала получите ваш API ключ в личном кабинете, если ещё не сделали этого.

Это ваш API-ключ с помощью, которого вы можете генерировать. Не сообщайте его никому.

Запрос на выполнение задачи

Теперь необходимо создать задачу на генерацию. Результат вы можете получать по-разному, можно по системе Long-Pooling, либо вы можете задать callback_url и мы отправим вам результат по готовности. Подробнее с тем, как использовать эти способы можете ознакомиться в документации. В данном примере мы рассмотрим способ с получением результата на callback_url.

В этом запросе указаны лишь обязательные параметры, если вам необходимы дополнительные параметры, то можете ознакомится с ними здесь

Пример ответа

Получение результата

На указанный в первом запросе callback_url придёт следующий ответ.

Ознакомиться с другими способами получения результата можете в документации

Параметры для генерации

callback_urlurl

Это URL, на который будет отправлен ответ от нейросети.

translate_inputboolean

Перевод входных данных.

Значение по умолчанию : true

audio_urlurl_or_file

Обязательно

Входное аудио.

promptstring

Обязательно

Промпт.

Значение по умолчанию : A single person is shown in a calm, relaxed seated pose. The character speaks naturally, maintaining a steady and composed posture. Arm and body movements are subtle and minimal, aligned with a natural conversational style. The background must remain stable and consistent throughout the video, preserving the original spatial arrangement, lighting, and color temperature of the reference image.

negative_promptstring

Негативный промпт.

num_frames_per_generationnumeric

Количество кадров для одновременной генерации.

Значение по умолчанию : 121

guidance_scalenumeric

Масштаб управления.

Значение по умолчанию : 4.5

audio_guidance_scalenumeric

Масштаб управления аудио.

Значение по умолчанию : 2.5

seedinteger

Случайное зерно для генерации.

output_formatstring

Формат выходного файла.

Значение по умолчанию : mp4

image_urlurl_or_file

Обязательно

Входное изображение.