yandex

Sora 2 API

starstarstarstarstar

5/5

Sora 2 создает фотореалистичные видео до 10 секунд по текстовым промптам или на основе изображений с корректной физикой и кинематографичным качеством.

ID для подключения по API : sora-2

Средняя скорость генерации ~ 529.97 сек
Дата выхода: 20/11/2025

Видео

Генерация по тексту

Генерация по картинке

Премиальная

Запустить через API

Выберите язык:

Как работать с Sora 2 через API?

Получение API ключа

Для начала получите ваш API ключ в личном кабинете, если ещё не сделали этого.

Это ваш API-ключ с помощью, которого вы можете генерировать. Не сообщайте его никому.

Запрос на выполнение задачи

Теперь необходимо создать задачу на генерацию. Результат вы можете получать по-разному, можно по системе Long-Pooling, либо вы можете задать callback_url и мы отправим вам результат по готовности. Подробнее с тем, как использовать эти способы можете ознакомиться в документации. В данном примере мы рассмотрим способ с получением результата на callback_url.

В этом запросе указаны лишь обязательные параметры, если вам необходимы дополнительные параметры, то можете ознакомится с ними здесь

Пример ответа

Получение результата

На указанный в первом запросе callback_url придёт следующий ответ.

Ознакомиться с другими способами получения результата можете в документации

Параметры для генерации

callback_urlurl

Это URL, на который будет отправлен ответ от нейросети.

translate_inputboolean

Перевод входных данных.

Значение по умолчанию : true

promptstring

Обязательно

Промпт.

Значение по умолчанию : Создайте динамичное 4-секундное музыкальное видео с участием афроамериканского мужчины-рэпера, выступающего с интенсивным, эмоционально заряженным выступлением в ультрасовременной студии звукозаписи, освещенной неоновым светом. Художник воплощает современный городской стиль с тщательно продуманными деталями: винтажная джинсовая куртка с потертостями поверх белоснежной хлопковой футболки, множество цепочек из чистого серебра, которые переливаются при каждом движении, и элегантные солнцезащитные очки-авиаторы, заправленные за воротник. Его волосы уложены в современные косички с тонкими бликами, которые переливаются в свете студийного освещения. Performance space - это изысканная изолированная кабина со стеклянными стенами, в которой представлена профессиональная среда звукозаписи, оснащенная аудиооборудованием премиум-класса, включая конденсаторный микрофон Neumann U87 с большой диафрагмой, микшерный пульт SSL с анимированными светодиодными индикаторами уровня и высококачественные мониторные динамики. Выступление рэпера физически выразительно и технически точно - он энергично сжимает стойку микрофона, с закрытыми глазами произносит эмоциональные пассажи, а затем устанавливает прямой зрительный контакт с камерой во время кульминационных моментов. Движения его рук поставлены так, чтобы подчеркнуть лирическое содержание: щелканье пальцами в такт музыке, поднятие ладони во время мелодических потоков и акцентирование внимания указательным пальцем во время выразительной речи. Синхронизация губ отличается скрупулезной точностью, улавливая каждый слог стремительных куплетов с аутентичными движениями рта и сокращениями лицевых мышц. Дизайн освещения меняется на протяжении всего 4-секундного повествования: начинается с яркого лазурно-голубого прожектора сверху, который подчеркивает черты лица и верхнюю часть тела, переходит к ритмичным импульсам пурпурных и розовых неоновых полос, встроенных в архитектуру студии, которые идеально синхронизируются с воображаемыми басовыми частотами, затем вводится динамическое лазерное проекционное отображение, которое создает замысловатые геометрические узоры на поверхностях, кульминацией которых является теплая янтарная подсветка, создающая эффект эффектного ореола вокруг головы исполнителя. В кинематографе используется несколько ракурсов съемки в непрерывной последовательности: начиная со среднего кадра, кадрирующего от груди вверх, который медленно смещается внутрь, переходя к экстремальному крупному плану, фокусирующемуся на артикуляции рта и напряжении челюстей во время технических пассажей, переходя к мощному низкоугольному кадру, который подчеркивает доминирование и присутствие на сцене, включая драматический голландский стиль. ракурс с плавным вращательным движением вокруг исполнителя и завершением - интимный крупный план открывающихся глаз с интенсивным фокусом. Аудиовизуализация проявляется в виде видимых звуковых волн - мерцающей, волнообразной ряби энергии, исходящей от микрофонного корпуса и искажающей свет и воздух при распространении в пространстве. Неоновая подсветка пульсирует в идеальной гармонической синхронизации с низкочастотными ритмами, в то время как аналоговые видеомагнитофоны на консоли показывают агрессивное отклонение стрелки, соответствующее интенсивности голоса. Элементы фона придают интерьеру глубину и аутентичность: сквозь звуконепроницаемое стекло виден пульт управления, на котором одобрительно кивает фигура производителя, анализаторы спектра в режиме реального времени отображают частотный состав, конденсат атмосферной воды на контейнерах с охлажденными напитками, едва заметная вибрация от динамиков монитора и плавающие частицы пыли, подсвеченные лазером. Техническое исполнение обеспечивает кинематографическую съемку с частотой 24 кадра в секунду и биологически точную физику движений человека - сложное взаимодействие групп мышц лица во время произнесения вокальных партий, естественную динамику движения волос при поворотах головы, детальную текстуру ткани и драпировку джинсовой куртки, а также точное колебание металлической цепочки. Эмоциональное повествование создает неотразимую напряженность на протяжении всей временной шкалы: начинается с контролируемой, уверенной подачи, устанавливающей связь, постепенно усиливающей физическую вовлеченность и кинетическую энергию, достигающей пика выразительности за счет самоотдачи всего тела и силы голоса, завершающейся мощной устойчивой позой, удерживающей финальную фонетическую ноту. Стилистические усовершенствования включают в себя тонкую хроматическую аберрацию в моменты высокой интенсивности, аутентичное наложение текстуры зернистости на 35-миллиметровую пленку, стратегический акцент в замедленной съемке на ключевых лирических акцентах и элегантные артефакты в виде световых полос во время быстрых переходов камеры.

image_urlurl_or_file

Входное изображение.

resolutionstring

Разрешение.

Значение по умолчанию : 720p

aspect_ratiostring

Соотношение сторон.

Значение по умолчанию : 16:9

durationinteger

Продолжительность видео (сек).

Значение по умолчанию : 4

proboolean

Режим Pro.

Значение по умолчанию : false