Войти
5/5
ID для подключения по API : silero-stt
Средняя скорость генерации ~ 6.28 сек
Дата выхода:
Бюджетная
Silero Speech-to-Text — компактная и точная модель распознавания речи.
Преобразует аудиофайл в текст: загружаете речь (в формате WAV и др.), и модель выдаёт текстовую транскрипцию. Работает локально, на процессоре и без лишних зависимостей.

5/5
Опираясь на передовые технологии искусственного интеллекта от OpenAI, модель готова перевести любые голосовые файлы в текст.
Средняя скорость генерации ~ 6.06 сек

5/5
ElevenLabs Speech to text — это современная модель для преобразования речи в текст, обеспечивающая высокоточную транскрипцию аудио и видео контента.
Средняя скорость генерации ~ 6.67 сек