Аналоги Silero STT

Бюджетная
Whisper
5/5
Опираясь на передовые технологии искусственного интеллекта от OpenAI, модель готова перевести любые голосовые файлы в текст.
Whisper
Средняя скорость генерации ~ 18.87 сек

Бюджетная
ElevenLabs Speech to text
5/5
ElevenLabs Speech to text — это современная модель для преобразования речи в текст, обеспечивающая высокоточную транскрипцию аудио и видео контента.
ElevenLabs Speech to text
Средняя скорость генерации ~ 18.00 сек
Версии:
v1 / v2

Бюджетная
Silero Vad
5/5
Silero Vad – сверхлегкая модель для распознавания речи, которая предназначена для распознования речи в аудиофайле
Silero Vad
Средняя скорость генерации ~ 9.27 сек

Бюджетная
Nemotron ASR
5/5
Nemotron ASR — модель для преобразования речи в текст с настраиваемым уровнем ускорения обработки.
Nemotron ASR
Средняя скорость генерации ~ 75.31 сек

