Аналоги Silero STT

Бюджетная
Whisper
5/5
Опираясь на передовые технологии искусственного интеллекта от OpenAI, модель готова перевести любые голосовые файлы в текст.
Whisper
Средняя скорость генерации ~ 8.51 сек

Бюджетная
ElevenLabs Speech to text
4.8/5
ElevenLabs Speech to text — это современная модель для преобразования речи в текст, обеспечивающая высокоточную транскрипцию аудио и видео контента.
ElevenLabs Speech to text
Средняя скорость генерации ~ 9.83 сек
Версии:
v1 / v2

Бюджетная
Silero Vad
5/5
Silero Vad – сверхлегкая модель для распознавания речи, которая предназначена для распознования речи в аудиофайле
Silero Vad
Средняя скорость генерации ~ 24.97 сек

Бюджетная
Nemotron ASR
5/5
Nemotron ASR — модель для преобразования речи в текст с настраиваемым уровнем ускорения обработки.
Nemotron ASR
Средняя скорость генерации ~ 249.77 сек

