0s
200s
Не менее 3 звезд
Показывать сначала:
5/5
Nemotron ASR — модель для преобразования речи в текст с настраиваемым уровнем ускорения обработки.
Средняя скорость генерации ~ 28.89 сек
Silero Vad – сверхлегкая модель для распознавания речи, которая предназначена для распознования речи в аудиофайле
Средняя скорость генерации ~ 13.62 сек
Silero STT – это высокоскоростная нейросетевая модель распознавания речи (speech-to-text), которая мгновенно преобразует речь в текст.
Средняя скорость генерации ~ 1.86 сек
ElevenLabs Speech to text — это современная модель для преобразования речи в текст, обеспечивающая высокоточную транскрипцию аудио и видео контента.
Средняя скорость генерации ~ 15.26 сек
Опираясь на передовые технологии искусственного интеллекта от OpenAI, модель готова перевести любые голосовые файлы в текст.
Средняя скорость генерации ~ 6.56 сек