0s
200s
Не менее 3 звезд
Показывать сначала:
5/5
Silero Vad – сверхлегкая модель для распознавания речи, которая предназначена для распознования речи в аудиофайле
Средняя скорость генерации ~ 12.91 сек
Silero STT – это высокоскоростная нейросетевая модель распознавания речи (speech-to-text), которая мгновенно преобразует речь в текст.
Средняя скорость генерации ~ 2.14 сек
ElevenLabs Speech to text — это современная модель для преобразования речи в текст, обеспечивающая высокоточную транскрипцию аудио и видео контента.
Средняя скорость генерации ~ 5.38 сек
Опираясь на передовые технологии искусственного интеллекта от OpenAI, модель готова перевести любые голосовые файлы в текст.
Средняя скорость генерации ~ 6.37 сек