Нейросети на текущем этапе развития способны решать многие задачи, одно из востребованных направлений – перевод живой речи в обычный текст. Такой режим можно использовать для расшифровки интервью, сохранения лекций, быстрого создания важных заметок или списка покупок.
Google Keep
Популярность данного сервиса в первую очередь обусловлена массовостью – оно предустановлено на многих смартфонах на базе ОС Android, поэтому у пользователей есть возможность ознакомиться с функционалом. Утилита предназначена для быстрого создания и удобного хранения коротких заметок. При тестировании выяснилось, что с задачей распознавания текста она пока справляется недостаточно хорошо.
В частности, полностью игнорируются знаки препинания и интонация, хотя сами фразы распознаются корректно. Также инструмент не подойдет для распознавания длительных лекций или интервью – при паузе в 2-3 секунды обработка автоматически прекращается. Эти особенности обусловлены первоначальным назначением программы – для быстрой записи заметки возможностей вполне достаточно.
SpeechText.ai
Данный сервис уже лучше справляется с распознаванием текста. Обеспечивается корректное разделение на предложения, правильно распознается интонация, при необходимости добавляются знаки препинания, также не возникает проблем с вопросительной интонацией. Могут возникать ошибки с грамматикой, но они не влияют на читаемость текста и быстро исправляются вручную.
Значительный минус – нет возможности надиктовать текст, можно только загрузить аудиофайл. В бесплатной версии длительность записи ограничена 20 минутами, при покупке лицензии данное ограничение убирается.
ВКонтакте
Мобильное приложение популярной социальной сети также имеет модуль для распознавания речи. Изначально функция предназначена для расшифровки голосовых сообщений, присланных другими пользователями, однако можно просто надиктовать сообщение и прислать его самому себе. Такая схема вполне подходит для сохранения заметок, плана работы, напоминаний и так далее.
Качество распознавания пока достаточно низкое, могут быть ошибки в словах, не всегда корректно расставляются знаки препинания. Для простых задач утилиту использовать можно, однако для сложных текстов лучше найти альтернативное решение.
SaluteSpeech от Сбера
Сервисы распознавания все активнее появляются и в Telegram, что обусловлено популярностью платформы. В данном секторе выделяется бот SaluteSpeech от специалистов Сбера. Можно диктовать текст или загрузить нужный файл для распознавания. Однако для файлов есть ряд ограничений – поддерживается только формат MP3, длительность записи не более 20 минут. Эти особенности стоит учитывать, тем, кто планирует использовать диктофоны для платформы Android – они преимущественно используют для сохранения формат AAC. Поэтому может потребоваться дополнительная конвертация в нужный формат.
Качество распознавания очень высокое, ошибки встречаются достаточно редко. Стоит отметить, что физически невозможно организовать распознавание полностью без ошибок – у людей разная дикция, могут быть внешние шумы и так далее.
Составление рейтинга
На первом месте стоит разместить платформу SaluteSpeech, которая обеспечивает хорошее качество распознавания. На втором месте – сервис SpeechText.ai, который не уступает по качеству, но является платным, что подойдет не всем пользователям.
Google Keep и ВКонтакте заметно отстают от лидеров, поскольку плохо справляются с распознаванием сложных текстов. Их можно рекомендовать только для создания коротких заметок на ходу.