Социальная сеть «ВКонтакте» научилась распознавать текст аудиосообщений. Об этом сообщается в официальном аккаунте соцсети. Пока что функция доступна только части пользователей мобильного приложения, но в течение текущей недели опцией смогут воспользоваться все желающие.
Распознаванием речи занимается нейросеть, разработанная сотрудниками «ВКонтакте». По словам разработчиков, она распознаёт сленг и учитывает сложные условия записи. В текст можно будет переработать как отправленные, так и полученные сообщения длительностью до 30 секунд. Кроме этого, нейросеть позволит искать голосовые сообщения по указанному тексту. В будущем функцию планируют добавить в декстопную версию соцсети.
«Расшифровка аудиосообщений значительно отличается от распознавания речи в голосовых помощниках. С другом в чате общаются совсем не так, как с умной колонкой: сообщения записываются на бегу с посторонними шумами, большим количеством сленга и сокращений. Поэтому мы сделали три нейросети: одна отвечает за распознавание, вторая находит подходящие слова, а третья расставляет знаки препинания. Вместе они станут самым высоконагруженным сервисом по распознаванию речи на русском языке», — рассказывает директор по исследованиям в области искуственного интеллекта «ВКонтакте» Павел Кайдин.
Компания сообщила о планах добавить распознавание голосовых сообщений ещё в марте. Соцсеть объяснила необходимость тем, что голосовые сообщения являются очень популярным форматом общения — ежемесячно ими обмениваются около 30 миллионов пользователей.