В скором времени в социальной сети «ВКонтакте» заработает функция распознавания голосовых сообщений и перевод их в текст. Пользователям также будет доступна и обратная функция, когда текст будет переводиться в голосовые сообщения. Об этом рассказали в пресс-службе социальной сети.
Команда разработчиков «ВКонтакте» уже приступила к тестированию технологии распознавания голосовых сообщений. Для того чтобы увидеть содержание голосового сообщения, пользователям будет достаточно нажать на соответствующую кнопку, после чего на экран будет выведен расшифрованный текст.
В настоящее время воспользоваться технологией распознавания речи могут только участники программы тестирования VK Testers. При этом функция распознавания речи работает на iOS, опираясь на стороннюю технологию. В дальнейшем туда планируется интегрировать собственную разработку социальной сети, на основе которой функция распознавания речи станет доступна широкому кругу пользователей.
Что касается технических аспектов, то технология распознавания голоса представляет собой нейросетевое решение, способное обучаться русскому сленгу, а также может масштабироваться и настраиваться. В будущем данная технология может стать основой функции поиска по сообщениям, в том числе голосовым.
«Ежемесячно 30 млн человек обмениваются голосовыми сообщениями ВКонтакте. Для такого высоконагруженного сервиса требовалось решение, способное обрабатывать огромное количество входящей информации без потери качества. Поэтому мы создали его сами. Ещё одним серьёзным вызовом стал разговорный язык. Записывая голосовые сообщения, люди редко выражаются как персонажи классической русской литературы — напротив, они используют много сленга и заимствованной лексики. Готовые решения на наших тестах плохо справлялись с распознаванием таких слов, но мы учли специфику современного русского языка при разработке собственной технологии», — сказал директор по исследованиям в области искусственного интеллекта ВКонтакте Павел Калайдин.