Социальная сеть «ВКонтакте» объявила о работе над созданием искусственного интеллекта для автоматического распознавания материалов с оскорбительными, враждебными высказываниями. Технология призвана ускорить время обработки жалоб и помочь пользователям реже сталкиваться с проявлениями нетерпимости, травли и откровенной агрессии.
В соцсети отмечают, что за первую половину 2020 года на платформе было удалено 520 тыс. единиц контента по теме разжигания вражды и ненависти, а также заблокировано 1340 профилей и 2470 сообществ, распространяющих враждебные высказывания.
В связи с этим команда разработчиков приняла решение автоматизировать процесс поиска и удаления враждебного контента. Новая нейросеть займётся поиском и вычислением проявлений нетерпимости, ксенофобии, расизма, оскорблений и многого другого. Пользователи могут помочь обучению нейросети. Для этого разработчики создали специальную категорию жалоб — «Враждебные высказывания». На первом этапе модерированием будут заниматься администраторы, но это поможет в развитии технологии.
Пользователь может выбрать её, если нажмёт кнопку «Пожаловаться» у оскорбительной публикации. После этого материал попадёт на рассмотрение к модераторам. Эта категория позволит точнее откалибровать уже существующие инструменты и собрать датасет для новых решений на основе нейросетей. При этом команды модерации и поддержки не только реагируют на жалобы, но и проводят проактивный внутренний мониторинг — в частности, с помощью механизмов автоматического поиска, технологии цифровых отпечатков и нейронных сетей.
«Мы разделяем позицию наших пользователей и партнёров касательно языка вражды и прославления насилия. Если же вы заметили оскорбительную публикацию, пожалуйтесь на неё. С проявлениями нетерпимости эффективнее бороться вместе — и мы призываем пользователей присоединяться к нам в этой борьбе», — заявил руководитель команды модерации «ВКонтакте» Иван Корнеев.
Информация опубликована в новом разделе «Центра безопасности» под названием «Нормы платформы». В нём команда «ВКонтакт»е подробно рассказывает о том, как борется с проявлениями нетерпимости, а также описывает, какие именно высказывания считаются неприемлемыми на платформе.