Сотрудники факультета вычислительной математики и кибернетики (ВМК) МГУ при поддержке Российского фонда фундаментальных исследований разработали новое уникальное программное обеспечение для построения интеллектуальных систем, предназначенных для решения задач противодействия терроризму и экстремизму с использованием информации из сети Интернет.
Как сообщили "Инвест-Форсайту" на факультете ВМК МГУ, подавляющее большинство существующих систем, применяемых для решения указанных выше задач, носят языково-зависимый характер, между тем даже в рамках одного языка и региона лексика в области экстремизма и терроризма постоянно меняется, при этом велика вероятность ложноотрицательной ошибки, то есть пропуска экстремистского текста, если он использует нестандартную лексику.
Новый метод, разработанный на факультете ВМК МГУ, полностью нивелирует все недостатки лингвистического поиска: для выявления нужной информации неважно качество языка, наличие опечаток и грамматических ошибок, в том числе преднамеренных.
"Новая технология является полностью независимой от языковых аспектов. В данной разработке документ рассматривается как сложный набор символов с дальнейшим анализом на скрытые тематики с целью классификации и рубрикации", - рассказал один из авторов работы Михаил Петровский, доцент кафедры интеллектуальных информационных технологий ВМК МГУ.
Для подстройки используются механизмы машинного обучения и поиск по образцу. Существует возможность интеграции сценариев работы с базой данных Global Terrorism Database, позволяющая осуществлять в Сети тематический поиск упоминания событий из GTDB и использовать результаты тематического поиска для разметки членов сообществ и оценки их угрозы.
Ссылки по теме