Суперкомпьютер Nautilus ретроспективно "предсказал" египетскую революцию

Николай Третьяков

Исследователь из Университета Иллинойса продемонстрировал возможность краткосрочного прогнозирования социальной динамики на основе семантического анализа большого объёма новостной информации.

Упоминания Усамы бен Ладена в СМИ с 1979 по 2011 год, с географической привязкой (схема Kalev Leetaru).
Упоминания Усамы бен Ладена в СМИ с 1979 по 2011 год, с географической привязкой (схема Kalev Leetaru).

Относительно новое направление в исследованиях общества, которое некоторые авторы называют "культуромикой" (Culturomics), сильно напоминает "психоисторию" из книжного цикла Айзека Азимова о Фонде (а также методики, которыми пользовался главный герой "Пересадочной станции" Клиффорда Саймака) и соприкасается с клиодинамикой. Культуромика (как и психоистория) - это анализ огромных объёмов информации (первоначально это были книги, затем - новости в традиционных и интернет-СМИ) для выявления тенденций в развитии общества (не только культурных, но также политических и экономических).

Калев Лиитару из Университета Иллинойса (США) претендует на изобретение "культуромики 2.0". Вторая версия дисциплины отличается от первой использованием средств семантического анализа текстов и географического позиционирования упомянутых в них сущностей, а также визуализации результатов (что забавно, использовавшаяся учёными у Азимова система визуализировала варианты развития исторических событий). Исследователь говорит, что ретроспективно определил по новостям местонахождение укрытия Усамы бен Ладена - зону радиусом 200 км в Пакистане, в которую попадает Абботабад (где бен и был застрелен).

Использовавшийся в исследованиях суперкомпьютер Nautilus, принадлежащий Национальному институту вычислительных систем (NICS) при Университете Теннесси, способен искать паттерны в системах с 10 млрд узлов и 100 трлн связей. Анализировались 100 млн новостных статей, датированных 1979-2011 годами. В качестве источников использовались Open Source Center иSummary of World Broadcasts - созданные соответственно правительством США и Би-би-си переводные базы данных по открытым иностранным источникам информации. Доступ к первой имеют госслужащие и государственные подрядчики; на вопрос Discovery News о своих отношениях с разведслужбами Лиитару отвечать отказался.

У метода Лиитару много ограничений; сообщения в социальных сетях анализировать трудно из-за необходимости точного перевода идиом и разговорной речи (а Facebook, например, вообще активно противится попыткам посторонних собирать контент). Кроме того, если в стране абсолютно несвободная пресса, то её анализ позволяет относительно точно предсказать внешнюю политику, но не тенденции местной общественной жизни (хотя усовершенствованный семантический анализ, наверное, позволил бы читать прессу вроде советской "между строк").

В Египте, который в исследовании рассматривается в качестве одного из примеров, пресса имела некоторую степень свободы и при президенте Мубараке, поэтому анализ показал корреляцию между тональностью новостей и дестабилизацией внутриполитической ситуации. Восприятие Хосни Мубарака египетскими и мировыми СМИ резко ухудшилось после теракта в коптской церкви 1 января 2011 года (это восприятие служило индикатором отношения к автократу в первую очередь внутри страны, так как мировые новости начинаются с местных). Массовые демонстрации с требованием отставки президента начались 25 января; таким образом, анализ СМИ действительно позволяет делать краткосрочные прогнозы. Интересно, что "Нью-Йорк таймс" в начале 2011-го относилась к Мубараку гораздо лучше, чем Интернет и мировая пресса в целом (учтённая SWB).

Изменение отношения Интернета, мониторящихся SWB СМИ и
Изменение отношения Интернета, мониторящихся SWB СМИ и "Нью-Йорк таймс" к Хосни Мубараку (схема Kalev Leetaru).

Лиитару также проанализировал, насколько часто СМИ разных стран пишут о событиях в других государствах, и поделил страны мира на информационные кластеры, которые назвал "цивилизациями СМИ" (не забыв упомянуть Хантингтона). Затем исследователь построил схему отношений между кластерами.

Smbd

"Цивилизации" мировых СМИ (по данным SWB за 1979-2011 годы); схема Kalev Leetaru.

Smbd

Отношения между "СМИ-цивилизациями" (по данным SWB за 1979-2011 годы); схема Kalev Leetaru.

Результаты исследования опубликованы в интернет-журнале First Monday.


Страница сайта http://test.interface.ru
Оригинал находится по адресу http://test.interface.ru/home.asp?artId=26533