(495) 925-0049, ITShop интернет-магазин 229-0436, Учебный Центр 925-0049
  Главная страница Карта сайта Контакты
Поиск
Вход
Регистрация
Рассылки сайта
 
 
 
 
 

Математик взломал сайт знакомств и нашёл девушку мечты

35-летнему математику Крису Маккинли (Chris McKinlay) из Калифорнийского университета в Лос-Анджелесе потребовалось всего 88 дней, чтобы осуществить дата-майнинг анкет на сайте знакомств и подобрать девушку, которая идеально подходит по характеру. Помог ему в этом доступ к суперкомпьютерам Калифорнийского университета, пишет Wired.

В июне 2012 года Маккинли работал над докторской диссертацией по обработке больших массивов данных и параллельным методам вычислений. В какой-то момент он решил отвлечься и зарегистрироваться на сайте знакомств OkCupid. Нужно заметить, что этот сайт основан гарвардскими студентами и использует хитрую систему вычисления совместимости между потенциальными партнёрами. Каждый из них отвечает на сотни вопросов о своём характере, привычках и предпочтениях. Вопросы самые разные: "Любите ли вы кошек?" (какие ответы вы приемлете от других), "Как часто вы используете Facebook?", "Как долго планируете встречаться?" и т.д. После этого вы можете посмотреть, насколько тот или иной человек подходит вам. Система показывает вероятность успешных отношений, дружбы и вражды.

Логика в том, что чем больше партнёры похожи, тем лучше им будет друг с другом.

Хитрость в том, что посмотреть, как ответила девушка на определённый вопрос, можно только после того, как вы сами ответите на него. При этом максимальное количество для каждого участника ограничено 350 ответами, в то время как общий банк содержит тысячи вопросов. Другими словами, некоторые ответы девушек навсегда останутся для вас загадкой, а "рейтинг совместимости" может оказаться слегка неточным.

Маккинли нашёл всего лишь около 100 девушек, у которых показатель совместимости превышал 90%, но даже с ними свидания как-то не сложились (Криса хватило на шесть свиданий). И тогда парень придумал способ, как провести анализ по своим собственным правилам.

Крис создал 12 фейковых профилей, отвечая на вопросы случайным образом. После этого он смог получить доступ к полным профилям девушек со всеми ответами. За три недели дата-майнинга его система собрала 6 млн ответов от тестовой выборки из 20 тыс. анкет.

После фильтрации осталось 5000 девушек, которые живут в Лос-Анджелесе и Сан-Франциско и заходили на сайт в течение последнего месяца. Крис написал скрипт на Python для сортировки девушек с разными характеристиками на семь кластеров, вроде "Заботливые", "Верующие", "Татуировки" и т.д. 

 
Два кластера он нашёл особенно интересными. В первом были девушки примерно 25 лет хиповатого стиля, музыканты и актрисы. Во второй кластер вошли более старшие девушки с креативными профессиями в литературе и дизайне. Так что Крис создал два своих профиля, чтобы сфокусироваться на каждом из этих кластеров - и ответил на 500 самых популярных вопросов в каждой из групп. Здесь уже Крис отвечал на вопросы честно, хотя слегка оптимизировал ответы в зависимости от кластера. Например, на вопрос "Что для вас важнее: любовь или секс", он отвечал "любовь", но указывал более низкую степень важности ответа для первой группы и более высокую - для второй.

Результаты оказались поразительными. Он сразу получил более 10 000 результатов с совместимостью более 90%. На последнем этапе нужно было привлечь внимание девушек. Сайт OkCupid информирует пользователя, если в его профиль кто-то заходит, так что Крис настроил бота для автоматического посещения анкет всех девушек с показателем более 90%. Потом он проверял, кто из них заходил к нему. Естественно, девушки были тоже удивлены столь высокими показателями совместимости - Крис получал от них до 20 сообщений в день.

30 июня компьютерная часть квеста закончилась и наступило время свиданий. К 20 июля Крис обратил внимание, что женщины из первого кластера часто живут в дальней части города, а у женщин второй группы часто есть собачка среднего размера. Для экономии времени он удалил профиль первой группы и сократил количество кандидаток вдвое. За июль математик смог провести 55 свиданий. В трёх случаях дело дошло до второго свидания, но всё безрезультатно, и только на 88-м свидании Крису повезло и он нашёл поистине родственную душу, 28-летнюю художницу, с которой у него был рейтинг совместимости 91%. Они продолжили встречаться даже через год, когда девушка вернулась после годичной стажировки из Катара. Сейчас собираются пожениться.



 Распечатать »
 Правила публикации »
  Написать редактору 
 Рекомендовать » Дата публикации: 28.01.2014 
 

Магазин программного обеспечения   WWW.ITSHOP.RU
Quest Software. Toad for DBA Suite for Oracle
IBM DOMINO ENTERPRISE CLIENT ACCESS LICENSE AUTHORIZED USER LICENSE + SW SUBSCRIPTION & SUPPORT 12 MONTHS
Oracle Database Standard Edition 2 Named User Plus License
Stimulsoft Reports.Ultimate Single License Includes one year subscription
ZBrush 4R6 Win Commercial Single License ESD
 
Другие предложения...
 
Курсы обучения   WWW.ITSHOP.RU
 
Другие предложения...
 
Магазин сертификационных экзаменов   WWW.ITSHOP.RU
 
Другие предложения...
 
3D Принтеры | 3D Печать   WWW.ITSHOP.RU
 
Другие предложения...
 
Новости по теме
 
Рассылки Subscribe.ru
Информационные технологии: CASE, RAD, ERP, OLAP
Безопасность компьютерных сетей и защита информации
CASE-технологии
OS Linux для начинающих. Новости + статьи + обзоры + ссылки
СУБД Oracle "с нуля"
Один день системного администратора
Corel DRAW - от идеи до реализации
 
Статьи по теме
 
Новинки каталога Download
 
Исходники
 
Документация
 
 



    
rambler's top100 Rambler's Top100