Мои мысли о Web 3.0

Источник: artishev

Андрей Артищев

Автор: Андрей Артищев

Эпоха универсального Интернета заканчивается. Сейчас сеть становится персональной, это означает, что скоро, вводя в строку поиска "Хочу купить недорого автомобиль", пользователь получит ответ в виде ближайшего автосалона к его местоположению. Более того, поисковая система сможет определить, какой именно автомобиль нужен пользователю на основе информации о том, какими тестдрайвами он больше всего интересуется и какие автомобильные сайты посещает. Устройством же, предоставляющим такую информацию, будет не персональный компьютер, который таковым не является, а медиафон, способный передавать и обрабатывать любые виды информации, в том числе и изображение реального мира, используя такие персональные данные пользователя, как биоритмы, местоположение абонента и другие. О том, как работают технологии, позволяющие учитывать индивидуальность человека в Интернете, более подробно - в данной статье.

Как известно, развитие Интернета движется циклами, каждый из которых, по моей оценке, составляет в среднем 3 года. Так, сейчас подходит к концу период web 2.0, и стартует новый, цикл персонального Интернета, который будет протекать в 2009-2011 годах, характеризуясь кардинальными изменениями.

В начале развития Интернета для осуществления поиска информации в Сети достаточно было воспользоваться каталогами. Вспомним про Yahoo, самый посещаемый сайт мира, который был основан изначально как каталог сайтов. Спустя 10 лет при накоплении контента (англ. content - содержание) информацию начали упорядочивать поисковики, такие как "Яндекс",Google, однако уже и они не справляются с ее объемами. Сейчас пользователь в результате запроса получает не индивидуальный контент, который ему необходим, а общие универсальные тексты, либо списки сайтов, в которых он уже сам начинает вручную искать нужную ему, конкретную информацию. Таким образом, возникает необходимость в изменении самого метода поиска, персонализировав его, а также способа предоставления различной информации в любых сервисах в сети Интернет. Фактически постепенно происходит переход глобальной сети Интернет от универсальности к индивидуальности.

С эпохой web 2.0, во главе которой стоит пользовательский контент, в сети появилось огромное количество персональной информации. Все мы сейчас публикуем заметки в блогах, рассказываем о себе в различных социальных сетях, "заливаем" фотографии на Flickr и видео на YouTube, все это говорит о нас как о личности. Даже если пользователь ничего не публикует в сети, а просто просматривает информацию, - список и очередность просмотренных сайтов вполне может охарактеризовать его.

Важно также помнить, что мы не просто выкладываем информацию, а находимся в непрерывном общении с другими пользователями сети - пишем им сообщения, добавляем в друзья на "Одноклассниках", "Вконтакте", а также оставляем комментарии.

Формируется достаточно большое количество контента, но он весь разрознен. Сейчас данная информация находится под разными учетными записями, каждый сайт определяет пользователя как уникального посетителя, а не как одного и того же человека, заходящего на различные порталы.

Аккумулировать же всю информацию, которую пользователь оставляет после себя в Сети можно с помощью социального графа. Напомню, что, если социальная сеть представляет собой ресурс, состоящий из реальных участников, связанных между собой отношениями, то социальный граф (social graph) - это формальное описание структуры социальной сети, связей между ее участниками, математический граф, представляющий собой базу данных, содержащую формальный список всех участников социальной сети.

Концепция социального графа сводит к минимуму действия пользователей по построению социальных связей на сайтах, не имеющих отношения друг к другу. Так, например, новая разработка Google, Social Graph API, автоматически отслеживает контакты пользователя в Интернете. В силу того, что большинство веб-сайтов связаны между собой ссылками, и Google обрабатывает эти связи, существует возможность извлекать информацию, касающуюся конкретных пользователей. Social Graph API анализирует ссылки между блогами, а также учетные данные в разнообразных социальных сетях. В результате строятся взаимосвязи между определенными людьми.

Другим сервисом, аккумулирующим оставленный пользователем контент, является сайт Spokeo.com. При вводе имени того или иного человека в строку поиска ресурс выдает данные о том, на каких сайтах и какой контент оставлял конкретный пользователь. Собрав все данные с разных сайтов, мы получим разностороннюю информацию, которая будет характеризовать его как личность.

Кроме того, благодаря таким сервисам появятся также единые учетные записи пользователей, которые будут действовать на все порталы, включая персональные данные и настройки по принципу OpenID (универсальный идентификатор личности). Свой OpenID пользователь регистрирует один раз на специальном сайте-провайдере, внося все свои данные. Далее зайдя на любой портал, с помощью OpenID вместо привычных полей регистрации, логин и пароль, нужно заполнить только строку ввода OpenID-идентификатора. Таким образом, пользователь регистрируется на всех сайтах с одним логином и паролем. С помощью единых учетных записей можно будет проходить регистрацию на множестве сайтов без заполнения одних и тех же полей.

Таким образом, огромное количество информации о пользователе можно будет в итоге собрать с помощью социального графа. Но как быть дальше с кусочками разнородной информации? Ведь пока все данные не собраны воедино, невозможно понять общей картины о том, что представляет собой человек с присущим ему набором файлов и информации.

Ранее ИТ-специалисты не задумывались о том, что рано или поздно всю инфраструктуру сбора, передачи и обработки данных придется унифицировать. Одних только стандартов передачи данных и форматов существуют сотни и тысячи. Зачастую не только у каждой индустрии свой тип используемых файлов, но и свой формат данных. Данные требуют фактически индивидуального обслуживания: их нужно снимать, интерпретировать и заново загружать в новые сервисы и ИТ-системы в новых форматах, на что тратится огромное количество труда и времени.

Для того, чтобы обработать разрозненную информацию, необходимо правильно "склеить" данные в единое целое, привести их к единому формату. В ближайшие годы потребуется ввод в масштабах всей Сети универсального формата данных, в рамках которого бы шел обмен данными между всеми сервисами. После введения такого универсального формата передача и приведение разрозненной информации о пользователе к единому типу будут решаться программами-роботами. Все задачи по переписи одних и тех же данных из одного формата в другой, и их упорядочивание в определенной степени упразднятся. Программы-роботы самостоятельно станут состыковывать разнородную информацию на базе единого контейнера между различными сервисами, объектами, и форматами. Единый формат будет понятен и удобен для любых сценариев передачи данных и алгоритмов обработки информации.

Интернет вещей

Для того, чтобы получить полную информацию о пользователе необходимо отразить в вебе три типа объектов - места, люди, предметы. Для этого необходимо, чтобы информация о них также собиралась автоматически. Напомню, что уже давно выдвигались предположения о том, что Интернет будет представлять собой не только виртуальные страницы, но и упорядочивать мир вещей. Таким образом, каждый человек, предмет и место будут иметь в сети свой "резервуар" для накопления и обработки уникальных данных.

Одной из технологий, позволяющих синхронизировать и проводить автоматическую идентификацию физических объектов, является стандарт ZigBee. Так, в рамках оснащения датчиками жилых помещений ("Умный дом"), можно добиться того, что холодильник будет передавать данные в компьютер, например, о том, что закончились такие-то продукты, а дальше информация отсылается в службу доставки продуктов "Утконос".

Вещи могут общаться и объединяться, причем без участия людей. Научная фантастика воплощается в жизнь - весьма буднично, зато с солидной экономией времени со стороны человека. Огромное количество предметов, такие как кондиционеры, освещение, системы безопасности, видеомагнитофоны, холодильники, телевизоры и другие существуют автономно. Но при этом данные, которые они производят, остаются в замкнутых системах конкретных устройств и не помогают улучшать жизнь потребителя, информация не попадает в общую сеть и, соответственно, не делают ее эффективнее.

Сбор и автоматический обмен данными между электронными физическими устройствами и решает протокол Zigbee. За счет встроенного программного обеспечения ZigBee-устройства самостоятельно находят друг друга и формируют сеть передачи данных. И в случае, если даже 50% устройств выйдет из строя, система самостоятельно реорганизует передачу данных на имеющихся устройствах.

Семантический веб

Однако наличие собранной информации о предметах, местах, пользователях не дает представления о самом человеке. Необходимо понять эти данные с точки зрения смысла, а не статистики. Для достижения этих целей существуют алгоритмы семантики. Семантика, а также семасиология - наука о понимании определенных знаков, последовательностей символов и других условных обозначений; раздел семиотики. Существует также отдельная самостоятельная дисциплина общая семантика, рассматривающая общую теорию оценки фактов, отношений, ощущений не с точки зрения просто вербальных определений того, что говорится о значениях, но с точки зрения того, как в действительности происходят оценочные реакции у человека. В рамках концепции семантики в мире машин лежит способность компьютеров и специальных программ распознавать смысл той или иной информации. Так, в частности, поиск в Интернете благодаря технологиям семантического веба будет осуществляться не только за счет совпадения со словами запроса, но также будет зависеть от смысла этого запроса. Так, например, в строку поиска вместо "август отдых дешево" можно будет вводить "Где можно отдохнуть в августе недорого?", и компьютер выдаст ответ, не просто основываясь на популярности тех или иных сайтов, статистики, а "подумает" и предоставит результат поиска на основе смысла запроса.

Сейчас направление распознавания данных по смыслу, семантического веба, становится все более востребованным. В подтверждение этого летом 2008 года софтверный гигант Microsoft подписал соглашение о приобретении американской поисковой системы Powerset. Специалисты Powerset разработали технологию семантического и языкового поиска, которая будет интегрирована с поисковым механизмом Miscrosoft Live Search.

С развитием семантического веба после сбора определенных данных о пользователе технологии позволят составить его социально-демографический портрет. Собранные пользовательские данные компьютеры будут понимать уже как портрет личности, если применить к ним CRM-алгоритмы. Отмечу, что CRM (Customer Relationship Management System, система управления взаимодействием с клиентами) - это информационная система, которая предназначена для автоматизации процессов клиентоориентированной стратегии. CRM направлена на улучшение обслуживания заказчиков путем сохранения информации о клиентах (контрагентах) и истории взаимоотношений с ними, установления и улучшения бизнес-процедур и последующего анализа результатов. Данный подход подразумевает, что при любом взаимодействии с клиентом по любому каналу, программе-роботу доступна полная информация обо всех взаимоотношениях с этим клиентом и решение принимается на основе этой информации (информация о решении, в свою очередь, тоже сохраняется).

Примером построения взаимодействия с пользователем в зависимости от его индивидуальных особенностей может служить рекомендательный сервис "Имхонет" (Imhonet.ru) в Интернете, который, основываясь на оценках конкретного пользователя о фильмах, книгах или услугах, формирует представление о вкусе человека и подбирает людей со схожими предпочтениями, которые могут давать ему рекомендации. "Имхонет" проводит персонализированную выборку наилучших для каждого человека рекомендаций, которая формируется автоматически. Например, заходя на сайт, пользователь дает оценку сортам вин, которые он пробовал. А программа на основе этих оценок строит его профиль предпочтений. Далее идет сравнение профилей разных пользователей, и формируются сообщества людей с близкими предпочтениями, внутри которых налаживается обмен мнениями.

Технологии, позволяющие узнать пользователя не как абстрактного посетителя, а как личность, дают возможность выдавать ему более точную информацию. Например, когда человек спрашивает у знакомого совета по жизненной ситуации, собеседник, как правило, просит более подробно рассказать о себе и о ситуации, ведь чем большей информацией он обладает, тем точнее будет совет. Если человек обращается к другу, который знает его как личность, то ему не требуется дополнительная информация в силу того, что он ей уже располагает. Также будет и в Интернете, чем больше пользователь сообщит информации о себе, тем более точное решение получит от интернет-сервисов и компьютеров, причем данные собираются не за счет "набивания" контента пользователем, а в силу того, что система отслеживает выбор и действия пользователей.

Персональный контент - на персональную точку доступа в Интернет

Для доставки индивидуального контента необходимо наличие персональной точки доступа, иначе результат запроса не будет соответствовать конкретному пользователю. Не секрет, что персональные компьютеры не такие уж и персональные, зачастую одним ПК пользуются несколько человек в семье или на работе, соответственно, оставляемые в Интернете "следы", не могут относиться к одному пользователю, чего не скажешь о телефоне, который всегда с собой и онлайн. Люди даже фактически ложатся спать с ними. По статистике больше половины пользователей мобильников используют телефон как будильник.

Как уже упоминалось, развитие тех или иных технологий движется циклами. Так, если цикл развития Интернета составляет 3 года, то, говоря о мобильных телефонах, отмечу, что этот период составляет 2 года. Давайте посмотрим, что произойдет на рынке в эти ближайшие 2 года.

Например, следующей ступенью развития телефонов являются набирающие популярность смартфоны, которые могут передать больше персональной информации. Благодаря GPS (Global Positioning System, глобальная система позиционирования) или LBS (Location Based Services, сервисы определения местонахождения на базе координат базовых станций сотовой связи) смартфон передает координаты местонахождения человека. В этом случае при поиске в Интернете, пользователь может получить не просто упорядоченные ссылки, но и самые ближайшие к нему объекты поиска. К примеру, когда человек покупает какой-то товар через Интернет или ищет ресторан, то ему важно, чтобы он находился поблизости, а не на другом конце города. Это возможно при условии, если интернет-сервисы будут располагать информацией о координатах пользователя. Системы навигации уже заняли достаточно уверенные позиции на рынке, в следующем же, 2009, году эти решения станут массовыми.

Однако цикл смартфонов закончился в 2008 году, а в 2009 наступает эра не просто "умных" телефонов, а устройств, способных передавать персональные данные человека. Так, в следующем году, по моей информации, всемирно известные производители сотовых телефонов планируют выпустить модели телефонов, которые будут предназначены для ношения на руке как часы, и будут способны считывать различные биоритмы человека, такие как пульс, давление и прочие медицинские параметры. Одно из применений этих данных будут полезны в медицине. Так, информация будет передаваться автоматически лечащему врачу, но также может быть использована и в более широком назначении. Допустим, телефон сможет подбирать музыку в зависимости от настроения его обладателя. А если человек спит или устал, то вполне адекватным будет отклонение звонка.

Подобные технологии использования биоритмов доступны уже сейчас, пусть и не с максимальной точностью, но это явно показывает прогресс и тренды. Недавно появилось приложение HappyWakeUp для смартфонов на базе Symbian S60, которое способно будить человека в самый подходящий для его организма момент. Работа HappyWakeUp основана на медицинских данных, полученных при исследовании человеческих биоритмов. При помощи встроенного в телефон микрофона HappyWakeUp следит за сном и посылает сигнал о пробуждении именно тогда, когда организм находится в заключительной стадии сна и может проснуться естественным путем. Пробуждение именно в этот момент считается самым безопасным для человеческого мозга и всего тела.

Все эти сервисы возможны на следующем этапе развития смартфонов и коммуникаторов и превращения их в медиафоны, устройства, которые способны передавать и обрабатывать абсолютно любые виды контента, в том числе и изображение реального мира, используя персональные данные как биоритмы, местоположение абонента и другую подобную информацию.

Такие приложения, как Happy Wake Up, системы поиска PowerSet, которые способны "подумать" о том, что нужно пользователю, а не выдать ответ на основе статистики, а также датчики электронных устройств на базе технологий Zigbee, которые будут самостоятельно обмениваться информацией, в совокупности с социальным графом, позволяющего собрать о пользователе информацию комплексно, имеется возможность перевести любой аспект реальности в цифровой вид. И чем больше пользователь передает различных данных о себе с персонального устройства, тем более точный контент получает в ответ на запросы, даже если они были указаны не полностью или не явно, ведь в этом случае доступна для анализа личность пользователя.