IBM Watson: путь к когнитивно-вычислительному бизнесу

Источник: therunet

Для начала суперкомпьютер обыграл человека в шахматы. Сегодня проект Watson собирает вокруг себя целую экосистему проектов, каждый из которых способен серьезно изменить человеческий мир.

IBM приступила к проекту Watson в 2007 году. Отнюдь не на пустом месте. За плечами компании были десятилетия работы с суперкомпьютерами и прорывной успех "Deep blue". В 1997 году впервые чемпион мира по шахматам среди компьютеров победил чемпиона среди людей - Гарри Каспарова. Сделано это было с таким блеском, что великий шахматист даже публично выражал сомнение, что обыграл его компьютер, а не группа экспертов.

Гарри Каспаров сомневался, что компьютер победил его честно. Но реванша не получилось.

Однако сомнения быстро рассеялись. Компьютеры стали регулярно обыгрывать чемпионов мира по шахматам и лучших шахматистов мира. В итоге интерес к шахматам в мире резко упал, а "Голубой гигант", как называют IBM, занялся подготовкой к новому прорывному проекту.

Вундеркинд

После четырех лет обучения Watson, как любого ребенка выпустили поиграть. Для всемирного дебюта было выбрано топовое американское телешоу Jeоpardy, известное в России, как "Своя игра". Против Watson`a выпустили не кого-нибудь, а чемпионов Америки. Итог был ошеломляющим для человечества, но не для команды разработчиков IBM. Watson выиграл за явным преимуществом.

Американских суперигроков "Своей игры" Watson разгромил в пух и прах.

Некоторые поспешили окрестить Watson уже родившимся на свет искусственным интеллектом, прообразом столь популярного в Америке Skynet. Однако, на мой взгляд, по крайней мере, на нынешний момент это - явное преувеличение. Пока Watson представляет собой самую эффективную в мире экспертную систему широкого профиля.

Что же такое Watson? На момент теледебюта это были 750 серверов POWER7, соединенных в систему с объемом в 15 терабайтов памяти. Следует особо подчеркнуть, что это абсолютно типовые сервера, которые используются корпорацией для различных нужд и не представляют собой топ суперкомпьютер, которых IBM изготовила тоже достаточно. Суперкомпьютером сервера становятся, когда собираются в кластеры. Типовой характер серверов позволяет их соединять в сколь угодно большие кластеры и реализовывать на них облачные вычисления.

Одна из стоек знаменитого Deep Blue.

Еще более важным, чем "железная" начинка, является уникальное программное обеспечение. Собственно оно-то и представляет собой проект Watson. Это программное обеспечение получило название DeepQA. Оно включает в себя не имеющую аналогов интеграцию машинной обработки естественного языка NLP, поиска информации IR, машинного обучения ML, множественно-параллельных вычислений и представления знаний и рассуждений KP&R. Всего в уникальное интеллектуальное ядро Watson`a входит 40 ключевых программ. Программное обеспечение Watson`a написано на различных языках, в том числе Java, C + + и Прологе и использует Apache Hadoop.

Если рассматривать Watson более пристально, то получается следующая картина.

Во-первых, аппаратная архитектура Watson`a такова, что позволяет осуществлять распределенные вычисления, т.е. сразу работать с множеством задач в параллельном режиме. Кроме того, выполнять программы сразу на многих устройствах, подключенных к головному кластеру серверов, реализованному, в том числе, в облаке.

Во-вторых, Watson обладает быстродействием, свойственным именно суперкомпьютерам, что позволяет решать самые сложные задачи в режиме реального времени и соответственно вести оперативный, без задержек диалог с оператором, с человеком.

В-третьих, Watson способен работать с супербольшими данными, т.е. структурированной и неструктурированной информацией, включающей не только тексты и таблицы, но и фотоизображения, видео- и аудиопотоки. Все эти разнородные форматы данных интегрируются в Watson в единые информационные базы и потоки. При этом в системе имеется мощнейший интеллектуальный аппарат многомерной обработки любых данных. Этот аппарат использует не только статистические методы, но и алгоритмы, базирующиеся на теории распознавания образом, а также других разделах математики.

В-четвертых, в Watson в полном объеме реализован принцип машинного обучения. Результаты машинных вычислений постоянно сравниваются с эталонными ответами, и соответственно при наличии ошибок в автоматическом режиме система перестраивается и совершенствуется таким образом, чтобы каждую следующую итерацию получать более правильные ответы.

Наконец, в-пятых, система способна воспринимать естественный язык, как в виде звукового ряда, так и текстов, как на входе, так и на выходе. В этом смысле Watson представляет собой самую совершенную в мире экспертную систему, способную вести диалог с человеком на обычном языке, как это и было продемонстрировано в ходе игры Jeopardy.

Пора учиться

После детских игр Watson пошел учиться. Как полагается вундеркинду, он сразу же отправился в один из ведущих университетов и существующий при нем Мемориальный центр Слоун-Кеттеринг. В этом центре команда разработчиков вместе с ведущими американскими онкологами обучали Watson`a диагностике онкологических заболеваний. Была поставлена задача, чтобы в итоге он помогал врачам диагностировать больных, и рекомендовал подходящие для каждого конкретного случая курсы лечения. 

В процессе обучения Watson "прочел" более трех миллионов страниц медицинских книг, пособий, справочников, "изучил" полтора миллиона медицинских карт больных онкологическими заболеваниями, включая полторы тысячи людей, больных раком и находящихся на лечении в Мемориальном центре. Параллельно команда Watson совершенствовала его хард и софт и значительно увеличила когнитивно-вычислительные возможности.

После тщательного обучения Watson приступил к практическому консультированию. Не так давно корпорация IBM и Мемориальный центр сообщили общественности, что уже сегодня Watson значительно повысил точность диагностики онкологических заболеваний и способен давать советы врачам средней квалификации, а таких в Америке и в мире подавляющее большинство, которые значительно повышают эффективность лечения раковых больных этими медиками.

Недавно команда Watson объединила свои усилия с Бэйлорским медицинским колледжем. Это учебное заведение в штате Техас известно умением разрабатывать высокотехнологичные продукты для массовой медицины.

Предварительно было установлено, что существует определенный вид белка, который как бы стережет организм от злокачественных опухолей. Нарушение в его выработке организмом резко повышает риск возникновения онкологических заболеваний. Соответственно существуют специальные вещества, которые исправляют это несовершенство организма и помогают ему вырабатывать искомый белок. А соответственно, предотвращать, а иногда даже подавлять онкологические заболевания. Вся проблема состояла в том, что в год открывается только один фермент, который оказывался пригоден для разработки на его основе опытных лекарства. В итоге, на поиски таких ферментов, на испытание лекарств, на их проверку уходят не только долгие годы, но и десятки, а иногда и сотни миллионов долларов.

Для этой работы был подряжен Watson. Перед ним была поставлена задача прочитать все научные статьи, опубликованные на всех основных языках, посвященные данной тематике.И не просто прочитать, а постараться извлечь новые знания, то есть, найти ферменты, которые потенциально могут быть взяты в разработку для подготовки лекарств.

Парадокс сегодняшней науки состоит в том, что исследователи всех стран мира генерируют огромное количество научной информации. Причем, практически никто не в силах прочитать ее всю, чтобы сложить мозаику в общую картину. Ситуация усугубляется еще и тем, что современные специалисты - это исследователи высокоспециализированной науки.

Сегодняшняя наука описывается словами Бориса Заходера "Академик по китам, Академик по котам". А состояние в технологиях предвидел Козьма Прутков, когда сформулировал: "специалист подобен флюсу". При этом мало того, что каждый год генерируются огромные массивы информации, нет и гарантий, что те или иные решения не были найдены 5-10-15-20 лет назад. В науке полно примеров, когда вновь переоткрывали то, что было найдено много лет, а то и десятилетий назад, но не получило признания, не было привязано к решению конкретной задачи, не имело конкретного технологического воплощения.

После трех месяцев работы Watson таких потенциальных ферментов было найдено не один, а целых семь. И все они весьма перспективны. Понятно, что при помощи такого же подхода можно искать решения практически в любой области знаний, технологической и инженерной деятельности.

Служу отечеству

Одновременно Watson вышел на государственную службу. В настоящее время известно, что система готовится к использованию Департаментом внутренней безопасности АНБ и ФБР. Что касается ФБР, то, как заявил, правительственный чиновник Шон Маккарти: "Watson является великолепной аналитической платформой. Детальный скрупулезный анализ огромных массивов данных он может выполнить лучше наших специалистов. Он не будет принимать решения, он будет делать выводы. А конечные решения будут принимать, естественно, люди. Первой областью, где мы собираемся задействовать Watson - это расследование случаев мошенничества". 

Мошенничества в Соединенных Штатах приобрели размеры национального бедствия. Недавно было объявлено, что Министерство юстиции США готово начать расследование в отношении Bank of America, Citigroup, Credit Suisse, Deutsche Bank, Goldman Sachs, Morgan Stanley, Royal Bank of Scotland, UBS и Wells Fargo.

Как пишет Financial Times, обвинения будут связаны с введением покупателей в заблуждение о качестве предлагаемых активов. Ранее стало известно, что банк JPMorgan Chase & Co. уже заключил с властями соглашение, по которому должен выплатить правительству США $13 млрд. 

В мошенничестве со страховками, различного рода государственной помощью, кредитными картами в Америке уличены сотни тысяч людей. Теперь банками, гражданами и домохозяйствами займется Watson.

Параллельно Watson отлично показал себя в качестве актуария, расчетчика страховых рисков и инвестиционного консультанта. Его рекомендации по формированию портфеля акций оказались заметно более прибыльными, чем рекомендации контрольной группы маститых инвестиционных консультантов Wall Street. 

А для развлечения широкой публики Watson научился составлять рецепты блюд для дорогих популярных нью-йоркских ресторанов. Одновременно был устроен эксперимент: публику попросили давать оценку новым блюдам. При этом она не знала, кто был автором рецепта - лучшие повара, либо Watson. По сообщению New York Times победил в кулинарном конкурсе, хотя и с немалым трудом, опять же Watson.

Голова в облаках

Все это позволило в ноябре этого года объявить о начале третьего этапа в жизни Watson. Он переселяется в облако, и открывается для сторонних разработчиков приложений. У Watson появились API, при помощи которых сторонние программы и сервисы могут использовать мощь когнитивных вычислений Watson.

Команды разработчиков, получив знания по архитектуре Watson и его программным решениям, могут писать свои приложения для конкретных, нужных им предметных областей. Если у разработчиков возникают какие-либо затруднения, то 500 человек, занятых в программе Watson, готовы дать необходимые пояснения. Пока IBM ограничивает число сторонних разработчиков. Те, кто захочет для своих приложений использовать возможности Watson, должны сначала обратиться в компанию, получить одобрение и доступ в облако, и лишь потом начать работу.

Уже определены первые сторонние программы и приложения, в которых будут задействованы мощности Watson. Первое приложение создает компания Fluid. Fluid Expert Personal Shopper ориентирован на электронную коммерцию. Посетитель интернет-магазинов со встроенным Fluid Expert Personal Shopper, смогут задавать виртуальному помощнику вопросы на обычном языке также, как живому человеку и получать исчерпывающие, персонифицированные ответы. Задача Watson`a состоит в понимании вопроса покупателя, и главное, в выборе рекомендаций, наиболее соответствующих заданным вопросам, а также имеющейся информации о пользователе интернет-магазина.

Еще одно приложение разрабатывают в компании MD Buyline, специализирующейся на поставке медицинского оборудования и программного обеспечения. Оно ориентировано на врачей и называется соответственно - Hippocrates. Обязанностями "Гиппократа" с мозгом Watson будут обработка информации, которую накопили медицинские учреждения, и выработка быстрых и основанных на имеющихся фактах рекомендаций, способных помочь специалистам в момент принятия решения.

И самая свежая разработка - виртуальный "консьерж", созданный медицинской компанией Welltok. Он способен провести с человеком информативную и дружественную беседу о выборе последним методов и способов охраны своего здоровья.

Тренд сезона - когнитивные вычисления

На пресс-конференции руководство IBM заявило, что на первом этапе оно будет отдавать предпочтение приложениям, связанным с потребительским рынком, а также медицинскими услугами. Одновременно оно объявило, что по мере накопления опыта взаимодействия команды Watson со сторонними разработчиками, увеличением масштабов облака и отработкой технических деталей, корпорация планирует открыть доступ к Watson для всех сторонних разработчиков.

Наиболее проницательные аналитики буквально в последние недели пришли к выводу о том, что вслед за Облачными вычислениями, Мобильным вебом и Большими Данными на горизонте появилась следующая Big Thing - бизнес на Когнитивных Вычислениях. На сегодняшний день это бизнес вместе с нашим знакомцем Watson в самых различных сферах. 

Наилучший путеводитель по когнитивным вычислениям - это вышедшая в октябре этого года книга Джона Келли и Стива Хемма "Умные машины: Watson от IBM и эпоха когнитивных вычислений" (John E. Kelly III , Steve Hamm "Smart Machines: IBM's Watson and the Era of Cognitive Computing").

Чтобы в очередной раз не опоздать на поезд информационных технологий и занять привилегированные места в его головных вагонах, необходимо понимать несколько основополагающих принципов успеха в бизнесе Когнитивных Вычислений.

Во-первых, сторонние разработчики должны располагать собственными первоклассными базами данных, включающими как структурированную, так и неструктурированную информацию, по возможности, максимально полно охватывающую предмет или тему, по которой создается приложение. Важно, что информация может извлекаться практически из любых источников - из интернета, из оцифрованной печатной продукции, из сведений, накопленных в офф-лайне и так далее.

Во-вторых, должна быть четко и исчерпывающе сформулирована цель или функциональная нагрузка приложения. Watson - это не человек, и даже не искусственный интеллект в полном смысле этого слова, а сверхмощная экспертная система. Соответственно, он может отвечать на вопросы, делать прогнозы, находить не6тривиальные связи, проводить анализ, строить детальнейшие классификации не в любых произвольных, а в заданных разработчиками сферах. Поэтому, чем точнее сформулирован вопрос и поставлена задача, тем больший эффект будет получен от Watson.

В-третьих, разработчики должны ясно представлять способ коммерциализации приложения, либо платформы, использующей мощь когнитивных вычислений. Таких путей в принципе может быть три. Либо повышение внутренней эффективности работы бизнеса, либо рост его капитализации, либо увеличение продаж с выходом на новую клиентскую группу или открытие нового рынка. Как писали Ильф и Петров: "В мире чистогана правит доллар", а соответственно, приложения, если они не носят откровенно социальной направленности, должны приносить прибыль. Понятно, что для IBM проект Watson и когнитивные вычисления - это, прежде всего, бизнес, а соответственно, подключение к Watson наверняка будет платным, и возможно недешевым.

Когнитивные вычисления в ближайшие годы будут востребованы в самых различных сферах деятельности. Понятно, что в первую очередь они затронут те офисные сферы, где труд достаточно рутинен, но при этом весьма и весьма дорогостоящ. В этом плане необозримые перспективы открывает применение Watson в юриспруденции и консалтинге. Здесь основная часть времени уходит не на поиск решения, а на перелопачивание огромных массивов информации. Именно на это затрачиваются сотни и тысячи часов, которые оплачивают клиенты юридических и консалтинговых фирм по всему миру.

Это даже не миллиарды, а десятки, и в итоге, вероятно, и сотни миллиардов долларов. Большинство юристов и консалтеров, занятых обработкой документации, с успехом и быстро заменит Watson. Не меньшие масштабы высвобождения он, вероятно, сможет обеспечить и в сфере медицинских услуг. И это лишь первые шаги.

Один их хитов продаж - книга о печальной судьбе человечества и торжестве искусственного разума.

Кстати, перспективы Watson понимают не только те, кто от его прихода в повседневную жизнь выиграет, но и те, кто может оказаться в убытке. Не зря предрождественским бестселлером в Америке стала книга Джеймса Баррата "Наше последнее изобретение: искусственный интеллект и конец человеческой эры" (Our Final Invention: Artificial Intelligence and the End of the Human Era).


Страница сайта http://test.interface.ru
Оригинал находится по адресу http://test.interface.ru/home.asp?artId=35352