Кремниевый учёный ищет средства от рака

Источник: Computerra

В ранних рассказах Азимова роботы начинали с тех работ, которые для тогдашней смеси традиционного и индустриального обществ казались простейшими: уход за детьми, труд шахтёра - то, что поручалось пришедшим из деревни девке или парню. К пульту управления их допускали позже… Реальность немного иная: роботы-сиделки редки, лишь 159 штук продано в 2012-м на всей планете, но автоматика управляет энергосистемами, водит авиалайнеры, самостоятельно формирует структуры ЦОДов. А теперь "программные роботы" начинают брать на себя труд учёного, высший вид интеллектуальной деятельности!

Медицинские исследования всегда были самыми актуальными в человеческом обществе. И с морально-этической точки зрения, и с прагматично-финансовой (в здоровых государствах на здравоохранение выделяется много большая доля ВВП, чем на оборону и полицию). Ну а исследования рака занимают среди них совсем уж особое место. Мы-то состоим из машин фон Неймана, которые биологи зовут клетками. И нарушения процессов их воспроизводства, которые относятся к группе онкологических заболеваний, ужасны, а статистика их страшна. Не даром же "лекарство от рака" занимало прочное место в мечтах и прогнозах…

И вот теперь в борьбу со страшной болезнью включаются "умные" машины. Причём включаются на этапе научных исследований, то есть именно там, где могут быть совершены открытия и разработаны технологии, могущие спасти миллионы жизней. Речь идёт о программном обеспечении, созданном совместно IBM и Бэйлоровском медицинском колледжем (Baylor College of Medicine). Это учебное заведение в Хьюстоне (штат Техас) специализируется на наиболее высокотехнологических видах медицинских исследований и традиционно большое внимание уделяет вычислительной технике, располагая немалыми мощностями.

720p-ibm_rtp_data_center_2

И занимается новое программное обеспечение очень интересным делом. Оно "читает" научные статьи, в количестве десятков тысяч штук. И - "раскапывает" в них новые научные знания! Опытная эксплуатация была проведена на тематике белка p53. Окрещён сей протеин был по его молекулярной массе - 53 килодальтона. А функция его в организме чрезвычайно важна. Он работает подавителем, супрессором онкологических процессоров. Именно он "стережёт" организм от злокачественных опухолей! И примерно в половине случаев этой болезни отмечают нарушения его выработки из-за мутаций гена TP53.

Так белок p53 изобразили в компании ДНК.

Ну а на уровне биохимии организма поведение белка p53 регулируется ферментами, называемыми киназами. И вот как раз на эти энзимы обычно нацеливаются при лечении рака: отрегулируешь их - и протеин p53 сам начнёт делать своё дело. Приведём аналогию с другой большой системой - государством. Изменение работы ферментов эквивалентно установлению правильных и исполняемых законов, при которых активность людей - всегда своекорыстная и не склонная предвидеть последствия - начинает работать во благо. 

А такими весёлыми картинками биологи иллюстрируют роль р53 в организме.

Ну а что мешает "исправить законы" в организме? Так именно то, что он является большой системой. Слишком много процессов, на слишком большом числе уровней, со слишком большим числом слишком сложных связей. Причём технология методы отслеживания этих процессов дала. И биохимических исследований ведётся много… Нужно только привести эти данные в систему, извлечь из них знания, полезные для медицинских исследований и - на следующем этапе - для практической медицины.

И вот тут-то на помощь приходит "умная" машина. Сколько научных статей можно прочесть за день? Не пробежать по диагонали, а прочесть? Три, пять… Может, десять? А рабочих дней в году две с половиной сотни… А объём ведущихся в мире работ - громаден. Какую часть от того, что уже сделано другими, освоишь? Можно, конечно, пойти по пути специализации… Но вот беда: у природы специализаций нет. Ну, на уровне зоологии разделение на заходеровских "Академик по китам, / Академик по котам" сработает: кит даже со слоном на практике не борется, хотя кто его знает, из кого делают кошачий корм…

А вот на уровне биохимии организма, непрерывно играющейся в нем симфонии белков и ферментов, номер уже не пройдёт. Сосредоточишься на том или ином протеине, гене, энзиме - и окажешься в роли пушкинского Сальери. Но музыку-то как труп разъять можно: ей, музыке не больно, и самосознания у неё нет. А тут-то организм… Которому очень не хочется стать трупом. И вот на помощь пришла технология - так же, как когда-то она подарила естественным наукам микроскоп, породив микробиологию с её полезнейшими практическими выводами.

Теперь программное обеспечение от IBM и Бэйлоровского медицинского колледжа начинает работать усилителем способностей к познанию. Результаты работ - впечатляют. Прочитано шестьдесят тысяч статей по биохимии. Выделены все упоминания об известных киназах - тех ферментах, которые взаимодействуют с белком p53. Затем, вероятно (подробности работы приводят с аккуратностью: это не просто наука, а ещё и инженерия с бизнесом), были определены некие общие черты этих энзимов. Ну а на основе общих черт сформировали список ферментов, представляющих интерес для названной проблемы.

Ну а потом предсказания компьютерного исследователя были проверены на практике. И оказалось, что он указал довольно перспективные направления экспериментальных научных работ. Во всяком случае, по словам Оливера Лихтарджа (Olivier Lichtarge) из Бэйлоровского медицинского колледжа, семь из десяти предсказанных роботом-учёным ферментов с очень высокой вероятностью оказываются киназами. Безусловно, находкам предстоит ещё пройти подробное исследование и цикл публикаций в рецензируемых научных журналах, то прирост темпа исследований впечатляет.

Дело в том, что в среднем в двадцать первом веке, по словам того же Лихтарджа, открывается одна киназа в год. А тут - сразу семь! Ускорение поражающее. Ведь это - потенциальные лекарства. Это возможность спасения человеческих жизней. И это способ сокращения затрат на разработку новых препаратов, которая ныне составляет от полумиллиарда до миллиарда долларов, в немалой степени из-за того, что работы ведутся вслепую. Из-за слишком большой сложности наших организмов, и из-за гигантского объёма данных, накопленных исследователями.

Высказывание "Жизнь коротка, искусство вечно" слышали все. Как правило - на поминках деятеля искусств. Хотя на латыни оно - "Vita brévis, ars lónga" - означает "Жизнь коротка, искусство обширно"… Но и это неточно, слова-то сказаны великим врачом. И изрёк Гиппократ: "Ὁ βίος βραχύς, ἡ δὲ τέχνη μακρή" ("Жизнь быстра, а  [медицинская]наука огромна"). Так было в античности, так остаётся и в современности. Образование должно продолжаться всю жизнь, и усвоишь всего лишь мелкую часть того, что должен…

А сегодня, по словам Лоренса Хантера (Lawrence Hunter), главы Центра вычислительной фармакологии в Колорадском университете, автора интереснейшей книги " Искусственный интеллект и молекулярная биология", за последний год к Национальной медицинской библиотеке США, согласно базе данных  Medline, добавлено больше миллиона биомедицинских работ. А всего там содержится более 23 миллионов работ. Соотношение между μακρή и βραχύς совсем не в пользу человека…

Но, как мы говорили выше, информационные технологии приходят на помощь. Помогают извлекать те факты, которые иначе были бы - вместе с трудом нашедших их исследователей - навечно погребены в грудах бумаг и цепочках байтов на книжных полках или серверах… Конечно, это только намётки для будущих экспериментальных работ классическими методами естественнонаучного исследования, в данном случае биомедицинского. Но прирост темпов извлечения полезного знания, похоже, будет очень весомый!

Ну и, конечно, данные успехи IBM и Baylor имеют, как всегда, вполне явных предшественников в науках и технологиях. Прежде всего это технология data mining - раскопок данных, о которых "Компьютерра" писала с середины девяностых. Дальше - научная "модель мира". Если в модели Коперника Земля обращалась вкруг Солнца, а у Кеплера планеты бежали по эллипсам, то в статьях, обработанных "умной машиной", содержалась модель биохимического взаимодействия в организме, описанного на смеси естественного и научных языков. И новые знания дал "прогон" этой модели!

И конкретная эта история, на которой мы остановились подробно, означает, кроме всего сказанного выше, начало новой отрасли бизнеса. Познавательное предпринимательство - так, что ли, перевести "The Cognitive Enterprise"? Бизнес на выработке знаний - его возможные масштабы можно оценить по приведённым выше миллиардным расходам на разработку одного лишь лекарства!!! И это уже конкретная сфера приложения сил и денег, по ней уже проходят конференции вроде проведённой 19 ноября 2013 года лабораторией IBM Research - Almaden в Сан-Хосе. Новая отрасль ИТ-бизнеса зреет на наших глазах!


Страница сайта http://test.interface.ru
Оригинал находится по адресу http://test.interface.ru/home.asp?artId=35221