Тест Тьюринга пройден!

Сегодня, 7 июня 2014 года свершилось эпохальное событие в истории науки об управлении - кибернетики - тест для определения искусственного интеллекта, придуманный британским математиком Аланом Тьюрингом 64 года назад, пройден!

Важность этого события трудно переоценить, несмотря на то, что никто не заметил преодоления этого важного рубежа. Прежде чем рассказать о событии, давайте я немного расскажу о развитии в исследовании интеллекта и о том, что есть тест Тьюринга.

Отгремела последняя мировая война. В пекле этой войны родились все великие инновации 20 века, которые определили дальнейший ход развития технологий - реактивный полет, космические ракеты, атомная энергия, радиолокация, компьютеры. Алан Тьюринг, математик, был одним из разработчиков первых ЭВМ в мире. Именно с помощью этих электронных вычислителей союзники читали всю немецкую шифрованную переписку как открытую книгу. Важность стала очевидна в то время. Задумавшись о развитии этих машин, Тьюринг поставил важнейший вопрос - может ли машина мыслить. Затем этот вопрос он свел к другому, более простому - можно ли сделать так, что мышление машины (и речь, как отражение мышления) не возможно отличить от мышления (и речи) человека? Может ли человек спутать с кем он говорит - с машиной или с человеком.

Алан был странным и необычным математиком. Статья http://www.csee.umbc.edu/courses/471/papers/turing.pdf написанная в 1950 г не утратила актуальности и по сей день - мы также постоянно спорим о том, имеет ли машина мышление?

Стандартная интерпретация теста (согласно Википедии) звучит так:" Человек взаимодействует с одним компьютером и одним человеком. На основании ответов на вопросы он должен определить, с кем он разговаривает: с человеком или компьютерной программой. Задача компьютерной программы - ввести человека в заблуждение, заставив сделать неверный выбор ". Тьюринг посчитал, что к 2000 году машины будут способны ввести в заблуждение 30% собеседников при условии длительности беседы не более 5 минут.

Желающие получить подробное представление о философии, которая лежит за этим тестом могут посмотреть замечательный фильм, снятый в СССР на эту тему

http://youtu.be/n-kMeXIngZE

C того времени предпринималось множество попыток преодолеть ТТ. Первая важнейшая веща была установлена компьютерной программой ЭЛИЗА, созданной Джозефом Вейценбаумом. Подробнее на http://ru.wikipedia.org/wiki/%D0%AD%D0%BB%D0%B8%D0%B7%D0%B0

Опять же, гениальный документальный фильм Plug and Pray http://en.wikipedia.org/wiki/Plug_%26_Pray который неоднократно демонстрировался на наших мероприятиях Открытым Университетом Сколково. http://youtu.be/ecPEkG2Pclg

Прогресс в области изучения естественных языков и повышения мощностью компьютеров привел к тому. что возможности для выполнения ТТ пришли с самого неожиданного направления - со стороны чатботов. Чатботы - это компьютерные программы, специально разработанные для моделирования на диалога на естественном языке. Покупка и последующее превращение программы SRI в Siri установленное в яблофонах - помогло развитию индустрии искусственных помощников. Сейчас активно развиваются приложения для диалога компьютера и человека для развления, обучения, маркетинга и проч. В Сколково у нас есть пара многообещающих проектов на эту тему - Наносемантика и Спиктуит.

Но основная цель, заданная Тьюрингом до последнего времени оставалась недостижимой - чатботы были скучны и совершено и банально демонстрировали машинный интеллект отдающий жаром процессора и машинным маслом. До сегодняшнего дня.

Сегодня рубеж перейден. Чат бот, созданный по руководством российского программиста Владимира Веселова, живущего и работающего в США, сумел преодолеть 30% барьер установленный Тьюрингом более полувека назад.

Сам Владимир рассказал про себя, команду и свой чатбот следующее:

Чатбот Евгений Густман был создан командой энтузаистов в 2001 году. В 2001 мы попали в финал Loebner Prize (http://www.loebner.net/Prizef/loebner-prize.html) где поделили 2-3 место с Эллой. В состав команды входили: Евгений Демченко, Сергей Уласень, Михаил Гершкович, Джон Деннинг, Андрей Адащик, Игорь Быковских, Селена Семушкина. Графический образ создан Лореном Алкир (Laurent Alquier). Основная часть команды находится в Санкт Петербурге. После этого программа и база знаний дорабатывались, исправлялись недостатки. В 2012-м году Густман победил в соревнованиях посвященных 100-летию со дня рождения Алана Тьюринга, предсказавшего в 1950 году что к 2000-му году компьютеры смогут имитировать человека так, что средний собеседник с вероятностью более 30% будет принимать робота за человека в течение пяти минут диалога. В 2012 результат был 29.2 %, в 2014 33.3%. Программа состоит из базы знаний, которая имеет около 3-х тысяч шаблонов распознавания фраз пользователя. Это довольно немного, по сравнению с другими чатботами. Мы использовали также различные методы управления диалогом, которые позволяют имитировать именно человека, а не поисковую машину. Евгений старается направить беседу в нужное ему русло, стараясь создавать такие ситуации, когда его фраза выглядят человеко-подобно. При короткой продолжительности беседы (5 минут) такой подход часто сработывает.
Владимир Веселов закочнил Военный Инженерно Космический Институт им. А.Ф. Можайского, служил на Байконуре, закончил адъюнктуру ВИКА им. А.Ф. Можайского, работал программистом, научным сотрудником. В данный момент - разрабочик программного обеспечения в компании Amazon Web Services.

ТТ проходил следующим образом. команда ученых-организаторов теста под руководством профессора Кевина Варвика http://www.kevinwarwick.com/ и его ассистента Хумы Шан набрала судей (порядка 20 человек, поделенных на 4 смены) и "скрытых людей", которые должны были вести диалог. В тесте участвовало также пять чат-ботов, которые говорили на английском языке.

Каждый судья имел перед собой экран монитора, разделенный на 2 части. Судья должен был вести диалог одновременно с двумя сущностями. При этом не известно, кто из них компьютер, а кто человек. Ровно, как в классическом тесте. Через пять минут окна отключались. Судья заполнял анкету и потом приступал к оценке следующей пары. Основная задача определить с кем шел диалог - машина или человек.

Программа, созданная Владимиром и коллегами, смогла ввести в заблуждение ровно треть всех судей, присутствоваших на мероприятии. Поверьте, большей концентрации профессоров кибернетики я видел только на собраниях академии наук.

Подошли к концу четыре смены оценки - оргкомитет принялся подсчитывать бюллетени.

После всех церемоний я подошел к профессору и уточнил - действительно ли произошедшее означает что ТТ окончательно пройден. Да, - ответил проф. Варвик - мы специально пригласили судей и независимых наблюдателей-уважаемых ученых, чтобы все было сделано правильно и никаких сомнений не оставалось. Именно так - тест Тьюринга, пройден. Причем с оценкой значительно превосходящей (на 10%) оценку, данную самим Тьюрингом.

В целом, можно сказать, что для оценки искусственного интеллекта теперь надо придумывать другие тесты.

Пару слов о значении этого события для будущего. Прежде всего, это означает, что проникновение информационных систем в межчеловеческое общение только ускорится. Через пять лет уже невозможно будет сказать - вы общаетесь с живым оператором контактного центра или машиной. Разницу будет можно почувствовать лишь через 5 минут общения. Второе - срочно необходимо решать вопрос с проведением ТТ на русском языке. Сейчас мы явно отстаем от зарубежных коллег, ведущих исследования ИИ на английском языке. Соревновательный подход, практикуемый на родине спорта - Британии - явно показал свою эффективность. Может быть нам, в Сколково стоит взять инициативу и провести впервые ТТ на русском языке?