Группа американских учёных под руководством Брендена Лейка (Brenden Lake) из Нью-Йоркского университета представила алгоритм, позволяющий компьютеру "изучать" новые понятия и создавать визуальные образы, почти неотличимые от тех, которые создал бы человек. Разработка позволяет машинам осваивать ранее неизвестные явления значительно быстрее, чем это представлялось возможным ранее.
Когда человек сталкивается с чем-то новым для себя, будь то кухонный прибор, движение в танце или буква незнакомого алфавита, ему часто бывает достаточно нескольких примеров, чтобы понять, с чем он имеет дело. Хотя машины с некоторых пор тоже способны обучаться подобным образом, им для этого требуется в сотни, а иногда и в тысячи раз больше примеров, чем человеку.
Алгоритм, позволяющий решить эту проблему, разработчики назвали "Байесовским программным обучением" (Bayesian Program Learning) в честь автора одна из основных теорем элементарной теории вероятностей Томаса Байеса (Thomas Bayes). Работает этот алгоритм следующим образом: к примеру, если компьютеру нужно изучить букву "А", в него загружается компьютерный код, позволяющий генерировать примеры того, как эта буква выглядит. При этом различные примеры будут отличаться друг от друга так же, как две буквы "А", написанные от руки людьми с разным почерком. При этом, как утверждают учёные, "наблюдения" за этой генерацией позволяли машине изучить букву не как сочетание точек, а как определённую "концепцию". При этом программа является самообучающейся - к примеру, опыт изучения латинских букв может ей использоваться при изучении греческих. Модель была опробована на 1 600 символах из 50 языков, в том числе древних и даже вымышленных.
Чтобы испытать свою разработку, создатели алгоритма также провели "визуальный тест Тьюринга":в серии экспериментов человеку и компьютеру демонстрировали по одному примеру написания определённой буквы, после чего давали одно из двух заданий - изобразить эту букву самостоятельно либо придумать другую букву "в том же стиле". Когда другим людям предлагали определить, какое из двух получившихся изображений создано машиной, а какое - человеком, лишь 25% "судей" угадывали верно достаточно часто, чтобы это нельзя было списать на статистическую погрешность.
Работа учёных опубликована в журнале Science.