Prof.AI →
Документация →
Предсказание и моделирование в алгоритмическом пространстве
| |
|
Предсказание и моделирование в алгоритмическом пространствеСпоры о методе (о "правильном" научном методе познания), разгоревшиеся в филосифии Нового Времени, закончились признанием того, что абсолютно достоверного знания не существует. Однако это признание вовсе не отменило науку как таковую, а лишь поставило вопрос некоторого критерия ("критерия рациональности"), с помощью которого можно было выбирать наиболее правильную научную гипотезу (иными словами, осуществлять индуктивный вывод). Под правильностью же гипотезы или модели всегда понималась возможность предсказывать с ее помощью ранее ненаблюдавшиеся феномены. Удивительно, но в области ИИ опыт научной методологии был воспринят далеко не всеми и не сразу. Главенствующей тенденцией в ИИ долгое время оставалось (и частично остается сейчас) построение детерминированных логических (дедуктивных) систем, оперирующих с "достоверными знаниями". Например, в 1984 на годовом собрании AAAI голосованием было решено, что методы, имеющие дело с вероятностыми или недостоверными данными, никакого отношения к ИИ не имеют. В ответ на это была даже организована группа протеста, чья деятельность была посвящена вопросам вероятности и недостоверности в ИИ. И только когда машинное обучение стало одним из основных вопросов ИИ, значимость индуктивного вывода была оценена. На определенном уровне абстракции многие вопросы: распознавание образов,
формирование понятий, навигация во внешнем мире, интерпретация сенсорной
информации, обучение и т.д., - оказываются идентичными. При решении всех эти
проблем, по сути, строится модель на основе некоторых исходных данных. Более
того, и такие проблемы, как принятие решений, планирование или предсказание
можно рассматривать в качестве сопутствующих проблем моделирования. Таким
образом, решение проблемы построения модели должно стать ключом к построению
системы искусственного интеллекта. Существует множество частных методов
построения моделей, которые применяются в конкретных задачах. В этой связи особый интерес представляет алгоритмический подход к проблеме построения моделей. В этом подходе модель для некоторого исходного массива данных - это программа для универсальной машины Тьюринга (УТМ), которая эти данные порождает на выходе. Здесь необходимо сделать два замечания. 1. Помимо УТМ может использоваться любая другая эквивалентная формализация понятия алгоритма, например, нормальные алгорифмы Маркова, лямбда-исчисление, рекурсивные функции, нейронные сети и т.д. Здесь принципиально именно то, что пространство моделей является алгоритмически полным. 2. Программ, генерирующих исходный набор данных, бесконечно много. В частности, может быть просто программа, которая содержит сам массив данных, а ее работа заключается просто в том, чтобы напечатать его. Тогда возникает естественный вопрос: а где же тут, собственно, модель??? В действительности, любая программа, печатающая на выходе исходные данные является моделью, но у них есть одно принципиальное отличие - их длина. Длина программы непосредственно связана с вероятностью соответствующей модели. Чем длиннее программа, тем хуже модель. Программа, в которую данные зашиты в исходном виде, - это ad hoc модель (классическая ad hoc модель озвучивается как "на то божья воля"). Ее длина равна длине самих данных (плюс оператор печати), то есть это наихудшая (наименее вероятная) модель. Чем короче программа, тем эффективнее она выявляет закономерности, скрытые в данных. Как раз длина модели (описывающая ее сложность) и является критерием рациональности, единым для индуктивного вывода и машинного обучения. Однако обсуждение этого критерия - отдельный вопрос. Оказывается, что с помощью алгоритма можно представить любую вообразимую
человеком модель. Удивительно, но для всех иррациональных чисел, которые
известны человеку, существуют короткие программы их генерации. То есть, имея,
скажем миллион знаков числа пи, их можно сжать в программу на языке Си длиной
порядка 150 байт. И хотя многие могут возразить, что это является моделью числа
пи, однако подобная модель может использоваться для генерации последующих знаков
числа пи, причем сделает это правильно. Итак, алгоритмический подход к построению моделей позволяет преодолеть принципиальную ограниченность классических методов машинного обучения. Системы, построенные на основе этого подхода, демонстрируют возможность научиться тому, что никак не учитывалось (и просто не могло быть принято во внимание) человеком-разработчиком. Описания двух наиболее значительных проектов на эту тему можно найти по
ссылкам: Ray Solomonoff |
E-mail
© Prof 2005
25.09.2005