МОДЕЛИРОВАНИЕ КОГНИТИВНОЙ ЭВОЛЮЦИИ - ЕСТЕСТВЕННЫЙ ПУТЬ К ИСКУССТВЕННОМУ ИНТЕЛЛЕКТУ
В.Г. Редько
Естественный интеллект возник в процессе биологической эволюции, в процессе постепенного усовершенствования систем адаптивного управления поведением животных. Но как возникли такие «интеллектуальные изобретения» биологической эволюции? Насколько возможно промоделировать процесс эволюции высшей нервной деятельности, приведшей к возникновению человеческого интеллекта? Могут ли теоретические исследования «интеллектуальных изобретений» биологической эволюции служить естественнонаучной основой для построений систем искусственного интеллекта?
Для того, что осмыслить эти интригующие вопросы, целесообразно постараться проанализировать, что уже сделано, и что можно сделать в будущем в области теоретических исследований «интеллектуальных изобретений» биологической эволюции.
Задача моделирования «интеллектуальных изобретений» биологической эволюции.
Отметим уровни «интеллектуальных изобретений», в основном следуя книге Л.Г. Воронина «Эволюция высшей нервной деятельности» [1]. Естественно начать с самого начала - с происхождения жизни и идти по ступеням эволюции к наиболее четкой форме человеческого интеллекта - к человеческой логике.
Уровень первый - организм различает состояния внешней среды, память об этих состояниях записана в геноме и передается по наследству, организм адекватно использует различие сред, меняя свое поведение с изменением среды.
Пример этого уровня - свойство регулирования синтеза белков в ответ на изменение питательных веществ во внешней среде по классической схеме Ф. Жакоба и Ж. Моно [2]. Например, бактерия кишечной палочки обычно питается глюкозой, но если нет глюкозы, а есть лактоза, то в бактерии включается синтез специальных ферментов, перерабатывающих глюкозу в лактозу, что и обеспечивает жизнь бактерии в лактозной среде. Фактически рассмотренное свойство регулирования синтеза белков - это безусловный рефлекс на молекулярно-генетическом уровне.
Второй уровень - кратковременное запоминание организмом состояния среды и адекватное (также временное) приспособление к среде.
Пример этого уровня - привыкание, а именно, постепенное угасание реакции раздражения на биологически нейтральный стимул. Этот простейший приобретаемый навык появляется на уровне сложных одноклеточных организмов. Например, если на инфузорию действовать нейтральным стимулом, скажем, капать капелькой воды, то у инфузории возникает реакция раздражения. Но, если этот стимул повторяется многократно, то реакция раздражения постепенно угасает. Отметим, что привыкание отличается от утомления: если на инфузорию, привыкшую к падающей капле воды, подействовать другим нейтральным стимулом, то реакция раздражения восстанавливается. Согласно опытам В. Кинастовского [3] время выработки привыкания у инфузорий составляет 10 - 30 минут, сохраняется привыкание в течение 1 - 3 часов.
Третий уровень - запоминание устойчивых связей между событиями в окружающей организм природе.
Пример - классический условный рефлекс (И.П. Павлов, [4]), в котором происходит долговременное запоминание связи между условным и безусловным стимулами. Скажем, собака запоминает связь между звуковым сигналом (условный стимул) и пищей (безусловный стимул).
Формирование условного рефлекса (УР) происходит в три стадии [5]. Первая стадия - прегенерализация, во время которой еще нет реакции на условный стимул, однако повышается электрическая активность разных областей мозга. За ней следует стадия генерализации, при которой реакция возникает как на условный стимул, так и на различные подобные ему (дифференцировочные) раздражители. Затем происходит специализация, при которой реакция на дифференцировочные стимулы постепенно ослабевает, и сохраняется только реакция на условный стимул. Память о связи между условным и безусловным стимулами долговременная: УР сохраняется в течение многих недель у низших позвоночных и до нескольких лет, а, может быть, и всю жизнь у высших животных [1]. Биологическое значение классического УР - предвидение будущих событий и адаптивное использование этого предвидения. Появляется классический условный рефлекс примерно на уровне моллюсков.
Между классическим условным рефлексом и логикой лежит ряд промежуточных уровней [1]. Здесь мы только упомянем некоторые из них. Инструментальный условный рефлекс отличается от классического тем, что здесь для получения поощрения животному необходимо совершить заранее неизвестное ему действие. Цепь условных рефлексов - система реакций, формирующаяся на основе ранее хранившихся в памяти животного условных связей. Начиная с некоторого уровня, у животных возможно формирование моделей внешнего мира [6,7]. Итак, можно выделить несколько ключевых «изобретений» и расположить их в последовательный ряд эволюционных достижений (рис.1). В этом ряду происходит постепенное усовершенствование «познания» закономерностей в окружающей среде.
Что же сделано в области теоретического моделирования эволюции «интеллектуальных» изобретений и осмысления того, как в процессе биологической эволюции возникали и развивались познавательные способности биологических организмов? Общая ситуация примерно такова. Есть множество математических и компьютерных моделей, характеризующих «интеллектуальные» изобретения: модель возникновения безусловного рефлекса на молекулярно-генетическом уровне (В.Г. Редько, 1990 [8]), модели привыкания (Дж. Стэддон, 1993 [9]), большое количество моделей условного рефлекса (А.А. Ляпунов, 1958, С. Гроссберг, 1974, А. Бэрто, Р. Саттон, 1982, Г. Клопф и др., 1993 [10-14]). Однако эти модели очень фрагментарны, слабо разработаны и не формируют общую картину эволюционного происхождения интеллекта.
Рис. 1. «Интеллектуальные изобретения» биологической эволюции. «Авторы изобретений» и «даты приоритетов» представлены довольно условно. Штриховая стрелка иллюстрирует то, что между условным рефлексом и логикой есть ряд не представленных на рисунке «изобретений».
Пока можно проводить только предварительные аналогии между когнитивными свойствами животных и логикой человека. Например, после выработки условного рефлекса в памяти животного формируется связь между условным стимулом УС и безусловным стимулом БС, и животное приобретает способность делать определенный «логический вывод». А именно, если наступает событие УС, то животное, зная, что за УС последует БС, «выводит», что надо ожидать событие БС. Этот вывод аналогичен применению классического правила логики modus ponens: если из А следует В и имеет место А, то имеет место В.
Итак, сейчас можно говорить только об определенном заделе теоретических исследований «интеллектуальных изобретений» биологической эволюции. Но этот задел активно развивается.
Сравнительно недавно (конец 1980 - начало 1990 годов) появились два интересных направления исследований «Искусственная жизнь» и «Адаптивное поведение», которые тесно связаны с моделированием познавательных способностей биологических организмов.
Направления исследований «искусственная жизнь» и «адаптивное поведение»
Основной мотивацией исследований «Искусственной жизни» (английское название Artificial Life или ALife) служит желание понять и промоделировать формальные принципы организации биологической жизни [15,16]. Как сказал руководитель первой международной конференции по искусственной жизни К. Лэнгтон «основное предположение Искусственной жизни состоит в том, что "логическая форма" организма может быть отделена от материальной основы его конструкции». В большинстве моделей искусственной жизни «организмы» - это придуманные людьми объекты, живущие в мире компьютерных программ.
Приведем примеры характерных исследований Искусственной жизни (см. также [17]):
исследование динамики жизнеподобных структур в клеточных автоматах (К. Лэнгтон);
эволюция и формирование «биоразнообразия» самовоспроизводящихся программ, живущих в виртуальных компьютерах; теоретический анализ этого биоразнообразия (Т. Рей, К. Адами);
компьютерная модель ПолиМир (PolyWorld), разработанная Л. Ягером, в которой эволюция популяции искусственных организмов (агентов) происходит вполне естественным образом: агенты питаются растущей на лужайках травой, могут бороться друг с другом (в результате борьбы агент может погибнуть, тогда он превращается в пищу, которую может съесть победитель), могут скрещиваться, давая потомков - новых агентов; каждый агент имеет нейронную сеть, которая управляет поведением агента.
Отметим, что хотя лозунг «Искусственная жизнь» провозглашен в конце 1980-х, в действительности, идейно близкие модели разрабатывались в 1950-70-е годы. Приведем два примера из истории отечественной науки.
В 1960-х годах блестящий кибернетик и математик М.Л. Цетлин предложил и исследовал модели автоматов, способных адаптивно приспосабливаться к окружающей среде [18]. Работы Цетлина инициировали целое научное направление, получившее название «коллективное поведение автоматов». Уровень «интеллекта» автоматов Цетлина примерно соответствует уровню привыкания (см. рис. 1).
В 1960-70-х годах под руководством талантливого кибернетика М.М. Бонгарда была построена весьма нетривиальная модель «Животное», характеризующая адаптивное поведение искусственных организмов, живущих на разбитой на клетки плоскости и обладающих рядом конкурирующих между собой потребностей [14,19].
Направление «Адаптивное поведение» [20] тесно связано с «Искусственной жизнью»: оно также базируется на предположении, что поведение животных можно промоделировать, отвлекаясь от материальной основы биологических организмов. Однако исследования «Адаптивного поведения» более целенаправленны: основной подход этого направления - конструирование и исследование искусственных (в виде компьютерной программы или робота) «организмов», способных приспосабливаться к внешней среде. Эти организмы называются «аниматами». Термин «анимат» происходит от слов animal (животное) и robot: ANIMAL + ROBOT = ANIMAT.
Поведение аниматов имитирует поведение животных. Исследователи направления «Адаптивное поведение» стараются строить такие модели, которые применимы к описанию поведения как реального животного, так и искусственного анимата.
Программа-минимум направления «Адаптивное поведение» - исследовать архитектуры и принципы функционирования, которые позволяют животным или роботам жить и действовать в переменной внешней среде.
Программа-максимум этого направления - попытаться проанализировать эволюцию когнитивных способностей животных и эволюционное происхождение человеческого интеллекта.
Как видно, программа-максимум «Адаптивного поведения» фактически совпадает со сформулированной выше задачей моделирования эволюции познавательных способностей биологических организмов.
И так же, как для «Искусственной жизни», для направления «Адаптивное поведение» были явные провозвестники этого направления до его «официального провозглашения». Яркие примеры провозвестников - очень хороший обзор ранних работ по адаптивному поведению, представленный в книге М.Г. Гаазе-Рапопорта, Д.А. Поспелова «От амебы до робота: модели поведения» [14] и цикл глубоких и разносторонних исследований по ситуационному управлению [21]. Кроме того, несомненно, необходимо отметить теорию функциональных систем, предложенную и разработанную в 1930-70-х годах советским нейрофизиологом П.К. Анохиным [22] (см. ниже).
Многочисленные Интернет-ссылки по направлению исследований «Адаптивное поведение» можно найти на сайте международного общества «International Society for Adaptive Behavior»: http://www.adaptive-behavior.org/info/
Итак, именно сейчас ведутся (к сожалению, в основном за рубежом) активные исследования по компьютерному и математическому моделированию эволюции адаптивного поведения и познавательных способностей живых организмов.
Однако, одного моделирования явно недостаточно для охвата всей многогранности эволюции познавательных способностей биологических организмов. Поэтому целесообразно сочетание построения математических и компьютерных моделей с развитием общих схем и концепций исследования когнитивной эволюции. Отметим некоторые из концептуальных теорий.
Концептуальные теории
Теория функциональных систем П.К. Анохина. В 1930-70-х годах советским нейрофизиологом П.К. Анохиным была разработана достаточно универсальная схема адаптивного поведения организмов [22], которая может быть положена в основу исследований эволюции «интеллектуальных изобретений».
Рис. 2. Кибернетическая схема функциональной системы (в духе П.К. Анохина).
Функциональная система по Анохину - кибернетическая схема управления организмом, нацеленного на достижение полезных для организма результатов. Она характеризует следующие свойства управления (рис. 2):
целенаправленность, связанную с необходимостью удовлетворения потребностей животного;
мотивацию, задающую предпосылки (например, обусловленные потребностями) для формирования цели;
доминанту по А.А. Ухтомскому [23], обеспечивающую мобилизацию ресурсов животного на достижение приоритетной цели, в том числе мобилизацию интеллектуальных ресурсов (концентрацию внимания);
распознавание ситуации;
«планирование» действий;
принятие решения;
прогноз результата действия;
выполнение самого целенаправленного действия;
оценку результата действия;
сопоставление прогноза и результата;
поиск нужного решения и корректировку базы знаний (в случае рассогласования прогноза и результата);
обучение - процесс формирования базы знаний.
Важное понятие функциональной системы - мотивация. Роль мотивации - формирование цели и поддержка целенаправленных форм поведения. Мотивация может рассматриваться как активная движущая сила, которая стимулирует нахождение такого решения, которое адекватно потребностям животного в рассматриваемой ситуации.
Перечисленные свойства характеризуют общую схему системы управления поведением животного. Следует подчеркнуть, что есть большой потенциал для глубокого развития этой схемы. Наметим вопросы, задающие направления развития: