Модуль «Восходящее моделирование интеллектуальной деятельности» в общеобразовательном курсе інформатики
И. В. Левченко,
Д. Б. Абушкин,
А. А. Михайлюк
В статье предложен авторский подход к изложению учебного материала, позволяющего раскрыть школьникам возможность моделирования интеллектуальной деятельности с помощью нейронных сетей.
Ключевые слова: методика обучения; школьный курс информатики; компьютерное моделирование; искусственный интеллект; нейронные сети.
В данной статье описана методика преподавания модуля «Восходящее моделирование интеллектуальной деятельности», который необходимо рассматривать после модуля «Введение в искусственный интеллект», «Нисходящее моделирование интеллектуальной деятельности» [8; 9].
Сначала рассмотрим подход к реализации модуля «Восходящее моделирование интеллектуальной деятельности» [7]. При изложении содержания данного модуля необходимо опираться на сформированные знания и умения учащихся [5] и их опыт работы с базовыми информационными технологиями [3; 4], а также следует систематически использовать доступные технические средства и предлагать задания по поиску информации в сети Интернет [2; 6].
В рамках данного модуля предлагается рассмотреть четыре темы: «Информационная модель искусственного нейрона», «Структурный подход к моделированию нейронных сетей», «Эволюционный подход к моделированию нейронных сетей», «Квазибиологический подход к моделированию систем». Выделим предметные, метапредметные и личностные результаты обучения [1]. Предметные результаты обучения:
* уметь иметь представление о различных подходах к моделированию интеллектуальной деятельности;
* уметь приводить примеры решения различных задач с использованием нейронных сетей;
* иметь представление о перспективных направлениях моделирования интеллектуальной деятельности;
уметь обучать готовые нейронные сети при проведении компьютерных экспериментов.
Метапредметныерезультаты обучения:
формирование универсальных учебных действий (познавательные, регулятивные, коммуникативные), обобщенных способов информационной деятельности при моделировании интеллектуальной деятельности;
развитие познавательного интереса и творческих способностей при моделировании интеллектуальной деятельности;
приобретение опыта обучения нейронных сетей при проведении компьютерных экспериментов в индивидуальной, групповой и коллективной учебно-познавательной деятельности.
Личностные результаты обучения:
личностное и предпрофессиональное самоопределение через познавательную мотивацию к получению профессий, связанных с искусственным интеллектом, и через познавательный интерес -- к моделированию интеллектуальной деятельности;
возможность коррекции дальнейшей индивидуальной образовательной траектории после получения представления о перспективных направлениях моделирования интеллектуальной деятельности;
осознание стратегической важности для государства, общества и своего личного будущего успешности развития технологий моделирования интеллектуальной деятельности.
Базовыми понятиями для изучения модуля будут являться следующие: информация и ее виды, кодирование данных, объект и система, структура, информационная модель и компьютерное моделирование, архитектура компьютера, основные логические операции и величины, алгоритмические структуры и способы их записи, искусственный нейрон, вес межнейронной связи, порог чувствительности нейрона, таблица весов межнейронных связей, целевая функция нейросети.
К дидактическим элементам, которые осваиваются при изучении модуля, относятся: искусственный нейрон, его сигналы и параметры, таблица весов межнейронных связей, нейронная сеть и нейрокомпьютер, структурный подход к построению и обучению нейронных сетей, эволюционный и квазибиологи- ческий подходы к моделированию системы, молекулярный компьютер.
Остановимся на рассмотрении методики преподавания темы «Информационная модель искусственного нейрона», которая является первой в модуле.
Цель: дать представление об искусственном нейроне и его характеристиках, обеспечить усвоение правила формирования сигналов искусственного нейрона.
Контрольные вопросы:
Каково представление о структуре мозга человека?
В каком случае нейрон переходит в возбужденное состояние и передает сигнал другим нейронам?
Что характеризует вес межнейронной связи?
Благодаря чему нейроны выборочно реагирует на входные сигналы?
Каким образом может быть представлена вся информация, хранящаяся в мозге человека?
Какие формулы описывают преобразование сигналов в искусственном нейроне?
Каким образом искусственный нейрон может моделировать логические операции?
В каком виде хранятся веса межнейронных связей?
Вопросы для обсуждения:
Чем похожи и чем отличаются искусственные нейроны и нейроны мозга человека?
Каким образом искусственными нейронами моделируются логические операции?
Почему для моделирования функционирования искусственных нейронов достаточно устанавливать порог их чувствительности и веса межнейронных связей?
Методические рекомендации:
Обращаем внимание, что моделирование интеллектуальной деятельности человека возможно разными способами. Вначале целесообразно рассмотреть способ, который можно назвать восходящим моделированием искусственного интеллекта. Объясняем, что такое моделирование строится на основе знаний о строении и функционировании мозга человека.
Уточняем, что мозг человека состоит из множества нервных клеток, называемых нейронами, соединенных между собой нервными волокнами. Предлагаем учащимся схематичное представление структуры мозга человека.
Уточняем, что через нервные волокна нейроны обмениваются между собой электрическими сигналами. Причем число входных сигналов в один нейрон может доходить до 10 тысяч, а выходной сигнал нейрона всегда только один. Важно, что нейрон начинает передавать электрический сигнал по нервному волокну только тогда, когда суммарное значение полученных электрических сигналов превышает определенную величину, которая называется порогом чувствительности нейрона.
Обсуждаем, что каждый нейрон принимает входные сигналы по множеству каналов связи от других нейронов, обрабатывает их, и если переходит в возбужденное (активное) состояние, то передает выходной сигнал.
Объясняем, что у каждого канала связи имеется определенный вес, который характеризует силу (прочность) межнейронной связи. Причем вес межнейронной связи может меняться и зависит он от того, насколько часто эти нейроны передают информацию. Уточняем, что благодаря различным весам межнейронных связей, нейрон выборочно реагирует на входные сигналы.
Предлагаем информационную модель искусственного нейрона, представленную в виде схемы, на которой выделяем входные сигналы и выходной сигнал.
Определяем правило формирования выходного сигнала:
каждое значение входного сигнала умножается на весовой коэффициент связи;
определяется сумма всех скорректированных значений входных сигналов;
если полученная сумма не меньше порога чувствительности нейрона, то нейрон передает выходной сигнал, в противном случае на выходе сигнала нет.
Рассматриваем возможность моделирования основных логических операций (инверсии, конъюнкции и дизъюнкции) с помощью искусственного нейрона. Так, искусственный нейрон, который имеет два входа с единичными весовыми коэффициентами, моделирует конъюнкцию (порог чувствительности равен двум) или дизъюнкцию (порог чувствительности равен единице). Искусственный нейрон, который имеет один вход с весовым коэффициентом минус единица, моделирует инверсию (порог чувствительности равен нулю).
Делаем вывод, что каждый искусственный нейрон имеет определенное значение порога чувствительности и определенные значения весовых коэффициентов. Уточняем, что значения весовых коэффициентов обычно представляют в виде таблицы весов межнейронных связей.
Обращаем внимание, что искусственный нейрон (как и биологический) может находиться в двух состояниях, переход между которыми зависит от значений поступающих к нему сигналов с учетом весов межнейронных связей.
Остановимся на рассмотрении методики преподавания темы «Структурный подход к моделированию нейронных сетей», которая является второй в модуле.
Цель: закрепить знание правила формирования сигналов искусственного нейрона, дать представление об обучении нейронной сети.
Контрольные вопросы:
Что понимается под нейронной сетью?
Что понимается под нейрокомпьютером?
Какую интеллектуальную функцию человека имитирует персептрон?
Как персептрон получает входные сигналы?
Как персептрон получает начальные значения весовых коэффициентов?
Какие значения весовых коэффициентов подлежат корректировки в персептроне?
Каковы правила изменений весовых коэффициентов для обучения персептрона?
Что означает структурный подход к моделированию нейронных сетей?
В каком виде и месте хранятся данные в нейрокомпьютере?
Вопросы для обсуждения:
В чем сходство и отличие классической архитектуры компьютера и архитектуры нейрокомпьютера? Каково назначение нейрокомпьютеров?
Почему нейрокомпьютеры не получили широкого распространения сразу после их изобретения в середине ХХ века?
Какие преимущества нейрокомпьютеров можно выделить?
Методические рекомендации:
Вводим понятие нейронной сети (нейросети) как информационной модели, созданной по принципу организации и функционирования нервной системы живых организмов. Уточняем, что информационная модель отражает не все свойства исходного объекта, а лишь существенные с точки зрения цели моделирования.
Объясняем, что нейрокомпьютер -- это компьютер, работающий с информацией на основе нейронной сети.
Уточняем, что первая нейросеть типа персептрон была предложена Мак- Каллоком и Питтсом (середина ХХ в.) и позднее реализована Розенблаттом с помощью первого нейрокомпьютера (ЭВМ «Марк-1»). Этот нейрокомпьютер моделировал глаз и его взаимосвязь с мозгом человека.
Рассматриваем, каким образом с помощью нейросети типа персептрон смогли решить задачу на определение четности чисел.
Объясняем, что нейроны, реализованные в виде отдельных электротехнических устройств на электронных лампах, были связаны между собой проводниками, по которым проходили электрические сигналы. Входной сигнал на каждый нейрон поступал от фотоэлементов, расположенных на пластине прямоугольной формы, на которую накладывали изображение цифры. Если фрагмент цифры закрывал фотоэлемент, то сигнал выдавался, а если не закрывал -- не выдавался.
Уточняем, что каждый нейрон вырабатывал значение выходного сигнала (а именно логические ноль или единицу) в результате сравнения порога чувствительности с суммарным значением скорректированных входных сигналов в соответствии с их весовыми коэффициентами.
Рассматриваем идею обучения персептрона определению четности числа, т. е. способности выдавать значение «единица» при расположении на системе фотоэлементов изображения четного числа и выдавать значение «ноль» при расположении изображения нечетного числа.
Обсуждаем, что сначала значения весовых коэффициентов и порога чувствительности можно задать случайным образом. Затем обучение нейросети происходит с помощью изменений весовых коэффициентов. Предположим, что предъявлено изображение четной цифры (например, 6). В случае получения правильного ответа (выходной сигнал равен единице) весовые коэффициенты не корректируются. В случае получения неправильного ответа (выходной сигнал равен нулю) увеличивают весовые коэффициенты тех активных входов, которые способствовали возбуждению нейрона.
Рассматриваем, продолжение обучения нейросети решению задачи на нахождение четных (есть сигнал на выходе) и нечетных (нет сигнала на выходе) чисел при предъявлении изображения нечетной цифры (например, 7).
Обсуждаем, что если выходной сигнал оказался равным нулю, что означает нечетность (реакция правильная), то корректировать весовой коэффициент не нужно. Если выходной сигнал оказался равным единице, что означает четность числа (реакция неправильная), то следует уменьшить весовые коэффициенты тех активных входов, которые способствовали возбуждению нейрона.
Обращаем внимание, что продолжение обучения нейрокомпьютера для определения четности любых других чисел происходит также с помощью изменений весовых коэффициентов.
Уточняем, что существуют различные алгоритмы обучения, но все они основаны на постепенном изменении весовых коэффициентов и сравнении получаемого результата с эталонным. Обращаем внимание, что количество изменений и обходов циклов алгоритма нейросети при обработке данных может достигать триллионов повторений и даже на суперкомпьютерах это занимает несколько суток, что не позволяет говорить об оперативности решения подобных задач.