Управление поведением мультиагентной системы и выбором ее действий. Рациональность поведения является основным свойством мультиагентной системы, в тоже время именно это свойство сложнее всего поддается формализации. Наиболее часто рациональность отождествляется с УПРАВЛЯЕМЫМ ЦЕЛЯМИ ПОВЕДЕНИЕМ, при этом подразумевается, что коалиция агентов МА-системы не просто взаимодействует с объектом взаимодействия, а пытается при этом достичь определенных ЦЕЛЕЙ.
Известно [6], что под ЦЕЛЬЮ часто понимается некоторое подмножество состояний объекта воздействий , одного из которых МА-системе необходимо достичь. РАСШИРЕННЫМИ ЦЕЛЯМИ часто называют множество конечных цепочек состояний объекта воздействий . Расширенная цель считается достигнутой в том случае, если история взаимодействия коалиции агентов с объектом воздействий имеет конечный префикс, состояния объекта воздействий в котором совпадают с состояниями одной из цепочек множества . Такие цели относятся к ЦЕЛЯМ С КОНЕЧНЫМ ГОРИЗОНТОМ, т.е. к целям, которые могут быть однажды достигнуты.
Другим видом целей являются ИНВАРИАНТНЫЕ СВОЙСТВА, которые должны выполняться на протяжении всего, потенциально бесконечного, взаимодействия МА-системы с объектом воздействий. Инвариантные свойства также можно описать с помощью множества состояний объекта воздействий , подразумевая, что свойство выполнено, пока объект воздействий находится в одном из этих состояний. По аналогии с расширенными целями, можно описать и РАСШИРЕННЫЙ ВАРИАНТ ИНВАРИАНТНОГО СВОЙСТВА с помощью множества бесконечных цепочек . В этом случае свойство считается выполненным, если состояния объекта воздействий в истории взаимодействия МА-системы с ним являются префиксом одной из цепочек в множестве .
Применительно к мультиагентным системам управления составной отражающей поверхности наиболее предпочтительным описанием цели коалиции агентов является представление ее в виде ФУНКЦИИ-КРИТЕРИЯ:
, (31)
при этом каждая из функций-критериев агентов, входящих в коалицию, может принимать три значения:
? completed, когда цель окончательно достигнута;
? continue, если история взаимодействия соответствовала цели, но окончательно цель еще не достигнута;
? failure, если цель не была достигнута и не может быть достигнута и в будущем.
Заметим, что множество является частью внутреннего состояния МА-системы .
На вход функции-критерия подается часть истории взаимодействия МА-системы с объектом воздействий, т.е. с составной поверхностью, содержащая информацию о восприятии соответствующих пространственных состояний панелей поверхности и информацию о представлениях коалиции агентов на данный момент (в т.ч. о модельных представлениях МА-системы). Результатом функции-критерия является флаг, показывающий достигнута ли цель и возможно ли её достижение в будущем.
Отметим, что у ограниченной ресурсами МА-системы не всегда есть возможность достижения всех своих целей, поэтому зачастую множество всех целей агента называют ЖЕЛАНИЯМИ МА-СИСТЕМЫ , а подмножество тех целей, которые коалиция агентов собирается реализовать - НАМЕРЕНИЯМИ МА-СИСТЕМЫ. В целом можно выделить следующие свойства намерений:
Свойство 1. Намерения ЗАДАЮТ НАПРАВЛЕНИЕ ДЕЯТЕЛЬНОСТИ - коалиция агентов пытается найти действия, способные осуществить намерения и выполнить их.
Свойство 2. Намерения ОГРАНИЧИВАЮТ БУДУЩИЙ ВЫБОР - МА-система не может формировать новые намерения, несовместимые с уже принятыми, т.е. ведущие к невыполнимости множества намерений.
Свойство 3. Намерения ИМЕЮТ ДОЛГОЕ ВРЕМЯ ЖИЗНИ - если МА-система сформировала план реализации намерения, но он не привел к успеху, то система будет формировать новые планы и пытаться реализовать намерение другим способом.
Свойство 4. Намерение МОЖЕТ БЫТЬ ОТБРОШЕНО ТОЛЬКО ПРИ ОСУЩЕСТВЛЕНИИ ОПРЕДЕЛЕННОГО УСИЛИЯ в случаях, если коалиция агентов пришла к выводу, что реализовать намерение невозможно (не удается сформировать план, ведущий к достижению намерения) или оно уже неактуально для коалиции.
Свойство 5. Намерения ВЛИЯЮТ НА БУДУЩИЕ ПЛАНЫ - если МА-система выработала намерение, то она может строить планы на будущее с предположением, что это намерение реализовано.
Таким образом, подмножество целевых критериев должно быть выполнимо по представлениям МА-системы, т.е. все намерения коалиции должны быть ДОСТИЖИМЫ В СОВОКУПНОСТИ или ВЫПОЛНИМЫ. Под выполнимостью намерений здесь понимается наличие у коалиции агентов ПЛАНА, ведущего к осуществлению всех намерений.
План у МА-коалиции можно рассматривать как КОНЕЧНЫЙ АВТОМАТ
, (32)
входной алфавит которого является множеством возможных полных восприятий коалицией состояний объекта воздействий и действий агентов МА-системы, выходной алфавит совпадает с множеством действий коалиции, а множество внутренних состояний автомата планирования есть декартово произведение внутренних состояний планов агентов
, (33)
с вектором начального состояния и отношением переходов
, (34)
определяющим по полному восприятию текущего состояния составной отражающей поверхности и действий МА-коалиции, набору сигналов , переданных агентами коалиции друг другу, и текущему внутреннему состоянию плана следующее состояние плана , а также действие , которое необходимо выполнить МА-системе.
ВОЗМОЖНЫМ РЕЗУЛЬТАТОМ ПЛАНА в начальном состоянии внешней среды и в начальном состоянии плана по модельным представлениям коалиции агентов обычно называется множество цепочек , где для каждой -й цепочки и , и, если для любого существуют такие состояния векторов , и , что и , то для существует такое действие , что и .
Заметим, что результат плана по представлениям МА-системы может отличаться от реальных результатов плана в том случае, если представления коалиции агентов расходятся с реальностью. Будем считать, что план реализует цель по модельным представлениям МА-системы в текущем состоянии объекта воздействий, воспринимаемом как , если для любой цепочки выполнено . Множество всех возможных планов обозначим как . В тех случаях, когда это не будет вести к двусмысленности, будем отождествлять план с его отношением переходов .
План коалиции агентов не является статичным - при изменении желаний или представлений МА-системы он может быть перестроен. Этот процесс можно смоделировать ФУНКЦИЕЙ ОБНОВЛЕНИЯ ПЛАНА:
, (35)
сопоставляющей текущему модельному представлению , текущей цели , текущему плану и полному восприятию текущего состояния внешней среды и действий коалиции агентов новый план .
В большинстве случаев новый план будет совпадать со старым, однако, если цели (желания) или модельные представления МА-системы радикально изменились или произошедшие в объекте воздействий изменения не были предусмотрены исходным планом, может быть построен новый план. Заметим также, что с каждым планом можно ассоциировать некоторое множество целей , которые реализуются планом по модельным представлениям коалиции агентов и которые содержались в целевом множестве коалиции на момент построения. Именно эти цели и соответствующие им законы управления, как уже упоминалось, и являются НАМЕРЕНИЯМИ МУЛЬТИАГЕНТНОЙ СИСТЕМЫ.
Выбор действия МА-системы является одним из важнейших этапов его работы. В типовой ситуации МА-коалиция, основываясь на полном восприятии текущего фазового состояния объекта воздействий (в совокупности с другими дополнительными параметрами, характеризующем состояние - подробнее см. соотношение (21)), на текущем внутреннем состоянии МА-системы, на текущем модельном представлении МА-коалиции об объекте воздействий и руководствуясь текущим состоянием плана , а также знанием о предыдущем действии коалиции агентов, выбирает свое следующее плановое действие при наличии ограничений на выбор действия:
. (36)
Заметим, что данный способ выбора действия МА-системы учитывает текущую цель управления объектом воздействий (составной отражающей поверхности главного рефлектора) посредством использования функции обновления плана , задаваемой соотношением (35). Однако в условиях всепогодности применения современных больших полноповоротных радиотелескопов миллиметрового диапазона приводящих к значительным колебаниях "мощности" деформирующих процессов, искажающих реальную форму составной поверхности главного рефлектора, необходимо изменять порядок выбора текущей цели управления активной поверхностью главного зеркала. Этот выбор может быть осуществлен, если определена т.н. СТРАТЕГИЯ УПРАВЛЕНИЯ для каждого агента, под которой в приложении к -му агенту понимается отображение, сопоставляющее любой непустой конечной последовательности состояний объекта (точнее состояний сектора поверхности, управляемого агентом нижнего уровня, либо объекта управления в целом для агента среднего уровня) выбор воздействий агента таким образом, что , т.е. выбор действия агента не противоречит текущему -му состоянию составной поверхности. СТРАТЕГИЕЙ КОАЛИЦИИ АГЕНТОВ при этом является набор стратегий всех агентов, входящих в коалицию.
Последовательность назовем ВОЗМОЖНЫМ РЕЗУЛЬТАТОМ СТРАТЕГИИ в состоянии , если и
(37)
Здесь - отношение переходов, описывающее возможные изменения
состояния составной поверхности в зависимости от действий всех агентов МА-системы, а множество всех возможных результатов стратегии в состоянии обозначим как .
Заключение
Представление средств управления активной поверхностью главного зеркала радиотелескопа в виде многоагентной интеллектуальной системы не требует глобальной трансформации и реконфигурации структуры управляющих звеньев, поскольку существующая инфраструктура распределенной иерархической управляющей среды изначально обладает практически всеми свойствами коалиции интеллектуальных агентов. Основная модернизация необходима только для программно-математического обеспечения центров управления в целях расширения функциональности агентов соответствующих управляющих уровней для реализации базового набора свойств агента - Автономности, Реактивности, Проактивности, Коммуникативности. Также требуется несколько видоизменить программные механизмы координации и кооперации функционирования управляющих агентных центров в обеспечения корректной коллегиальной работы коалиции агентов, образующих мультиагентную систему.
В конечном итоге интеллектуализация процессов регулировки пространственного положения зеркальных щитов составной поверхности главного рефлектора большого радиотелескопа миллиметрового и субмиллиметрового диапазона существенно повышает эффективность приема антенной системой космических радиоизлучений за счет повышения точности соответствия реальной многопанельной отражающей поверхности эталонному аппроксимирующему параболоиду вращения в условиях сильного влияния множества неблагоприятных факторов - гравитационных, термических, аэродинамических, акселерационных.
Литература
1. Jacob W.M. Baars. The paraboloidal reflector antenna in radio astronomy and communication: Theory and practice.//Astrophysics and space science library. v.348. - New York, Springer Science+Business Media, LLC. 2007. - 253p.
2. Greve A., Bremer M. Thermal design and thermal behaviour of radio telescopes and their enclosures.// Astrophysics and space science library. v.364. - London, New York, Springer Heidelberg Dordrecht. 2010. - 398p.
3. Grue G., Alvito G., Ambrosini R. et al. The Sardinia Radio Telescope// Memorie della Supplementi Societa Astronomica Italiana. 2004. Vol. 5. pp.351-356.
4. Kaercher H.J, Baars J.W. Design of the Large Millimeter Telescope//Gran Telescopio Millimetrico (LMT/GTM), Proc. SPIE. 2000. Vol. 4015, pp. 155-168.
5. Lacasse R.J. The Green Bank Telescope Active Surface System.//National Radio Astronomy Observatory (NRAO)//Technical Report 184, GBT Memo Series, 1998.
6. Бугайченко Д.Ю. Математическая модель и спецификация интеллектуальных агентных систем. // Системное программирование, 2006, № 2. - С. 94-115.
7. Городецкий В.И. Многоагентные системы: современное состояние исследований и перспективы применения // Новости искусственного интеллекта, 1996, № 1. - С. 44-59.
8. Городецкий В.И., Грушинский М.С., Хабалов А.В. Многоагентные системы (обзор) // Новости искусственного интеллекта, 1997, № 1. - С. 12-47.
9. Городецкий В.И. Многоагентные системы: основные свойства и модели координации поведения // Информационные технологии и вычислительные системы, 1998, № 1. - С.22-34.
10. Евгенев Г.Б. Мультиагентные системы компьютеризации инженерной деятельности // Информационные технологии, 2000, № 3. - С. 2-7.
11. Рассел С., Норвиг П. Искусственный интеллект: Современный подход. Пер. с англ. - М.: Изд. дом "Вильямс", 2006. - 1406с.
12. Информационные системы./Волкова В.Н., Кузин Б.И., Барабанова И.М. и др. Под общ. ред. В.Н. Волковой и Б.И. Кузина - СПб.: Изд-во СПбГПУ, 2004. - 224с.