Оглавление
Обозначения и сокращения
Введение
Глава 1. Аналитический обзор средств и языков описания интеллектуальных порталов
1.1 Интеллектуальные порталы
1.1.1 Понятие интеллектуального портала
1.1.2 Компоненты интеллектуального портала
1.2 Анализ традиционных способов представления знаний
1.3 Понятие предметно-ориентированного языка
1.4 Обзор существующих предметно-ориентированных языков для web-приложений
Глава 2. Анализ технологии OSTIS
2.1 Требования к разрабатываемому языку
2.2 Устройство и особенности языка технологии OSTIS
2.3 SCg - язык
2.3.1 SCg-код первого уровня (SCg-ядро)
2.3.2 SCg-код второго уровня
2.3.3 SCg-код третьего уровня
2.3.4 SCg-код четвертого уровня
2.4 Создание метаструктур языка
2.5 Обоснование выбора DSM-платформы
2.6 Рекомендации по усовершенствованию языка описания интеллектуальных порталов
2.7 Результаты анализа технологии OSTIS
Глава 3. Разработка предметно-ориентированного языка проектирования интеллектуальных порталов
3.1 Общецелевая метамодель языка описания структуры интеллектуального портала
3.2 Метамодель языка проектирования интеллектуальных порталов
3.3 Пример модели интеллектуального портала
Заключение
Библиографический список
Приложения
Обозначения
и сокращения
1. OSTIS - Open Semantic Technology for Intellectual.
2. SC - Semantic Code.
. KBE - Knowledge Based Editor.
. DSL - Domain-SpecificLanguage.
. XML - eXtensible Markup Language.
. RDF - Resource Description Framework.
Увеличение объемов информации в сети Интернет привело к необходимости структуризации и систематизации этой информации, с целью облегчения ее дальнейшей обработки. Широкое развитие таких понятий, как искусственный интеллект, интеллектуальные системы, семантические сети послужило росту интереса среди разработчиков к изучению новых технологий, направленных на повышение эффективности информационного обеспечения различных видов деятельности. В 2001 году Тим Бернерс-Ли - изобретатель URI, URL, HTML, HTTP вместе с единомышленниками выпустили статью "Будущее веб - за семантикой" [20], где предлагалась идея выражения информации в форме, понятной как человеку, так и машине-обработчику. Данная статья положила начало развития проекту SemanticWeb, направленному на создание универсальных средств обработки семантически структурированных знаний. Поэтому современное состояние развития Интернета невозможно представить без разработки средств, направленных на осмысление информации (интеллектуальный поиск, аналитика "больших данных", структуризация электронных документов). В настоящее время проект разрабатывается консорциумом W3C совместно с большим количеством исследователей, ученых и промышленных партнеров [4]. Поэтому исследование и попытка решения вопроса интеллектуализации веб-структур актуальны в контексте развития Интернета.
Разработчики нуждаются в средствах описания таких сложных структур данных, как интеллектуальные системы и, в частности, интеллектуальные порталы. В данном исследовании в качестве такого средства предлагается использовать предметно-ориентированный подход, ввиду того, что предметно-ориентированные языки (DomainSpecificLanguages, DSL) - языки, напрямую связанные с предметной областью, в которой работает пользователь, которые могут быть созданы для повышения удобства разработки и сопровождения различных видов программного обеспечения, в том числе и информационных порталов. Они являются доступными для применения непрофессиональными пользователями в узких предметных областях посредством того, что оперируют понятиями конкретных областей знаний.
Данное исследование основывается на работе [3], целью которой было проанализировать технологию OSTIS как средство проектирования интеллектуальных порталов и практически ознакомиться с инструментальным средством для проектирования информационных интеллектуальных порталов на основе семантических сетей KBE 0.3.0, предлагаемым разработчиками технологииOSTIS.
Исследование возможностей технологии OSTIS показало, что навыков инженера по знаниям недостаточно для разработки и сопровождения интеллектуального портала, так как язык описания базы знаний сложен для понимания и требует глубокого изучения. Логично было бы отказаться от применения этой технологии, однако ее убедительные преимущества говорят о том, что технология заслуживает внимания.
Вывод о том, что технология требует изучения и изменения, послужил поводом для разработки предметно-ориентированного языка, который будет упрощать процесс проектирования интеллектуальных порталов, в частности будет являть собой улучшенный язык создания баз знаний, основанный на преобразовании сущностей и отношений в направлении большей конкретизации их значений и свойств, а также большую ориентированность на разделение алфавита языка на 2 структурных уровня (общецелевая метамодель, которая также обозначена как мета2-модель и метамодель). Об этом будет более подробно рассказано в основном тексте работы.
Объектом исследования является устройство интеллектуального портала, его архитектура. Предметом исследования является предметно-ориентированный язык как средство описания структуры интеллектуального портала.
интеллектуальный портал модель программирование
Целью выпускной квалификационной работы является разработка универсального предметно-ориентированного языка, на основе анализа семантического языка, позволяющего в терминах конкретной предметной области описывать содержание и структуру интеллектуального портала.
Для достижения поставленной цели необходимо решить следующие задачи:
1. Проанализировать существующие предметно-ориентированные языки описания web-приложений и интеллектуальных систем.
2. Проанализировать систему OSTIS и сформулировать требования к разрабатываемому языку.
. Разработать предметно-ориентированный язык, позволяющий описать структуру и содержание интеллектуального портала.
. Построить модель интеллектуального портала с использованием разработанного языка.
Для решения поставленных задач используется как отечественная, так и зарубежная литература, связанная с принципами организации интеллектуальных порталов, способами представления знаний, семантическими технологиям. Для изучения особенностей предметно-ориентированных языков были найдены и переведены иностранные статьи, которые дают ответы на вопрос об актуальности использования предметно-ориентированного подхода для разработки интеллектуальных порталов.
В работе применяются такие методы, как задание синтаксиса и
семантики языка проектирования интеллектуальных порталов,
предметно-ориентированное моделирование. С помощью средства создания визуальных
предметно-ориентированных языков Meta Language разрабатывается язык для
проектирования интеллектуальных порталов.
Решене поставленных задач требует раскрытия таких аспектов, как свойства, компоненты интеллектуальных порталов, характеристики, которые должны быть описаны с помощью разрабатываемого языка. Конечно, нельзя оставить без внимания способы представления знаний и особенности этих способов, включая преимущества и недостатки. Это даст ответы на вопрос о том, насколько исследуемая семантическая технология применима для решения задачи проектирования интеллектуальных порталов.
Также необходимо раскрыть понятие предметно-ориентированного языка, задачи, при выполнении которых применяются различные текстовые или графические предметно-ориентированные языки. Для того, чтобы сделать вывод о рациональности применения данного метода в исследовании.
Информационные интеллектуальные порталы являются продуктом или технологией интеллектуальногоweb, изучаемой науками, объединенными в название "Искусственный интеллект". Их можно назвать следующим шагом развития Интернет-технологий. Эти понятия тесно коррелируют с такими понятиями, как Web Mining или Web Intelligence, технологиями, которые играют большую роль во многих развивающихся областях Интернета. Электронная торговля, поисковые системы, сайты, разработанные как для презентации крупных корпораций, так и для бытовых нужд человека. Эти технологии способны предоставлять пользователю возможность быстро получать доступ к интересующей его информации, показывать релевантные ссылки и генерировать списки похожих запросов, анализируя страницы прошлых действий и запросов пользователя, cookies, IP и геолокацию. Иными словами, не имея информации о пользователе, которую он должен специально указывать при регистрации, или отвечая на всплывающие окна, часто размещаемые на сайтах.
Информационные интеллектуальные порталы, такие, какими они становятся "сегодня" - явление, еще не получившее единого определения и классификации, однако существует строгая тенденция, по которой они развиваются. Данная тенденция ведет к переходу от web-сайтов с простой структурой к web-порталам, интегрирующим в себе крупную, сложноструктурированную информацию. Если классический сайт - это логический набор web-страниц, то информационный интеллектуальный портал - это тот же сайт, но имеющий при этом широкий спектр функций, накапливающий со временем некий объем знаний, а также способный самостоятельно понимать свое содержание. Сложность структуры такого портала заключается в многоуровневых информационных структурах, в которых имеют место связи не только между первичными элементами гипертекста, но и между целыми информационными структурами [4]. Эти иерархичные структуры содержат не стационарные во времени, нечеткие данные.
Однако интеллектуальная система принципиально отличается от
традиционной компьютерной системы совсем не текущим объемом своих возможностей
(своих знаний и умений), а способностью быстро приобретать новые знания и
умения практически неограниченно по объему и многообразию. Такое расширение
возможностей (обучение) интеллектуальной системы может осуществляться с помощью
коллектива разработчиков, постоянно совершенствующих систему, а также
самостоятельно или на основе анализа собственного опыта и имеющихся знаний и
навыков, или путем добывания (извлечения) новых знаний и навыков, например,
через Интернет.
На данный момент не существует принятого научным сообществом определения интеллектуального портала, однако, минские исследователи Белорусского государственного университета информатики и радиоэлектроники, в частности, заведующий кафедрой Голенков В.В., приводит следующее определение: "Интеллектуальная система - это система, обладающая способностью, умением и потребностью обучаться, т.е. способностью достаточно быстро переходить от одного уровня образованности к более высокому" [5].
Интеллектуальный портал является подклассом интеллектуальной системы, также основанный на концепции использования баз знаний и алгоритмов решения задач, направленных на конкретные потребности пользователей и имеющий ряд следующих функций, присущих интеллектуальным системам:
) адаптивность - способность к развитию параллельно изменениям области знаний);
2) самообучение - способность к автоматическому накоплению опыта и применению извлеченных из него знаний;
) умение решать задачи, основанные на нестационарных данных.
Следовательно, интеллектуальный портал - это некая интеллектуальная система, но таких систем существует огромное множество, включая экспертные системы, виртуальные собеседники, интеллектуальные поисковые системы (Wolfram|Alpha, Start, MYCIN), отличительными характеристиками интеллектуальных порталов будет являться следующее. Во-первых, они функционируют как сайты или точки доступа к информации в среде Интернет, во-вторых, пользователь извлекает информацию из них посредством браузера для web-сайта. Так, с точки зрения пользователя, портал является тематическим Интернет-ресурсом, обеспечивающим возможность поиска и просмотра информации в рамках заданной предметной области [14]. Можно выделить следующие признаки портала, как информационного ресурса:
) эргономичный пользовательский интерфейс;
2) возможность поиска по всему информационному пространству - средства, облегчающее работу пользователя с порталом;
) интеграция близких по тематике ресурсов, представленный в Интернет;
) информационная поддержка пользователей.
Таким образом, ключевое понятие, рассматриваемое в данной работе - понятие интеллектуального портала описывает некоторый web-ресурс, основанный на идеологии интеллектуальных систем, то есть, является слиянием двух понятий: интеллектуальная система и web-портал. Также интеллектуальный портал можно охарактеризовать как систему, основанную на концепции использования базы знаний для генерации алгоритмов решения задач различных классов в зависимости от конкретных информационных потребностей пользователей [12].
Концепция базы знаний, о которой говорит автор, подразумевает следующие возможности:
) интеграция новых видов знаний;
) переход от знаний к метазнаниям.
Внешняя надстройка базы знаний может представлять собой сайт, но ввиду того, что интеллектуальный портал имеет функции, отличающиеся от функций традиционного сайта, и служит цели максимально приблизить пользователя к необходимой ему информации, так как все вышеперечисленные возможности обеспечивают интеллектуальному порталу способность и умение обучаться. Интеллектуализация заключается в самостоятельной разработке решения алгоритма, развитии коммуникативных навыков.
Очевидно, что такая система должна действовать и принимать решения автоматически, но полностью исключить поддержку человека невозможно, таким образом, работу по расширению базы знаний и реализация новых логических связей выполняют разработчики в сотрудничестве со специалистами предметной области (экспертами), тем самым, исключая недостаток знаний системы.
Как было сказано выше, существует принципиальное отличие интеллектуальных систем от традиционных компьютерных систем, что требует и принципиального отличия в их внутреннем устройстве, понятие интеллектуального портала заключает в себе следующие компоненты (см. рис. 1.1.):
) база знаний;
2) база данных используется для описания ресурсов и хранения данных;
) модуль интеграции - средство подключения новых источников данных;
) Web-интерфейс - средство взаимодействия конечного пользователя с базой знаний и базой данных, а также средство доступа пользователя к информационным ресурсам;
) система поиска и основные ее элементы (понятия и ограничения).
) редактор базы знаний;
) редактор контента;
) программное ядро.
Рисунок 1.1 Внутреннее устройство интеллектуального портала
Ниже будут рассмотрены более подробно основные компоненты портала, методы и способы формирования каждого из них.
Прежде всего, необходимо начать с описания архитектурного компонента - базы знаний, разработка и изменение которой является основой технологического процесса проектирования интеллектуального портала.
База знаний - хранилище знаний, в некотором роде база данных, которая представляет собой структуру данных для управления знаниями, она разработана для логического вывода, обработки информации, а также непосредственного сбора, поиска и хранений знаний. Знания в базе знаний могут быть представлены с помощью различных формализмов, например, в виде онтологий или семантической сети. Голенков В.В. в работе [5] говорит, что база знаний может быть представлена результатом итерации нескольких баз знаний, что обусловлено необходимостью интеллектуальной системы не только уметь решать задачи в рамках предметной области, но и эффективно взаимодействовать с разработчиками и пользователями. Таким образом, к числу таких баз знаний могут относиться база знаний описываемой предметной области, база знаний пользовательского интерфейса, база знаний процесса коммуникации системы с внешней средой и другие. Модель базы знаний должна представлять собой двухуровневую структуру, то есть метаинформация управляет всей возможной порождаемой или изменяемой информацией базы знаний. Метаинформация информационного ресурса является представлением графовой грамматики (грамматики, порождающей размеченные графы) языка представления информации [7].