Таблица 2.4. Классы верхнего уровня отологии профиля пользователя
|
Наименование класса |
Описание класса |
|
|
Роли |
Функция, которую пользователь выполняет в деятельности в сообществе |
|
|
Идентичность |
Основная информация о пользователях посредством единой идентификации с использованием персональных данных, таких как имя, фамилия, информация о месте жительства В этот класс также может быть включена личная информация, такая как дата рождения, пол, семейное положение и т. д. |
|
|
Взаимодействия |
Явные и неявные отношения с другими сообществами и людьми. Устройства, которые пользователь может использовать. |
|
|
Навыки |
Навыки и компетенции пользователя в области знаний через образовательные и профессиональные знания пользователя, предоставленные его биографическими данными или взаимодействиями с сообществом. |
|
|
Интересы |
Интересы, связанные с обучением/работой пользователя, в области знаний пользователя |
Глава 3. Проектирование информационной системы
На основе результатов анализа проведенного выше, необходимо:
- сформулировать функциональные требования к ИС и требования к ее архитектуре;
- выполнить проектирование базы знаний (БЗ) и базы данных (БД);
- выполнить разработку макетов пользовательского интерфейса.
3.1 Формирование требований к проектируемой ИС
Основным требованием работы является учет интересов пользователей при подборе курсов профессиональной переподготовки.
По результатам проведенного анализа в главе 1 и 2:
1. Использование проектируемой ИС предполагается следующими категориями пользователей:
а) неавторизованный пользователь - любой пользователь сети Интернет;
б) пользователь ИС - авторизованный пользователь в системе;
в) администратор ИС - имеет доступ ко всей функциональности ИС, отвечает за работоспособность ИС.
2. ИС должна выполнять следующие функции:
Для всех типов пользователей:
- регистрация и авторизация;
- подбор курса с использованием поиска по ключевым словам;
- просмотр результатов подбора;
- сортировка результатов подбора;
- задание фильтров для результатов подбора;
- просмотр информации по выбранному курсу.
Для авторизированного пользователя дополнительно доступно:
- редактирование профиля;
- сохранение и удаление результатов подбора;
- добавление и удаление курса в избранное;
- возможность оценить курс: оставить отзыв, поставить оценку.
Для администратора дополнительно доступно:
- управление ИС (редактирование базы знаний, редактирование профиля пользователя (логина и пароля)).
Функциональные требования ИС представлены в виде диаграмм вариантов использования в нотации UML: диаграммы для неавторизованных пользователей ИС (рис. 3.1), общей (рис. 3.2). Данные диаграммы отражают функциональные особенности, которые позволят сделать проектируемую ИС более удобной в использовании.
Для хранения статической информации (регистрационные данные, личные данные пользователя) используется реляционная БД, а для хранения динамической информации (просмотренные Интернет-ресурсы пользователем по курсам, его интересы пользователя и т.д.) используется БЗ, основанная на онтологиях, проектирование которой приводится ниже. Описания прецедентов диаграмм вариантов использования приведены в приложении Б.
Рис. 3.1. Диаграмма вариантов использования для неавторизованных пользователей ИС
Рис. 3.2. Общая диаграмма вариантов использования
3.2 Описание поведения ИС
С помощью диаграмм вариантов использования было определено, что должна выполнять ИС подбора курсов профессиональной переподготовки. Для описания поведения ИС воспользуемся диаграммами активности прецедентов, проектирование которых приведено в приложении В.
Более подробно рассмотрим процесс подбора курсов профессиональной подготовки для авторизованных пользователей.
Для этого выделим в качестве акторов: ПС и компоненты проектируемой системы: модуль поиска, модуль формирования рекомендаций и БЗ. В ходе этого процесса:
1. Пользователь вводит запрос на естественном языке и выполняет действие:
- вариант 1: устанавливает отметку «Не учитывать мой профиль». Если пользователь осуществляет подбор курса не себе;
- вариант 2: не устанавливает отметку «Не учитывать мой профиль». Пользователь осуществляет подбор курсов для себя.
Далее пользователь передаёт запрос на подбор курса.
2. Модуль поиска перестраивает и расширяет пользовательский запрос, выявляя синонимию и семантические связи слов, используя:
- вариант 1: онтологию предметной области;
- вариант 2: онтологии предметной области и профиля пользователя.
3. Модуль поиска передает сформированный уточненный запрос в ПС.
4. ПС осуществляет поиск в соответствии с запросом и возвращает результат запроса в модуль поиска.
5. Модуль поиска извлекает данные согласно онтологии ресурсов информации и предметной области и передает данные в модуль формирования рекомендаций.
6. В модуле формирования рекомендаций:
- вариант 1: данные не обрабатываются;
- вариант 2: данные подвергаются дополнительной обработке согласно онтологии профиля пользователя.
Далее модуль формирования рекомендаций выводит список найденных курсов пользователю.
7. Пользователь просматривает результат подбора курсов.
Взаимодействие пользователя и различных компонентов ИС для подбора курсов профессиональной переподготовки с учетом интересов пользователя представлено в виде диаграммы последовательностей (рис. 3.3). На данной диаграмме отражено содержание запросов, которые передают друг другу акторы.
Рис. 3.3. Диаграмма последовательности действий подбора курсов профессиональной переподготовки
3.3 Требования к архитектуре проектируемой ИС
По результатам проведенного анализа в главах 1 и 2, а также исходя из того что подбор курсов профессиональной переподготовки осуществляется в сети Интернет, к архитектуре ИС предъявляются следующие требования:
- проектируемая ИС должна иметь распределенный характер: функции системы распределяются по различным компонентам системы, которые могут выполняться на различных узлах сети (серверах), данные получаются из различных источников и хранятся в БД и БЗ системы;
- на компьютер пользователя не должно устанавливаться никакое дополнительное программное обеспечение.
Исходя из перечисленных требований, архитектура ИС должна включать тонкий клиент (веб-браузер), сервер приложений, на котором располагается вся логика проектируемой ИС, и сервер для хранения статических и динамических данных проектируемой ИС. Таким образом, проектируемая система представляет собой частный случай трёхслойной архитектуры [24].
В качестве основы архитектуры проектируемой ИС подбора курсов профессиональной переподготовки воспользуемся структурой, описанной в работе [29] для системы, основанной на онтологии, внеся в неё изменения, ориентированные на решение задач данной работы.
Благодаря разделению функций системы на взаимодействующие друг с другом компоненты, увеличивается ее надежность, а также выполняется распределение нагрузки между серверами.
С учетом перечисленных особенностей проектирования архитектура ИС подбора курсов профессиональной переподготовки (рис. 3.4) включает следующие слои:
1. Слой интерфейса отвечает за взаимодействие пользователя с ИС. клиентом и веб-сервером осуществляется по защищённому протоколу HTTPS.
2. Слой приложения содержит модули для выполнения основных функций проектируемой ИС подбора курсов профессиональной переподготовки с учетом интересов пользователя: модуль поиска информации и модуль формирования рекомендаций. Для управления ИС администратором используется модуль администрирования.
3. Слой хранения данных предназначен для работы с данными: БД для хранения логина/пароля пользователя, статической информации, а также масштабируемая БЗ для хранения онтологий, так как в ходе развития ИС предполагается расширение предметной области.
Рис. 3.4. Основные элементы ИС подбора курсов профессиональной переподготовки
3.4 Проектирование базы знаний ИС
В качестве подхода выбранного в параграфе 2.1 БЗ проектируемой системы включает: онтологию источников информации, онтологию предметной области и онтологию профиля пользователя.
Порядок применения онтологий в процессе подбора курсов профессиональной подготовки состоит из следующих этапов (рис. 3.5):
1. Пользовательский запрос подвергается преобразованию и расширению в соответствии с данными, извлечёнными из онтологий, описывающих предметную область и профиль пользователя, и передается в ПС. Например, в онтологии можно найти по одному понятию, указанному в запросе (например, «менеджмент»), все понятия, относящиеся к этому направлению подготовки, синонимы и, таким образом расширить условия поиска. Как результат пользователь может получить информацию не только о курсах, в названии которых есть этот термин («менеджмент»), но и о курсах, где он в явном виде не указан или использовано, например, понятие «управление». Таким образом, обращение к онтологии позволяет автоматизировать работу пользователя, избавляет пользователей от необходимости формировать различные запросы с учётом синонимии понятий, различий в именовании объектов.
2. Результаты поисковой выдачи обрабатываются в соответствии с описаниями, содержащимися в онтологии источников информации. Для разбора страниц, имеющих различную структуру, могут использоваться разные программные средства. Онтология служит «справочником», позволяющим определить, каким образом должна выполняться обработка данных, где на полученной странице и в каком формате размещена интересующая пользователя информация (документы, программы курсов и пр.).
3. Далее выполняется извлечение и обработка данных с учетом онтологий предметной области и профиля пользователя, на основе чего формируется «фильтр», используя семантику понятий, их связей в модели предметной области. Например, если пользователя интересуют курсы по информационным технологиям, где в программы включены темы, связанные с метамоделированием, то будут отброшены все программы, где термин «метамоделирование» используется в другом контексте (например, будут отброшены курсы по нейролингвистическому программированию (NLP)).
4. В результате формирован список курсов с учетом онтологии профиля пользователя.
Рис. 3.5. Схема использования онтологий при подборе курсов профессиональной переподготовки
Если профиль пользователя не учитывается при подборе курсов профессиональной переподготовки, то на этапе 1 и 3 обращение к онтологии профиля пользователя не осуществляется.
В качестве онтологии источников информации воспользуемся разработанной онтологией структуры веб-страницы [12]. Данная онтология включает следующие уровни (рис. 3.6): уровень веб-сайта и уровень веб-страницы. Уровень веб-сайта описывает основные страницы сайта и их связи меду собой. Уровень веб-страницы описывает информационные блоки и их взаимосвязи.
Рис. 3.6. Фрагмент двухуровневой OWL онтологии описания веб-страницы Сост. по источнику: Ланин В. В. Онтология структуры веб-страниц / В. В. Ланин, Р. А. Нестеров // В кн.: Материалы Всероссийской конференции с международным участием «Знания - Онтологии - Теории» (ЗОНТ-2015), 6-8 октября 2015 г., Новосибирск Т. 1. Новосибирск: Институт математики им. С.Л. Соболева СО РАН. - 2015. - С. 180.
Для проведения этапа проектирования онтологии предметной области необходимо систематизировать знания о ней и выделить факты и понятия, необходимые для извлечения и дальнейшей обработки.
Предметной онтологией данной работы являются курсы профессиональной переподготовки.
По результатам анализа курсы профессиональной переподготовки можно классифицировать по:
- направлению обучения;
- форме обучения;
- уровню необходимого образования;
- выдаваемому документу;
- месту проведения.
На основании направления обучения (наиболее часто встречающиеся категории направлений) можно выделить классы:
- менеджмент;
- экономика;
- юриспруденция;
- информационные технологии;
- бизнес-обучение и т.д.
В таблице 3.1 приведены характеристики выбранных направлений обучения.
Таблица 3.1. Классификация направлений обучения