29)Технологии обновлении данных в ХД.
30)Причины отказа от использования хранилищ данных. Особенности загрузки данных из локальных источников.
31)Определение ETL, примеры ETL-процессов.
32)Создание вычисляемых выражений в кубе с помощью MS SQL Server.
33)Взаимодействие хранилища данных, системы DSS, OLAP и оперативных БД.
34)Двенадцать правил Кодда, применяемые для оценки OLAP-
систем.
35)Получение реляционной схемы данных из многомерного
куба.
36)Создание перспективы в кубах MS SQL Server.
37)Присоединение куба к источникам данных разного типа.
38)Тест FASMI, возможности его применения для оценки OLAP-систем.
39)Возможности применения OLTP-систем для оперативного анализа данных.
40)Основные положения концепции хранилищ данных (DW).
5.ТИПОВЫЕ ТЕСТОВЫЕ ЗАДАНИЯ
1.KDD (Knowledge Discovery in Databases) это:
a)Процесс получения из данных знаний в виде зависимостей, правил, моделей.
b)Обнаружение в «сырых» данных ранее неизвестных знаний.
c)Комплексирование достоверных данных, выполняемое на основе дисперсионного анализа.
2.Data Mining это:
a)Комплекс методов и процедур, направленных на устранение аномалий, пропусков, дубликатов, противоречий, шумов и т. д.
b)Набор операций над базой данных.
c)Обнаружение в «сырых» данных ранее неизвестных знаний.
3.К классам задач, решаемых методами Data Mining относятся:
a)Верстка и публикация результатов выполненного анализа
данных.
b)Загрузка, перезагрузка, выгрузка, проблемноориентированные операции.
c)Классификация, регрессия, кластеризация, ассоциация, последовательные шаблоны.
4 Очистка данных это:
a)Комплекс методов и процедур, направленных на устранение причин, мешающих корректной обработке: аномалий, пропусков, дубликатов, противоречий, шумов и т. д.
b)Комплекс методов и процедур, направленных на очистку хранилища от имеющихся в нем данных с обеспечением возможности отката.
c)Процесс удаления данных, содержащихся во временных и условно-постоянных файлах, а также в файлах разработки.
5.Обогащение данных это:
a)Процесс дополнения финансовых данных более высокими показателями за счет чего низкие показатели теряют свою актуальность и могут быть удалены.
b)Процесс дополнения данных некоторой информацией, позволяющей повысить эффективность решения аналитических задач.
c)Удаление данных, занимающих менее 10Гб.
6.Задачами процесса ETL (extraction, transformation, loading)
являются:
a)Извлечение данных из разнотипных источников, их преобразование, а также загрузка в базу или хранилище данных.
b)Загрузка данных в различные источники, а так же их выгрузка из базы или хранилища данных.
c)Сбор и последующая передача данных по единой телефонной линии (ЕТЛ).
7.Системы OLTP предназначены для:
a)Оперативной, то есть в режиме реального времени, обработки транзакций.
b)Удаления данных, содержащихся во временных и условнопостоянных файлах, а также в файлах разработки.
c)Длительного хранения больших объемов данных.
8.Транзакция это:
a)Набор операций над базой данных, который рассматривается как промежуточное, не завершенное, с точки зрения пользователя, действие над информацией.
b)Набор операций над базой данных, который рассматривается как единое завершенное, с точки зрения пользователя, действие над информацией.
c)Акция по транзиту данных через то или иное хранилище данных.
9.Главное требование к OLTP-системам:
a) Быстрое обслуживание относительно простых запросов
большого числа пользователей.
b)Обслуживание наиболее сложных запросов небольшого числа пользователей.
c)Должны иметь программное обеспечение, позволяющее выполнять быструю очистку и трансформацию данных.
10.Специализированные базы данных в СППР называются:
a)Реляционными базами данных.
b)Хранилищами данных.
c)Базами данных иерархической направленности.
11.Семантический слой это:
a)Механизм, позволяющий аналитику оперировать данными посредством бизнес-терминов предметной области.
b)Слой языковых единиц, позволяющий выполнять очистку поступающих в хранилище данных.
c)Слой языковых единиц, позволяющий создавать сводные таблицы.
12.Агрегирование данных это:
a)Процесс обобщения детализированных данных.
b)Применение специализированных программно-агрегатных комплексов для ускорения процесса загрузки данных в хранилище.
c)Процесс детализации обобщенных данных.
13.Аннотация, комментарии, глоссарий, примечания это:
a)Метаданные.
b)Семанотоданные.
c)Гетероданные.
14.Метаданные имеют два следующих уровня:
a)Технический (административный) и бизнес-уровень.
b)Высокоинтеллектуальный и сниженный.
c)Уровень пользователя и уровень разработчика.
15.ROLAP это:
a)Реляционные хранилища данных.
b)Многомерные хранилища данных.
c)Многофункциональные хранилища данных.
16.MOLAP это:
a)Реляционные хранилища данных.
b)Многомерные хранилища данных.
c)Многоуровневые хранилища данных.
17.HOLAP это:
a)Хост-процессорные хранилища данных.
b)Реляционные хранилища данных.
c)Гибридные хранилища данных.
18.Архитектуры ХД бывают:
a)Реляционными
b)Клиент-серверными.
c)Многоуровневыми.
d)Файл-серверными.
e)Модельными.
f)Виртуальными.
g)Гибридными.
h)Иерархическими.
i)Многомерными.
20.OLAP (On-Line Analytical Processing) это:
a)Аналитические системы, обеспечивающие загрузку данных в реляционные базы данных в режиме реального времени.
b)Быстрое обслуживание относительно простых запросов большого числа пользователей, при этом время ожидания выполнения типового запроса не должно превышать несколько секунд.
c)Технология оперативного извлечения нужной информации из больших массивов данных и формирования соответствующих отчетов.
21.Измерения это:
a)Средства визуализации анализируемых данных имеющие соответствующую разметку.
b)Наименования и свойства объектов, участвующих в некотором бизнес-процессе.
c)Измеренные значения объемов загружаемой информации.
22.Факты это:
a)Исключительно достоверные данные, загружаемые в хранилище данных.
b)Фактические данные, извлекаемые из хранилища данных для выполнения их анализа.
c)Данные, количественно описывающие бизнес-процесс.
23.Наименования товаров, названия фирм-поставщиков, названия городов это:
a)Факты.
b)Измерения.
c)Структурные элементы загружаемых в хранилище данных.
24.Цена товара, сумма продаж, зарплата сотрудников, сумма кредита это:
a)Факты.
b)Измерения.
c)Структурные элементы выгружаемых из хранилища данных.
25.Над измерениями гиперкуба можно производить следующие действия:
a)Сечение.
b)Свертка.
c)Транспонирование.
d)Группировка.
e)Детализация.
26.Реляционная БД состоит из:
a)Двумерных таблиц, связанных с помощью ключевых полей.
b)Структур типа «Звезда» или «Снежинка».
c)Объектно-ориентированных иерархических структур.
27.На логическом уровне различают следующие схемы построения реляционных ХД:
a)«Крыло».
b)«Релакс».
c)«Звезда».
d)Объектно-ориентированная.
e)«Снежинка».
28.ETL это:
a)Комплекс методов, реализующих процесс переноса исходных данных из различных источников в аналитическое приложение или поддерживающее его хранилище данных.
b)Единая телекоммуникационная линия для загрузки данных в хранилище.
c)Единая имитационно-моделирующая среда для построения виртуальных хранилищ данных.
29.В качестве источников извлечения данных используются:
a)Файлы СУБД.
b)Структурированные файлы различных форматов.
c)Неструктурированные источники.
30.К неструктурированным относятся данные:
a)Определенным образом упорядоченные и организованные с целью обеспечения возможности применения к ним некоторых действий.
b)Данные, для которых определены некоторые правила и форматы, но в самом общем виде.
c)Произвольные по форме, включающие тексты и графику, мультимедиа (видео, речь, аудио).
31.Трансформация данных это: