Статья: Опыт создания базы данных по палеоантропологическим материалам популяций круга ямной и афанасьевской культур эпохи раннего металла Евразии - результаты и перспективы

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Рис. 1 ER-моделъ данных рассматриваемой предметной области.

Как показал опыт разработки БнД КА ТГУ, в данном случае также целесообразно сразу предусмотреть два жизненных цикла. При наполнении банка данных КА ТГУ исходное информационное обеспечение было достаточно хорошо подготовлено для загрузки в базу данных в виде записей так называемых «инвентарных книгах», а также на стандартных бланках измерений. В данном случае дополнительным фактором в пользу того, чтобы заранее запланировать два жизненных цикла базы данных является и то, что исходные материалы получены в разное время разными авторами и хранятся в разных учреждениях. Сбор этой информации и приведение ее к стандартам разрабатываемой базы данных является самостоятельной и достаточно трудоемкой задачей. Как известно, такие данные являются плохо формализованными. Поэтому следует предусматривать, что по мере поступления информации из разных источников возможны изменения как в реляционной схеме базы данных, так и в интерфейсных формах. Соответственно, интерфейс для доступа к данным в этом случае получается наиболее простым и при необходимости может быть легко изменен. То есть, фактически на данном этапе необходима настольная информационная система управления базами данных(СУБД). В этом случае достаточно использовать СУБД MS Access. Из построенной ER-модели предметной области была спроектирована реляционная модель базы данных, на основе которой, в свою очередь, была создана сама база данных. Последняя, как часть информационной системы, выполняет функцию структурированного информационного хранилища. Схема БД в настоящее время состоит из 26 таблиц, часть из которых являются справочниками - простыми справочными таблицами с 2 столбцами. Данные фотографий черепов в этом цикле хранятся не в БД, а в виде отдельных файлов на жестком диске. Относительный путь к этим файлам вместе с метаданными фотографий (год, автор и др.) хранится в БД в специальной таблице CRAN_PHOTOS. Впоследствии, в следующем цикле, данные фотографий могут быть загружены для хранения непосредственно в БД, как это было сделано для базы данных КА ТГУ.

Программный интерфейс для загрузки данных в БД базируется на единственной главной экранной форме, которая запускается при старте и отображает все основные атрибуты костяка одного индивидуума. Для удобства и в соответствии со сложившейся практикой, эти атрибуты разделены (только на экранной форме!) на следующие группы: «паспортные данные», «идентификация скелета», «морфология скелета». В самом низу формы расположены стандартные кнопки для навигации по записям, относящимся к различным индивидуумам. Также внизу расположены кнопки для открытия связанных дочерних форм. Эти кнопки делятся на 2 похожих набора: для данных о черепе и для данных о посткраниальной части. В каждом наборе присутствуют кнопки для открытия следующих форм:

- состав и сохранность объекта,

- бланк измерений (краниологический или остеологический),

- фотоматериалы.

Что касается фотоизображений черепа, то предусмотрено по четыре фотографии (в фас, в профиль, вид сверху и вид сзади) и любое число фотографий для аномалий, патологий и фрагментов. Для них могут быть добавлены текстовые комментарии.

Здесь же могут быть добавлены кнопки для других систем признаков (краниоскопия, одонтология, данные генетических анализов и т. п.), при условии, что в базе данных созданы соответствующие подсхемы.

На главной форме есть кнопка для открытия в разделе «паспортные данные» формы «Археологические памятники» в табличном режиме, в котором можно выбрать ассоциированный с текущим скелетом археологический памятник, если последний уже есть в базе данных, или добавить новый археологический памятник. Из таблицы археологических памятников можно открыть для выбранного памятника в более полном режиме форму «Археологические памятники» для ввода и редактирования его атрибутов.

Также на главной форме есть кнопка для открытия обзорной формы, которая отображает в табличном виде основные данные об имеющихся в БД объектах костяков индивидуумов с возможностью сортировки по какому-либо атрибуту (столбцу). Эта форма предназначена для ускорения поиска нужной записи в БД, с возможностью обратного перехода на главную форму и открытия в ней выбранной в обзорной форме записи.

Поскольку работы, относящиеся к первому циклу в значительной мере завершены, то по итогам можно сказать, что принятый подход разделения работы на два цикла себя полностью оправдал. В процессе наполнения базы данных действительно пришлось вносить изменения как в схему БД, так и в интерфейсную форму.

Второй жизненный цикл предусматривает работу с БД пользователей для научных целей (что не исключает добавление новых записей или редактирование уже существующих). Для этого созданная БД может быть переведена в другую СУБД, более отвечающую требованиям этого цикла (например, многопользовательский режим, удаленный доступ и др.), и разработан соответствующий пользовательский интерфейс. В случае с БД КА ТГУ в качестве такой СУБД была выбрана Microsoft SQL Server. Как показывают приведенные выше оценки количества палеоантропологических материалов, число записей в БД может исчисляться несколькими сотнями. Общий объем информации, даже с учетом создания в будущем новых подсхем, едва ли будет превышать 1 Гбайт. Также следует иметь в виду, что после загрузки в БД основных объемов информации, последующие дополнения и изменения едва ли будут интенсивными. Количество пользователей у этой базы данных также не будет большим, не будет и особых требований к скорости доступа. То есть, каких-либо особых требований к СУБД в данном случае нет. Поэтому при переходе на новую СУБД, помимо обязательного требования возможности модификации, основными требованиями могут стать ее доступность и простота в сопровождении.

Кроме базы данных, существенной частью банка является клиентское приложение для доступа к данным. В банке данных КА ТГУ для его разработки был использован язык Visual Basic.NET с технологией доступа к данным ADO.NET. Клиентское приложение этого банка данных представляет собой обычное Windows-приложение с меню и набором окон-страниц с возможностью переключаться с помощью закладок (Рыкун и др. 2011: 126-134).

При разработке клиентского приложения для второго жизненного цикла следует иметь в виду ряд требований, которые перечислены ниже. Эти требования пока рассматриваются как проектные и могут быть изменены или уточнены в процессе их обсуждения со специалистами-антропологами.

Общие требования к банку данных:

- обеспечение быстрого поиска материалов по совокупности заданных условий (путем использования режима «фильтр», сортировок по выбранным полям, а также использования как предопределенных запросов, так и создания динамических запросов и др.);

- отслеживание связей между данными, в том числе различных категорий;

Частные требования (именно к этому банку данных):

- реализация функции автоматического формирования стандартных отчетов для офисных продуктов Microsoft Word и Microsoft Excel, а также экспорта данных для анализа в специализированных пакетах статистической обработки;

- расширение базы данных путем создания подсхем для других систем признаков (одонтология, краниоскопия, данные генетических анализов и др.) с точной привязкой их к объектам хранения;

- возможность работать как в режиме «форма» (работа с одним объектом), так и в режиме «таблица» (работа по всем наборам данных или с набором однотипных объектов); во втором случае пользователь должен иметь возможность скрыть неактуальные для него записи (строки таблицы) и столбцы и работать только с выбранным набором данных - именно такие наборы могут сохраняться антропологом в виде его краниологических серий;

- гибкое формирование серий (с возможностью сохранения их любым пользователем для своей дальнейшей работы), как по учетно-хранительским данным, так и по результатам измерений или иным наборам признаков, в том числе выделение таксономических уровней, на которых может проводиться междисциплинарное сопоставление с данными других наук;

- реализация аналога режима «галерея» для совместного просмотра фотографий, относящихся к различным индивидуумам;

- фиксирование пространственной привязки выделенных признаков с возможностью управлять визуализацией при анализе в зависимости от их значений (различные виды условных знаков, диаграмм);

- построение сплошных поверхностей (покрытий) исследуемых признаков с использованием интерполяции и экстраполяции, а также с возможностью управлять способами визуализации этих поверхностей (изолинии, «цветовая шкала», «отмывка»);

- построение ареалов распространения выделенных признаков или их комплексов;

- совместный анализ ареалов распространения выделенных признаков с сопоставимыми данными других дисциплин (археология, генетика, лингвистика и др.), а также с физико-географическими особенностями среды обитания (реконструируемой на соответствующий исторический период);

- формирование обобщенных карт по наборам признаков и формирование антропологического покрова исследуемой территории.

По поводу пространственного анализа данных следует иметь в виду следующее. Использование интерполяции и экстраполяции при построении сплошных поверхностей значений какого-либо признака может давать данные, не соответствующие исторической действительности там, где исходные данные по какой-либо причине отсутствуют. В связи с этим, такие поверхности должны дополняться картами изученности территории полевыми методами. Эта ситуация типична для всех дисциплин, получающих исходные данные в полевых условиях (Кравченко 2006: 62-67). Наиболее хорошо она отработана в геологии (Кравченко 1998: 284-295). Совместный с данными других дисциплин анализ географического распределения антропологических признаков наиболее эффективен с использованием геоинформационных технологий. В связи с этим, желательно предусмотреть для второго цикла СУБД, данные которой могли бы быть использованы в наиболее распространенных геоинформационных системах. Или, как альтернатива, должен быть предусмотрен экспорт из базы данных таблиц со значениями анализируемых признаков вместе со значениями координат. Далее стандартными средствами геоинформационных систем могут быть построены соответствующие картографические слои (покрытия), которые и могут анализироваться в какой-либо геоинформационной системе совместно с другими картографическими слоями (Кравченко и др. 2013: 38-42; Рыкун и др. 2016: 164-168).

Заключение

В работе представлены концептуальный подход и опыт создания базы данных по палеоантропологическим материалам, относящимся к определенным культурно-историческим группам населения. Такая база данных может рассматриваться как электронный «свод» наиболее значимых данных по рассматриваемым палеопопуляциям. В отличие от печатных сводов (Вадецкая и др. 2014), электронный вариант, по мере появления новых данных и уточнения существующих, всегда может быть в актуальном состоянии. Такой «свод» может использоваться не только для обеспечения справочного режима, но и служить вспомогательным средством при проведении научных исследований.

Работа по созданию базы данных изначально разделена на два жизненных цикла. Первый цикл связан с наполнением базы данных, на втором планируется создание программных средств для поддержки пользователей при проведении научных исследований с помощью созданной базы данных.

Работы, предусмотренные первым циклом, в значительной степени выполнены. Создана реляционная схема базы данных, разработан удобный интерфейс для заполнения базы данных. В базу занесены данные о скелетах, относящихся к ямной (собственно ямная и полтавкинская) и афанасьевской (Алтай, Монголия, Казахстан) культурам Евразии раннебронзового века. По мере дальнейшего наполнения базы данных как территориальные, так и хронологические границы используемых материалов могут быть расширены.

Что касается работ, предусмотренных на втором цикле, то их еще предстоит выполнить. Перед началом этих работ должны быть окончательно уточнены и согласованы требования конечных пользователей, вариант которых приведен выше в тексте статьи.

Представленный в работе опыт может быть полезен тем, кто планирует разработку собственных баз данных по палеоантропологии, а также в других гуманитарных областях.

Список сокращений

БД - база данных

БнД - банк данных

СУБД - система управления базами данных

КА ТГУ - кабинет антропологии Томского государственного университета

база данные палеоантропологический евразия

Литература

1. Балабанова 2016 - Балабанова М.А. К антропологии населения энеолита - ранней бронзы (по материалам могильников Волгоградской области). Нижневолжский археологический вестник, 2016. Т 15. № 1. С. 72-94.

2. Вадецкая и др. 2014 - Вадецкая Э.Б., Поляков А.В., Степанова Н.Ф. Свод памятников афанасьевской культуры. отв. ред. В. И. Молодин. Барнаул: АЗБУКА, 2014.

3. Кравченко 1998 - Кравченко Г.Г. Геоинформационные технологии в геологоразведочной отрасли. В сборнике: Геоинформатика. Теория и практика, Томск, 1998. С. 284-295.

4. Кравченко 2006 - Кравченко Г.Г. Применение ГИС-технологий в гуманитарных исследованиях (археография). Человек - текст - эпоха. Сборник научных статей и материалов. Томск, 2006. С. 62-67.

5. Кравченко и др. 2013 - Кравченко Г.Г., Рыкун М.П., Фукс А.Л. Реконструкция палеоклиматических условий в эпоху раннего железного века Верхнего Приобья (на территории распространения каменской культуры). Вестник Томского государственного университета. История, 2013. № 3. (23). С. 38-42.

6. Рыкун и др. 2011 - Рыкун М.П., Кравченко Г.Г., Кравченко Д.Г. Междисциплинарные исследования этнокультурных процессов в Северной Евразии (на основе антропологических данных и геоинформационных технологий). Вестник археологии, антропологии и этнографии, 2011. № 1. С. 126-134.