Статья: Опыт создания базы данных по палеоантропологическим материалам популяций круга ямной и афанасьевской культур эпохи раннего металла Евразии - результаты и перспективы

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Национальный исследовательский Томский государственный университет

Институт проблем освоения Севера, Тюменского научного центра Сибирского отделения Российской академии наук, Федерального исследовательского центра.

Самарский государственный социально-педагогический университет

Опыт создания базы данных по палеоантропологическим материалам популяций круга ямной и афанасьевской культур эпохи раннего металла Евразии - результаты и перспективы

Кравченко Геннадий Григорьевич, Кравченко Дмитрий Геннадьевич,

Рыкун Марина Петровна, Солодовников Константин Николаевич,

Хохлов Александр Александрович

Кравченко Геннадий Григорьевич - кандидат физико-математических наук, доцент

Кравченко Дмитрий Геннадьевич - инженер-программист

Рыкун Марина Петровна - кандидат исторических наук, заведующая кабинетом антропологии

Солодовников Константин Николаевич - кандидат исторических наук, старший научный сотрудник

Хохлов Александр Александрович - доктор исторических наук, профессор

В статье изложены концептуальные подходы к проектированию и особенности разработки базы данных по палеоантропологическим материалам популяций круга ямной и афанасьевской культур эпохи раннего металла Евразии. Работа разделена на две части: первая предусматривала создание схемы базы данных и средств для ее наполнения, вторая рассматривается как предстоящая работа и будет включать создание средств для работы антропологов с данными. Работы по первой части в основном завершены. Разрабатываемая база данных рассматривается как единое хранилище для структурированной по единым правилам и наиболее значимой информации о вышеназванных материалах. Такое хранилище, в отличие от печатных вариантов, может естественным образом пополняться и изменяться, оставаясь таким образом всегда в актуальном состоянии. После выполнения второй части работы у пользователей появится возможность систематизировать и использовать материалы в зависимости от своих задач.

Ключевые слова: палеоантропология, ямная культура, афанасьевская культура, краниологические данные, остеологические данные, фотофиксация, модель данных, база данных

G.G. Kravchenko, D.G. Kravchenko, M.P Rykun., K.N. Solodovnikov, A.A. Khokhlov.

The creation experience of a database on paleoanthropological materials of the populations of Yamnaya and Afanasyevo related culture group of the Early Metal Age of Eurasia - results and prospects.

The article presents conceptual approaches to design and development specifics for a database on paleoanthropological materials of the populations of Yamnaya and Afanasyevo related culture group of the Early Metal Age of Eurasia. The work is divided into two parts: the first comprises the creation of the database schema and means for filling it, the second is reviewed as an upcoming work and will involve the creation of tools for the work of anthropologists with data. The work on the first part is basically completed. The database being developed is considered as a united repository for the most significant information about the above-mentioned materials structured according to uniform rules. Such a storage, unlike printed versions, can be easily populated and changed, thus remaining always up to date. After completing the second part of the work, users will have an opportunity to systematize and use materials depending on their tasks.

Key words: paleoanthropology, Yamnaya culture, Afanasyevo culture, craniological data, osteological data, photographic fixation, data model, database.

Основная часть

В любой науке необходимым условием объективности выдвигаемых доказательств, предположений и гипотез, совершенствования ее методов познания и развития в целом является целенаправленный сбор, качественное хранение, систематизация и периодическая инвентаризация фактического материала. На современном этапе исследований существуют разные формы кодирования и доведения первоисточников до широкого круга ученых - от специализированных бланков, публикационной и отчетной информации до электронных баз данных. Среди них электронная фиксация данных имеет преимущество в быстром и доступном публичном распространении, максимально качественной их подаче, включая различные иллюстративные оформления источника.

В антропологии многие исследователи имеют собственные базы данных, сформированные, как правило, на основе «MS Excel», но они предназначены для личного пользования и фактически представляют наборы электронных таблиц.

Инициатива создания компьютерного каталога и баз данных антропологических коллекций в России принадлежит сотрудникам Музея антропологии и этнографии им. Петра Великого (Кунсткамера) РАН (Чистов, Титов 2003: 119-127). Созданная (начиная с 1992 г.) к настоящему времени в этой организации база данных представляет одну таблицу MS Excel. Она содержит данные об измерениях 3139 черепов (2209 мужских и 930 женских), представляющих 16 этнических групп. Материалы происходят из различных районов Восточной и Северо-Восточной Европы, в том числе России, Финляндии, Эстонии, Латвии и Белоруссии. Датировка большинства материалов укладывается в период с 17 по начало 20 вв. Помимо собственно измерений, таблица содержит 11 полей с информацией о черепах и авторах измерений, здесь же находятся специальные элементы управления, необходимые для сортировки и применения фильтра при работе с данными. Эта таблица представляет собой и пользовательский интерфейс, что не всегда удобно (Широбоков и др. 2017). В этой же работе содержится краткий обзор подобных баз данных, созданных за рубежом.

Среди существующих в России электронных баз данных по палеоантропологии, существует специально спроектированная и разработанная для КА ТГУ (Рыкун и др. 2011: 126-134). В основе этой БД лежит фиксация палеоантропологических материалов конкретного адресного фонда, в данном случае Томского университета, со сложившейся системой регистрации и учета объектов хранения. Эта БД содержит, в том числе, подробные сведения об условиях поступления материалов, фиксирует несколько вариантов измерений одного и того же объекта и т.д.

При проектировании и разработке настоящей базы данных была учтена необходимость хранения в ней сведений, которые могут быть полезны с любой исследовательской точки зрения. Для этого материал должен иметь четкую географическую и историческую привязку; информацию о научных публикациях и отчетах, где он прежде был представлен; его морфологические (краниологические и остеометриче- ские) характеристики, иллюстрации. Последний аспект учета необходим не только в связи с требованиями классического хранения первоисточника, документированного фотофиксацией. Визуальное восприятие конкретной палеоантропологической находки позволяет удостовериться в ранее опубликованной для нее оценке, или же, напротив, усомниться. В случае суммарных внутригрупповых и межгрупповых сопоставлений, общее зрительное восприятие, к примеру, краниологических выборок может быть весьма полезным для сравнения с результатами, полученными формальными методами многомерной статистики (классификации, кластеризации).

Как вариант, для создаваемой нами базы данных рассматривалось программное обеспечение, разработанное для БнД КА ТГУ (Рыкун и др. 2011: 126-134). Несмотря на то, что в обоих случаях речь идет об одних и тех же наборах данных, в основе создаваемой базы данных и созданной для КА ТГУ лежат разные концептуальные подходы. Для банка данных КА ТГУ моделируемой предметной областью являются фонды КА ТГУ, со сложившейся в них системой учета объектов хранения. Соответственно, важную роль в этом случае является учетно-хранительская информация и появляется сущность «объект учета».

Создаваемая база данных в основном моделирует множество палеоантропологических объектов, имеющих определенную культурно-историческую идентификацию. Храниться они могут в различных учреждениях с отличающимися условиями учета хранимых материалов. Фактически, база данных КА ТГУ имеет некоторые избыточные данные с точки зрения создаваемой БД (например, условия поступления материалов, статус хранимых объектов и др.). При этом, с точки необходимости поддерживать по-возможности широкий круг задач антропологов, база данных КА ТГУ не содержит некоторых необходимых данных, таких как углеводородное датирование, ссылки на публикации и др. Все это явилось основанием для постановки задачи на проектирование и разработку новой базы данных.

Основная функция создаваемой базы данных - предоставление единого хранилища для структурированной по единым правилам и наиболее значимой информации, относящейся к палеоантропологии популяций, связанных с кругом ямной и афанасьевской культур. То есть, рассматриваются данные как предшествующих ямной культур добронзовой эпохи, так и последующих - полтавкинской, тамарут- кульской, криволукской, а также культур средней бронзы. Носители афанасьевской культуры представлены материалами Горного Алтая (включая арагольский, куро- тинский и улитинский типы погребения), а также Минусинской котловины и прилегающих регионов.

Адекватная картина расогенеза носителей этих культур возможна лишь при наличии репрезентативных краниологических, остеологических, одонтологических данных с максимальным пространственным и временным диапазоном. В связи с этим большое значение имеет единый подход к систематизации и атрибутации палеоантропологических материалов, находящихся в фондах различных учреждений (музеи, университеты, академические институты).

Степень детализации информации в создаваемой нами базе данных не должна быть избыточной (иначе не удастся преодолеть различия в представлении информации разных учреждений), но вместе с тем достаточной для решения основных задач.

Среди таких задач, в первую очередь, нужно назвать междисциплинарные исследования миграционных процессов на основе индивидуальных и средних значений по конкретным группам населения. Для изучения пространственно-временных изменений в базе должны содержаться географические координаты мест сбора палеоантропологических материалов, а также результаты их датировки. Как отмечено выше, обязательным требованием к данной базе является то, что в ней, наряду с цифровой и текстовой информацией, должны храниться фотоизображения палеоантропологических объектов. Также в этой базе должны быть ссылки на археологические отчеты и публикации (последние или наиболее значимые) как на первоисточники используемой информации. Так как создание в базе данных подсхемы для хранения данных библиографических описаний публикаций в соответствии с принятыми сейчас стандартами (как в электронных библиотеках) является достаточно сложной задачей, то принято решение хранить ссылки в текстовом виде. Здесь же можно добавлять электронный адрес публикации. Поскольку большинство публикаций сейчас издается сразу в электронном виде (изданные ранее интенсивно оцифровываются), то по этому адресу сразу можно получить доступ к нужной публикации.

Основной сущностью в модели создаваемой базы данных является скелет. Описанные выше требования к БД приводят к необходимости использования более сложной модели предметной области, чем в (Широбоков и др. 2017), так как база данных на основе универсального отношения в данном случае становится неэффективной. Поэтому возникает необходимость разработки реляционной базы данных.

Как сказано выше, палеоантропологические материалы для создаваемой базы данных происходят с территорий Волго-Уралья (ямная, полтавкинская, тамаруткуль- ская и другие археологические культуры), Горного Алтая, Минусинской котловины (афанасьевская культура) и сопредельных территорий. Хронологически они относятся к энеолиту - средней бронзе. В Волго-Уралье насчитывается значительное число археологических памятников, давших не менее 135 скелетов, относящихся к ямной, полтавкинской, тамаруткульской, криволукской культурам (Хохлов 2017). Если сюда добавить материалы Нижней Волги (Балабанова 2016: 72-94), Калмыкии и других регионов, а также материалы добронзовой эпохи и средней бронзы, то количество скелетов возрастет в несколько раз. В последнем и наиболее полном своде памятников афанасьевской культуры приведены сведения о 215 археологических памятниках, хотя они и не все дали антропологические материалы (Вадецкая и др. 2014). Исходя из этих оценок, объем записей в базе данных можно оценить в 400-500.

Так как основной сущностью создаваемой базы данных является скелет, то его атрибутика должна быть полной, хотя и не избыточной. Соответствующая принятому в данном случае «оптимуму» модель данных предметной области в виде ER-модели (модель «сущность-связь») показана на рис. 1.

Основными структурами в ER-модели являются множества сущностей и множества связей между сущностями. Для описания логической структуры данной предметной области были использованы нотации диаграмм, поддерживаемые в системе ERWIN. Эти нотации приняты в модели IDEF1x - модификации классической ER- модели. Каждое выявленное множество сущностей изображено на ER-диаграмме в виде прямоугольника, над которым указано название множества. Названия атрибутов каждого множества сущностей перечислены внутри соответствующего прямоугольника. Каждый прямоугольник разделен прямой линией на две части - в верхней указываются атрибуты, входящие в первичный ключ сущности, в нижней - все остальные ее атрибуты. Множества связей обозначены линиями, соединяющими соответствующие множества сущностей. В использовавшейся модели IDEF1x связи могут быть только бинарными - между двумя сущностями. Также в рамках этой модели поддерживается два типа множеств сущностей: независимые и зависимые. Первые, экземпляры которых могут быть уникальным образом идентифицированы без определения связи с сущностями из других множеств, изображены на ER-диаграмме прямоугольником с острыми углами. Вторые, экземпляры которых не могут быть уникальным образом идентифицированы без определения связи с сущностями из других множеств, показаны прямоугольником с закругленными углами. Со- ответственно множества связей между зависимыми и независимыми сущностями (идентифицирующих связей) показаны сплошными линиями, а множества связей между независимыми друг от друга сущностями (неидентифицирующих связей) - пунктирными линиями. Кардинальность связи обозначает отношения числа экземпляров одной сущности к числу экземпляров другой. Точка на конце линии у прямоугольника служит для обозначения кардинальности связи, указывая, что несколько сущностей из соответствующего множества могут быть ассоциированы с одной и той же сущностью из множества на другом конце связи. Если это верно для обоих множеств, сущности которых участвуют в связи, то говорят, что соответствующие связи имеют тип «многие-ко-многим». Примером связи «многие-ко-многим» в данном случае является связь «археологический памятник» - «исследователь», а связи «один ко многим» - «археологический памятник» - «скелет».