“Интерактивная база данных по дендроклиматологии”
Работу выполнил: Кожановский Юрий,
Научный руководитель: Маргаритов В.С.
Москва, 2012
Введение
Моя дипломная работа очень актуальна, потому что дендроклиматология - малоизученная и малоизвестная область биологии. Дендроклиматология пустила корни в летней школе в 2000 году, за это время накоплено большое количество данных.
В связи с этим появились цели структурировать базы данных, накопленные в течение всего периода изучения дендроклиматологии в летней школе. Моя основная задача заключается в создании web-ресурса с элементами php и java, а также базами данных, СУБД и удобным интерфейсом. Функциональность сайта достаточно проста, а именно на него можно загружать свои базы данных по дендроклиматологии и скачивать уже имеющиеся, что достаточно удобно для накопления сведений об этой науке и развитии ее.
Мои задачи -- изучить литературу по базам данных(виды баз данных,объяснить выбор реляционной бд,рассказать почему сейчас выбираются реляционные бд,объяснить принцип работы бд),собрать все базы данных,находящиеся в архиве ЛШ, создать новую базу данных для удобного использования,изучить среды программирование php и java, разработать структуру интернет-ресурса и написать сначала альфа версию проекта ( только html),по мере изучения новых языков программирования будут постоянно добавляться новые элементы,такие как сценарии на java,возможности загрузить новых баз данных и скачивания их с сервера, и при необходимости выложить продукт моей деятельности на просторы интернета.
Структура моей работы будет выглядеть следующим образом:
Сначала ознакомлюсь с литературой, создам базы данных по дендроклиматологии, затем буду писать html версию своего ресурса,постепенно добавляя новые элементы, после этого соберу все воедино и продемонстрирую работу функциональность сайта,
1. Дендроклиматология
Дендроклиматология - раздел климатологии, исследующий изменения местных климатов в исторический период времени преимущественно по толщине годичных колец у многолетних древесных растений.
Это наука изучает взаимосвязь между годичными кольцами деревьев и метеорологическими величинами - температурой, осадками и солнечным сиянием. Возникла она на основе развития другой научной дисциплины - дендрохронологии, занимающейся определением возраста лесов путем исследования годичных колец деревьев.
Поскольку некоторые деревья живут многие сотни и даже тысячи лет (например, Мамонтове дерево в Калифорнии, как показал срез его пня, имело возраст более 3000 лет, а остистая сосна, росшая в предгорьях Уайт-Маунтинс в Северной Америке и спиленная в 1956 году, имела возраст более 4500 лет!), изучение их годичных колец позволяет судить о климате прошлого, о колебаниях температуры, режима осадков и солнечного сияния. Кроме того, сопоставление свежих срезов <живых> деревьев со срезами погребенных деревьев более ранних времен открывает возможность продления хронологии изменения климата далеко за пределы возраста современных деревьев. Для Северной Америки и Средней Европы по годичным кольцам остистой сосны, дуба, лиственницы, ели и кедровой сосны восстановлена непрерывная хронология за период, превышающий 8000 лет, хронология с некоторыми пробелами - почти за 12 000 лет.
Численными методами с использованием ЭВМ была рассчитана количественная связь между данными ежегодных измерений характеристик древесины и летними температурами. Расхождение с фактическими данными оказалось меньше одного градуса. Удалось также сопоставить данные о колебаниях климата (а именно, о колебаниях температуры) с данными об изменениях фронта ледников в Альпах. Согласованность между всеми этими изменениями очень хорошая, что говорит о перспективности методов дендроклиматологии.
1.1 Методы исследования
Отбор проб производится с помощью ручного бура на определенном участке леса, отведенном для исследования. Образцы представляют собой пробы в виде цилиндра примерно 5мм в диаметре, взятые на одинаковой высоте по радиусу дерева. Дендролоклиматологи выбирают участок леса оптимально представляющий данный район. Например крутой скалистый южный склон может быть выбран для сбора данных о деревьях, произраставших в условиях недостатка воды или даже засухи. Темп прироста древесины на таком участке будет сильно зависеть от выпадения атмосферных осадков. Следовательно, очень важно знать основные характеристики участка и факторы, влияющие на рост древесины, до начала исследований, для правильной и точной интерпретации полученных результатов. Для презентативного статистического анализа необходимо как минимум 10 образцов. Образцы отправляются в лабораторию, где они подготавливаются к замерам ширины годовых колец. (Некоторые исследователи также измеряют плотность древесины, так как в некоторых случаях это помогает более правильно определить темп роста древесины). Точность измерения ширины годовых колец до 0,01мм. Все собранные данные записываются в компьютеризированную базу данных.
После чего все заносятся в базу данных ширины годовых колец, собранных на одном участке, обработаны, стандартизированы, и результаты представлены в хронологическом порядке. Процесс стандартизации включает в себя сглаживание кривых годовых колец для каждой серии образцов, этого можно добиться делением каждой ширины годового кольца на соответствующее отклонение кривой. Такой процесс дает возможность сравнения образцов с различным приростом, и может быть использован для избежания влияния на исследования нежелательных тенденций роста. Ширина годовых колец с возрастом дерева уменьшается по экспоненте, что показывает, что прирост древесины с течением времени снижается. Применив, обратную экспоненциальную зависимость исследователи могут рассчитать отклонение от среднего ожидаемого прироста древесины для данного образца без влияния возрастного фактора. Это отклонение далее используется для вычисления промежуточных результатов в исследованиях.
Обработка спилов
Возьмем спил дерева,затем его отшлифуем с помощью шлифовальной машинки,выберем 3 направления и с помощью миллиметровой бумаги или специального программного обеспечения измерим расстояния от середины спила до его краев. Заносим результаты в базу данных.
Связь с другими науками
Дендроклиматология главным образом связана с 2 науками:дендрологией и дендрохронологией.
Наука, занимающаяся изучением древесных растений, носит название дендрология.
Дендрохронология -- наука о методах абсолютной датировки исторических событий на основе использования специфических особенностей древесного прироста отдельных лет и их сочетаний. Методами дендрологии выявляются связи и закономерности, которые используются для ретроспективного восстановления климатических изменений в современных лесах за исторические периоды, в которые не велись инструментальные наблюдения за климатом.
Поэтому дендроклиматология тесно связана с дендрохронологией и дендрологией
1.2 Базы данных
База данных -- представленная в объективной форме совокупность самостоятельных материалов , систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ)
В традиционном понятии история возникновения баз данных начинается с 1955 года, когда появилось программируемое оборудование обработки записей. Программное обеспечение этого времени поддерживало модель обработки записей на основе файлов. Для хранения данных использовались перфокарты.
Существует большая классификация бд(свыше 50 видов ),рассмотрим следующие:
Cетевые
Иерархические
Реляционные
Иерархические базы данных
Иерархические базы данных могут быть представлены как дерево, состоящее из объектов различных уровней. Верхний уровень занимает один объект, второй -- объекты второго уровня и т. д.
В иерархической модели связи между данными можно описать с помощью упорядоченного графа (или дерева). Упрощенно представление связей между данными в иерархической модели показано на рис
Сетевые базы данных
В середине 60-х годов появились оперативные сетевые БД. Операции над оперативными базами данных обрабатывались в интерактивном режиме с помощью терминалов. Простые индексно-последовательные организации записей быстро развились к более мощной модели записей, ориентированной на наборы. За руководство работой Data Base Task Group (DBTG), разработавшей стандартный язык описания данных и манипулирования данными, Чарльз Бахман получил Тьюринговскую премию
Сетевая модель данных определяется в тех же терминах, что и иерархическая. Она состоит из множества записей, которые могут быть владельцами или членами групповых отношений. Связь между между записью-владельцем и записью-членом также имеет вид 1:N.
Основное различие этих моделей состоит в том, что в сетевой модели запись может быть членом более чем одного группового отношения. Согласно этой модели каждое групповое отношение именуется и проводится различие между его типом и экземпляром. Тип группового отношения задается его именем и определяет свойства общие для всех экземпляров данного типа.
К достоинствам сетевой модели относится очень высокая скорость поиска и возможность адекватно представлять многие задачи в самых разных предметных областях. Высокая скорость поиска основывается на классическом способе физической реализации сетевой модели - на основе списков. Более подробно о способах физической реализации сетевых СУБД можно почитать в монографиях Дж.Мартина и Дж.Ульмана. Можно обрнатиться и к технической документации доступных сетевых СУБД.
Главным недостатком сетевой модели, как, впрочем, и иерархичесокй, является ее жесткость. Поиск данных, доступ к ним, возможен только по тем связям, которые реально существуют в данной конкретной модели. В нашем примере с издательствами очень легко и быстро можно найти список всех статей, выпущенных издательством “Бухгалтерия и спорт”, но задача поиска издательств, в которых была опубликована статья “Влияние колец Сатурна на своевременную сдачу норм ГТО” будет требовать гораздо больших усилий. Причиной для подобных проблем, по мнению Е.Кодда), является “навигационный” характер сетевых СУБД. Другими словами, при поиске данных сетевая СУБД требует перемещаться только по существующим, заранее предусмотренным связям.
Реляционная база данных
Реляционные системы берут свое начало в математической теории множеств. Они были предложены в конце 1968 года доктором Э.Ф.Коддом из фирмы IBM, который первым осознал, что можно использовать математику для придания надежной основы и строгости области управления базами данных. Работы Эдгара Ф. Кодда открыли путь к тесной связи прикладной технологии баз данных с математикой и логикой. За свой вклад в теорию и практику он также получил премию Тьюринга.
Реляционная база данных представляется пользователю как совокупность таблиц и ничего кроме таблиц. Вот пример реляционной БД.
|
Поставщики ПС Название Статус Город Адрес Телефон 1 СЫТНЫЙ рынок Ленинград Сытнинская, 3 2329916 2 ПОРТОС кооператив Резекне Садовая, 27 317664 3 ШУШАРЫ совхоз Пушкин Новая, 17 4705038 4 ТУЛЬСКИЙ универсам Ленинград Тульская, 3 2710837 5 УРОЖАЙ коопторг Луга Песчаная, 19 789000 6 ЛЕТО агрофирма Ленинград Пулковское ш.,8 2939729 7 ОГУРЕЧИК ферма Паневежис Укмерге, 15 127331 8 КОРЮШКА кооператив Йыхви Нарвское ш., 64 432123 |
|
|
Продукты |
Наличие ПР Продукт Белки Жиры Углев K Ca Na B2 PP C 1 Говядина 189. 124. 0. 3150 90 600 1.5 28. 0 2 Судак 190. 80. 0. 1870 270 0 1.1 10. 30 3 Масло 60. 825. 90. 230 220 740 0.1 1. 0 4 Майонез 31. 670. 26. 480 280 0 0. 0. 0 5 Яйца 127. 115. 7. 1530 550 710 4.4 1.9 0 6 Сметана 26. 300. 28. 950 850 320 1. 1. 2 7 Молоко 28. 32. 47. 1460 1210 1500 1.3 1. 10 8 Творог 167. 90. 13. 1120 1640 1410 2.7 4. 5 9 Морковь 13. 1. 70. 2000 510 210 0.7 9.9 50 10 Лук 17. 0. 95. 1750 310 180 0.2 2. 100 11 Помидоры 6. 0. 42. 290 140 400 0.4 5.3 250 12 Зелень 9. 0. 20. 340 275 75 1.2 4. 380 13 Рис 70. 6. 773. 540 240 260 0.4 16. 0 14 Мука 106. 13. 732. 1760 240 120 1.2 22. 0 15 Яблоки 4. 0. 113. 2480 160 260 0.3 3. 130 16 Сахар 0. 0. 998. 30 20 10 0. 0. 0 17 Кофе 127. 36. 9. 9710 180 180 0.3 1.8 0 |
|
|
ПР К_во Стоим 1 108 429.84 2 0 0.00 3 73 274.61 4 39 97.46 5 61 111.83 6 88 206.60 7 214 83.08 8 92 82.80 9 0 0.00 10 77 46.30 11 46 51.70 12 13 34.96 13 54 51.14 14 91 43.77 15 117 189.92 16 98 96.14 17 37 166.50 |
Термин реляционный имеет следующие происхождение (лат. Relation -- отношение) Это просто математический термин для обозначения неупорядоченной совокупности однотипных записей или таблиц определенного специфического вида, описанного выше.
Сравнение моделей данных
Возьмем 2 модели данных:реляционную и иерархическую
1)В иерархической модели связи между данными можно описать с помощью упорядоченного графа. В реляционной связь -- отношения
2)Разный степень понятности для человека (иерархическая модель является громоздкой для обработки информации с достаточно сложными логическими связями, а также сложность понимания)
3)Иерархическая модель данных эффективно использует память ЭВМ и неплохие показатели времени выполнения основных операций над данными. Также меньший объем избыточной информации,нежели в реляционной