Материал: Статистические методы в астрофизике

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Статистические методы в астрофизике















Реферат

СТАТИСТИЧЕСКИЕ МЕТОДЫ В АСТРОФИЗИКЕ

Введение

Термин «Статистические методы» можно понимать двояко. Во-первых, как описание эволюции систем, состоящих из большого числа частиц. К ним относятся, например, плазма - система электрически заряженных частиц, взаимодействующих посредством электромагнитных полей. Или галактики, содержащие десятки и сотни миллиардов звезд и представляющие плазмоподобные системы, т.к. звезды взаимодействуют гравитационно. И т.д.

Другое понимание термина - это применение методов математической статистики для построения моделей изучаемых процессов, а также методы обработки сигналов.

1. Космологическая теория Фридмана (1922-1924 гг.) предсказывала, что Вселенная расширяется по закону: , где есть лучевая скорость какой-то галактики (лучевая означает проекцию скорости на луч зрения, соединяющий наблюдателя и изучаемый объект на небе),  - расстояние до галактики, А - некоторая константа. Пронаблюдав ряд галактик и определив для них лучевые скорости и расстояния, можно найти константу А, которая является чрезвычайно важной, т.к. она определяет темп эволюции Вселенной и, соответственно, ее возраст. В 1929 г. Э. Хаббл впервые определил величину указанной постоянной из наблюдений (впоследствии ее стали называть постоянной Хаббла и обозначать буквой Н). Здесь важно отметить то, что Хаббл, по-видимому, не знал теории Фридмана. Тем не менее, он пришел к тому же самому представлению для поля скоростей галактик чисто из наблюдательных соображений. Сделано это было с помощью как раз построения статистической модели. Одна из целей курса, продемонстрировать, что скрыто за термином «построение статистической модели» или «статистическое моделирование»

. Определение скорости Солнца относительно ближайших звезд. Идея метода такова. Измеряются скорости группы звезд, которые рассматриваем как ближайшие. Обрабатывая эти скорости, по ним определяют скорость Солнца. Раскрытию смыла термина «статистическая обработка наблюдений» будет посвящен специальный раздел.

. Определение фундаментальных параметров нашей Галактики. Одна из главных задач галактической астрономии - это нахождение массы Галактики. Масса определяется по движению звезд. В самом деле, если мы установим каким-то образом кривую вращения галактического диска, т.е. зависимость угловой скорости вращения галактики  от расстояния до ее центра r, то, используя условие равновесия  (здесь  - гравитационный потенциал Галактики, и считается, что центробежная сила уравновешена гравитационной силой, создаваемой всеми объектами Галактики), можем найти , а затем из уравнения Пуассона (, где ρ - плотность вещества) и массу Галактики. Проблема состоит в том, чтобы найти из наблюдений кривую вращения. Эта задача решается следующим образом. Измеряются скорости достаточно большого количества звезд. В отличие от предыдущей задачи, звезды должны занимать как можно больший объем галактики. Далее вводится некоторая математическая модель движения звезд в Галактике (в первом приближении считается, что звезды совершают чисто круговые движения) и путем статистической обработки данных измерений находятся параметры модели и, соответственно, кривой вращения, а затем масса Галактики.

В дальнейшем будут рассмотрены другие типы задач.

С точки зрения математики, статистические методы в астрофизике мало отличаются от других областей. Однако астрофизика налагает определенные особенности на требования к применяемым статистическим методам.

Для своего обоснования статистические методы в той или иной степени используют теорию вероятностей. В этой связи ниже представлен краткий исторический экскурс в теорию теории вероятностей.

Теория вероятностей как наука зародилась и сформировалась на материале азартных игр. Азартные игры, например, подбрасывание костей, карты и.д. - это достаточно простые и прозрачные для понимания процессы. Они и сейчас часто используются при изучении случайных процессов. Начало теории вероятностей как науке относится к 17 веку и связано оно с именами Галилея, Бернулли, Ферма и др. Значительный вклад в развитии теории принадлежит Гауссу, Чебышеву, Маркову и др.

Если говорить об астрономии, то тут следует отметить, что астрономия была первой экстремальной сферой знания, в которой человек попытался выйти за пределы обычной среды обитания, причем не только в пространственных, но и временных масштабах. Необычность этой науки ставила перед исследователями ряд проблем. Во-первых, необходимо было как-то получать информацию. Трудность здесь состояла в следующем. В астрономии мы не можем поставить активный эксперимент, т.е. не можем изменить состояние изучаемого объекта и посмотреть, к чему это приведет - за исключением ближайшей окрестности и вплоть до настоящего времени небесные объекты недостижимы. Все это приводит к тому, что мы вынуждены проводит пассивный эксперимент, ограничиваясь, как говорят, наблюдениями в ожидании того или иного события. Более того, эволюционные времена астрофизических объектов столь велики - в лучшем случае миллион лет, - что мы даже не можем непосредственно увидеть, как они эволюционируют со временем. Во-вторых, наблюдения проводятся зачастую вблизи предельных возможностей астрономических инструментов. И это ставит проблему о достоверности наших знаний о Мире в больших масштабах. Приблизиться к решению этого вопроса в немалой степени и как раз позволяют статистические методы.

Бурное развитие статистических исследований началось в 19-20 веках. Во-первых, человечество совершило прорыв во вторую экстремальную сферу знаний - атомную и ядерную физику. Здесь тоже потребовались изощренные методы обработки экспериментов. Во-вторых, статистика стала применяться в медицине, биологии, при планировании сложных и дорогостоящих экспериментов, что привело к созданию теории планирования экспериментов. Очень интенсивно статистика стала разрабатываться применительно к экономике. Возник даже термин «Эконометрика». Такое взаимное обогащение исследований в области статистики, проводившееся в разных областях науки, а также развитие компьютерной техники и методов привели к созданию современной более-менее стройной и цельной совокупности статистических методов.

В настоящем курсе будет рассмотрен ряд вопросов применения статистических методов, важных с точки зрения приложения в астрофизике, такие как оценивание тех или иных величин и их ошибок, статистическая обработка наблюдений, оценка достоверности данных, оценка гипотез, элементы дисперсионного анализа. В настоящее время разработан аксиоматический подход в теории вероятностей (Колмогоров). Но мы при изложении большинства вопросов будем базироваться на интуитивных, качественных представлениях, избегая громоздких и сложных для восприятия математических расчетов. В курсе подробно рассмотрено решение ряда реальных астрономических задач излагаемыми методами.

математический статистика погрешность сигнал

1. Природа ошибок. Методы их идентификации и оценки

В классической физике молчаливо принималось, что физические величины могут быть измерены, по крайней мере, в принципе, с любой точностью. Такая вера порождала иллюзию, что лишь недостаточное развитие приборной базы не позволяет достичь абсолютной точности. Однако со временем стало ясно, что полная неустранимость присутствия ошибок в измерениях - факт принципиальной важности. Особенно отчетливо это представление сформировалось благодаря развитию квантовой механики и формулировке принципа неопределенности Гейзенберга, который очертил пределы наименьших возможных ошибок при измерениях. При этом ошибки не следует рассматривать как нечто неправильное. Их следует рассматривать как погрешности, и эти погрешности присущи самой природе. В дальнейшем мы будем использовать оба термина - ошибки и погрешности как равноправные.

Любой результат измерений содержит ряд ошибок, различной природы. Принято их делить на систематические и случайные.

Систематические погрешности могут быть связаны с рядом факторов, например, часы, в которых используется математический маятник, в зависимости от окружающей температуры будут идти с разной скоростью, поскольку будет меняться длина маятника вследствие температурного расширения, или на разных географических широтах вследствие изменения эффективного ускорения свободного падения. Эти эффекты являются инструментальными. Их можно уменьшить, сконструировав маятник особым образом так, чтобы его длина менялась как можно меньше при изменении окружающей температуры, тем самым, увеличив точность измерения промежутков времени (в особенности, больших). А можно построить прибор, на который эффекты температуры будут оказывать слабое влияние. Впрочем, один такой прибор сконструировала сама природа - это наша Земля, которая, как известно, вращается. В силу большого момента инерции влияние изменения температуры поверхности Земли на скорость ее вращения будет мало. Впрочем, для фиксации тех или иных моментов времени возникают другие (астрономические) проблемы. Но как бы то ни было, вращение Земли в течение длительного периода рассматривалось как наиболее точный инструмент измерения времени. С изобретением еще более точных атомных часов было показано, что вращение Земли не является строго равномерным. Здесь мы можем определенно сказать, что температурные эффекты не оказывают влияния на атомные и ядерные процессы.

Другой пример - измерение длины отрезка. Ее можно измерять с помощью линейки, которая опять же подвержена температурным влияниям. А можно с помощью современных лазерно-интерферометрических методов, точность которых на несколько порядков выше любых методах, основанных на сравнении длин отрезков.

Резюме этой части таково. Систематические ошибки - это главным образом инструментальные ошибки. На них могут оказывать влияние сезонные изменения, либо какие-то неучтенные факторы. Нередко такие погрешности трудно выделять. Для этого следует совершенствовать приборную базу, а также проводить более тонкий анализ всех факторов, которые могут повлиять на данное измерение. Далее это утверждение будет продемонстрировано на конкретном факте.

Случайные ошибки. Как показывают исследования, многократные измерения одной и той же величины приводят к разным результатам даже после устранения всех возможных систематических ошибок. Природа этих погрешностей - не контролируемые, или не поддающиеся учету факторы, влияющие на измерения. Статистика как раз и занимается случайными ошибками (уточнение будет дано ниже). Для обоснования статистических методов и используется теория вероятностей.

Измерения делятся на прямые и косвенные. Прямыми называются те измерения, в которых интересующая нас величина определяется непосредственно. Например, с помощью линейки находится длина некоторого отрезка. Или с помощью часов - промежуток времени, и т.д. Косвенными называются измерения, при которых интересующая нас величина сама не измеряется, а находится ряд величин, с которыми она связана некоторым функциональным соотношением. Мы начнем с прямых измерений.

. Прямые измерения

Согласно сказанному, измеряемую величину мы можем представить в виде:

, (1.1)

где  - истинное значение измеряемой величины,

 и - систематическая и случайная ошибки. Предположим, что систематической ошибкой мы можем пренебречь. Спрашивается, как найти истинное значение  и охарактеризовать случайную ошибку. Рецепт таков. Производим измерения несколько раз, скажем, N раз. Каждую реализацию измерений будем отмечать индексом i, т.е. получаем набор . В качестве истинного значения принимается среднее арифметическое из N измерений:

 (1.2)

Чтобы не выписывать каждый раз сумму, для арифметического среднего мы будем использовать обозначение

 

Под многоточием здесь понимается какое-либо выражение, и будем опускать индекс i в знаке суммы, если не возникает недоразумения.

В качестве ошибки можно было бы, например, взять среднее арифметическое от абсолютных значений отклонений  от , т.е.

. (1.3)

На практике чаще используется другая оценка :

. (1.4)

Или, используя обозначения среднего через угловые скобки:


Отсюда и получается выражение (1.4).

Ее называют среднеквадратичным отклонением или ошибкой. Ниже будет выяснено, в чем преимущество оценки , которое дается формулой (1.4), по сравнению с формулой (1.3). Там же мы уточним и смысл этой величины.

Простейшая интерпретация приведенных погрешностей - это рассеяние экспериментальных значений вокруг среднего. Сказанное поясняет рис. 1.1, где условно изображена стрельба по мишени из орудия.

Итак, повторяя многократно измерения какой-то величины, мы можем найти ее «истинное» значение и разброс этой величины вокруг истинного значения.

Рис. 1. Качественное пояснение среднего и погрешностей как коридоров рассеяний.

Оба этих значения характеризуют совокупность полученной при измерениях выборки значений. Слово истинное было взято в кавычки потому, что в действительности оно неизвестно. Мы лишь принимаем формулу (1.2) за оценку истинного значения. Величина , очевидно, характеризует разброс  относительного среднего значения. Поэтому она также может играть роль оценки ошибки истинного значения. Обратим внимание на то, что каждая из указанных величин для данной выборки не зависит от номера реализации i.

Окончательно для искомой величины имеем: интересующая нас величина

Замечание. Предположим, что 2 экспериментатора измеряли независимо одну и ту же величину и получили разные значения -  и . Спрашивается, Какую из этих величин надо принять за истинную? Ответ таков: если они совпадают в пределах ошибки, то мы можем считать, что они не отличаются. Но если они не попадают в соответствующие коридоры ошибок, то эксперимент следует повторить и найти источник ошибок.

3. Косвенные измерения

В большинстве случаев приходится иметь дело с косвенными измерениями. Рассмотрим такой пример. Пусть непосредственно измеряются 2 величины и (т.е. мы имеем выборку из N пар значений xi yi ), а нас интересует 3-я величина , которая сама не измеряется и с этими двумя связана соотношением: