Материал: Тема+4.+Статанализ+в+НИР

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Тема 4. Направления и задачи статистического анализа в НИР

Цель: Научиться понимать результаты статистического анализа медикобиологических данных.

Студент должен знать: Задачи статистического анализа результатов НИР, ключевые правила представления научной информации

Уметь: Понять в научной публикации смысл представленных фактических данных, возможность использования результатов исследования в практике здравоохранения.

Вопросы для самоподготовки:

1.Значение статистических методов в научных исследованиях.

2.Статистические показатели, характеризующие:

-явление (заболевание, факторы риска),

-значимость различий между группами сравнения,

-прогноз заболевания,

-риск развития заболевания,

-эффективность лечения,

-достоверность и точность диагностического теста.

3.Способы представления результатов НИР в описании, таблицах и диаграммах.

Домашнее задание

1.Изучите теоретический материал

2.Продумайте решение задач, приведенных в рамочках

3.Выполните письменно на отдельном листочке и сдайте перед занятием следующее задание:

Определите, какой тип диаграмм необходим для представления фактических данных, представленных в таблицах 1-4.

Выполните соответствующие диаграммы к каждой таблице.

Сделайте заключение по каждой таблице.

Таблица 1. Заболеваемость сахарным диабетом в РФ, на 10 000 человек

 

 

 

2006

 

2007

 

2008

 

2009

2010

Частота случаев

 

146,7

 

152,2

 

158,1

 

166,0

176,0

Таблица 2. Распределение воспитанников детского дома по росту, %

 

 

 

 

 

Рост воспитанников

 

 

Низкий

Ниже среднего

 

Средний

 

Выше среднего

Высокий

Доля детей

5

 

 

20

 

65

 

8

2

Таблица 3. Заболеваемость острыми вирусными гепатитами в РФ в 2010 году

 

Всего случаев, на 100 тыс.

В % от общего числа

 

чел.

 

Острые вирусные гепатиты,

44,94

100,0

Из них:

 

 

Гепатит А

30,05

66,9

Гепатит В

8,56

19,0

Гепатит С

4,47

9,9

Прочие формы

1,86

4,1

Таблица 4. Заболеваемость детей, подростков и взрослых в А-области, на 1000 чел.

Показатель

Дети

Подростки

Взрослые

Общая заболеваемость

1800

1503

980

Первичная заболеваемость

1478

1265

458

Задание для письменной контрольной работы

Проведите анализ медицинской публикации. Ответьте на следующие вопросы:

1.Основной научный вопрос

2.Вид исследования

3.Объект исследования

4.Виды статистического анализа и используемые статистические пока-

затели:

- Описание центральной тенденции и вариабельности количественных данных

- Описание частот качественных данных - Выявление эффектов, сходства и различия групп - Описание величины изучаемого эффекта

- Показатели, характеризующие достоверность результатов

5.Способы представления результатов, с какой целью используются

6.Ключевые результаты

7.Значение для практики здравоохранения

Теоретический материал

Статистический анализ применяется для обработки собранной в ходе исследования информации. Важнейшая цель статистического анализа – сделать вывод о существовании некой общей закономерности на основании анализа ограниченного числа наблюдений. Статистические методы дают возможность:

-компактно и информативно описывать результаты эксперимента или наблюдения;

-устанавливать степень достоверности сходства и различия исследуемых объектов на основании результатов измерения их показателей;

-анализировать наличие или отсутствие зависимости между различными показателями;

-количественно описывать эти зависимости;

-выявлять информативные показатели;

-классифицировать изучаемые объекты;

-прогнозировать значение показателей и т.д.

Внаучных публикациях в разделе «Материалы и методы исследования» следует обязательно указывать используемые методы математического и статистического анализа, применяемые пакеты статистических программ.

Выбор методов статистического анализа связан с несколькими условиями: характер решаемой научной задачи и дизайн исследования (описательное или аналитическое исследование), вид данных (количественные или качественные) и особенности их распределения в исследуемой популяции (выборке) и др.

Наиболее часто в медицине статистика применяется для решения 4 типов задач:

1. Описание центральной тенденции и вариабельности количественных данных.

2. Описание частот (абсолютных и относительных) качественных дан-

ных.

3. Выявление эффектов, сходства и различия групп.

4. Описание величины изучаемого эффекта.

Ваналитических исследованиях могут решаться все типы задач, в описательных исследованиях – только задачи 1 и/или 2.

Задача 1. Описание центральной тенденции и вариабельности количественных данных.

В качестве центральной тенденции используются среднее арифметическое (М) – при нормальном (Гауссовском) распределении фактических данных, или медиана (Ме) – величина, соответствующая середине вариационного ряда изучаемого признака. При нормальном распределении М и Ме совпадают.

Мерой вариабельности при нормальном распределении признака выступает среднее квадратическое отклонение - сигма (σ), или стандартное отклонения (все термины означают одно и то же). Для любого распределения (нормального или нет) применяют нижний и верхний квартили, или межквартильный размах – значения признака, отсекающие по 25% объектов выборки с левой и правой стороны распределения количественного признака. Дополнительный показатель – вариационный размах – разница между максимальным и минимальным значением.

Задача: Как описать индекс массы тела (масса/рост2) среди призывников? Обследовано 200 человек, характер распределения показателя неизвестен. Выберите меры для оценки центральной тенденции и вариабельности.

Задача 2. Описание частоты явления для качественных данных.

При решении данной задачи рассчитывают число случаев с тем или иным значением качественного признака (абсолютные частоты), а затем их количество, приходящееся на 100 (1000, 10000 и т.п.) наблюдений – относительные частоты.

При изучении заболеваемости выделяют 2 группы относительных показателей: интенсивные и экстенсивные. Интенсивные показатели заболеваемости характеризуют частоту случаев (вновь выявленных случаев или всех зарегистрированных случаев) данной болезни в какой-то группе населения за определенный период времени или в данный момент на конкретной территории. Интенсивный показатель рассчитывают по формуле:

ИП = (количество случаев / численность населения)* 1000.

В данном случае ИП характеризует частоту случаев заболеваний, приходящихся на 1000 человек.

Экстенсивные показатели оценивают величину какой-либо структурной части по отношению ко всему явлению, например, какую долю составляют болезни органов дыхания от всей совокупности зарегистрированных заболеваний. Экстенсивный показатель рассчитывается по формуле:

ЭП = (часть явления/явление)*100.

ЭП показатель обычно измеряется в процентах.

Задача: В городе А с численностью населения 50 000 человек зарегистрировано 50 больных, у 20 из них болезнь выявлена впервые в отчетном году. Рассчитайте интенсивный и экстенсивный показатель заболеваемости.

Задача 3. Выявление эффектов, сходства и различия.

При сравнении результатов, полученных в 2 или более группах, изменений, произошедших в 1 группе в течение какого-либо времени в силу естественных причин или направленных воздействий, приходится решать, являются ли существенными эти различия. Во всех выборочных исследованиях изучают часть популяции (генеральной совокупности), поэтому следует ожидать появления некоторых различий между выборкой и реальной популяцией. Также в результат могут вмешиваться другие неучтенные исследователем факторы и искажать его. Это называется ошибкой выборки. Поэтому прогностические оценки в выборочных исследованиях должны сопровождаться оценкой их достоверности.

Эта задача может быть решена 2 способами:

1)Проверкой нулевой статистической гипотезы об отсутствии различий групп;

2)Построением доверительных интервалов для параметров центральной тенденции распределения либо для показателя величины эффекта

Проверка гипотез при сравнении групп осуществляется при использовании особых статистических критериев. Выбор их может быть сделан после ответа на несколько вопросов:

1. Какие признаки сравниваются в группах – количественные или качественные (порядковые, номинальные, бинарные)?

2.В случае количественных признаков: каковы распределения этих признаков в каждой из сравниваемых групп – нормальные или нет? Равны ли дисперсии в группах?

3.Являются ли выборки независимыми (несвязанными) или зависимыми (связанными)?

4.Какое количество групп сравнивается – 2, 3 или более?

Наиболее распространенные статистические критерии, используемые для сравнения групп

Тип признака

2 независимые груп-

2 зависимые групп

3 независимые груп-

 

пы

 

пы и более

Количественный

t-критерий Стьюден-

t-критерий Стью-

ANOVA по Пирсону

признак, нормальное

та для независимых

дента для зависи-

 

распределение

групп

мых групп

 

Количественный

Критерий Манна-

Критерий Вилкок-

ANOVA по Крускалу-

признак, любое рас-

Уитни

сона

Уоллису

пределение

 

 

 

Качественный по-

Критерий Манна-

Критерий Вилкок-

ANOVA по Крускалу-

рядковый признак

Уитни (при числе

сона

Уоллису (при числе

 

значений признака

 

значений признака

 

более 5), χ2

 

более 5), χ2

Качественный но-

χ2 (хи-квадрат)

Критерий Кокрана

χ2

минальный признак

 

 

 

Бинарный признак

Точный критерий

Критерий МакНе-

χ2

 

Фишера

мара

 

В процессе проверки гипотезы вычисляют значение статистического критерия и уровень статистической значимости р, который сравнивают с заданным заранее пороговым уровнем значимости ро (в медико-биологических исследования обычно ро принимается равной 0,05). При р< ро нулевая гипотеза (об отсутствии различий групп) отклоняется и принимается альтернативная гипотеза – о том, что различия групп существуют и являются статистически значимыми. Подчеркнем, что, если по результатам теста нулевая гипотеза не отклоняется, это не означает, что различия групп отсутствуют. Причин может быть 2: недостаточные объемы выборок и/или отсутствие эффекта.

Задача: Оцените результаты исследования умственной работоспособности. Какой статистический критерий следует использовать для оценки достоверности различий?

Динамика работоспособности учащихся на протяжении недели по результатам корректурного теста, М±m

Показатель

Вторник

Пятница

 

 

 

Число просмотренных знаков

246,1±13,7

264,1±10,8

 

 

 

Число ошибок на 500 знаков

9,3±2,8

6,9±1,4*

* - результат достоверно отличается от предыдущего исследования (р=0,015)