Роль статистики в нашей жизни настолько значительна, что люди, часто не задумываясь и не осознавая, постоянно используют элементы статистической методологии не только в трудовых процессах, но и в повседневном быту. Работая и отдыхая, делая покупки, знакомясь с другими людьми, принимая какие-то решения, человек пользуется определённой системой имеющихся у него сведений, сложившихся вкусов и привычек, фактов, систематизирует, сопоставляет эти факты, анализирует их, делает выводы и принимает определённые решения, предпринимает конкретные действия. Таким образом, в каждом человеке заложены элементы статистического мышления, представляющего собой способности к анализу и синтезу информации об окружающем нас мире.
Можно без преувеличения сказать, что статистическими методами сегодня пронизана вся наша жизнь [1].
В ХХ в. статистику обычно рассматривают как самостоятельную научную дисциплину. Статистика есть совокупность методов и принципов, согласно которым проводится сбор, анализ, сравнение, представление и интерпретация числовых данных (1925). В 1954 г. академик АН УССР Б.В. Гнеденко дал следующее определение: «Статистика состоит из трех разделов:
1) сбор статистических сведений, т.е. сведений, характеризующих отдельные единицы каких-либо массовых совокупностей;
2) статистическое исследование полученных данных, заключающееся в выяснении тех закономерностей, которые могут быть установлены на основе данных массового наблюдения;
) разработка приемов статистического наблюдения и анализа статистических данных. Последний раздел, собственно, и составляет содержание математической статистики».
Термин «статистика» употребляют еще в двух смыслах. Во-первых, в обиходе под «статистикой» часто понимают набор количественных данных о каком-либо явлении или процессе. Во-вторых, в специальной литературе статистикой называют функцию от результатов наблюдений, используемую для оценивания характеристик и параметров распределений и проверки гипотез [2].
В условиях постоянно расширяющегося ассортимента выпускаемой продукции основным фактором, определяющим целесообразность приобретения изделий потребителем, является качество [3].
Качество стало залогом успеха и основным условием, предопределяющим увеличение объема продукции, поставляемой на национальные и международные рынки. Тщательно разработанные и эффективно функционирующие системы управления качеством продукции обеспечивают рентабельность фирм и получение значительных прибылей на инвестированный капитал. В результате внедрения систем управления качеством предприятия увеличивают объем выпускаемой продукции, добиваются повышения производительности труда, обеспечивают существенное снижение расходов на качество и повышают свою конкурентоспособность [3].
Однако далеко не все предприятия добиваются равнозначного эффекта от реализации своей продукции на рынках сбыта. Так, качество продукции, выпускаемой одними фирмами, существенно отличается от качества продукции, выпускаемой другими [3].
В настоящее время понятие качества стало намного шире восприниматься производителями и потребителями. Уже недостаточным условием успешной работы предприятия является только производство качественной продукции, так как производитель, не обеспечивший на высоком уровне договорные и сопроводительные мероприятия по реализации своей продукции потребителям, рискует в будущем уступить конкурентам [3].
При таком положении дел потребитель, который в настоящее время может легко отличить более качественную продукцию от менее качественной, отдает, естественно, предпочтение продукции более высокого качества [3].
Стремление фирм во всем мире повысить качество выпускаемой продукции объясняется наличием различных уровней качества. В связи с этим методы и средства, обеспечивающие улучшение качества продукции, приобретают первостепенное значение и играют решающую роль в производственной деятельности [3].
К одному из таких методов относится организация работы предприятия по общепринятым нормам или стандартам, которые помогают организовать работу предприятия в направлении повышения качества продукции или услуги. В настоящее время одними из таких стандартов являются международные стандарты ISO 9000, в соответствии с которыми можно создавать систему качества на предприятии [3].
В методологическом плане принципиально важным для всего семейства стандартов ISO серии 9000 является введенное положение о том, что вся работа, выполняемая организацией, рассматривается как совокупность взаимосвязанных процессов. Соответственно общее руководство качеством достигается через управление процессами, реализуемыми в организации и умением применять статистические методы [3].
Основным результатом работы систем менеджмента качества является завоевание изготовителем соответствующего доверия в отношении его способности обеспечивать качество, как самого продукта, так и всех процессов его создания [3].
Системы ISO 9000 являются моделью СМК, то есть их задача состоит в организации системы управления качеством [4].
Стандарты ISO 9000, в том числе устанавливают возможность и необходимость принятия обоснованных решений в области качества на базе достоверной информации - принцип «Принятие решений, основанное на фактах». Этот принцип может быть реализован, если возможно будет осуществить следующие действия:
1) проведение измерений, сбор данных и информации на всех этапах технологического цикла продукции;
2) обеспечение точности, надежности и доступности данных и информации;
) проведение соответствующего анализа и информации с помощью различных методов [4].
Поскольку в реальных условиях часто затруднено использование детермированных параметров, используют методы математической статистики (статистического анализа) [4].
Статистические методы подразумевают работу со случайными величинами [4].
В системе стандартов ISO указывается, что должна обеспечиваться возможность реализации статистических методов для подтверждения возможности производства и достижения требуемых характеристик продукции. В целом, статистические методы рассматриваются как средства измерений, описания, анализа, интерпретации и моделирования изменчивости качества при наличии определенного количества данных [4].
Основные этапы выполнения статистического анализа:
1. Сбор и первичный анализ информации. При кажущейся тривиальности данный этап по трудоемкости является наиболее весомым и во многом определяет достоверность получаемых результатов.
2. Описательная статистика и первичная обработка выборки. Целью является выявление и устранение грубых погрешностей, расчет числовых характеристик и установление вида распределения, как правило, подтверждение нормальности распределения (распределение Гаусса).
. Дисперсионный анализ одно- или двухфакторного комплекса. На данном этапе качественно устанавливается или опровергается гипотеза о зависимости (влиянии) параметров управления на параметры состояний [4].
Фактически, нужно дать ответ на вопрос - влияет или не влияет
на
(
- параметры управления, то есть факторы,
которыми можно варьировать;
- результат процесса, параметры состояния) [4].
. Корреляционный анализ - количественно (численно)
устанавливается степень влияния
на
.
. Регрессионный анализ - устанавливается конечная
математическая зависимость между
и
, которая в дальнейшем позволяет, варьируя
значениями
, получать значений
.
. Анализ полученных результатов и возможностей использования (построение контрольных карт, диаграмм, корректировка технологического процесса, осуществление организационных мероприятий, внесение изменений в нормативную документацию и др.) [4].
Рассмотрим подробнее этап описательной статистики.
статистический контрольный карта
Описательная статистика применяется для систематизации и описания данных наблюдения. Задачи, которые решает описательная статистика - это, прежде всего, задачи соединения и обобщения данных. Цель здесь состоит не только в том, чтобы извлечь и представить в самом сжатом виде существенную информацию об изделии или процессе, придав ей форму некоторой системы данных [3].
Описание данных обычно является начальным этапом в анализе количественных данных и часто - первым шагом к использованию других статистических процедур [3].
В качестве данных для описательной статистики может быть любая информация, которая отражает содержание наблюдений: опросы общественного мнения, показатели экономической и финансовой деятельности, характеристики производственных процессов и т.д. Характеристики выборочных данных могут служить основанием для выводов относительно характеристик всей совокупности данных. И какова бы ни была генеральная совокупность наблюдений, из которой черпаются данные, описательная статистика предлагает наиболее целесообразные способы, с помощью которых можно не только быстро выделить основное содержание полученной информации, но и провести дальнейший ее анализ с минимальной трудоемкостью [3].
На этапе описательной статистики определяются следующие основные характеристики выборки:
1. Минимум и максимум. Максимум - самое большое значение из анализируемого набора данных, минимум - самое маленькое (может быть и отрицательным числом). Это крайние значения в совокупности данных, обозначающие границы их вариации [5].
2. Размах выборки - обозначается буквой R. Это самый
простой показатель, который можно получить для выборки - разность между
максимальной и минимальной величинами данного конкретного вариационного ряда,
т.е.
[5].
3. Среднее арифметическое выборки характеризует средний
уровень значений изучаемой случайной величины в наблюдавшихся случаях и
вычисляется путем деления суммы отдельных величин исследуемого признака на
общее число наблюдений:
,
где
- выборочное среднее,
- объем выборки,
- i-й элемент выборки [5].
4. Медиана представляет собой срединное значение
упорядоченного массива чисел. Если массив не содержит повторяющихся чисел, то
половина его элементов окажется меньше, а половина - больше медианы. Если
выборка содержит экстремальные значения, для оценки среднего значения лучше использовать
не среднее арифметическое, а медиану. Чтобы вычислить медиану выборки, ее
сначала необходимо упорядочить.
элемент упорядоченного массива [5].
Эта формула неоднозначна. Ее результат зависит от четности или
нечетности числа
:
если выборка содержит нечетное количество элементов, медиана равна (n+1)/2-му элементу;
если выборка содержит четное количество элементов, медиана лежит между двумя средними элементами выборки и равна среднему арифметическому, вычисленному по этим двум элементам [5].
5. Мода. Термин был впервые введен Пирсоном в 1894 г. Мода - это число, которое чаще других встречается в выборке (наиболее модное). Мода хорошо описывает, например, типичную реакцию водителей на сигнал светофора о прекращении движения. Классический пример использования моды - выбор размера выпускаемой партии обуви или цвета обоев. Если распределение имеет несколько мод, то говорят, что оно мультимодально или многомодально (имеет два или более «пика»). Мультимодальность распределения дает важную информацию о природе исследуемой переменной. Например, в социологических опросах, если переменная представляет собой предпочтение или отношение к чему-то, то мультимодальность может означать, что существуют несколько определенно различных мнений. Мультимодальность также служит индикатором того, что выборка не является однородной и наблюдения, возможно, порождены двумя или более «наложенными» распределениями. В отличие от среднего арифметического, выбросы на моду не влияют. Для непрерывно распределенных случайных величин, например, для показателей среднегодовой доходности взаимных фондов, мода иногда вообще не существует (или не имеет смысла). Поскольку эти показатели могут принимать самые разные значения, повторяющиеся величины встречаются крайне редко [5].
6. Дисперсия и стандартное отклонение. Эти показатели
позволяют оценить степень колебания данных вокруг среднего значения. Выборочная
дисперсия является приближением среднего арифметического, вычисленного на
основе квадратов разностей между каждым элементом выборки и выборочным средним.
Для выборки
выборочная дисперсия, обозначаемая
символом
, задается следующей формулой:
[5].
В общем случае выборочная дисперсия - это сумма квадратов
разностей между элементами выборки и выборочным средним, деленная на величину,
равную объему выборки минус один:
[5].
Наиболее практичной и широко распространенной оценкой разброса
данных является стандартное выборочное отклонение. Этот показатель обозначается
символом
и равен квадратному корню из выборочной
дисперсии:
[5].
Ни выборочная дисперсия, ни стандартное выборочное отклонение не
могут быть отрицательными. Единственная ситуация, в которой показатели
и
могут быть нулевыми, - если все элементы выборки равны между
собой [5].
7. Асимметрия распределения - качественное свойство
кривой распределения, указывающее на отличие от симметричного распределения.
Асимметрия распределения положительна (отрицательна), если коэффициент
асимметрии положителен (отрицателен). При положительной (отрицательной)
асимметрии распределения более «длинная» часть кривой плотности распределения
лежит правее (левее) моды [6].
,
где
- общее количество выборки,
- стандартное выборочное отклонение.
8. Эксцесс - характеризует остроконечность или
сглаженность функции распределения:
[4].
Различают относительную и кумулятивную частоты. В общем случае, частота - это количество значений случайной величины в выборке [4].
Относительная частота:
.
где
- частота отдельных значений в выборке
[4].
Кумулятивная частота:
[4].
В первом приближении
совпадает с вероятностью [4].