21
Измерение вариации состоит в нахождении чисел, которые характеризуют степень разброса данных относительно центра распределения.
Размах – это разница между наибольшим и наименьшим значениями. Для нахождения размаха прежде рекомендуется упорядочить данные в порядке возрастания. Можно записать размах с помощью формулы
R xmax xmin .
Квартили – это значения, которые делят вариационный ряд на четыре равные по объему части. Квартильный размах (Inter Quartile Range - IRQ) –
это разница между третьим и первым квартилями. Таких значений должно быть три: первая, вторая и третья квартиль соответственно. Для начала данные следует упорядочить. Затем отыскивается медиана, которая является вторым квартилем по определению. После этого находятся первый и третий квартили. Существует несколько вариантов формального определения квартилей.
Квартильный размах находится по формуле
IQR Q3 Q1
Если при вычислении размаха используются только наибольшее и наименьшее значения признака, а распределение данных между ними полностью игнорируется, то при вычислении квартильного размаха игнорируются «крайние» данные, расположенные за пределами первого и третьего квартилей. Между Q1 и Q3 расположено 50 % всех данных.
Дисперсия для набора данных или выборки – это среднее арифметическое квадратов отклонений значений от их среднего.
Дисперсия обозначается s 2 . Основная формула (по определению) для нахождения дисперсии
s 2
x x 2
n 1
Формула означает, что нам следует вычитать среднее из каждого значения выборки, суммировать квадраты разности, а затем разделить полученную сумму на количество наблюдений минус 1.
Стандартное отклонение – квадратный корень из дисперсии выборки. Обозначается s и вычисляется по формуле
|
|
|
s |
x x 2 |
|
. |
||
|
n 1 |
|
22
Коэффициент вариации вычисляется как отношение стандартного отклонения к среднему значению выборки.
Формула для коэффициента вариации
CV xs .
Порядок выполнения работы
1.Создать скрипт для выполнения работы и сохранить его. В первой строке написать комментарий, содержащий название работы:
2.Сгенерировать последовательность случайных чисел размером 40:
3.Преобразовать выборку в целые числа, умножив каждый элемент на 100 и округлив до целого значения:
4.Найти моду распределения. Для этого нужно определить, какие значения встречаются в последовательности, и сколько раз встречается каждое из этих значений:
5.Найти медиану и среднее распределения:
6.Сформировать четыре дополнительные последовательности произвольного объема от 30 до 60: sample_В, sample_С, sample_D и sample_E.
23
7.Вычислить среднее и размер получившихся последовательностей, воспользовавшись для этого функциями mean и size . Найти произведения этих величин для каждой последовательности (А-Е).
8.Найти общее число наблюдений, сложив размеры всех последовательностей.
9.Найти взвешенное среднее получившихся последовательностей.
10.Вычислить размах выборки А. Использовать функции нахождения максимального и минимального элементов min и max .
11.Найти квартильный размах (функция iqr ) выборки А.
12.Вычислить дисперсию (функция var iance ), стандартное отклонение и коэффициент вариации выборки A.
13.Построить гистограмму исходной последовательности А:
14.Оформить отчѐт по лабораторной работе. Раздел «Выполнение работы» содержит запись результатов выполнения предыдущих пунктов.
Варианты заданий
Варианты заданий в этой работе отсутствуют.
Контрольные вопросы
1.Какие существуют способы численного описания распределений переменных, каковы их параметры?
2.В чем состоит измерение центральной тенденции?
3.Что такое мода, каковы ограничения еѐ применения?
4.Приведите примеры нахождения моды.
5.Что такое медиана, как она вычисляется?
6.Что такое среднее и взвешенное среднее, как они вычисляются?
7.Размах и квартильный размах, формулы для их вычисления.
8.Что такое дисперсия, стандартное отклонение и коэффициент вариации, как они вычисляются?
24
Лабораторная работа № 3. Комбинаторика
Цель работы: получение навыков расчета в среде Scilab формул комбинаторики: перестановок, размещений, сочетаний и выбора с повторением.
Теоретическая часть
Для вычисления вероятности иногда приходится использовать несколько важных формул из комбинаторики. Комбинаторика – это раздел математики, который содержит методы решения задач, связанных с перечислением и подсчетом. В комбинаторике имеются формулы для определения числа подмножеств заданного множества, подсчета числа перестановок, размещений и сочетаний.
Принцип суммы. Если некоторый объект A может быть выбран из совокупности объектов m способами, а другой объект B может быть выбран n способами, то выбрать либо A , либо B можно m n способами.
Принцип произведения. Если одно множество состоит из n различных элементов, другое из m различных элементов, и эти множества не пересекаются, то сколько различных пар можно образовать из элементов этих множеств, если первый элемент берется из первого множества, а второй – из второго? Согласно принципу произведения количество пар будет равно n m .
Перестановки. Сколькими способами n разных объектов могут быть расположены на одной линии?
Например, сколькими способами 6 человек могут сесть на шесть стульев? Чтобы подсчитать, можно размышлять следующим образом. Для первого существует 6 возможностей, для второго, после того как первый уже выбрал, останется всего 5, для следующего – 4 и так далее. Последний, шестой, после пятерых будет иметь только одну возможность. Итак, 6 5 4 3 2 1 720 . Будем использовать обозначение 6! для записи таких произведений (произносится: шесть факториал). В общем виде количество перестановок из n элементов обозначается Pn и вычисляется по формуле
Pn n!
Размещения. Сколькими способами из n разных объектов можно выбрать упорядоченное подмножество из m объектов? Упорядоченным считается множество, в котором задан порядок элементов. Объекты после выбора не возвращаются и повторно не могут быть выбраны. Например,
25
сколькими способами из 6 человек можно выбрать четверых и рассадить на четыре стула? Способ подсчета аналогичен предыдущему. На первый стул сядет любой из шести, на следующий – уже из пяти. Всего четыре стула,
поэтому: 6 5 4 3 360 . В общем виде, количество возможных размещений из n |
|||
элементов по m обозначается Am и рассчитывается по формуле |
|||
|
n |
||
Am n n 1 n m 1 |
n! |
|
|
n m ! |
|||
n |
|||
|
|
||
Сочетания. Сколькими способами из n разных объектов можно выбрать m объектов? Выбор не упорядочен. Объекты после выбора не возвращаются.
Например, сколькими способами из шестерых человек можно выбрать четверых? Несложные размышления приведут к тому, что следует модифицировать формулу для размещений, а именно, отказаться от упорядоченности выбранных элементов, что будет стоить нам m! в знаменателе. Количество сочетаний для множества из n элементов по m элементов определяется по формуле
C m |
n! |
|
|
||
m! n m ! |
||
n |
||
|
Выбор с повторением. Сколькими способами из n разных объектов можно выбрать m объектов с повторением? Объекты после выбора возвращаются.
Например, сколькими способами из шестерых человек можно выбрать четверых для дежурства, если можно выбирать с повторением и, потенциально, один из шестерых может быть выбран все четыре раза? В этом случае для каждого выбора у нас имеются все шесть кандидатов. Получим 6 6 6 6 64 . В общем виде количество способов для множества из n элементов по m элементов определяется по формуле: nm .
Порядок выполнения работы
1.Создать скрипт для выполнения работы и сохранить его. В первой строке написать комментарий, содержащий название работы:
2.Сгенерировать два целых случайных числа n и m , использовав функцию rand , в пределах согласно своему варианту. При этом должно соблюдаться условие n m .