Курсовая работа: Теория определения информации и данных

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Величина неопределённости Д оцениваемой величины X зависит от уровня гарантированной вероятности РД. Значения величин Д и РД всегда связаны однозначной зависимостью. Важно сначала понять, с каким уровнем гарантированной вероятности должна решаться задача? Тогда с выбором конкретного интервала неопределённости затруднений не возникает. Вторую группу приближённых данных составляют результаты измерений простейшими измерительными средствами (линейкой, транспортиром и т.п.), не имеющими законов распределения погрешностей, и количественные оценки различных специалистов. В этом случае получаемые результаты характеризуют предельной или предельно допустимой погрешностью. Например, производя измерения линейкой, мы получаем результат с предельной погрешностью в 1мм (± 0,5мм), микрометром - в 0,01мм (± 0,005мм). Диспетчер на основании имеющегося опыта и конкретных условий определяет время окончания какой-то работы в виде интервала. При этом он не анализирует корректную выполнимость вероятностных условий (массовости и статистической однородности) для тех опытных данных, на которые он опирается в своих рассуждениях (он даже может и не знать вероятностных основ). Он пользуется приближёнными данными на простейшем, детерминированном уровне. И так поступают в большинстве случаев на практике высококвалифицированные специалисты (эксперты), досконально знающие свою предметную область (начальники участков, цехов, производств, экономисты, логистики и т.п.). И несмотря на то, что никаких строгих статистических оценок и методик получения подобных данных эти специалисты не используют, такие данные служат основой очень важных расчётов, планов и решений. Очевидно, степень приближения таких данных нужно учитывать и оценивать её влияние на неопределённость конечных результатов.

Если математический аппарат для детерминированных точных и вероятностных представлений хорошо разработан (теория чисел, функциональный анализ, теория вероятностей, математическая статистика и др.) и составляет базовую основу образования высшей школы, то для приближённых интервальных представлений такого аппарата до последнего времени не было. Для преодоления этого принципиального недостатка предлагались (и предлагаются) различные идеи. В частности, для работы с приближёнными интервальными данными разработана специальная интервальная математика, отражающая не только элементарные действия с этими данными и пересчёты интервалов неопределённостей, но и определяющая правила более сложного анализа /137,169,170/. Однако можно уверенно утверждать, что методы интервальной математики не нашли широкого практического применения. Это является следствием важного недостатка интервальной математики, имеющего принципиальное значение: в интервальной математике не учитывается частота появления возможных значений рассматриваемой величины в пределах выделенного интервала неопределённости. К сожалению, эта частота не остаётся неизменной при выполнении действий с интервальными величинами. Это обстоятельство можно проиллюстрировать на следующем простейшем примере.

Допустим, для получения оценки X некоторого показателя приходится складывать значения двух слагаемых X1 и Х2, имеющих одинаковые интервалы неопределенностей, в пределах которых эти слагаемые могут принимать любые целочисленные значения от -5 до +5, частота f1,2 появления которых одинакова и равна 1/11 (рис. 3). В результате сложения могут быть получены значения оцениваемого показателя X в интервале от -10 до +10, почти в два раза превышающем величину исходных интервалов неопределенности. Частота появления отдельных значений в рамках интервала [-10, +10] будет далеко не одинаковой. Так, значение, равное нулю, получится, когда значение второго слагаемого будет равным значению первого, но противоположно ему по знаку. Всего таких комбинаций будет 11. Значение, равное единице, получится в десяти комбинациях и т. д. В итоге частота fx появления значений результирующего показателя X будет иметь вид, представленный на рис. 4, и будет существенно отличаться от частоты появления значений исходных слагаемых. Это отличие становится еще большим в задачах, не сводящихся к простому суммированию показателей Х1 и Х2.

fх1,2 fх

1/11 11/121 Х1 1/121

-5 -4 -3 -2 -1 0 1 2 3 4 5 Х2 -10 -8 -6 -4 -2 0 2 4 6 8 10 Х

Рис. 3. Частота появления

Рис. 4. Частота появления значений Х1 и Х2 значений Х = Х12

Так как характер изменения частоты возможных значений в интервальной математике не отражается, то объективно сравнить уровень неопределённости вычисленных результатов (а следовательно и уровень риска формируемых решений) становится невозможным. Кроме того, интервалы неопределённостей конечных результатов оказываются неоправданно расширенными, что также затрудняет проведение обоснованного выбора. Избежать указанных недостатков можно за счёт объединения достоинств интервального представления с анализом качества получаемых оценок. Именно эта идея положена в основу предложенного интервального гарантированного подхода или интервального гарантированного оценивания.

2. Гарантированное интервальное оценивание

Идея гарантированного подхода в оценивании известна достаточно давно, но корректного и широкого использования для решения важных практических задач до последнего времени так и не получила. В лучшем случае под гарантированными оценками понимаются точечные пессимистические оценки, характерные для наиболее неблагоприятных (наиболее тяжелых или предельных) условий подготовки и проведения операций. Количественный уровень гарантии получения планируемого результата (или уровень риска) при использовании таких оценок не определяется. Интуитивно он представляется как некоторый предельный, абсолютный. Однако вполне очевидно, что свести к нулю степень риска в условиях неопределенности практически невозможно. Уменьшение степени риска всегда связано с необходимостью расходования определенных ресурсов, т.е. с вложением дополнительных затрат. И чем существеннее мы хотим уменьшить риск, тем больше требуется затрат.

Объективные гарантированные оценки с количественным отражением степени неопределённости или риска могут быть получены, если обоснованно определять не только интервал неопределённости, но и частоту появления возможных значений рассматриваемой величины в рамках этого интервала. Именно на этой основе можно объективно установить и величину интервала неопределённости, и соответствующий ему уровень гарантированности. Для вероятностных величин (множество значений которых получено в одинаковых условиях) сложностей с таким представлением нет /171/. В этом случае результирующая оценка рассматриваемого показателя X представлена законом распределения возможных значений (например, плотности распределения W(X)), отражающим уровень и характер (вид, форму) неопределенности получаемых результатов. На основании этого закона определяются гарантированные значения

Х1 : Р (Х1 ? Xтр) ? Ртр ,

если мы стремимся получить значения X, не меньше требуемого Xтр и

Р(Х1 ? Хтр ) ? Ртр , если мы стремимся получить значения Х1 не больше Xтр (рис. 5)

W(X)

Рис. 5. Получение гарантированных оценок

а - X1 не меньше Xтр

б - X1 не больше Xтр

Следует иметь в виду, что распространённые и широко используемые при обосновании важных решений усредненные оценки рассматриваемых показателей, выражаемые, например, в виде среднего числа (математического ожидания) боевых блоков, доставляемых к поражаемым целям, средних значений предполагаемых финансовых затрат и т.п., в общем случае, оказываются практически неприемлемы, так как могут приводить к формированию явно ошибочных решений. Подобная типичная ситуация показана на рис. 6, на котором представлены плотности распределения значений анализируемого показателя X для двух вариантов. Если варианты оценивать по значениям математических ожиданий m 1 и m2, то наиболее предпочтительным оказывается первый вариант, так как m1 > m2 при этом условие пригодности по математическому ожиданию выполняется для каждого варианта: m1 > m2> Xтр. В то же время первый вариант из-за большого разброса возможных значений имеет низкий уровень гарантированных оценок (P1 < 0,7), неприемлемый для характеристики единичных исходов. Второй вариант, хотя и имеет меньшее среднее значение, вполне приемлем по уровню гарантированности (Р2 > 0,95) получаемых оценок и в действительности гораздо предпочтительнее первого.

Рис. 6. Сравнение альтернативных вариантов по средним и гарантированным оценкам

Для статистических данных с известными законами распределения методы гарантированного интервального оценивания хорошо разработаны и широко применяются. Однако применение методов классической теории вероятностей и математической статистики к приближённым единичным количественным данным невозможно из-за несоблюдения принципиальных условий, лежащих в основе этой науки - массовости и статистической однородности. В случае использования результатов единичных измерений объективной основой гарантированного интервального оценивания является величина интервала неопределённости и соответствующий ей уровень гарантированной вероятности. Для обоснования вида распределения частоты возможных значений в рамках интервала неопределённости нужна дополнительная информация. Если такой информации нет, вид распределения можно предположить. Например, исходя из принципа наибольшей неопределённости его можно считать равномерным и использовать в последующих расчётах. Использование этого закона позволит с одной стороны применить хорошо разработанный математический инструмент теории вероятностей, а с другой - получить гарантированную интервальную оценку необходимого результата.

Если же приближённые данные рассматриваются на детерминированном уровне и для них указан только интервал неопределённости, «доопределять» нужно ещё и уровень гарантированности (уверенности) или риска.

Очевидно подобные «доопределения» вида распределения возможных значений и уровня гарантированности могут отражаться на обоснованности конечных результатов и формируемых решений. Чтобы этого избежать нужно дополнительно исследовать влияние «доопределяемых» факторов на величину и неопределённость конечного результата. Если это влияние будет заметным, придётся либо проверять дополнительные гипотезы (условия), либо уточнять исходные данные: от приближённых детерминированных (экспертных) величин переходить к результатам измерений, а на основе результатов измерений, если потребуется, набирать необходимые объёмы статистических данных. Важным при этом является то, что процесс уточнения количественных данных становится обоснованным и целенаправленным.

Корректное применение гарантированного интервального оценивания требует оценки неопределённости (приближённости) не только используемых количественных исходных данных, но и анализа проводимых с ними действий. Чтобы этого не выполнять каждый раз при решении прикладных задач, метрологической аттестации нужно подвергнуть все используемые алгоритмы, программы, модели, методики, методы. Причём делать это нужно на вероятностной (статистической) основе. Если для измерительных средств процедура метрологической аттестации, предусматривающая получение законов распределения погрешностей, стала по существу обязательной и привычной, то точностные свойства разрабатываемых математических моделей, алгоритмов, программ, методик и методов, необходимых для проведения количественных расчетов, исследуются весьма поверхностно или не исследуются вообще. Поэтому, прежде чем что-то рассчитывать, нужно понимать, с какой точностью это нужно делать и знать (или устанавливать) точность применяемого математического инструмента и используемых исходных данных.

Точность используемых методов, методик, моделей и исходных данных должна выбираться такой, которая позволит обеспечить получение результата с требуемым уровнем неопределенности. Недостаточная точность может привести к получению ошибочных результатов и принятию неверных решений. Излишняя точность порождает неоправданную громоздкость и трудоемкость вычислений. В этом случае требуется большая предварительная работа по построению высокоточных моделей, разработке необходимых методов и получению "очень точных" исходных данных. Все это связано с дополнительными экономическими и временными затратами и к тому же трудно реализуемо на практике.

Следует заметить, что в случае имеющихся статистических данных математический аппарат теории вероятностей и математической статистики используется в привычном (классическом) виде. Для единичных результатов измерений и для приближённых оценок использование математического аппарата теории вероятностей носит условный, формальный характер - оно не свидетельствует о вероятностной природе рассматриваемой величины или процесса (для результатов измерений оно отражает только вероятностную природу погрешностей измерений аттестованных измерительных средств).

Важным при этом является то, что вид результирующего закона неопределённости (закона распределения значений определяемой величины в рамках интервала неопределённости) формируется на объективной основе (обосновывается) и обеспечивает получение гарантированных оценок с количественным определением уровня риска.

3. Анализ эффективности в условиях неопределённости

При анализе эффективности дело приходится иметь с различными данными. Например, у покупателя может быть весьма поверхностное (описательное, вербальное) представление о необходимых свойствах интересующей его продукции. Однако уже консультант по продажам, предлагая потенциальному покупателю различные виды продукции, знает её многие свойства на количественном уровне и более объективно может представлять достигнутый уровень качества продукции и её конкурентоспособность. А разработать сложную продукцию без детального количественного представления её свойств просто невозможно - нужна конструкторская документация, все данные в которой представлены в количественном виде.

Несомненно, всем хотелось бы иметь полную количественную определённость: производителю - точную оценку показателей эффективности, и в первую очередь, планируемого дохода, покупателю -«полную» гарантию качества продукции и предлагаемых услуг. Однако при решении сложных задач получить абсолютно точные количественные данные принципиально нельзя, поэтому нужно уметь получать корректные приближённые оценки. При этом необходимо помнить: чем точнее мы хотим что-то измерить или оценить (рассчитать), тем дороже и продолжительнее становится процедура получения исчерпывающих количественных данных. Поэтому точность используемых данных должна быть приемлемой: недостаточная точность может привести к неприемлемым ошибкам, а в конечном счёте к недостижению намеченной цели, а избыточная точность связана с неоправданными затратами /133,171/.