6
Р(kj /Di ) – вероятность появления признака kj у объектов с состоянием Di. Если среди Ni объектов, имеющих диагноз Di, у Nij проявился признак kj, то
N
P(k j / Di ) Nij . (4)
i
В равенстве (2) P(Di /kj ) вероятность диагноза Di после того, как стало известно наличие у рассматриваемого объекта признака kj после испытания
(апостериорная вероятность диагноза).
Задача 1. Формула Байеса при наличии одного диагностического признака
Кмоменту выработки ресурса шарикоподшипников 90 % из них находятся
висправном состоянии. Диагностический признак k – повышение температуры смазочного масла выше нормальной на 30 °С – встречается у исправных подшипников только в 10 % случаев, а у неисправных – в 80 % случаев.
Требуется определить, насколько изменится вероятность исправного неисправного состояния подшипника, выработавшего свой ресурс, появлении диагностического признака k.
Решение. Так как Р(k) в данном случае определяется по формуле
Р(k) Р( Ди ) Р(k / Ди ) Р( Дни ) Р(k / Дни ) ,
то формула (2) примет вид
Р( Ди / k ) |
Р( Ди ) Р(k / Ди ) |
|
, |
|
|
||
Р( Ди ) Р(k / Ди ) Р( Дни ) |
|
||
|
Р(k / Дни ) |
||
и
при
(5)
(6)
где Ди, Дни – исправное и неисправное состояние подшипника соответственно.
Р(Ди) = 0,9; Р(Дни) = 1– 0,9 = 0,1.
Вероятность Р(k /Ди) = 0,1; Р(k /Дни) = 0,8.
По формуле Байеса (6) находим вероятность диагноза Ди при условии, что проявился признак k:
|
|
|
|
7 |
Р( Ди |
/ k ) |
|
0,9 0,1 |
0,5294 . |
|
|
|||
|
0,1 0,1 0,8 |
|||
|
0,9 |
|
||
Аналогично
Р( Дни / k) |
Р( Дни ) Р(k / Дни ) |
|
|
0,1 0,8 |
0,4706 . |
|
|
|
|
|
|||
Р( Ди ) Р(k |
/ Ди ) Р( Дни ) Р(k / Дни ) |
|
0,1 0,1 0,8 |
|||
|
0,9 |
|
||||
Изменение вероятности исправного состояния составит:
Ри=Р(Ди/k) – Р(Ди) = 0,5294 – 0,9 ≈ -0,3706.
Изменение вероятности неисправного состояния составит:
Рни=Р(Дни/k) – Р(Дни) = 0,4706 – 0,1 = 0,3706.
2 Обобщенная формула Байеса
Эта формула относится к случаю, когда обследование проводится по комплексу признаков K, включающему признаки k1, k2, ..., kv. Каждый из признаков kj имеет mj разрядов (kj1, ki2, ..., kjmj). В результате обследования становится известной реализация признака:
k * j k |
js |
(7) |
|
|
и всего комплекса признаков К*. Индекс * означает конкретное значение (реализацию) признака. Формула Байеса для комплекса признаков имеет вид
P(D / K * ) P(D ) P(K * / D ) / P(K * ) |
(i 1,2 ...n), |
(8) |
||
i |
i |
i |
|
|
где Р(Di /K*) – вероятность диагноза Di после того, как стали известны результаты обследования по комплексу признаков K (апостериорная вероятность);
Р(Di ) – предварительная вероятность диагноза Di (по предшествующей статистике – априорная вероятность).
8
Формула (8) относится к любому из n возможных состояний (диагнозов) системы. Предполагается, что система находится только в одном из указанных состояний и потому
n |
|
P(Ds ) 1. |
(9) |
s1
Впрактических задачах нередко допускается возможность существования нескольких состояний А1, ..., Аr, причем некоторые из них могут встретиться в комбинации друг с другом. Тогда в качестве различных диагнозов Di следует
рассматривать отдельные состояния D1 = A1, ..., Dr = Ar и их комбинации (произведения) Dr 1 A1 A2 , ... и т.п.
Перейдем к определению Р(K*/Di ). Если комплекс признаков состоит из v признаков, то
P(K * / D ) P(k * |
/ D ) P(k |
* / k * |
D ) ... P(k |
* / k |
* |
... |
k |
* |
D ), (10) |
|||
i |
1 |
i |
2 |
1 |
i |
v |
1 |
|
|
v 1 |
i |
|
где kj* = kjs – s-тый разряд j-того признака, выявившийся в результате |
||||||||||||
обследования. Для диагностически независимых признаков |
|
|
|
|
||||||||
P(K * / D ) P(k |
* / D ) P(k * |
/ D ) ... P(k |
* / D ). |
|
|
(11) |
||||||
|
i |
1 |
|
i |
2 |
i |
v |
|
i |
|
|
|
В большинстве практических задач, особенно при большом числе признаков, можно принимать условие независимости признаков даже при наличии существенных корреляционных связей (статистической зависимости) между ними.
Вероятность появления комплекса признаков К*
|
n |
|
|
|
|
P(K * ) P(Ds ) P(K * / Ds ) . |
(12) |
||||
|
s 1 |
|
|
|
|
Обобщенная формула Байеса может быть записана так: |
|
||||
P(D / K * ) |
P(D ) P(K * / D ) |
|
|
||
i |
i |
, |
(13) |
||
n |
|
|
|||
i |
|
|
|
|
|
|
P(Ds ) P(K * / Ds ) |
|
|
||
s 1
9
где Р(K*/Di ) определяется равенством (10) или (11). Из соотношения (13) вытекает
n |
|
P(Di / K * ) 1, |
(14) |
i 1
что, разумеется, и должно быть, так как по предположению один из диагнозов обязательно реализуется, а реализация одновременно двух диагнозов невозможна.
Следует обратить внимание на то, что знаменатель формулы Байеса для всех диагнозов одинаков. Это позволяет сначала определить вероятности совместного появления i-го диагноза и данной реализации комплекса признаков
P(D K * ) P(D ) P(K * / D ) |
(15) |
||
i |
i |
i |
|
и затем апостериорную вероятность диагноза
|
n |
|
|
P(Di / K * ) P(Di |
K * ) / P(Ds |
K * ). |
(16) |
s 1
Если реализация некоторого комплекса признаков К* является детерминирующей для диагноза Dp, то этот комплекс не встречается при других диагнозax:
0 при s p;
P(K * / D )
s 0 при s p.
Тогда, в силу равенства (13)
|
0 |
при s p; |
|
|
|
|
|
P(Ds |
/ K * ) |
при s p. |
(17) |
|
1 |
|
Таким образом, детерминистская логика установления диагноза (с вероятностью 100 %) является частным случаем вероятностной логики. Формула Байеса может использоваться и в том случае, когда часть признаков имеет дискретное распределение, а другая часть – непрерывное. Для непрерывного распределения используются плотности распределения. Однако в отношении расчетов указанное различие признаков несущественно, если
10
задание непрерывной кривой осуществляется с помощью совокупности дискретных значений.
Задача 2. Формула Байеса при наличии двух диагностических признаков
Допустим, что на основании статистических данных известно, что 70 % подшипников в определенных эксплуатационных условиях вырабатывают ресурс в исправном состоянии, то есть Р(Dи ) = 0,7, Р(Dни ) = 1 0,7 = 0,3. Диагностический признак k1 – повышение температуры смазочного масла выше нормальной на 30 °С – встречается у исправных подшипников только в 10 % случаев, а у неисправных – в 90 % случаев. Диагностический признак k2 – повышенная интенсивность шума при работе подшипника – встречается у исправных подшипников только в 5 % случаев, а у неисправных – в 95 % случаев. Предположим, что признаки k1 и k2 статистически независимы. Требуется определить вероятность исправного состояния подшипника при появлении диагностических признаков k1 и k2.
Решение. В данном случае комплекс признаков К* представляет собой произведение событий k1 и k2, поэтому формула (12) принимает вид
P(K * ) Р(k |
k |
) Р( Д |
и |
) Р(k |
k |
2 |
/ Д |
и |
) Р( Д |
ни |
) Р(k |
k |
2 |
/ Д |
ни |
) , |
|
(18) |
|
1 |
2 |
|
|
1 |
|
|
|
1 |
|
|
|
|
|
||||||
а формула (13) искомой вероятности примет вид |
|
|
|
|
|
|
|
|
|||||||||||
Р( Ди / k1 |
k2 ) |
|
|
|
Р( Ди ) Р(k1 k |
2 / Ди ) |
|
|
|
|
|
, |
(19) |
||||||
Р( Ди ) Р(k1 |
k2 / Ди ) Р( Дни ) Р(k1 |
|
k2 / Д |
|
|||||||||||||||
|
|
|
ни ) |
|
|||||||||||||||
где Ди, Дни |
– исправное |
и |
|
неисправное |
состояние подшипника |
||||||||||||||
соответственно. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В соответствии с формулой (11) вероятность
Р(k1∩k2 /Ди) = Р(k1/ Ди) ∙ Р(k2/ Ди) = 0,1∙0,05 = 0,005;
Р(k1∩k2 /(Дни) = Р(k1/ Дни ) ∙ Р(k2/ Дни ) = 0,9∙0,95 = 0,855.
С учетом этого по формуле Байеса (19) находим вероятность диагноза Ди при условии, что проявились оба признака k1 и k2: