Заметим, что во второй игре при 25 бросаниях пары костей две шестерки, т. е. 12 очков, появляются хотя бы один раз с вероятностью 1 – (35/36)25 ≈ 0,505. Поэтому игрок, делающий ставку на успех этого события при 25 бросаниях, выигрывает примерно в 50,5 % игр, а игрок, делающий ставку на успех этого события при 24 бросаниях, выигрывает примерно в 49,1 % игр.
Важным примером применения теоремы умножения вероятностей являются по-
вторные независимые испытания, рассмотренные Якобом Бернулли. Испытания проводятся при одинаковых условиях, причем в серии из n испытаний результаты каждого из них никак не сказываются на последующих результатах. Особенно ин-
тересна при рассмотрении испытаний Бернулли задача о том, с какой вероятностью при n независимых испытаниях успех осуществится ровно k раз. Заметим, что случаи k = 0 или k = n были рассмотрены выше и сейчас мы приступаем к рассмотрению случая при произвольном k, где 0 ≤ k ≤ n.
Утверждение. В эксперименте с n повторными независимыми испытаниями, называемыми испытаниями Бернулли, где каждое из них имеет два исхода (успех с вероятностью p и неудачу с вероятностью q = 1 – p), вероятность получения ровно k успехов при n испытаниях называется формулой Бернулли и равна
Cnk pk qn−k = |
n! |
|
pk qn−k . |
|
k!(n −k)! |
||||
|
|
|||
Доказательство. В заданном эксперименте с повторением n независимых испытаний для нахождения вероятности k успехов предположим сначала, что первыми реализуются k успехов, а вторыми n–k неудач. Так как успех или неудача при каждом испытании представляют собой события, независимые от результатов других испытаний, то согласно теореме умножения вероятностей вероятность осуществления k успехов с последующей реализацией n–k неудач равна pkqn-k. Фактически каждое осуществление k успехов, соответственно n–k неудач, независимо от порядка их наступления будет иметь вероятность pkqn-k. Общее событие, состоящее в k успехах при n испытаниях, есть объединение элементарных событий рассмотренного типа, которые несовместны. Поскольку существует Cnk способов получения k успехов в n испы-
таниях, то по теореме сложения вероятностей, вероятность получить ровно k успехов при n испытаниях равна Cnk pk qn−k , что и требовалось доказать.
Например, пусть все различные наиболее употребительные слова пронумерованы и для каждого слова указана вероятность его появления. Если говорить о каком-то определенном, ограниченном «участке» языка, то более или менее точное количество слов известно. Так, в разных стилях и жанрах наиболее употребительно по данным
«Частотного словаря русского языка» (М., 1977) около 40 тысяч слов. На фоне дан-
ных о лексических богатствах всего русского языка представляет интерес объем «личного словника», или, как говорят лингвисты, объем активного словаря, т. е. количество слов, употребляемых одним человеком, которое у образованных людей оценивается в среднем в 5—10 тысяч слов.
Обозначим общее число различных наиболее употребительных слов через N, номер слова в списке через i, а вероятность появления i-го слова — через pi. При проведении численных расчетов в качестве вероятности можно использовать отно-
162
шение указанной частоты появления слова в выборке к объему выборки, т. е. стати-
стическую вероятность.
Тогда в лингвистической трактовке испытаний Бернулли вероятность ис-
пользования i-го слова k раз в тексте из n слов определяется формулой Бернулли:
Ck pk (1 |
− p |
)n−k |
= |
n! |
|
pk (1 − p |
)n−k . |
||
k! (n − k)! |
|||||||||
n i |
i |
|
|
i |
i |
|
|||
Говорят также, что такой эксперимент с испытаниями Бернулли имеет биномиальное распределение, а вероятности Cnk pk qn−k называются биномиальными вероят-
ностями, поскольку согласно формуле бинома Ньютона (см. раздел 2.2) справедливо равенство
n
∑Cnk pk qn−k = (q + p)n = 1n = 1.
k =0
Последнее равенство означает, что объединение всех событий в испытании Бернулли, т. е. для всех k = 0, 1, …, n, является достоверным событием и согласно колмо-
горовской аксиоматике имеем
Cn0qn + Cn1pqn−1 + Cn2p2qn−2 +…+ Cnn−1pn−1q + Cnnpn = 1.
Каждому одночлену, возникающему при возведении суммы, не только двух слагаемых в степень, можно придать вероятностный смысл. Напомним, что коэффициент при a1n1 a2n2 … arnr в выражении (a1 + a2 + … + ar)n из суммы r слагаемых, где n =
= n1 + n2 + … + nr равен числу анаграмм слова, составленного из n1 |
букв a1 , n2 букв |
|||||||
|
|
|
|
|
|
n! |
|
|
a2, …, nr букв ar, т. е. это число перестановок с повторением Pn ,n ,K,n |
|
= |
||||||
r |
n1! n2!Knr! |
|||||||
1 2 |
|
|
||||||
|
|
|
|
|||||
(см. раздел 2.3). Рассмотрим в заключение этого раздела несколько примеров, использующих схему испытаний Бернулли, а затем решим задачу, обобщающую эту схему с помощью филологического понятия анаграмма.
Пример. Игральная кость бросается не четыре, а шесть раз. Больше или меньше половины вероятность выпадения одного очка ровно один раз?
В этом эксперименте с шестью независимыми испытаниями «успех», т. е. выпадение 1-го очка, имеет вероятность p = 1/6, тогда как «неудача», т. е. выпадение не менее 2 очков, имеет вероятность q = 1–p = 1 – 1/6 = 5/6. Поэтому согласно схеме испытаний Бернулли вероятность одного успеха при шести бросаниях, т. е. для k = 1 и
|
k k |
|
n−k |
|
1 |
|
1 1 |
5 |
5 |
6! |
|
|
1 1 |
|
5 5 |
|
5 5 |
|||||||
n = 6 в |
формуле Бернулли Cn p |
q |
|
равна |
C6 |
|
|
|
|
|
= |
|
|
|
|
|
|
|
|
|
= |
|
|
≈ 0,4. |
|
6 |
6 |
1! 5! |
6 |
6 |
6 |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
Искомая вероятность примерно равна 2/5, т. е. меньше 1/2 — половины.
Пример. Пусть вероятность падения бутерброда маслом вниз равна 3/4. Произошла досадная неприятность: поднос с пятью бутербродами опрокинулся. Что более вероятно: два или три бутерброда упадут маслом вниз?
Надо рассмотреть пять независимых испытаний с падением бутербродов. Поскольку p = 3/4, q = 1/4 и n = 5, то в схеме испытаний Бернулли надо сравнить соот-
163
ветствующие биномиальные вероятности двух экспериментов для k = 2 и k = 3, т. е.
2 |
|
3 |
2 |
|
1 |
3 |
5! |
3 2 |
|
1 |
3 |
|
45 |
|
3 |
|
3 |
3 |
|
1 |
|
2 |
5! |
|
|
3 |
3 |
|
1 |
|
2 |
135 |
|
|||
C5 |
|
|
|
|
|
|
= |
|
|
|
|
|
|
|
= |
|
и |
C5 |
|
|
|
|
|
|
= |
|
|
|
|
|
|
|
|
= |
|
. Таким об- |
4 |
4 |
|
|
4 |
312 |
4 |
4 |
3! 2! |
4 |
4 |
312 |
|||||||||||||||||||||||||
|
|
|
|
|
|
2! 3! |
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
разом, вероятнее, что все же три, а не два бутерброда упадут маслом вниз.
Пример. В корзине лежит много красивых перцев, причем 1/3 часть из них — красные, 1/2 — желтые и 1/6 — зеленые. Какова вероятность того, что продавец, не глядя, выбирает 6 перцев, среди которых 2 красных, 3 желтых и 1 зеленый?
Если продавец, не глядя, выбирает из корзины один перец, то мы полагаем вероятность того, что он окажется красным (к) равной 1/3, желтым (ж) — 1/2, зеленым (з) — 1/6. Посчитаем сначала вероятность появления слова ккжжжз, т. е. события, состоящего в последовательном выборе двух красных, затем трех желтых и, наконец, одного зеленого перцев. Поскольку перцы выбираются независимо от результатов других испытаний, то по теореме умножения вероятностей, соответствующая веро-
|
1 2 |
|
1 3 |
|
1 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
ятность равна |
|
|
|
|
|
|
|
. Так как число анаграмм слова ккжжжз равно числу |
|||||||||||||||||
|
|
|
|||||||||||||||||||||||
|
3 |
|
2 |
|
6 |
6! |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
перестановок с повторениями |
|
(см. раздел 2.3), то по теореме сложения веро- |
|||||||||||||||||||||||
2! 3!1! |
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
6! |
|
|
1 2 |
|
1 3 |
|
1 1 |
5 |
|
|||||
ятностей, искомая вероятность равна |
|
|
|
|
|
|
|
|
|
|
|
= |
|
. |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
2! 3!1! |
|
3 |
|
2 |
|
6 |
36 |
|
||||||
Сосчитать абсолютно все слова «живого» русского языка никто не может, поэтому языковеды и пришли к выводу: язык в количественном отношении неисчислим. Однако любой язык обладает любопытным свойством, которое называется избыточностью языка. Имеется в виду тот факт, что не все элементы, из которых состоит текст или устная речь, являются необходимыми для восприятия этого текста или речи. Как поясняет математик и лингвист Ю. И. Левин в работе «Математика и лингвистика» (М., 1964), избыточность языка вредна в одних отношениях и полезна — даже необходима — в других. С одной стороны, благодаря этому свойству языка нам, например, не слишком мешают опечатки или описки в книгах, а с другой стороны, благодаря этой избыточности приходится передавать, например, по линиям связи много лишнего, что при-
водит к их перегрузке. Количественная оценка избыточности языка оценивается с помощью математического понятия количества информации, приходящейся на букву текста, для определения которого нужны различные вероятностные и комбинаторные характеристики локальных лингвистических событий, рассмотренные в этой главе.
Компьютерная революция и новые информационные технологии необычайно расширили оттенки смысла, передаваемого числами с помощью цифровых устройств. Нельзя не восхищаться красотой, поэтому
эстетическое начало, заложенное в математическое знание, всегда
164
вызывало ответные ассоциации у выдающихся поэтов. У поэтов начала прошлого века Николая Гумилева, Максимилиана Волошина, Велимира Хлебникова и др. есть замечательные стихи о числах и формулах с неожиданными прозрениями для каждого, кому не чужда научная тематика. В этом проявляется естественная потребность каждого образованного человека ощутить себя носителем культуры как общего процесса духовного, интеллектуального и эстетического развития. Вот достойный образец поэтического осмысления Валерием Брюсовым классического дифференциального и интегрального исчисления:
Здесь что? Мысль роль мечты играла, Металл ей дал пустой рельеф; Смысл — там, где змеи интеграла Меж цифр и букв, меж d и f.
Вопросы для самоконтроля
1. Верно ли, что вероятность того, что из рассыпанных кубиков с буквами слова ФИЛОЛОГИЯ, выбранные последовательно наудачу пять
кубиков составят слово ЛИЛИЯ, равна |
A22 A22 A11 |
= |
2 |
|
2 |
|
1 |
|
1 |
|
1 |
= |
1 |
? |
|
A95 |
9 |
8 |
7 |
6 |
5 |
3780 |
|||||||||
|
|
|
|
|
|
|
|
2. Верно ли, что если симметричная монета подбрасывается 10 раз, то вероятность того, что орел выпадет при этом ровно 3 раза равна
3 |
|
1 3 |
|
1 7 |
10 9 8 |
|
1 10 |
15 |
|
|||||
C10 |
|
|
|
= |
1 2 3 |
|
|
|
= |
|
|
? |
||
2 |
128 |
|||||||||||||
|
|
2 |
|
2 |
|
|
|
|
|
|||||
3. Верно ли, что вероятность того, что нужное слово угадано, если два студента одновременно и независимо друг от друга угадывают слова с вероятностью 0,6 и 0,5, равна 0,6 + 0,5 – 0,6 0,5 = 0,8?
* * *
Можно ли считать, что в гуманитарных науках новое знание — область исследовательская, а новые смыслы — область творческая. Замечательный филолог Михаил Гаспаров в одной из своих последних книг «Записи и выписки» (М., 2000), в которой равно сочетается талант учено-
го и талант писателя, спрашивал: «Способна ли филология производить новые смыслы, новое знание или только устанавливать уже сущест-
вующие смыслы текстов?». Вспомним в связи с этим две строки «Сти-
хов, сочиненных ночью во время бессонницы» А. С. Пушкина:
Я понять тебя хочу, Смысла я в тебе ищу…
165
Последняя строка допускает несколько толкований: «Смысла в жиз-
ни я ищу…» и «Смысла в сне твоем ищу…». К этим личностным смыс-
лам нужно добавить вариант Василия Жуковского, который в силу политических соображений заменил пушкинскую строку на «Темный твой язык учу…». Юрий Лотман объяснял возможность такой подмены ори-
гинала следующим образом: «Чтобы понять смысл жизни, нужно вы-
учить ее темный язык…». Готовая истина не способствует развитию творческого мышления.
Вчем заключается ценность математического языка и математической методологии в лингвистике и литературоведении? Ценность их в том, что при помощи математического языка и соответствующих методов, направленных на изучение лингвистических объектов, удается раскрыть механизмы действия определенных структур, наполненных лингвистическим содержанием, задавая определенный уровень строгости и точности исследования. В одном из номеров американского журнала «Scientific American», когда его математический раздел редактировал профессор Даглас Хофштадтер, автор имевшей заслуженный успех кни-
ги «Гёдель, Эшер, Бах: эта бесконечная гирлянда» (Самара, 2001), было опубликовано «честное» предложение, статистически строго и точно говорящее о самом себе.
Вэтой фразе два раза встречается слово «в», два раза встречается слово «этой», два раза встречается слово «фразе», четырнадцать раз встречается слово «встречается», четырнадцать раз встречается слово «слово», шесть раз встречается слово «раз», девять раз встречается слово «раза», семь раз встречается слово «два», три раза встречается слово «четырнадцать», три раза встречается слово «три», два раза встречается слово «девять», два раза встречается слово «семь», два раза встречается слово «шесть».
Хотя читать его нелегко, и оно утверждает «чистую» самодостаточную правду, для научной истины оно бесполезно. Как говорил англий-
ский писатель Олдос Хаксли, «истина — понятие бесконечное: каждая часть ее, однажды открытая, требует открытия других частей». В
классический период развития сравнительного языкознания требования логической строгости не достаточно широко применялись языковедами, что было отчасти обусловлено уровнем исследовательской практики и недостаточностью собранных лингвистических фактов. Поэтому классическое языкознание отставало, например, от классической математики по точности и объективности аргументации. Под влиянием лингвистических идей, отображающих свойства языковой структуры, математиче-
166