Теория

Независимые испытания. Схема Бернулли

Ранее в п. 1.4 введены понятия зависимых и независимых событий. С понятием независимых событий связано и имеет широкое применение понятие независимых опытов или испытаний.

Опыты α1, α2, … , αn называются независимыми, если любая комбинация их исходов является совокупностью независимых событий. Иначе, если в задаче проводится ряд многократно повторяющихся испытаний α1, α2, …, αn при неизменном комплексе условий и в каждом испытании некоторые событие А может наступить с некоторой вероятностью p = p(А) не зависящей от других испытаний, и не наступить с вероятностью p(Ā), то указанные испытания называются независимыми. Данная схема независимых испытаний носит название схемы Бернулли.

Схема названа в честь Якоба Бернулли – родоначальника семьи выдающихся швейцарских учёных. (Якоб Б., Иоганн Б., Николай Б., Даниил Б. и др.). Якоб Бернулли доказал так называемую теорему Бернулли – важный частный случай закона больших чисел (см. п. 3.11). Указанная теорема относится к рассматриваемой здесь последовательности независимых испытаний.

Якоб Бернулли 1654-1705

clip_image002

Примерами независимых испытаний являются: а) многократное (n раз) подбрасывание монеты; б) извлечение (n раз) одинаковых на ощупь шаров из урны с их последующим возвращением; в) любая совокупность независимых испытаний (опытов), в каждом из которых вероятность успешных исходов одинакова, например, серия выстрелов по мишени, выбор n деталей из их совокупности, изучение n анализов горной породы определённого свойства и т.д.

В схеме Бернулли наступление события А с вероятностью p = p(А) условно называется успехом, а его ненаступление (противоположное событие Ā) –неудачей. Вероятность неудачи в каждом опыте такого типа равна q = 1 – p.

На практике обычно возникают задачи со сложными событиями, в которых из n опытов, составляющих схему Бернулли, в m опытах (m < n) событие А наступает (т.е завершается успехом), а в (nm) опытах это событие не наступает (завершается неудачей). Пусть Pn(k) – обозначает вероятность того, что при производстве n опытов успех наступает в k опытах (успех реализуется k раз). Ставится следующая задача: пусть в n испыта-ниях, соответствующих схеме Бернулли, k испытаний завершились успехом. Требуется найти вероятность Pn(k) (читается: «P из n испытаний k успешных»). Данная вероятность рассчитывается по формуле Бернулли, которой соответствует одноименная теорема.

Теорема Бернулли. Если вероятность p наступления события А в каждом из последовательности n испытаний α1, α2, … , αn постоянна, то вероятность того, что событие А наступит k раз и не наступит nk раз, вычисляется по формуле Бернулли:

Pn(k) = Сnk pk qn-k , (2.1)

где q = 1- p.

Доказательство. Действительно, пусть события Aį и Āį – появление и непоявление соответственно события А в į-ом испытании αi (i = 1, 2, … , n). Пусть также Вk обозначает событие, состоящее в том, что в n независимых испытаниях событие А появилось k раз. При n = 3 и k = 2 событие В2 выражается через элементарные события Аį (į = 1, 2, 3) по формуле :

В2 = А1 А2 Ā3 + А1 Ā2 А3 + Ā1 А2 А3.

В общем виде последняя формула будет такой

clip_image004 (2.2)

т.е каждый член суммы (2.2) соответствует появлению события А k раз и (nk) раз непоявлений. Число всех комбинаций (слагаемых) в (2.2) равно числу способов выбора из n испытаний k испытаний, в которых событие А произошло, т.е числу сочетаний Cnk. Вероятность каждой такой комбинации по теореме умножения вероятностей независимых событий равна pk × qnk, так как p(Аį) = p, p(Āį) = q, i = 1,2,…,n. Но комбинации в (2.2) являются несовместными событиями. Поэтому по теореме сложения вероятностей получим

clip_image006.

Таким образом, имеет место формула Бернулли

Pn(k) = Cnk pk qn-k .

Что и требовалось доказать.

Замечание 1. Сформулированная выше теорема относится к случаю, когда в каждом испытании вероятность появления события А постоянна. Тогда для расчета вероятности Pn(k) справедлива формула Бернулли (2.1). Если же вероятности наступления события А в испытаниях α1, α2, … , αn разные, т.е. вероятности составляют значения p1, p2, … , pn, то тогда вместо (2.1) справедлива формула:

clip_image008

где clip_image010 − производящая функция, х – соответствует числу успехов.

Замечание 2. Каждый опыт в схеме Бернулли составляет пространство элементарных событий, содержащее только два элементарных события clip_image012 Замечание 3. Множество элементарных исходов для n опытов {α12,…,αn} состоит из 2n элементов. Например, при n = 2 опыт повторяется два раза и (Ω = {(Ā×Ā), (Ā×A), (A×Ā), (A×A)} (Ω содержит 4 элемента); при n = 3 опыт повторяется три раза и Ω = {(Ā×Ā×Ā), (А×А×Ā), (А×Ā×А), (Ā×А×А), (А×Ā×Ā), (Ā×А×Ā), (Ā×Ā×А), (А×А×А)} (Ω содержит 8 элементов) и т. д. Вероятность каждого элементарного события из Ω определяется однозначно с исполь-зованием теории умножения независимых событий. Например, для элемента (Ā×Ā): p(Ā×Ā) = q2; для элементов (Ā×А) и (Ā×А): p(Ā×А) = p(А×Ā) = рq; для элемента (А×А): p(А×А) = р2 .

Замечание 4. Иногда для вероятностей p(А) и p(Ā) необходимо использовать числовые представления, т.е. p) = 1, p(Ā) = 0. В этом случае (0, 0) означает, что в обоих испытаниях событие не наступило; (0, 1) – собы-тие не наступило в первом опыте, а во втором наступило и т.д.

Замечание 5. Вероятность Pn(1 ≤ k n) того, что в n опытах успех наступит хотя бы один раз, вычисляется по формуле

clip_image014 (2.3)

Замечание 6. Вероятность того, что в n опытах, проводящихся по схеме Бернулли, успех наступит от k1 до k2 раз clip_image016, вычисляется по формуле

clip_image018 (2.4)

clip_image020

Рис.2.1

clip_image022

Рис. 2.2

Можно построить график закона распределения Бернулли (зависимости Pn(k)) для конкретных значений n и p. Так как аргумент k принимает лишь целые значения, график представляется в виде точек на плоскости (k, Pn(k)). Для наглядности точки соединяются ломаной линией, и такой график называется полигоном распределения (рис.2.1). При p = 0,5, n = 6, как показано на рисунке 2.1, полигон симметричен относительно прямой x = np (если p близко к 0,5, то полигон близок к симметричному). При малых p полигон существенно асимметричен, и наивероятнейшими явля-ются частоты, близкие к нулю. На рисунке 2.2 изображен полигон распределения для p = 0,2 при числе испытаний n = 6. При больших p, близких к 1, наиболее вероятны максимальные значения. На рис. 2.3 показан полигон распределения, для p = 0,8 и n = 6.

clip_image024 Рис. 2.3.