Распределение случайной величины х. Дискретные случайные величины. Правило трех сигм

Как известно, случайной величиной называется переменная величина, которая может принимать те или иные значения в зависимости от случая. Случайные величины обозначают заглавными буквами латинского алфавита (X, Y, Z), а их значения – соответствующими строчными буквами (x, y, z). Случайные величины делятся на прерывные (дискретные) и непрерывные.

Дискретной случайной величиной называется случайная величина, принимающая лишь конечное или бесконечное (счетное) множество значений с определенными ненулевыми вероятностями.

Законом распределения дискретной случайной величины называется функция, связывающая значения случайной величины с соответствующими им вероятностями. Закон распределения может быть задан одним из следующих способов.

1 . Закон распределения может быть задан таблицей:

где λ>0, k = 0, 1, 2, … .

в) с помощью функции распределения F(x) , определяющей для каждого значения x вероятность того, что случайная величина X примет значение, меньшее x, т.е. F(x) = P(X < x).

Свойства функции F(x)

3 . Закон распределения может быть задан графически – многоугольником (полигоном) распределения (смотри задачу 3).

Отметим, что для решения некоторых задач не обязательно знать закон распределения. В некоторых случаях достаточно знать одно или несколько чисел, отражающих наиболее важные особенности закона распределения. Это может быть число, имеющее смысл «среднего значения» случайной величины, или же число, показывающее средний размер отклонения случайной величины от своего среднего значения. Числа такого рода называют числовыми характеристиками случайной величины.

Основные числовые характеристики дискретной случайной величины :

Mатематическое ожидание (среднее значение) дискретной случайной величины M(X)=Σ x i p i .
Для биномиального распределения M(X)=np, для распределения Пуассона M(X)=λ
Дисперсия дискретной случайной величины D(X)= M 2 или D(X) = M(X 2)− 2 . Разность X–M(X) называют отклонением случайной величины от ее математического ожидания.
Для биномиального распределения D(X)=npq, для распределения Пуассона D(X)=λ
Среднее квадратическое отклонение (стандартное отклонение) σ(X)=√D(X) .

Примеры решения задач по теме «Закон распределения дискретной случайной величины»

Задача 1.

Выпущено 1000 лотерейных билетов: на 5 из них выпадает выигрыш в сумме 500 рублей, на 10 – выигрыш в 100 рублей, на 20 – выигрыш в 50 рублей, на 50 – выигрыш в 10 рублей. Определить закон распределения вероятностей случайной величины X – выигрыша на один билет.

Решение. По условию задачи возможны следующие значения случайной величины X: 0, 10, 50, 100 и 500.

Число билетов без выигрыша равно 1000 – (5+10+20+50) = 915, тогда P(X=0) = 915/1000 = 0,915.

Аналогично находим все другие вероятности: P(X=0) = 50/1000=0,05, P(X=50) = 20/1000=0,02, P(X=100) = 10/1000=0,01, P(X=500) = 5/1000=0,005. Полученный закон представим в виде таблицы:

Найдем математическое ожидание величины Х: М(Х) = 1*1/6 + 2*1/6 + 3*1/6 + 4*1/6 + 5*1/6 + 6*1/6 = (1+2+3+4+5+6)/6 = 21/6 = 3,5

Задача 3.

Устройство состоит из трех независимо работающих элементов. Вероятность отказа каждого элемента в одном опыте равна 0,1. Составить закон распределения числа отказавших элементов в одном опыте, построить многоугольник распределения. Найти функцию распределения F(x) и построить ее график. Найти математическое ожидание, дисперсию и среднее квадратическое отклонение дискретной случайной величины.

Решение. 1. Дискретная случайная величина X={число отказавших элементов в одном опыте} имеет следующие возможные значения: х 1 =0 (ни один из элементов устройства не отказал), х 2 =1 (отказал один элемент), х 3 =2 (отказало два элемента) и х 4 =3 (отказали три элемента).

Отказы элементов независимы друг от друга, вероятности отказа каждого элемента равны между собой, поэтому применима формула Бернулли . Учитывая, что, по условию, n=3, р=0,1, q=1-р=0,9, определим вероятности значений:
P 3 (0) = С 3 0 p 0 q 3-0 = q 3 = 0,9 3 = 0,729;
P 3 (1) = С 3 1 p 1 q 3-1 = 3*0,1*0,9 2 = 0,243;
P 3 (2) = С 3 2 p 2 q 3-2 = 3*0,1 2 *0,9 = 0,027;
P 3 (3) = С 3 3 p 3 q 3-3 = р 3 =0,1 3 = 0,001;
Проверка: ∑p i = 0,729+0,243+0,027+0,001=1.

Таким образом, искомый биномиальный закон распределения Х имеет вид:

По оси абсцисс откладываем возможные значения х i , а по оси ординат – соответствующие им вероятности р i . Построим точки М 1 (0; 0,729), М 2 (1; 0,243), М 3 (2; 0,027), М 4 (3; 0,001). Соединив эти точки отрезками прямых, получаем искомый многоугольник распределения.

3. Найдем функцию распределения F(x) = Р(Х

Для x ≤ 0 имеем F(x) = Р(Х<0) = 0;
для 0 < x ≤1 имеем F(x) = Р(Х<1) = Р(Х = 0) = 0,729;
для 1< x ≤ 2 F(x) = Р(Х<2) = Р(Х=0) + Р(Х=1) =0,729+ 0,243 = 0,972;
для 2 < x ≤ 3 F(x) = Р(Х<3) = Р(Х = 0) + Р(Х = 1) + Р(Х = 2) = 0,972+0,027 = 0,999;
для х > 3 будет F(x) = 1, т.к. событие достоверно.

График функции F(x)

4. Для биномиального распределения Х:
- математическое ожидание М(X) = np = 3*0,1 = 0,3;
- дисперсия D(X) = npq = 3*0,1*0,9 = 0,27;
- среднее квадратическое отклонение σ(X) = √D(X) = √0,27 ≈ 0,52.

Нормальный закон распределения вероятностей

Без преувеличения его можно назвать философским законом. Наблюдая за различными объектами и процессами окружающего мира, мы часто сталкиваемся с тем, что чего-то бывает мало, и что бывает норма:

Перед вами принципиальный вид функции плотности нормального распределения вероятностей, и я приветствую вас на этом интереснейшем уроке.

Какие можно привести примеры? Их просто тьма. Это, например, рост, вес людей (и не только), их физическая сила, умственные способности и т.д. Существует «основная масса» (по тому или иному признаку) и существуют отклонения в обе стороны.

Это различные характеристики неодушевленных объектов (те же размеры, вес). Это случайная продолжительность процессов, например, время забега стометровки или превращения смолы в янтарь. Из физики вспомнились молекулы воздуха: среди них есть медленные, есть быстрые, но большинство двигаются со «стандартными» скоростями.

Далее отклоняемся от центра ещё на одно стандартное отклонение и рассчитываем высоту:

Отмечаем точки на чертеже (зелёный цвет) и видим, что этого вполне достаточно.

На завершающем этапе аккуратно чертим график, и особо аккуратно отражаем его выпуклость / вогнутость ! Ну и, наверное, вы давно поняли, что ось абсцисс – это горизонтальная асимптота , и «залезать» за неё категорически нельзя!

При электронном оформлении решения график легко построить в Экселе, и неожиданно для самого себя я даже записал короткий видеоролик на эту тему. Но сначала поговорим о том, как меняется форма нормальной кривой в зависимости от значений и .

При увеличении или уменьшении «а» (при неизменном «сигма») график сохраняет свою форму и перемещается вправо / влево соответственно. Так, например, при функция принимает вид и наш график «переезжает» на 3 единицы влево – ровнехонько в начало координат:

Нормально распределённая величина с нулевым математическим ожиданием получила вполне естественное название – центрированная ; её функция плотности – чётная , и график симметричен относительно оси ординат.

В случае изменения «сигмы» (при постоянном «а») , график «остаётся на месте», но меняет форму. При увеличении он становится более низким и вытянутым, словно осьминог, растягивающий щупальца. И, наоборот, при уменьшении график становится более узким и высоким – получается «удивлённый осьминог». Так, при уменьшении «сигмы» в два раза: предыдущий график сужается и вытягивается вверх в два раза:

Всё в полном соответствии с геометрическими преобразованиями графиков .

Нормальное распределёние с единичным значением «сигма» называется нормированным , а если оно ещё и центрировано (наш случай), то такое распределение называют стандартным . Оно имеет ещё более простую функцию плотности, которая уже встречалась в локальной теореме Лапласа : . Стандартное распределение нашло широкое применение на практике, и очень скоро мы окончательно поймём его предназначение.

Ну а теперь смотрим кино:

Да, совершенно верно – как-то незаслуженно у нас осталась в тени функция распределения вероятностей . Вспоминаем её определение :
– вероятность того, что случайная величина примет значение, МЕНЬШЕЕ, чем переменная , которая «пробегает» все действительные значения до «плюс» бесконечности.

Внутри интеграла обычно используют другую букву, чтобы не возникало «накладок» с обозначениями, ибо здесь каждому значению ставится в соответствие несобственный интеграл , который равен некоторому числу из интервала .

Почти все значения не поддаются точному расчету, но как мы только что видели, с современными вычислительными мощностями с этим нет никаких трудностей. Так, для функции стандартного распределения соответствующая экселевская функция вообще содержит один аргумент:

=НОРМСТРАСП(z)

Раз, два – и готово:

На чертеже хорошо видно выполнение всех свойств функции распределения , и из технических нюансов здесь следует обратить внимание на горизонтальные асимптоты и точку перегиба .

Теперь вспомним одну из ключевых задач темы, а именно выясним, как найти –вероятность того, что нормальная случайная величина примет значение из интервала . Геометрически эта вероятность равна площади между нормальной кривой и осью абсцисс на соответствующем участке:

но каждый раз вымучивать приближенное значение неразумно, и поэтому здесь рациональнее использовать «лёгкую» формулу :
.

! Вспоминает также , что

Тут можно снова задействовать Эксель, но есть пара весомых «но»: во-первых, он не всегда под рукой, а во-вторых, «готовые» значения , скорее всего, вызовут вопросы у преподавателя. Почему?

Об этом я неоднократно рассказывал ранее: в своё время (и ещё не очень давно) роскошью был обычный калькулятор, и в учебной литературе до сих пор сохранился «ручной» способ решения рассматриваемой задачи. Его суть состоит в том, чтобы стандартизировать значения «альфа» и «бета», то есть свести решение к стандартному распределению:

Примечание : функцию легко получить из общего случая с помощью линейной замены . Тогда и:

и из проведённой замены как раз следует формула перехода от значений произвольного распределения – к соответствующим значениям стандартного распределения.

Зачем это нужно? Дело в том, что значения скрупулезно подсчитаны нашими предками и сведены в специальную таблицу, которая есть во многих книгах по терверу. Но ещё чаще встречается таблица значений , с которой мы уже имели дело в интегральной теореме Лапласа :

Если же в нашем распоряжении есть таблица значений функции Лапласа , то решаем через неё:

Дробные значения традиционно округляем до 4 знаков после запятой, как это сделано в типовой таблице. И для контроля есть Пункт 5 макета .

Напоминаю, что , и во избежание путаницы всегда контролируйте , таблица КАКОЙ функции перед вашими глазами.

Ответ требуется дать в процентах, поэтому рассчитанную вероятность нужно умножить на 100 и снабдить результат содержательным комментарием:

– с перелётом от 5 до 70 м упадёт примерно 15,87% снарядов

Тренируемся самостоятельно:

Пример 3

Диаметр подшипников, изготовленных на заводе, представляет собой случайную величину, распределенную нормально с математическим ожиданием 1,5 см и средним квадратическим отклонением 0,04 см. Найти вероятность того, что размер наугад взятого подшипника колеблется от 1,4 до 1,6 см.

В образце решения и далее я буду использовать функцию Лапласа, как самый распространённый вариант. Кстати, обратите внимание, что согласно формулировке, здесь можно включить концы интервала в рассмотрение. Впрочем, это не критично.

И уже в этом примере нам встретился особый случай – когда интервал симметричен относительно математического ожидания. В такой ситуации его можно записать в виде и, пользуясь нечётностью функции Лапласа, упростить рабочую формулу:

Параметр «дельта» называют отклонением от математического ожидания, и двойное неравенство можно «упаковывать» с помощью модуля :

– вероятность того, что значение случайной величины отклонится от математического ожидания менее чем на .

Хорошо то решение, которое умещается в одну строчку:)
– вероятность того, что диаметр наугад взятого подшипника отличается от 1,5 см не более чем на 0,1 см.

Результат этой задачи получился близким к единице, но хотелось бы ещё бОльшей надежности – а именно, узнать границы, в которых находится диаметр почти всех подшипников. Существует ли какой-нибудь критерий на этот счёт? Существует! На поставленный вопрос отвечает так называемое

правило «трех сигм»

Его суть состоит в том, что практически достоверным является тот факт, что нормально распределённая случайная величина примет значение из промежутка .

И в самом деле, вероятность отклонения от матожидания менее чем на составляет:
или 99,73%

В «пересчёте на подшипники» – это 9973 штуки с диаметром от 1,38 до 1,62 см и всего лишь 27 «некондиционных» экземпляров.

В практических исследованиях правило «трёх сигм» обычно применяют в обратном направлении: если статистически установлено, что почти все значения исследуемой случайной величины укладываются в интервал длиной 6 стандартных отклонений, то появляются веские основания полагать, что эта величина распределена по нормальному закону. Проверка осуществляется с помощью теории статистических гипотез .

Продолжаем решать суровые советские задачи:

Пример 4

Случайная величина ошибки взвешивания распределена по нормальному закону с нулевым математическим ожиданием и стандартным отклонением 3 грамма. Найти вероятность того, что очередное взвешивание будет проведено с ошибкой, не превышающей по модулю 5 грамм.

Решение очень простое. По условию, и сразу заметим, что при очередном взвешивании (чего-то или кого-то) мы почти 100% получим результат с точностью до 9 грамм. Но в задаче фигурирует более узкое отклонение и по формуле :

– вероятность того, что очередное взвешивание будет проведено с ошибкой, не превышающей 5 грамм.

Ответ :

Прорешанная задача принципиально отличается от вроде бы похожего Примера 3 урока о равномерном распределении . Там была погрешность округления результатов измерений, здесь же речь идёт о случайной погрешности самих измерений. Такие погрешности возникают в связи с техническими характеристиками самого прибора (диапазон допустимых ошибок, как правило, указывают в его паспорте) , а также по вине экспериментатора – когда мы, например, «на глазок» снимаем показания со стрелки тех же весов.

Помимо прочих, существуют ещё так называемые систематические ошибки измерения. Это уже неслучайные ошибки, которые возникают по причине некорректной настройки или эксплуатации прибора. Так, например, неотрегулированные напольные весы могут стабильно «прибавлять» килограмм, а продавец систематически обвешивать покупателей. Или не систематически ведь можно обсчитать. Однако, в любом случае, случайной такая ошибка не будет, и её матожидание отлично от нуля.

…срочно разрабатываю курс по подготовке продавцов =)

Самостоятельно решаем обратную задачу:

Пример 5

Диаметр валика – случайная нормально распределенная случайная величина, среднее квадратическое отклонение ее равно мм. Найти длину интервала, симметричного относительно математического ожидания, в который с вероятностью попадет длина диаметра валика.

Пункт 5* расчётного макета в помощь. Обратите внимание, что здесь не известно математическое ожидание, но это нисколько не мешает решить поставленную задачу.

И экзаменационное задание, которое я настоятельно рекомендую для закрепления материала:

Пример 6

Нормально распределенная случайная величина задана своими параметрами (математическое ожидание) и (среднее квадратическое отклонение). Требуется:

а) записать плотность вероятности и схематически изобразить ее график;
б) найти вероятность того, что примет значение из интервала ;
в) найти вероятность того, что отклонится по модулю от не более чем на ;
г) применяя правило «трех сигм», найти значения случайной величины .

Такие задачи предлагаются повсеместно, и за годы практики мне их довелось решить сотни и сотни штук. Обязательно попрактикуйтесь в ручном построении чертежа и использовании бумажных таблиц;)

Ну а я разберу пример повышенной сложности:

Пример 7

Плотность распределения вероятностей случайной величины имеет вид . Найти , математическое ожидание , дисперсию , функцию распределения , построить графики плотности и функции распределения, найти .

Решение : прежде всего, обратим внимание, что в условии ничего не сказано о характере случайной величины. Само по себе присутствие экспоненты ещё ничего не значит: это может оказаться, например, показательное или вообще произвольное непрерывное распределение . И поэтому «нормальность» распределения ещё нужно обосновать:

Так как функция определена при любом действительном значении , и её можно привести к виду , то случайная величина распределена по нормальному закону.

Приводим. Для этого выделяем полный квадрат и организуем трёхэтажную дробь :

Обязательно выполняем проверку, возвращая показатель в исходный вид:

, что мы и хотели увидеть.

Таким образом:
– по правилу действий со степенями «отщипываем» . И здесь можно сразу записать очевидные числовые характеристики:

Теперь найдём значение параметра . Поскольку множитель нормального распределения имеет вид и , то:
, откуда выражаем и подставляем в нашу функцию:
, после чего ещё раз пробежимся по записи глазами и убедимся, что полученная функция имеет вид .

Построим график плотности:

и график функции распределения :

Если под рукой нет Экселя и даже обычного калькулятора, то последний график легко строится вручную! В точке функция распределения принимает значение и здесь находится

Можно выделить наиболее часто встречающиеся законы распределения дискретных случайных величин:

Биномиальный закон распределения
Пуассоновский закон распределения
Геометрический закон распределения
Гипергеометрический закон распределения

Для данных распределений дискретных случайных величин расчет вероятностей их значений, а также числовых характеристик (математическое ожидание, дисперсия, и т.д.) производится по определенных «формулам». Поэтому очень важно знать данные типы распределений и их основные свойства.

1. Биномиальный закон распределения.

Дискретная случайная величина $X$ подчинена биномиальному закону распределения вероятностей, если она принимает значения $0,\ 1,\ 2,\ \dots ,\ n$ с вероятностями $P\left(X=k\right)=C^k_n\cdot p^k\cdot {\left(1-p\right)}^{n-k}$. Фактически, случайная величина $X$ - это число появлений события $A$ в $n$ независимых испытаний . Закон распределения вероятностей случайной величины $X$:

$\begin{array}{|c|c|}
\hline
X_i & 0 & 1 & \dots & n \\
\hline
p_i & P_n\left(0\right) & P_n\left(1\right) & \dots & P_n\left(n\right) \\
\hline
\end{array}$

Для такой случайной величины математическое ожидание $M\left(X\right)=np$, дисперсия $D\left(X\right)=np\left(1-p\right)$.

Пример . В семье двое детей. Считая вероятности рождения мальчика и девочки равными $0,5$, найти закон распределения случайной величины $\xi $ - числа мальчиков в семье.

Пусть случайная величина $\xi $ - число мальчиков в семье. Значения, которые может принимать $\xi:\ 0,\ 1,\ 2$. Вероятности этих значений можно найти по формуле $P\left(\xi =k\right)=C^k_n\cdot p^k\cdot {\left(1-p\right)}^{n-k}$, где $n=2$ - число независимых испытаний, $p=0,5$ - вероятность появления события в серии из $n$ испытаний. Получаем:

$P\left(\xi =0\right)=C^0_2\cdot {0,5}^0\cdot {\left(1-0,5\right)}^{2-0}={0,5}^2=0,25;$

$P\left(\xi =1\right)=C^1_2\cdot 0,5\cdot {\left(1-0,5\right)}^{2-1}=2\cdot 0,5\cdot 0,5=0,5;$

$P\left(\xi =2\right)=C^2_2\cdot {0,5}^2\cdot {\left(1-0,5\right)}^{2-2}={0,5}^2=0,25.$

Тогда закон распределения случайной величины $\xi $ есть соответствие между значениями $0,\ 1,\ 2$ и их вероятностями, то есть:

$\begin{array}{|c|c|}
\hline
\xi & 0 & 1 & 2 \\
\hline
P(\xi) & 0,25 & 0,5 & 0,25 \\
\hline
\end{array}$

Сумма вероятностей в законе распределения должна быть равна $1$, то есть $\sum _{i=1}^{n}P(\xi _{{\rm i}})=0,25+0,5+0,25=1 $.

Математическое ожидание $M\left(\xi \right)=np=2\cdot 0,5=1$, дисперсия $D\left(\xi \right)=np\left(1-p\right)=2\cdot 0,5\cdot 0,5=0,5$, среднее квадратическое отклонение $\sigma \left(\xi \right)=\sqrt{D\left(\xi \right)}=\sqrt{0,5}\approx 0,707$.

2. Закон распределения Пуассона.

Если дискретная случайная величина $X$ может принимать только целые неотрицательные значения $0,\ 1,\ 2,\ \dots ,\ n$ с вероятностями $P\left(X=k\right)={{{\lambda }^k}\over {k!}}\cdot e^{-\lambda }$, то говорят, что она подчинена закону распределения Пуассона с параметром $\lambda $. Для такой случайной величины математическое ожидание и дисперсия равны между собой и равны параметру $\lambda $, то есть $M\left(X\right)=D\left(X\right)=\lambda $.

Замечание . Особенность этого распределения заключается в том, что мы на основании опытных данных находим оценки $M\left(X\right),\ D\left(X\right)$, если полученные оценки близки между собой, то у нас есть основание утверждать, что случайная величина подчинена закону распределения Пуассона.

Пример . Примерами случайных величин, подчиненных закону распределения Пуассона, могут быть: число автомашин, которые будут обслужены завтра автозаправочной станцией; число бракованных изделий в произведенной продукции.

Пример . Завод отправил на базу $500$ изделий. Вероятность повреждения изделия в пути равна $0,002$. Найти закон распределения случайной величины $X$, равной числу поврежденных изделий; чему равно $M\left(X\right),\ D\left(X\right)$.

Пусть дискретная случайная величина $X$ - число поврежденных изделий. Такая случайная величина подчинена закону распределения Пуассона с параметром $\lambda =np=500\cdot 0,002=1$. Вероятности значений равны $P\left(X=k\right)={{{\lambda }^k}\over {k!}}\cdot e^{-\lambda }$. Очевидно, что все вероятности всех значений $X=0,\ 1,\ \dots ,\ 500$ перечислить невозможно, поэтому мы ограничимся лишь первыми несколькими значениями.

$P\left(X=0\right)={{1^0}\over {0!}}\cdot e^{-1}=0,368;$

$P\left(X=1\right)={{1^1}\over {1!}}\cdot e^{-1}=0,368;$

$P\left(X=2\right)={{1^2}\over {2!}}\cdot e^{-1}=0,184;$

$P\left(X=3\right)={{1^3}\over {3!}}\cdot e^{-1}=0,061;$

$P\left(X=4\right)={{1^4}\over {4!}}\cdot e^{-1}=0,015;$

$P\left(X=5\right)={{1^5}\over {5!}}\cdot e^{-1}=0,003;$

$P\left(X=6\right)={{1^6}\over {6!}}\cdot e^{-1}=0,001;$

$P\left(X=k\right)={{{\lambda }^k}\over {k!}}\cdot e^{-\lambda }$

Закон распределения случайной величины $X$:

$\begin{array}{|c|c|}
\hline
X_i & 0 & 1 & 2 & 3 & 4 & 5 & 6 & ... & k \\
\hline
P_i & 0,368; & 0,368 & 0,184 & 0,061 & 0,015 & 0,003 & 0,001 & ... & {{{\lambda }^k}\over {k!}}\cdot e^{-\lambda } \\
\hline
\end{array}$

Для такой случайной величины математическое ожидание и дисперсия равным между собой и равны параметру $\lambda $, то есть $M\left(X\right)=D\left(X\right)=\lambda =1$.

3. Геометрический закон распределения.

Если дискретная случайная величина $X$ может принимать только натуральные значения $1,\ 2,\ \dots ,\ n$ с вероятностями $P\left(X=k\right)=p{\left(1-p\right)}^{k-1},\ k=1,\ 2,\ 3,\ \dots $, то говорят, что такая случайная величина $X$ подчинена геометрическому закону распределения вероятностей. Фактически, геометрическое распределения представляется собой испытания Бернулли до первого успеха.

Пример . Примерами случайных величин, имеющих геометрическое распределение, могут быть: число выстрелов до первого попадания в цель; число испытаний прибора до первого отказа; число бросаний монеты до первого выпадения орла и т.д.

Математическое ожидание и дисперсия случайной величины, подчиненной геометрическому распределению, соответственно равны $M\left(X\right)=1/p$, $D\left(X\right)=\left(1-p\right)/p^2$.

Пример . На пути движения рыбы к месту нереста находится $4$ шлюза. Вероятность прохода рыбы через каждый шлюз $p=3/5$. Построить ряд распределения случайной величины $X$ - число шлюзов, пройденных рыбой до первого задержания у шлюза. Найти $M\left(X\right),\ D\left(X\right),\ \sigma \left(X\right)$.

Пусть случайная величина $X$ - число шлюзов, пройденных рыбой до первого задержания у шлюза. Такая случайная величина подчинена геометрическому закону распределения вероятностей. Значения, которые может принимать случайная величина $X:$ 1, 2, 3, 4. Вероятности этих значений вычисляются по формуле: $P\left(X=k\right)=pq^{k-1}$, где: $p=2/5$ - вероятность задержания рыбы через шлюз, $q=1-p=3/5$ - вероятность прохода рыбы через шлюз, $k=1,\ 2,\ 3,\ 4$.

$P\left(X=1\right)={{2}\over {5}}\cdot {\left({{3}\over {5}}\right)}^0={{2}\over {5}}=0,4;$

$P\left(X=2\right)={{2}\over {5}}\cdot {{3}\over {5}}={{6}\over {25}}=0,24;$

$P\left(X=3\right)={{2}\over {5}}\cdot {\left({{3}\over {5}}\right)}^2={{2}\over {5}}\cdot {{9}\over {25}}={{18}\over {125}}=0,144;$

$P\left(X=4\right)={{2}\over {5}}\cdot {\left({{3}\over {5}}\right)}^3+{\left({{3}\over {5}}\right)}^4={{27}\over {125}}=0,216.$

$\begin{array}{|c|c|}
\hline
X_i & 1 & 2 & 3 & 4 \\
\hline
P\left(X_i\right) & 0,4 & 0,24 & 0,144 & 0,216 \\
\hline
\end{array}$

Математическое ожидание:

$M\left(X\right)=\sum^n_{i=1}{x_ip_i}=1\cdot 0,4+2\cdot 0,24+3\cdot 0,144+4\cdot 0,216=2,176.$

Дисперсия:

$D\left(X\right)=\sum^n_{i=1}{p_i{\left(x_i-M\left(X\right)\right)}^2=}0,4\cdot {\left(1-2,176\right)}^2+0,24\cdot {\left(2-2,176\right)}^2+0,144\cdot {\left(3-2,176\right)}^2+$

$+\ 0,216\cdot {\left(4-2,176\right)}^2\approx 1,377.$

Среднее квадратическое отклонение:

$\sigma \left(X\right)=\sqrt{D\left(X\right)}=\sqrt{1,377}\approx 1,173.$

4. Гипергеометрический закон распределения.

Если $N$ объектов, среди которых $m$ объектов обладают заданным свойством. Случайных образом без возвращения извлекают $n$ объектов, среди которых оказалось $k$ объектов, обладающих заданным свойством. Гипергеометрическое распределение дает возможность оценить вероятность того, что ровно $k$ объектов в выборке обладают заданным свойством. Пусть случайная величина $X$ - число объектов в выборке, обладающих заданным свойством. Тогда вероятности значений случайной величины $X$:

$P\left(X=k\right)={{C^k_mC^{n-k}_{N-m}}\over {C^n_N}}$

Замечание . Статистическая функция ГИПЕРГЕОМЕТ мастера функций $f_x$ пакета Excel дает возможность определить вероятность того, что определенное количество испытаний будет успешным.

$f_x\to $ статистические $\to $ ГИПЕРГЕОМЕТ $\to $ ОК . Появится диалоговое окно, которое нужно заполнить. В графе Число_успехов_в_выборке указываем значение $k$. Размер_выборки равен $n$. В графе Число_успехов_в_совокупности указываем значение $m$. Размер_совокупности равен $N$.

Математическое ожидание и дисперсия дискретной случайной величины $X$, подчиненной геометрическому закону распределения, соответственно равны $M\left(X\right)=nm/N$, $D\left(X\right)={{nm\left(1-{{m}\over {N}}\right)\left(1-{{n}\over {N}}\right)}\over {N-1}}$.

Пример . В кредитном отделе банка работают 5 специалистов с высшим финансовым образованием и 3 специалиста с высшим юридическим образованием. Руководство банка решило направить 3 специалистов Для повышения квалификации, отбирая их в случайном порядке.

а) Составьте ряд распределения числа специалистов с высшим финансовым образованием, которые могут быть направлены на повышение квалификации;

б) Найдите числовые характеристики этого распределения.

Пусть случайная величина $X$ - число специалистов с высшим финансовым образованием среди трех отобранных. Значения, которые может принимать $X:0,\ 1,\ 2,\ 3$. Данная случайная величина $X$ распределена по гипергеометрическому распределению с параметрами: $N=8$ - размер совокупности, $m=5$ - число успехов в совокупности, $n=3$ - размер выборки, $k=0,\ 1,\ 2,\ 3$ - число успехов в выборке. Тогда вероятности $P\left(X=k\right)$ можно рассчитать по формуле: $P(X=k)={C_{m}^{k} \cdot C_{N-m}^{n-k} \over C_{N}^{n} } $. Имеем:

$P\left(X=0\right)={{C^0_5\cdot C^3_3}\over {C^3_8}}={{1}\over {56}}\approx 0,018;$

$P\left(X=1\right)={{C^1_5\cdot C^2_3}\over {C^3_8}}={{15}\over {56}}\approx 0,268;$

$P\left(X=2\right)={{C^2_5\cdot C^1_3}\over {C^3_8}}={{15}\over {28}}\approx 0,536;$

$P\left(X=3\right)={{C^3_5\cdot C^0_3}\over {C^3_8}}={{5}\over {28}}\approx 0,179.$

Тогда ряд распределения случайной величины $X$:

$\begin{array}{|c|c|}
\hline
X_i & 0 & 1 & 2 & 3 \\
\hline
p_i & 0,018 & 0,268 & 0,536 & 0,179 \\
\hline
\end{array}$

Рассчитаем числовые характеристики случайной величины $X$ по общим формулам гипергеометрического распределения.

$M\left(X\right)={{nm}\over {N}}={{3\cdot 5}\over {8}}={{15}\over {8}}=1,875.$

$D\left(X\right)={{nm\left(1-{{m}\over {N}}\right)\left(1-{{n}\over {N}}\right)}\over {N-1}}={{3\cdot 5\cdot \left(1-{{5}\over {8}}\right)\cdot \left(1-{{3}\over {8}}\right)}\over {8-1}}={{225}\over {448}}\approx 0,502.$

$\sigma \left(X\right)=\sqrt{D\left(X\right)}=\sqrt{0,502}\approx 0,7085.$

Функцией распределения случайной величины X называется функция F(x), выражающая для каждого х вероятность того, что случайная величина X примет значение , меньшее х

Пример 2.5. Дан ряд распределения случайной величины

Найти и изобразить графически ее функцию распределения. Решение. В соответствии с определением

F(jc) = 0 при х х

F(x) = 0,4 + 0,1 = 0,5 при 4 F{x) = 0,5 + 0,5 = 1 при х > 5.

Итак (см. рис. 2.1):

Свойства функции распределения:

1. Функция распределения случайной величины есть неотрицательная функция, заключенная между нулем и единицей:

2. Функция распределения случайной величины есть неубывающая функция на всей числовой оси, т.е. при х 2 >х

3. На минус бесконечности функция распределения равна нулю, на плюс бесконечности - равна единице, т.е.

4. Вероятность попадания случайной величины X в интервал равна определенному интегралу от ее плотности вероятности в пределах от а до b (см. рис. 2.2), т.е.

Рис. 2.2

3. Функция распределения непрерывной случайной величины (см. рис. 2.3) может быть выражена через плотность вероятности по формуле:

F(x)= Jp (*)*. (2.10)

4. Несобственный интеграл в бесконечных пределах от плотности вероятности непрерывной случайной величины равен единице:

Геометрически свойства / и 4 плотности вероятности означают, что ее график - кривая распределения - лежит не ниже оси абсцисс , и полная площадь фигуры , ограниченной кривой распределения и осью абсцисс , равна единице.

Для непрерывной случайной величины X математическое ожидание М(Х) и дисперсия D(X) определяются по формулам:

(если интеграл абсолютно сходится); или

(если приведенные интегралы сходятся).

Наряду с отмеченными выше числовыми характеристиками для описания случайной величины используется понятие квантилей и процентных точек.

Квантилем уровня q (или q-квантилем) называется такое значение x q случайной величины , при котором функция ее распределения принимает значение , равное q, т. е.

100q%-ou точкой называется квантиль X~ q .
? Пример 2.8.

По данным примера 2.6 найти квантиль xqj и 30%-ную точку случайной величины X.

Решение. По определению (2.16) F(xo t3)= 0,3, т. е.

~Y~ = 0,3, откуда квантиль х 0 3 = 0,6. 30%-ная точка случайной величины X , или квантиль Х)_о,з = xoj » находится аналогично из уравнения ^ = 0,7 . откуда *,= 1,4. ?

Среди числовых характеристик случайной величины выделяют начальные v* и центральные р* моменты к-го порядка , определяемые для дискретных и непрерывных случайных величин по формулам:

Рассмотрим дискретные распределения, которые часто используются при моделировании систем сервиса.

Распределение Бернулли. Схемой Бернулли называется последовательность независимых испытаний, в каждом из которых возможны лишь два исхода - «успех» и «неудача» с вероятностями р и q = 1 - р. Пусть случайная переменная X может принимать два значения с соответствующими вероятностями:

Функция распределения Бернулли имеет вид

Ее график показан на рис. 11.1.

Случайная величина с таким распределением равна числу успехов в одном испытании схемы Бернулли.

Производящая функция, согласно (11.1) и (11.15), вычисляется как

Рис. 11.1.

По формуле (11.6) найдем математическое ожидание распределения:

Вычислим вторую производную производящей функции по (11.17)

По (11.7) получим дисперсию распределения

Распределение Бернулли играет большую роль в теории массового сервиса, являясь моделью любого случайного эксперимента, исходы которого принадлежат двум взаимно исключающим классам.

Геометрическое распределение. Предположим, что события происходят в дискретные моменты времени независимо друг от друга. Вероятность того, что событие произойдет, равна р, а вероятность того, что оно не произойдет, q = 1-р, например пришедший клиент делает заказ.

Обозначим через р к вероятность того, что событие произойдет 1-й раз в момент к, т.е. к -й клиент сделал заказ, а предыдущие к- 1 клиентов нет. Тогда вероятность этого сложного события можно определить по теореме умножения вероятностей независимых событий

Вероятности событий при геометрическом распределении показаны на рис. 11.2.

Сумма вероятностей всех возможных событий

представляет собой геометрическую прогрессию, поэтому распределение и называется геометрическим. Так как (1 - р)

Случайная величина Хс геометрическим распределением имеет смысл номера первого успешного испытания в схеме Бернулли.

Рис. 11.2.

Определим вероятность того, что событие произойдет для Х>к

и функцию геометрического распределения

Вычислим производящую функцию геометрического распределения по (11.1) и (11.20)

математическое ожидание геометрического распределения по (11.6)

а дисперсию по (11.7)

Геометрическое распределение считается дискретной версией непрерывного экспоненциального распределения и также обладает рядом свойств, полезных для моделирования систем сервиса. В частности, как экспоненциальное распределение, геометрическое не имеет памяти:

т.е. если проведено / неуспешных опытов, тогда вероятность того, что для первого успеха необходимо провести еще j новых опытов, такая же, как вероятность того, что при новой серии испытаний для первого успеха необходимо провести./"опытов. Другими словами, предыдущие опыты не оказывают эффекта на будущие опыты и опыты являются независимыми. Часто это соответствует действительности. Например, клиенты независимы и заказы делают случайным образом.

Рассмотрим пример системы, параметры функционирования которой подчиняются геометрическому распределению.

В распоряжении мастера имеется п однотипных запасных деталей. Каждая деталь с вероятностью q имеет дефект. При ремонте деталь устанавливается в устройство, которое проверяется на работоспособность. Если устройство не работает, то деталь заменяется на другую. Рассматривается случайная величина X - число деталей, которые будут проверены.

Вероятности числа проверенных деталей будут иметь значения, показанные в таблице:


					ря"~ х

Здесь q = 1 - р.

Математическое ожидание числа проверенных деталей определяется как

Биномиальное распределение. Рассмотрим случайную величину

где Xj подчиняется распределению Бернулли с параметром р и случайные величины Xj независимы.

Значение случайной величины X будет равно числу появления единиц при п испытаниях, т.е. случайная величина с биномиальным распределением имеет смысл числа успехов в п независимых испытаниях.

Согласно (11.9), производящая функция суммы взаимно независимых случайных величин, каждая из которых имеет распределение Бернулли, равна произведению их производящих функций (11.17):

Раскладывая производящую функцию (11.26) в ряд, получим

В соответствии с определением производящей функции (11.1) вероятность того, что случайная величина X примет значение к:

где - биномиальные коэффициенты.

11оскольку & единиц на п местах можно расположить С* способами, то число выборок, содержащих к единиц, будет, очевидно, таким же.

Функция распределения для биномиального закона вычисляется по формуле

Распределение называется биномиальным в связи с тем, что вероятности по форме представляют собой члены разложения бинома:

Ясно, что суммарная вероятность всех возможных исходов равна 1:

Из (11.29) можно получить ряд полезных свойств биномиальных коэффициентов. Например, при р =1, q =1 получим

Если положить р =1, q = - 1 , то

При любом 1к справедливы следующие соотношения:

Вероятности того, что в п испытаниях событие наступит: 1) менее &раз; 2) более к раз; 3) не менее &раз; 4) не более &раз, находят соответственно по формулам:

Используя (11.6), определим математическое ожидание биномиального распределения

а по (11.7) - дисперсию:

Рассмотрим несколько примеров систем, параметры функционирования которых описываются биномиальным распределением.

1. Партия из 10 продуктов содержит один нестандартный. Найдем вероятность того, что при случайной выборке 5 продуктов все они будут стандартными (событие А).

Число всех случайных выборок п - С , э 0 , а число выборок, благоприятствующих событию, есть п = С 9 5 . Таким образом, искомая вероятность равна

2. При въезде в новую квартиру в осветительную сеть было включено 2к новых электрических ламп. Каждая электрическая лампа в течение года перегорает с вероятностью р. Найдем вероятность того, что в течение года не менее половины первоначально включенных ламп придется заменить новыми (событие А):

3. Человек, принадлежащий к определенной группе потребителей, с вероятностью 0,2 предпочитает продукт 1, с вероятностью 0,3 - продукт 2, с вероятностью 0,4 - продукт 3, с вероятностью 0,1 - продукт 4. Выбрана наугад группа из 6 потребителей. Найдем вероятности следующих событий: А - в составе группы находятся не менее 4 потребителей, предпочитающих продукт 3; В- в составе группы находится хотя бы один потребитель, предпочитающий продукт 4.

Эти вероятности равны:

При больших/? вычисления вероятностей становятся громоздкими, поэтому используют предельные теоремы.

Локальная теорема Лапласа , согласно которой вероятность Р п (к) определяется формулой

где - функция Гаусса;

Интегральная теорема Лапласа используется для вычисления вероятности того, что в п независимых испытаниях событие наступит не менее к { раз и не более к 2 раз:

Рассмотрим примеры использования данных теорем.

1. Швейная мастерская производит пошив одежды по индивидуальному заказу, среди которой 90 % высшего качества. Найдем вероятность того, что среди 200 изделий будет высшего качества не меньше 160 и не больше 170.

Решение:

2. У страховой компании имеется 12 тыс. клиентов. Каждый из них, страхуясь от несчастного случая, вносит 10 тыс. руб. Вероятность несчастного случая р - 0,006, а выплата пострадавшему 1 млн руб. Найдем прибыль страховой компании, обеспечиваемую с вероятностью 0,995; иными словами, на какую прибыль может рассчитывать страховая компания при уровне риска 0,005.

Решение: Суммарный взнос всех клиентов 12 000-10 000 = 120 млн руб. Прибыль Якомпании зависит от числа к несчастных случаев и определяется равенством Я = 120 000-1000/: тыс. руб.

Следовательно, надо найти такое число Л/, чтобы вероятность события Р(к > М) не превосходила 0,005. Тогда с вероятностью 0,995 будет обеспечена прибыль Я =120000-10004/ тыс. руб.

Неравенство Р(к > М) Р(к0,995. Так как к > 0, то Р( 0 0,995. Для оценки этой вероятности воспользуемся интегральной теоремой Лапласа при п- 12 000 и/?=0,006, #=0,994:

Так как*! F(x ]) = -0,5.

Таким образом, необходимо найти Л/, при котором

Находим (М - 72)/8,5 > 2,58. Следовательно, М>12 + 22 = 94.

Итак, с вероятностью 0,995 компания гарантирует прибыль

Часто требуется определить наивероятнейшее число к 0 . Вероятность наступления события с числом успехов к 0 превышает или по крайней мере не меньше вероятности остальных возможных исходов испытаний. Наивероятнейшее число к 0 определяют из двойного неравенства

3. Пусть имеется 25 образцов средств потребления. Вероятность того, что каждый из образцов будет приемлем для клиента, равна 0,7. Необходимо определить наиболее вероятное число образцов, которые окажутся приемлемыми для клиентов. По (11.39)

Отсюда к 0 - 18.

Распределение Пуассона. Распределение Пуассона определяет вероятность того, что при очень большом числе испытаний п, в каждом из которых вероятность события р очень мала, событие наступит ровно к щз.

Пусть произведение пр = к; это означает, что среднее число появления события в различных сериях испытаний, т.е. при различных п, остается неизменным. В этом случае распределение Пуассона может использоваться для аппроксимации биномиального распределения:

Так как для больших п

Производящая функция распределения Пуассона вычисляется по (11.1) как

где по формуле Маклорена

В соответствии со свойством коэффициентов производящей функции вероятность появления к успехов при среднем числе успехов X вычисляется как (11.40).

На рис. 11.3 показана плотность вероятности распределения Пуассона.

Производящую функцию распределения Пуассона можно также получить, воспользовавшись разложением в ряд производящей функции биномиального распределения для пр = Х при п -» оо и формулой Маклорена (11.42):

Рис. 11.3.

Определим математическое ожидание по (11.6)

а дисперсию по (11.7)

Рассмотрим пример системы с пуассоновским распределением параметров.

Предприятие отправило в магазин 500 изделий. Вероятность повреждения изделия в пути равна 0,002. Найти вероятности того, что в пути будет повреждено изделий: ровно 3 (событие Я); менее 3 (событие В) более 3 (событие Q; хотя бы одно (событие D).

Число п = 500 велико, вероятность р = 0,002 мала, рассматриваемые события (повреждение изделий) независимы, поэтому можно использовать формулу Пуассона (11.40).

При X = пр = 500 0,002=1 получим:

Распределение Пуассона обладает рядом полезных для моделирования систем сервиса свойств.

1. Сумма случайных переменных Х= Х { + Х 2 с пуассоновским распределением также распределена по закону Пуассона.

Если случайные переменные имеют производящие функции:

то, согласно (11.9), производящая функция суммы независимых случайных переменных с пуассоновским распределением будет иметь вид:

Параметр результирующего распределения равен Х х + Х 2 .

2. Если число элементов./V множества подчиняется пуассоновскому распределению с параметром X и каждый элемент выбирается независимо с вероятностью р, тогда элементы выборки размером Y распределены по закону Пуассона с параметром рХ.

Пусть , где отвечает распределению Бернулли, а N - распределению Пуассона. Соответствующие производящие функции, согласно (11.17), (11.41):

Производящая функция случайной переменной Y вычисляется в соответствии с (11.14)

т.е. производящая функция соответствует распределению Пуассона с параметром рХ.

3. Как следствие свойства 2 справедливо следующее свойство. Если число элементов ^множества распределено по закону Пуассона с параметром X и множество случайным образом распределяется с вероятностями /?, и р 2 = 1 - Р на две группы, тогда размеры множеств 7V, и N 2 независимы и распределены по Пуассону с параметрами р{к и р{к.

Для удобства использования представим полученные результаты относительно дискретных распределений в виде табл. 11.1 и 11.2.

Таблица 11.1. Основные характеристики дискретных распределений

Распределение	Плотность	Диапазон	Параметры	tn \|		С Х --2
Бернулли	Р{Х = } = р Р {X = 0} = Р + Я = 1	п - 0,1
Геометрическое	р(-р) к - 1	к = 1,2,...			^ 1 1 \|тз	1 -р
Биномиальное	с к р к (- Р г к	* = 1,2,...,#»			пр{ - р)	1 -р пр
Пуассона	Е -х к !	к = 1,2,...

Табл и ца 11. 2. Производящие функции дискретных распределений

КОНТРОЛЬНЫЕ ВОПРОСЫ

1. Какие распределения вероятностей относят к дискретным?
2. Что такое производящая функция и для чего оно используется?
3. Как вычислить моменты случайных величин с использованием производящей функции?
4. Чему равна производящая функция суммы независимых случайных величин?
5. Что называется составным распределением и как вычисляются производящие функции составных распределений?
6. Дайте основные характеристики распределения Бернулли, приведите пример использования в задачах сервиса.
7. Дайте основные характеристики геометрического распределения, приведите пример использования в задачах сервиса.
8. Дайте основные характеристики биномиального распределения, приведите пример использования в задачах сервиса.
9. Дайте основные характеристики распределения Пуассона, приведите пример использования в задачах сервиса.