Нормальное распределение непрерывной случайной величины. Нормальное распределение Случайная величина х принимает

Случайная величина Х имеет нормальное распределение (или распределение по закону Гаусса), если ее плотность вероятности имеет вид:
,
где параметры а – любое действительное число и σ >0.
График дифференциальной функции нормального распределения называют нормальной кривой (кривой Гаусса). Нормальная кривая (рис. 2.12) симметрична относительно прямой х =а , имеет максимальную ординату , а в точках х = а ± σ – перегиб.

Рис. 2.12
Доказано, что параметр а является математическим ожиданием (также модой и медианой), а σ – средним квадратическим отклонением. Коэффициенты асимметрии и эксцесса для нормального распределения равны нулю:As = Ex = 0.
Установим теперь, как влияет изменение параметров а и σ на вид нормальной кривой. При изменении параметра а форма нормальной кривой не изменяется. В этом случае, если математическое ожидание (параметр а ) уменьшилось или увеличилось, график нормальной кривой сдвигается влево или вправо (рис. 2.13).
При изменении параметра σ изменяется форма нормальной кривой. Если этот параметр увеличивается, то максимальное значение функции убывает, и наоборот. Так как площадь, ограниченная кривой распределения и осью Ох , должна быть постоянной и равной 1, то с увеличением параметра σ кривая приближается к оси Ох и растягивается вдоль нее, а с уменьшением σ кривая стягивается к прямой х = а (рис. 2.14).

Рис. 2.13 Рис. 2.14
Функция плотности нормального распределения φ(х ) с параметрами а = 0, σ = 1 называется плотностью стандартной нормальной случайной величины , а ее график – стандартной кривой Гаусса.
Функция плотности нормальной стандартной величины определяется формулой , а ее график изображен на рис. 2.15.
Из свойств математического ожидания и дисперсии следует, что для величины , D(U )=1, M (U ) = 0. Поэтому стандартную нор мальную кривую можно рассматривать как кривую распределения случайной величины , где Х – случайная величина, подчиненная нормальному закону распределения с параметрами а и σ.
Нормальный закон распределения случайной величины в интегральной форме имеет вид
(2.10)
Полагая в интеграле (3.10) , получим
,
где . Первое слагаемое равно 1/2 (половине площади криволинейной трапеции, изображенной на рис. 3.15). Второе слагаемое
(2.11)
называется функцией Лапласа , а также интегралом вероятности.
Поскольку интеграл в формуле (2.11) не выражается через элементарные функции, для удобства расчетов составлена для z ≥ 0 таблица функции Лапласа. Чтобы вычислить функцию Лапласа для отрицательных значений z , необходимо воспользоваться нечетностью функции Лапласа: Ф(–z ) = – Ф(z ). Окончательно получаем расчетную формулу

Отсюда получаем, что для случайной величины Х , подчиняющейся нормальному закону, вероятность ее попадания на отрезок [ α, β] есть
(2.12)
С помощью формулы (2.12) найдем вероятность того, что модуль отклонения нормального распределения величины Х от ее центра распределения а меньше 3σ. Имеем
Р(|x a | < 3 s) =P(а –3 s< X < а +3 s)= Ф(3) – Ф(–3) = 2Ф(3) »0,9973.
Значение Ф(3) получено по таблице функции Лапласа.
Принято считать событие практически достоверным , если его вероятность близка к единице, и практически невозможным, если его вероятность близка к нулю.
Мы получили так называемое правило трех сигм : для нормального распределения событие (|x a | < 3σ) практически достоверно.
Правило трех сигм можно сформулировать иначе: хотя нормальная случайная величина распределена на всей оси х , интервал ее практически возможных значений есть (a –3σ, a +3σ) .
Нормальное распределение имеет ряд свойств, делающих его одним из самых употребительных в статистике распределений.
Если предоставляется возможность рассматривать некоторую случайную величину как сумму достаточно большого числа других случайных величин, то данная случайная величина обычно подчиняется нормальному закону распределения. Суммируемые случайные величины могут подчиняться каким угодно распределениям, но при этом должно выполняться условие их независимости (или слабой независимости). Также ни одна из суммируемых случайных величин не должна резко отличаться от других, т.е. каждая из них должна играть в общей сумме примерно одинаковую роль и не иметь исключительно большую по сравнению с другими величинами дисперсию.
Этим и объясняется широкая распространенность нормального распределения. Оно возникает во всех явлениях, процессах, где рассеяния случайной изучаемой величины вызывается большим количеством случайных причин, влияние каждой из которых в отдельности на рассеяние ничтожно мало.
Большинство встречающихся на практике случайных величин (таких, например, как количества продаж некоторого товара, ошибка измерения; отклонение снарядов от цели по дальности или по направлению; отклонение действительных размеров деталей, обработанных на станке, от номинальных размеров и т.д.) может быть представлено как сумма большого числа независимых случайных величин, оказывающих равномерно малое влияние на рассеяние суммы. Такие случайные величины принято считать нормально распределенными. Гипотеза о нормальности подобных величин находит свое теоретическое обоснование в центральной предельной теореме и получила многочисленные практические подтверждения.
Представим себе, что некоторый товар реализуется в нескольких торговых точках. Из–за случайного влияния различных факторов количества продаж товара в каждой точке будут несколько различаться, но среднее всех значений будет приближаться к истинному среднему числу продаж.
Отклонения числа продаж в каждой торговой точке от среднего образуют симметричную кривую распределения, близкую к кривой нормального распределения. Любое систематическое влияние какого-либо фактора проявится в асимметрии распределения.
Задача . Случайная величина распределена нормально с параметрами а = 8, σ = 3.Найти вероятность того, что случайная величина в результате опыта примет значение, заключенной в интервале (12,5; 14).
Решение . Воспользуемся формулой (2.12). Имеем

Задача . Число проданного за неделю товара определенного вида Х можно считать распределенной нормально. Математическое ожидание числа продаж тыс. шт. Среднее квадратическое отклонение этой случайной величины σ = 0,8 тыс. шт. Найти вероятность того, что за неделю будет продано от 15 до 17 тыс. шт. товара.
Решение. Случайная величина Х распределена нормально с параметрами а = М(Х ) = 15,7; σ = 0,8. Требуется вычислить вероятность неравенства 15 ≤ X ≤ 17. По формуле (2.12) получаем

Функция распределения в этом случае согласно (5.7), примет вид:

где: m – математическое ожидание, s– среднеквадратическое отклонение.

Нормальное распределение называют еще гауссовским по имени немецкого математика Гаусса . Тот факт, что случайная величина имеет нормальное распределение с параметрами: m,, обозначают так: N (m,s), где: m =a =M ;

Достаточно часто в формулах математическое ожидание обозначают через а . Если случайная величина распределена по закону N(0,1), то она называется нормированной или стандартизированной нормальной величиной. Функция распределения для нее имеет вид:

.

График плотности нормального распределения, который называют нормальной кривой или кривой Гаусса, изображен на рис.5.4.

Рис. 5.4. Плотность нормального распределения

Определение числовых характеристик случайной величины по её плотности рассматривается на примере.

Пример 6 .

Непрерывная случайная величина задана плотностью распределения:.

Определить вид распределения, найти математическое ожидание M(X) и дисперсию D(X).

Сравнивая заданную плотность распределения с (5.16) можно сделать вывод, что задан нормальный закон распределения с m =4. Следовательно, математическое ожидание M(X)=4, дисперсия D(X)=9.

Среднее квадратическое отклонение s=3.

Функция Лапласа, имеющая вид:

,

связана с функцией нормального распределения (5.17), cоотношением:

F 0 (x) = Ф(х) + 0,5.

Функции Лапласа нечётная.

Ф(-x )=-Ф(x ).

Значения функции Лапласа Ф(х) табулированы и берутся из таблицы по значению х (см. Приложение 1).

Нормальное распределение непрерывной случайной величины играет важную роль в теории вероятностей и при описании реальности, имеет очень широкое распространение в случайных явлениях природы. На практике очень часто встречаются случайные величины, образующиеся именно в результате суммирования многих случайных слагаемых. В частности, анализ ошибок измерения показывает, что они являются суммой разного рода ошибок. Практика показывает, что распределение вероятностей ошибок измерения близко к нормальному закону.

С помощью функции Лапласа можно решать задачи вычисления вероятности попадания в заданный интервал и заданного отклонения нормальной случайной величины.

Во многих задачах, связанных с нормально распределенными случайными величинами, приходится определять вероятность попадания случайной величины , подчиненной нормальному закону с параметрами , на участок от до . Для вычисления этой вероятности воспользуемся общей формулой

где - функция распределения величины .

Найдем функцию распределения случайной величины , распределенной по нормальному закону с параметрами . Плотность распределения величины равна:

. (6.3.2)

Отсюда находим функцию распределения

. (6.3.3)

Сделаем в интеграле (6.3.3) замену переменной

и приведем его к виду:

(6.3.4)

Интеграл (6.3.4) не выражается через элементарные функции, но его можно вычислить через специальную функцию, выражающую определенный интеграл от выражения или (так называемый интеграл вероятностей), для которого составлены таблицы. Существует много разновидностей таких функций, например:

;

и т.д. Какой из этих функций пользоваться – вопрос вкуса. Мы выберем в качестве такой функции

. (6.3.5)

Нетрудно видеть, что эта функция представляет собой не что иное, как функцию распределения для нормально распределенной случайной величины с параметрами .

Условимся называть функцию нормальной функцией распределения. В приложении (табл. 1) приведены таблицы значений функции .

Выразим функцию распределения (6.3.3) величины с параметрами и через нормальную функцию распределения . Очевидно,

. (6.3.6)

Теперь найдем вероятность попадания случайной величины на участок от до . Согласно формуле (6.3.1)

Таким образом, мы выразили вероятность попадания на участок случайной величины , распределенной по нормальному закону с любыми параметрами, через стандартную функцию распределения , соответствующую простейшему нормальному закону с параметрами 0,1. Заметим, что аргументы функции в формуле (6.3.7) имеют очень простой смысл: есть расстояние от правого конца участка до центра рассеивания, выраженное в средних квадратических отклонениях; - такое же расстояние для левого конца участка, причем это расстояние считается положительным, если конец расположен справа от центра рассеивания, и отрицательным, если слева.

Как и всякая функция распределения, функция обладает свойствами:

3. - неубывающая функция.

Кроме того, из симметричности нормального распределения с параметрами относительно начала координат следует, что

Пользуясь этим свойством, собственно говоря, можно было бы ограничить таблицы функции только положительными значениями аргумента, но, чтобы избежать лишней операции (вычитание из единицы), в таблице 1 приложения приводятся значения как для положительных, так и для отрицательных аргументов.

На практике часто встречается задача вычисления вероятности попадания нормально распределенной случайной величины на участок, симметричный относительно центра рассеивания . Рассмотрим такой участок длины (рис. 6.3.1). Вычислим вероятность попадания на этот участок по формуле (6.3.7):

Учитывая свойство (6.3.8) функции и придавая левой части формулы (6.3.9) более компактный вид, получим формулу для вероятности попадания случайной величины, распределенной по нормальному закону на участок, симметричный относительно центра рассеивания:

. (6.3.10)

Решим следующую задачу. Отложим от центра рассеивания последовательные отрезки длиной (рис. 6.3.2) и вычислим вероятность попадания случайной величины в каждый из них. Так как кривая нормального закона симметрична, достаточно отложить такие отрезки только в одну сторону.

По формуле (6.3.7) находим:

(6.3.11)

Как видно из этих данных, вероятности попадания на каждый из следующих отрезков (пятый, шестой и т.д.) с точностью до 0,001 равны нулю.

Округляя вероятности попадания в отрезки до 0,01 (до 1%), получим три числа, которые легко запомнить:

0,34; 0,14; 0,02.

Сумма этих трех значений равна 0,5. Это значит, что для нормально распределенной случайной величины все рассеивания (с точностью до долей процента) укладывается на участке .

Это позволяет, зная среднее квадратическое отклонение и математическое ожидание случайной величины, ориентировочно указать интервал её практически возможных значений. Такой способ оценки диапазона возможных значений случайной величины известен в математической статистике под названием «правило трех сигма». Из правила трех сигма вытекает также ориентировочный способ определения среднего квадратического отклонения случайной величины: берут максимальное практически возможное отклонение от среднего и делят его на три. Разумеется, этот грубый прием может быть рекомендован, только если нет других, более точных способов определения .

Пример 1. Случайная величина , распределенная по нормальному закону, представляет собой ошибку измерения некоторого расстояния. При измерении допускается систематическая ошибка в сторону завышения на 1,2 (м); среднее квадратическое отклонения ошибки измерения равно 0,8 (м). Найти вероятность того, что отклонение измеренного значения от истинного не превзойдет по абсолютной величине 1,6 (м).

Решение. Ошибка измерения есть случайная величина , подчиненная нормальному закону с параметрами и . Нужно найти вероятность попадания этой величины на участок от до . По формуле (6.3.7) имеем:

Пользуясь таблицами функции (приложение, табл. 1), найдем:

; ,

Пример 2. Найти ту же вероятность, что и в предыдущем примере, но при условии, что систематической ошибки нет.

Решение. По формуле (6.3.10), полагая , найдем:

.

Пример 3. По цели, имеющей вид полосы (автострада), ширина которой равна 20 м, ведется стрельба в направлении, перпендикулярном автостраде. Прицеливание ведется по средней линии автострады. Среднее квадратическое отклонение в направлении стрельбы равно м. Имеется систематическая ошибка в направлении стрельбы: недолет 3 м. Найти вероятность попадания в автостраду при одном выстреле.

Нормальный закон распределения вероятностей

Без преувеличения его можно назвать философским законом. Наблюдая за различными объектами и процессами окружающего мира, мы часто сталкиваемся с тем, что чего-то бывает мало, и что бывает норма:


Перед вами принципиальный вид функции плотности нормального распределения вероятностей, и я приветствую вас на этом интереснейшем уроке.

Какие можно привести примеры? Их просто тьма. Это, например, рост, вес людей (и не только), их физическая сила, умственные способности и т.д. Существует «основная масса» (по тому или иному признаку) и существуют отклонения в обе стороны.

Это различные характеристики неодушевленных объектов (те же размеры, вес). Это случайная продолжительность процессов, например, время забега стометровки или превращения смолы в янтарь. Из физики вспомнились молекулы воздуха: среди них есть медленные, есть быстрые, но большинство двигаются со «стандартными» скоростями.

Далее отклоняемся от центра ещё на одно стандартное отклонение и рассчитываем высоту:

Отмечаем точки на чертеже (зелёный цвет) и видим, что этого вполне достаточно.

На завершающем этапе аккуратно чертим график, и особо аккуратно отражаем его выпуклость / вогнутость ! Ну и, наверное, вы давно поняли, что ось абсцисс – это горизонтальная асимптота , и «залезать» за неё категорически нельзя!

При электронном оформлении решения график легко построить в Экселе, и неожиданно для самого себя я даже записал короткий видеоролик на эту тему. Но сначала поговорим о том, как меняется форма нормальной кривой в зависимости от значений и .

При увеличении или уменьшении «а» (при неизменном «сигма») график сохраняет свою форму и перемещается вправо / влево соответственно. Так, например, при функция принимает вид и наш график «переезжает» на 3 единицы влево – ровнехонько в начало координат:


Нормально распределённая величина с нулевым математическим ожиданием получила вполне естественное название – центрированная ; её функция плотности чётная , и график симметричен относительно оси ординат.

В случае изменения «сигмы» (при постоянном «а») , график «остаётся на месте», но меняет форму. При увеличении он становится более низким и вытянутым, словно осьминог, растягивающий щупальца. И, наоборот, при уменьшении график становится более узким и высоким – получается «удивлённый осьминог». Так, при уменьшении «сигмы» в два раза: предыдущий график сужается и вытягивается вверх в два раза:

Всё в полном соответствии с геометрическими преобразованиями графиков .

Нормальное распределёние с единичным значением «сигма» называется нормированным , а если оно ещё и центрировано (наш случай), то такое распределение называют стандартным . Оно имеет ещё более простую функцию плотности, которая уже встречалась в локальной теореме Лапласа : . Стандартное распределение нашло широкое применение на практике, и очень скоро мы окончательно поймём его предназначение.

Ну а теперь смотрим кино:

Да, совершенно верно – как-то незаслуженно у нас осталась в тени функция распределения вероятностей . Вспоминаем её определение :
– вероятность того, что случайная величина примет значение, МЕНЬШЕЕ, чем переменная , которая «пробегает» все действительные значения до «плюс» бесконечности.

Внутри интеграла обычно используют другую букву, чтобы не возникало «накладок» с обозначениями, ибо здесь каждому значению ставится в соответствие несобственный интеграл , который равен некоторому числу из интервала .

Почти все значения не поддаются точному расчету, но как мы только что видели, с современными вычислительными мощностями с этим нет никаких трудностей. Так, для функции стандартного распределения соответствующая экселевская функция вообще содержит один аргумент:

=НОРМСТРАСП(z)

Раз, два – и готово:

На чертеже хорошо видно выполнение всех свойств функции распределения , и из технических нюансов здесь следует обратить внимание на горизонтальные асимптоты и точку перегиба .

Теперь вспомним одну из ключевых задач темы, а именно выясним, как найти –вероятность того, что нормальная случайная величина примет значение из интервала . Геометрически эта вероятность равна площади между нормальной кривой и осью абсцисс на соответствующем участке:

но каждый раз вымучивать приближенное значение неразумно, и поэтому здесь рациональнее использовать «лёгкую» формулу :
.

! Вспоминает также , что

Тут можно снова задействовать Эксель, но есть пара весомых «но»: во-первых, он не всегда под рукой, а во-вторых, «готовые» значения , скорее всего, вызовут вопросы у преподавателя. Почему?

Об этом я неоднократно рассказывал ранее: в своё время (и ещё не очень давно) роскошью был обычный калькулятор, и в учебной литературе до сих пор сохранился «ручной» способ решения рассматриваемой задачи. Его суть состоит в том, чтобы стандартизировать значения «альфа» и «бета», то есть свести решение к стандартному распределению:

Примечание : функцию легко получить из общего случая с помощью линейной замены . Тогда и:

и из проведённой замены как раз следует формула перехода от значений произвольного распределения – к соответствующим значениям стандартного распределения.

Зачем это нужно? Дело в том, что значения скрупулезно подсчитаны нашими предками и сведены в специальную таблицу, которая есть во многих книгах по терверу. Но ещё чаще встречается таблица значений , с которой мы уже имели дело в интегральной теореме Лапласа :

Если же в нашем распоряжении есть таблица значений функции Лапласа , то решаем через неё:

Дробные значения традиционно округляем до 4 знаков после запятой, как это сделано в типовой таблице. И для контроля есть Пункт 5 макета .

Напоминаю, что , и во избежание путаницы всегда контролируйте , таблица КАКОЙ функции перед вашими глазами.

Ответ требуется дать в процентах, поэтому рассчитанную вероятность нужно умножить на 100 и снабдить результат содержательным комментарием:

– с перелётом от 5 до 70 м упадёт примерно 15,87% снарядов

Тренируемся самостоятельно:

Пример 3

Диаметр подшипников, изготовленных на заводе, представляет собой случайную величину, распределенную нормально с математическим ожиданием 1,5 см и средним квадратическим отклонением 0,04 см. Найти вероятность того, что размер наугад взятого подшипника колеблется от 1,4 до 1,6 см.

В образце решения и далее я буду использовать функцию Лапласа, как самый распространённый вариант. Кстати, обратите внимание, что согласно формулировке, здесь можно включить концы интервала в рассмотрение. Впрочем, это не критично.

И уже в этом примере нам встретился особый случай – когда интервал симметричен относительно математического ожидания. В такой ситуации его можно записать в виде и, пользуясь нечётностью функции Лапласа, упростить рабочую формулу:


Параметр «дельта» называют отклонением от математического ожидания, и двойное неравенство можно «упаковывать» с помощью модуля :

– вероятность того, что значение случайной величины отклонится от математического ожидания менее чем на .

Хорошо то решение, которое умещается в одну строчку:)
– вероятность того, что диаметр наугад взятого подшипника отличается от 1,5 см не более чем на 0,1 см.

Результат этой задачи получился близким к единице, но хотелось бы ещё бОльшей надежности – а именно, узнать границы, в которых находится диаметр почти всех подшипников. Существует ли какой-нибудь критерий на этот счёт? Существует! На поставленный вопрос отвечает так называемое

правило «трех сигм»

Его суть состоит в том, что практически достоверным является тот факт, что нормально распределённая случайная величина примет значение из промежутка .

И в самом деле, вероятность отклонения от матожидания менее чем на составляет:
или 99,73%

В «пересчёте на подшипники» – это 9973 штуки с диаметром от 1,38 до 1,62 см и всего лишь 27 «некондиционных» экземпляров.

В практических исследованиях правило «трёх сигм» обычно применяют в обратном направлении: если статистически установлено, что почти все значения исследуемой случайной величины укладываются в интервал длиной 6 стандартных отклонений, то появляются веские основания полагать, что эта величина распределена по нормальному закону. Проверка осуществляется с помощью теории статистических гипотез .

Продолжаем решать суровые советские задачи:

Пример 4

Случайная величина ошибки взвешивания распределена по нормальному закону с нулевым математическим ожиданием и стандартным отклонением 3 грамма. Найти вероятность того, что очередное взвешивание будет проведено с ошибкой, не превышающей по модулю 5 грамм.

Решение очень простое. По условию, и сразу заметим, что при очередном взвешивании (чего-то или кого-то) мы почти 100% получим результат с точностью до 9 грамм. Но в задаче фигурирует более узкое отклонение и по формуле :

– вероятность того, что очередное взвешивание будет проведено с ошибкой, не превышающей 5 грамм.

Ответ :

Прорешанная задача принципиально отличается от вроде бы похожего Примера 3 урока о равномерном распределении . Там была погрешность округления результатов измерений, здесь же речь идёт о случайной погрешности самих измерений. Такие погрешности возникают в связи с техническими характеристиками самого прибора (диапазон допустимых ошибок, как правило, указывают в его паспорте) , а также по вине экспериментатора – когда мы, например, «на глазок» снимаем показания со стрелки тех же весов.

Помимо прочих, существуют ещё так называемые систематические ошибки измерения. Это уже неслучайные ошибки, которые возникают по причине некорректной настройки или эксплуатации прибора. Так, например, неотрегулированные напольные весы могут стабильно «прибавлять» килограмм, а продавец систематически обвешивать покупателей. Или не систематически ведь можно обсчитать. Однако, в любом случае, случайной такая ошибка не будет, и её матожидание отлично от нуля.

…срочно разрабатываю курс по подготовке продавцов =)

Самостоятельно решаем обратную задачу:

Пример 5

Диаметр валика – случайная нормально распределенная случайная величина, среднее квадратическое отклонение ее равно мм. Найти длину интервала, симметричного относительно математического ожидания, в который с вероятностью попадет длина диаметра валика.

Пункт 5* расчётного макета в помощь. Обратите внимание, что здесь не известно математическое ожидание, но это нисколько не мешает решить поставленную задачу.

И экзаменационное задание, которое я настоятельно рекомендую для закрепления материала:

Пример 6

Нормально распределенная случайная величина задана своими параметрами (математическое ожидание) и (среднее квадратическое отклонение). Требуется:

а) записать плотность вероятности и схематически изобразить ее график;
б) найти вероятность того, что примет значение из интервала ;
в) найти вероятность того, что отклонится по модулю от не более чем на ;
г) применяя правило «трех сигм», найти значения случайной величины .

Такие задачи предлагаются повсеместно, и за годы практики мне их довелось решить сотни и сотни штук. Обязательно попрактикуйтесь в ручном построении чертежа и использовании бумажных таблиц;)

Ну а я разберу пример повышенной сложности:

Пример 7

Плотность распределения вероятностей случайной величины имеет вид . Найти , математическое ожидание , дисперсию , функцию распределения , построить графики плотности и функции распределения, найти .

Решение : прежде всего, обратим внимание, что в условии ничего не сказано о характере случайной величины. Само по себе присутствие экспоненты ещё ничего не значит: это может оказаться, например, показательное или вообще произвольное непрерывное распределение . И поэтому «нормальность» распределения ещё нужно обосновать:

Так как функция определена при любом действительном значении , и её можно привести к виду , то случайная величина распределена по нормальному закону.

Приводим. Для этого выделяем полный квадрат и организуем трёхэтажную дробь :


Обязательно выполняем проверку, возвращая показатель в исходный вид:

, что мы и хотели увидеть.

Таким образом:
– по правилу действий со степенями «отщипываем» . И здесь можно сразу записать очевидные числовые характеристики:

Теперь найдём значение параметра . Поскольку множитель нормального распределения имеет вид и , то:
, откуда выражаем и подставляем в нашу функцию:
, после чего ещё раз пробежимся по записи глазами и убедимся, что полученная функция имеет вид .

Построим график плотности:

и график функции распределения :

Если под рукой нет Экселя и даже обычного калькулятора, то последний график легко строится вручную! В точке функция распределения принимает значение и здесь находится

Нормальный закон распределения наиболее часто встречается на практике. Главная особенность, выделяющая его среди других законов, состоит в том, что он является предельным законом, к которому приближаются другие законы распределения при весьма часто встречающихся типичных условиях (см. гл. 6).

Определение. Непрерывная случайная величина X имеет нормальный закон распределения (закон Гаусса) с параметрами а и а 2 , если ее плотность вероятности имеет вид

Термин «нормальный» не совсем удачный. Многие признаки подчиняются нормальному закону, например, рост человека, дальность полета снаряда и т.п. Но если какой-либо признак подчиняется другому, отличному от нормального, закону распределения, то это вовсе не говорит о «ненормальности» явления, связанного с этим признаком.

Кривую нормального закона распределения называют нормальной , или гауссовой , кривой. На рис. 4.6, а , 6 приведены нормальная кривая фд, (х) с параметрами йио 2 , т.е. И[а а 2), и график функции распределения случайной величины X , имеющей нормальный закон. Обратим внимание на то, что нормальная кривая симметрична относительно прямой х = а, имеет максимум в точке х = а ,

равный , т.е.

И две точки перегиба х = а±

с ординатой

Можно заметить, что в выражении плотности нормального закона параметры обозначены буквами а и ст 2 , которыми мы обозначаем математическое ожидание М(Х ) и дисперсию О(Х). Такое совпадение неслучайно. Рассмотрим теорему, устанавливающую теоретико-вероятностный смысл параметров нормального закона.

Теорема. Математическое ожидание случайной величины X, распределенной по нормальному закону, равно параметру а этого закона, т.е.

а ее дисперсия - параметру а 2 , т.е.

Математическое ожидание случайной величины X:

Произведем замену переменной, положив

Тогда пределы интегрирования не меняются

и, следовательно,

(первый интеграл равен нулю как интеграл от нечетной функции по симметричному относительно начала координат промежутку, а второй интеграл - интеграл Эйлера - Пуассона).

Дисперсия случайной величины X:

Сделаем ту же замену переменной х = а + о^2 t, как и при вычислении предыдущего интеграла. Тогда

Применяя метод интегрирования по частям, получим

Выясним, как будет меняться нормальная кривая при изменении параметров а и с 2 (или а). Если а = const, и меняется параметр а {а х а 3), т.е. центр симметрии распределения, то нормальная кривая будет смещаться вдоль оси абсцисс, не меняя формы (рис. 4.7).

Если а = const и меняется параметр а 2 (или а), то меняется ордината

максимума кривой При увеличении а ордината максимума

кривой уменьшается, но так как площадь под любой кривой распределения должна оставаться равной единице, то кривая становится более плоской, растягиваясь вдоль оси абсцисс; при уменьшении су, напротив, нормальная кривая вытягивается вверх, одновременно сжимаясь с боков. На рис. 4.8 показаны нормальные кривые с параметрами а 1(о 2 и а 3 , где о, а (он же математическое ожидание) характеризует положение центра, а параметр а 2 (он же дисперсия) - фор м у нормальной кривой.

Нормальный закон распределения случайной величины X с параметрами а = 0, ст 2 = 1, г.е. X ~ N(0; 1), называется стандартным или нормированным, а соответствующая нормальная кривая - стандартной или нормированной.

Сложность непосредственного нахождения функции распределения случайной величины, распределенной по нормальному закону, по формуле (3.23) и вероятности ее попадания на некоторый промежуток по формуле (3.22) связана с гем, что интеграл от функции (4.26) является «нсберу- щимся» в элементарных функциях. Поэтому их выражают через функцию

- функцию (интеграл вероятностей) Лапласа, для которой составлены таблицы. Напомним, что функция Лапласа уже встречалась нам при рассмотрении интегральной теоремы Муавра - Лапласа (см. параграф 2.3). Там же были рассмотрены ее свойства. Геометрически функция Лапласа Ф(.с) представляет собой площадь под стандартной нормальной кривой на отрезке [-х; х ] (рис. 4.9) 1 .

Рис. 4.10

Рис. 4.9

Теорема. Функция распределения случайной величины X, распределенной по нормальному закону, выражается через функцию Лапласа Ф(х) по формуле

По формуле (3.23) функция распределения:

Сделаем замену переменной, полагая при X -> -оо? -» -00, поэтому

1 Наряду с интегралом вероятностей вида (4.29), представляющим функцию Ф(х), в литературе используется его выражения и в виде других табулированных функций:

представляющих собой площади иод стандартной нормальной кривой соответственно на интервалах (0; х], (-оо; х], [-х>/2; Хл/2.

Первый интеграл

(в силу четности подынтегральной функции и того, что интеграл Эйлера - Пуассона равен ).

Второй интеграл с учетом формулы (4.29) составляет

Геометрически функция распределения представляет собой площадь под нормальной кривой на интервале (-со, х) (рис. 4.10). Как видим, она состоит из двух частей: первой, на интервале (-оо, а), равной 1/2, т.е. половине всей площади под нормальной кривой, и второй, на интервале (я, х),

равной

Рассмотрим свойства случайной величины, распределенной по нормальному закону.

1. Вероятность попадания случайной величины X, распределенной по нормальному закону, в интервал [х 1(х 2 ], равна

Учитывая, что согласно свойству (3.20) вероятность Р(х,

где и Г 2 определяются по формуле (4.33) (рис. 4.11). ?

2. Вероятность того, что отклонение случайной величины X, распределенной по нормальному закону, от математического ожидания а не превысит величину А > 0 (по абсолютной величине), равна

а также свойство нечетности функции Лапласа, получим

где? =Д/о (рис. 4.12). ?

На рис. 4.11 и 4.12 приведена геометрическая интерпретация свойств нормального закона .

Замечание. Рассмотренная в гл. 2 приближенная интегральная формула Муавра - Лапласа (2.10) следует из свойства (4.32) нормально распределенной случайной величины при х { = а, х 2 = Ь } а = пр и так

как биномиальный закон распределения случайной величины X = т с параметрами п и р, для которого получена эта формула, при п -> ос стремится к нормальному закону (см. гл. 6).

Аналогично и следствия (2.13), (2.14) и (2.16) интегральной формулы Муавра - Лапласа для числа X = т появления события в п независимых испытаниях и его частости т/п вытекают из свойств (4.32) и (4.34) нормального закона.

Вычислим по формуле (4.34) вероятности Р(Х-а д) при различных значениях Д (используем табл. II приложений). Получим

Отсюда вытекает «правило трех сигм».

Если случайная величина X имеет нормальный закон распределения с параметрами а и а 2 , т.е. М(а; а 2), то практически достоверно, что ее значения заключены в интервале (а - За, а + За).

Нарушение «правила трех сигм», т.е. отклонение нормально распределенной случайной величины X больше, чем на За (но абсолютной величине), является событием практически невозможным, так как его вероятность весьма мала:

Заметим, что отклонение Д в, при котором , называется

вероятным отклонением. Для нормального закона Д в « 0,675а, т.е. на интервал (а - 0,675а, а + 0,675а) приходится половина всей площади под нормальной кривой.

Найдем коэффициент асимметрии и эксцесс случайной величины X, распределенной по нормальному закону.

Очевидно, в силу симметрии нормальной кривой относительно вертикальной прямой х = а, проходящей через центр распределения а = М(Х), коэффициент асимметрии нормального распределения Л = 0.

Эксцесс нормально распределенной случайной величины X найдем по формуле (3.37), т.е.

где учли, что центральный момент 4-го порядка, найденный по формуле (3.30) с учетом определения (4.26), т.е.

(вычисление интеграла опускаем).

Таким образом, эксцесс нормального распределения равен нулю и крутость других распределений определяется по отношению к нормальному (об этом мы уже упоминали в параграфе 3.7).

О Пример 4.9. Полагая, что рост мужчин определенной возраст-ной группы есть нормально распределенная случайная величинах X с параметрами а = 173 и а 2 =36:

  • 1) Найти: а) выражение плотности вероятности и функции распределения случайной величины X; б) доли костюмов 4-го роста (176-182 см) и 3-го роста (170-176 см), которые нужно предусмотреть в общем объеме производства для данной возрастной группы; в) квантиль х 07 и 10%-ную точку случайной величины X.
  • 2) Сформулировать «правило трех сигм» для случайной величины X. Решение. 1, а) По формулам (4.26) и (4.30) запишем

1, б) Доля костюмов 4-го роста (176-182 см) в общем объеме производства определится по формуле (4.32) как вероятность


(рис. 4.14), так как по формулам (4.33)

Долю костюмов 3-го роста (170-176 см) можно было определить аналогично но формуле (4.32), но проще это сделать по формуле (4.34), если учесть, что данный интервал симметричен относительно математического ожидания а = М(Х) = 173, т.е. неравенство 170 X Х -173|

(см. рис. 4.14;.

1, в) Квантиль х 07 (см. параграф 3.7) случайной величины X найдем из уравнения (3.29) с учетом формулы (4.30):

откуда

По табл. 11 приложений находим I- 0,524 и

Это означает, что 70% мужчин данной возрастной группы имеют рост до 176 см.

  • 10%-ная точка - эго квантиль х 09 = 181 см (находится аналогично), т.е. 10% мужчин имеют рост не менее 181 см.
  • 2) Практически достоверно, что рост мужчин данной возрастной группы заключен в границах от а - Зет = 173 - 3 6 = 155 до а + Зет = 173 + 3 - 6 = = 191 (см), т.е. 155

    В силу особенностей нормального закона распределения, отмеченных в начале параграфа (и в гл. 6), он занимает центральное место в теории и практике вероятностно-статистических методов. Большое теоретическое значение нормального закона состоит в том, что с его помощью получен ряд важных распределений, рассматриваемых ниже.

    • Стрелками на рис. 4.11-4.13 отмечены условно п л о щ а д и соответствующих фигурпод нормальной кривой.
    • Значения функции Лапласа Ф(х) определяем но табл. II приложений.