Описано е нормалното разпределение. Нормално разпределение. Непрекъснати разпределения в EXCEL. Връзка с други дистрибуции

Статията показва подробно какъв е нормалният закон за разпределение на случайна променлива и как да го използваме при решаване на практически задачи.

Нормално разпределение в статистиката

Историята на закона датира от 300 години. Първият откривател е Абрахам дьо Моавър, който измисля приближението през 1733 г. Много години по-късно Карл Фридрих Гаус (1809) и Пиер-Симон Лаплас (1812) извеждат математически функции.

Лаплас също откри забележителен модел и формулира централен гранична теорема (CPT), според която сумата голямо количествомалки и независими величини има нормално разпределение.

Нормалният закон не е фиксирано уравнение на зависимостта на една променлива от друга. Записва се само естеството на тази зависимост. Конкретната форма на разпространение се определя чрез специални параметри. например, y = ax + bе уравнението на права линия. Къде точно минава обаче и под какъв ъгъл се определя от параметрите АИ b. Същото с нормалното разпределение. Ясно е, че това е функция, която описва тенденция стойностите да бъдат силно концентрирани около центъра, но точната й форма се определя от специални параметри.

Кривата на нормалното разпределение на Гаус изглежда така.

Графиката на нормалното разпределение прилича на камбана, поради което може да видите името камбановидна крива. Графиката има „гърбица“ в средата и рязко намаляване на плътността по краищата. Това е същността на нормалното разпределение. Вероятността, че случайна променливаще бъде близо до центъра много по-високо от това, че ще се отклонява значително от средата.

Фигурата по-горе показва две области под кривата на Гаус: синя и зелена. Причини, т.е. Интервалите са еднакви и за двете секции. Но височините са забележимо различни. Синята секция е по-далеч от центъра и има значително по-ниска височина от зелената секция, която се намира в самия център на разпределението. Следователно, областите, тоест вероятностите за попадане в определените интервали, също се различават.

Формулата за нормално разпределение (плътност) е следната.

Формулата се състои от две математически константи:

π – пи число 3.142;

д– натурален логаритъм с основа 2,718;

два променливи параметъра, които определят формата на конкретна крива:

мматематическо очакване(други обозначения могат да се използват в различни източници, напр. µ или а);

σ 2– дисперсия;

и самата променлива х, за които се изчислява плътността на вероятността.

Конкретната форма на нормалното разпределение зависи от 2 параметъра: ( м) И ( σ 2). Накратко посочено N(m, σ 2)или N(m, σ). Параметър м(математическо очакване) определя центъра на разпределението, на което съответства максимална височинаграфики. дисперсия σ 2характеризира обхвата на вариацията, тоест „размазването“ на данните.

Параметърът на математическото очакване измества центъра на разпределението надясно или наляво, без да засяга формата на самата крива на плътността.

Но дисперсията определя остротата на кривата. Когато данните имат малко разсейване, тогава цялата им маса е концентрирана в центъра. Ако данните имат голямо разсейване, тогава те са „разпръснати“ в широк диапазон.

Плътността на разпределение няма пряка практическо приложение. За да изчислите вероятностите, трябва да интегрирате функцията за плътност.

Вероятността една случайна променлива да бъде по-малка от определена стойност х, се определя нормална функция на разпределение:

Използване на математическите свойства на който и да е непрекъснато разпространение, лесно е да се изчислят всички други вероятности, тъй като

P(a ≤ X< b) = Ф(b) – Ф(a)

Стандартно нормално разпределение

Нормалното разпределение зависи от параметрите на средната и дисперсията, поради което свойствата му са слабо видими. Би било хубаво да има някакъв стандарт за разпространение, който да не зависи от мащаба на данните. И то съществува. Наречен стандартно нормално разпределение. Всъщност това е обикновено нормално разпределение, само с параметри математическо очакване 0 и дисперсия 1, накратко записани N(0, 1).

Всяко нормално разпределение може лесно да се преобразува в стандартно разпределение чрез нормализиране:

Къде z– нова променлива, която се използва вместо това x;
м– математическо очакване;
σ – стандартно отклонение.

За примерни данни се вземат оценки:

Средно аритметично и дисперсия на новата променлива zсега също са съответно 0 и 1. Това може лесно да се провери с помощта на елементарни алгебрични трансформации.

Името се среща в литературата z-резултат. Това е – нормализирани данни. Z-резултатможе директно да се сравни с теоретичните вероятности, т.к мащабът му съвпада със стандарта.

Нека сега да видим как изглежда плътността на стандартното нормално разпределение (напр z-резултати). Нека ви напомня, че функцията на Гаус има формата:

Нека заместим вместо това (x-m)/σписмо z, а вместо това σ – едно, получаваме функция на плътността на стандартното нормално разпределение:

Диаграма на плътността:

Центърът, както се очаква, е в точка 0. В същата точка функцията на Гаус достига своя максимум, което съответства на случайната променлива, приемаща средната си стойност (т.е. x-m=0). Плътността в тази точка е 0,3989, което може да се изчисли дори наум, защото e 0 =1 и всичко, което остава, е да изчислим отношението на 1 към корен от 2 pi.

По този начин графиката ясно показва, че стойностите, които имат малки отклонения от средната стойност, се срещат по-често от други, а тези, които са много далеч от центъра, се срещат много по-рядко. Скалата на оста x се измерва в стандартни отклонения, което ви позволява да се отървете от мерните единици и да получите универсална структура на нормално разпределение. Кривата на Гаус за нормализирани данни перфектно демонстрира други свойства на нормалното разпределение. Например, че е симетричен спрямо ординатната ос. В рамките на ±1σ от средното аритметично е концентрирано повечетовсички стойности (засега оценяваме на око). Повечето от данните са в рамките на ±2σ. Почти всички данни са в рамките на ±3σ. Последният имот е широко известен като правило три сигмаза нормално разпределение.

Стандартната функция за нормално разпределение ви позволява да изчислявате вероятностите.

Ясно е, че никой не брои ръчно. Всичко е изчислено и поставено в специални таблици, които са в края на всеки учебник по статистика.

Таблица за нормално разпределение

Има два вида таблици за нормално разпределение:

- маса плътност;

- маса функции(интеграл на плътността).

Таблица плътнострядко се използва. Нека обаче да видим как изглежда. Да кажем, че трябва да получим плътността за z = 1, т.е. плътност на стойност, отделена от очакването с 1 сигма. По-долу има част от масата.

В зависимост от организацията на данните, търсим желаната стойност по името на колоната и реда. В нашия пример ние вземаме линията 1,0 и колона 0 , защото няма стотни. Стойността, която търсите, е 0,2420 (0 преди 2420 е пропусната).

Функцията на Гаус е симетрична спрямо ординатната ос. Ето защо φ(z)= φ(-z), т.е. плътност за 1 е идентичен с плътността за -1 , което се вижда ясно на фигурата.

За да се избегне загубата на хартия, таблиците се отпечатват само за положителни стойности.

На практика стойностите се използват по-често функциистандартно нормално разпределение, т.е. вероятността за различни z.

Такива таблици също съдържат само положителни стойности. Следователно, за да разберете и да намерите всякаквинеобходимите вероятности трябва да са известни свойства на стандартното нормално разпределение.

функция Ф(z)симетричен относно стойността си 0,5 (а не ординатната ос, като плътност). Следователно равенството е вярно:

Този факт е показан на снимката:

Функционални стойности Ф(-z)И Ф(z)разделете графиката на 3 части. Освен това горната и долната част са равни (обозначени с отметки). За допълване на вероятността Ф(z)до 1, просто добавете липсващата стойност Ф(-z). Получавате равенството, посочено точно по-горе.

Ако трябва да намерите вероятността да попаднете в интервала (0; z), тоест вероятността за отклонение от нула в положителна странадо определен брой стандартни отклонения е достатъчно да се извади 0,5 от стойността на стандартната функция на нормалното разпределение:

За по-голяма яснота можете да погледнете чертежа.

На кривата на Гаус същата тази ситуация изглежда като областта от центъра надясно до z.

Доста често анализаторът се интересува от вероятността за отклонение в двете посоки от нула. И тъй като функцията е симетрична спрямо центъра, предишната формула трябва да се умножи по 2:

Снимка по-долу.

Под кривата на Гаус това е централната част, ограничена от избраната стойност –zналяво и zточно.

Тези свойства трябва да се вземат предвид, т.к табличните стойности рядко съответстват на интервала от интерес.

За да се улесни задачата, учебниците обикновено публикуват таблици за функциите на формата:

Ако имате нужда от вероятността за отклонение в двете посоки от нула, тогава, както току-що видяхме, стойността на таблицата за тази функция просто се умножава по 2.

Сега нека разгледаме конкретни примери. По-долу е дадена таблица на стандартното нормално разпределение. Нека намерим стойностите на таблицата за три z: 1.64, 1.96 и 3.

Как да разберем значението на тези числа? Да започнем с z=1,64, за която е табличната стойност 0,4495 . Най-лесният начин да обясните значението е във фигурата.

Това е вероятността стандартизирана нормално разпределена случайна променлива да попадне в интервала от 0 към 1,64 , е равно 0,4495 . Когато решавате проблеми, обикновено трябва да изчислите вероятността за отклонение в двете посоки, така че нека умножим стойността 0,4495 с 2 и получаваме приблизително 0,9. Заетата площ под кривата на Гаус е показана по-долу.

По този начин 90% от всички нормално разпределени стойности попадат в интервала ±1,64σот средното аритметично. Не случайно избрах значението z=1,64, защото кварталът около средноаритметичната стойност, заемащ 90% от цялата площ, понякога се използва за изчисляване на доверителните интервали. Ако стойността, която се тества, не попада в определената област, тогава нейното появяване е малко вероятно (само 10%).

За тестване на хипотези обаче по-често се използва интервал, покриващ 95% от всички стойности. Половин шанс 0,95 - Това 0,4750 (вижте втората маркирана стойност в таблицата).

За тази вероятност z=1,96.Тези. в рамките на почти ±2σ 95% от стойностите са от средните. Само 5% попадат извън тези граници.

Друга интересна и често използвана таблична стойност съответства на z=3, то е равно според нашата таблица 0,4986 . Умножете по 2 и получете 0,997 . И така, вътре ±3σПочти всички стойности са получени от средната аритметична стойност.

Ето как изглежда правилото за 3 сигма за нормално разпределение в диаграма.

С помощта на статистически таблици можете да получите всяка вероятност. Този метод обаче е много бавен, неудобен и много остарял. Днес всичко се прави на компютър. След това преминаваме към практиката на изчисления в Excel.

Нормално разпределение в Excel

Excel има няколко функции за изчисляване на вероятностите или обратните на нормалното разпределение.

Функция NORMAL DIST

функция НОРМА.СТ.РАЗС.предназначен за изчисляване на плътността ϕ(z)или вероятности Φ(z)по нормализирани данни ( z).

=NORM.ST.DIST(z;интеграл)

z– стойност на стандартизираната променлива

интегрална– ако е 0, тогава се изчислява плътносттаϕ(z) , ако 1 е стойността на функцията Ф(z), т.е. вероятност P(Z

Нека изчислим плътността и функционалната стойност за различни z: -3, -2, -1, 0, 1, 2, 3(ще ги посочим в клетка A2).

За да изчислите плътността ще ви трябва формулата =NORM.ST.DIST(A2;0). На диаграмата по-долу това е червената точка.

За да изчислите стойността на функцията =NORM.ST.DIST(A2;1). Диаграмата показва защрихованата област под нормалната крива.

В действителност по-често е необходимо да се изчисли вероятността дадена случайна променлива да не надхвърли определени граници от средната стойност (в стандартни отклонения, съответстващи на променливата z), т.е. P(|Z| .

Нека определим вероятността случайна променлива да попадне в границите ±1z, ±2z и ±3zот нулата. Трябва формула 2Ф(z)-1, в Excel =2*NORM.ST.DIST(A2;1)-1.

Диаграмата ясно показва основните основни свойства на нормалното разпределение, включително правилото на трите сигми. функция НОРМА.СТ.РАЗС.е автоматична таблица на стойностите на функцията за нормално разпределение в Excel.

Може да има и обратна задача: според наличната вероятност P(Z намерете стандартизираната стойност z, т.е. квантил от стандартното нормално разпределение.

Функция NORMAL REV

НОРМА.СТ.ОБизчислява обратната функция на стандартното нормално разпределение. Синтаксисът се състои от един параметър:

=NORM.ST.REV(вероятност)

вероятносте вероятност.

Тази формула се използва толкова често, колкото и предишната, защото с помощта на същите таблици трябва да търсите не само вероятности, но и квантили.

Например, когато се изчисляват доверителните интервали, се посочва доверителна вероятност, според която е необходимо да се изчисли стойността z.

Като се има предвид, че доверителният интервал се състои от горна и долна граница и че нормалното разпределение е симетрично около нулата, достатъчно е да се получи горната граница (положително отклонение). Долната граница се приема с отрицателен знак. Нека обозначим доверителната вероятност като γ (гама), тогава горната граница на доверителния интервал се изчислява по следната формула.

Нека изчислим стойностите в Excel z(което съответства на отклонението от средната стойност в сигма) за няколко вероятности, включително тези, които всеки статистик знае наизуст: 90%, 95% и 99%. В клетка B2 посочваме формулата: =NORM.ST.REV((1+A2)/2). Променяйки стойността на променливата (вероятност в клетка A2), получаваме различни граници на интервалите.

95% доверителен интервал е 1,96, тоест почти 2 стандартни отклонения. От тук е лесно, дори мислено, да се оцени възможното разпространение на нормална случайна променлива. Като цяло доверителните интервали от 90%, 95% и 99% съответстват на доверителни интервали от ±1,64, ±1,96 и ±2,58σ.

Като цяло функциите NORM.ST.DIST и NORM.ST.REV ви позволяват да извършвате всякакви изчисления, свързани с нормалното разпределение. Но за да улесни и намали броя на стъпките, Excel има няколко други функции. Например, можете да използвате CONFIDENCE NORM, за да изчислите доверителните интервали за средната стойност. За проверка на средното аритметично има формулата Z.TEST.

Нека да разгледаме още няколко полезни формули с примери.

Функция NORMAL DIST

функция НОРМАЛНО РАЗС.различен от НОРМА.СТ.РАЗС.само защото се използва за обработка на данни от всякакъв мащаб, а не само нормализирани. Параметрите за нормално разпределение са посочени в синтаксиса.

=NORM.DIST(x,средно,стандартно_отклонение,интеграл)

средно– математическо очакване, използвано като първи параметър на модела на нормалното разпределение

standard_off– стандартно отклонение – вторият параметър на модела

интегрална– ако 0, тогава се изчислява плътността, ако 1 – тогава стойността на функцията, т.е. P(X

Например, плътността за стойността 15, която е извлечена от нормална проба с очакване 10, стандартно отклонение 3, се изчислява, както следва:

Ако последният параметър е зададен на 1, тогава получаваме вероятността нормалната случайна променлива да бъде по-малка от 15 за дадените параметри на разпределение. По този начин вероятностите могат да бъдат изчислени директно от оригиналните данни.

Функция NORM.REV

Това е квантил на нормалното разпределение, т.е. стойността на обратната функция. Синтаксисът е както следва.

=NORM.REV(вероятност,средно,стандартно_отклонение)

вероятност- вероятност

средно– математическо очакване

standard_off– стандартно отклонение

Целта е същата като НОРМА.СТ.ОБ, само функцията работи с данни от всякакъв мащаб.

Пример е показан във видеото в края на статията.

Моделиране на нормалното разпределение

Някои проблеми изискват генериране на нормални произволни числа. Няма готова функция за това. Excel обаче има две функции, които връщат произволни числа: СЛУЧАЙ МЕЖДУИ РАНД.Първият произвежда произволни, равномерно разпределени цели числа в определени граници. Втората функция генерира равномерно разпределени произволни числа между 0 и 1. За да направите изкуствена извадка с дадено разпределение, имате нужда от функцията РАНД.

Да кажем, че за провеждане на експеримент е необходимо да се получи извадка от нормално разпределена популация с очакване 10 и стандартно отклонение 3. За една произволна стойност ще напишем формула в Excel.

НОРМА.ИНВ(РАНД();10;3)

Нека го разширим до необходимия брой клетки и нормалната проба е готова.

За да моделирате стандартизирани данни, трябва да използвате NORM.ST.REV.

Процесът на преобразуване на унифицирани числа в нормални числа може да бъде показан на следната диаграма. От унифицираните вероятности, които се генерират от формулата RAND, се начертават хоризонтални линии към графиката на функцията на нормалното разпределение. След това, от точките на пресичане на вероятностите с графиката, проекциите се спускат върху хоризонталната ос.

в сравнение с други видове дистрибуции. Основната характеристика на това разпределение е, че всички други закони за разпределение се стремят към този закон с безкрайно повторение на броя на тестовете. Как се получава това разпределение?

Нека си представим, че след като сте взели ръчен динамометър, се намирате на най-многолюдното място във вашия град. И предлагаш на всеки минаващ да си премери силата като стисне динамометъра с дясната или лявата ръка. Записвате внимателно показанията на динамометъра. След известно време, с достатъчно голям брой тестове, начертахте показанията на динамометъра на абсцисната ос, а на ординатната ос броят на хората, които „изцедиха“ това показание. Получените точки бяха свързани с гладка линия. Резултатът е кривата, показана на фиг. 9.8. Появата на тази крива няма да се промени много с увеличаването на времето на експеримента. Освен това от определен момент нататък новите стойности само ще прецизират кривата, без да променят нейната форма.


ориз. 9.8.

Сега нека преместим нашия динамометър в атлетическата зала и да повторим експеримента. Сега максимумът на кривата ще се измести надясно, левият край ще бъде леко затегнат, докато десният край ще бъде по-стръмен (фиг. 9.9).


ориз. 9.9.

Имайте предвид, че максималната честота за второто разпределение (точка B) ще бъде по-ниска от максималната честота за първото разпределение (точка A). Това може да се обясни с факта, че общият брой на хората, които посещават спортната зала, ще бъде по-малък от броя на хората, преминали близо до експериментатора в първия случай (в центъра на града на доста пренаселено място). Максимумът е изместен надясно, тъй като спортните зали се посещават от физически по-силни хора в сравнение с общия фон.

И накрая, ще посетим училища, детски градини и старчески домове с една и съща цел: да разкрием силата на ръцете на посетителите на тези места. И отново кривата на разпределението ще има подобна форма, но сега очевидно левият й край ще е по-стръмен, а десният ще е по-изтеглен. И както във втория случай, максимумът (точка С) ще бъде под точка А (фиг. 9.10).


ориз. 9.10.

Това забележително свойство на нормалното разпределение - запазване на формата на кривата на плътност на вероятностите (фиг. 8 - 10) е забелязано и описано през 1733 г. от Moivre, а след това е изследвано от Gauss.

В научните изследвания, в технологиите, в масови явления или експерименти, когато говорим за многократно повтарящи се случайни променливи при постоянни експериментални условия, те казват, че резултатите от теста претърпяват случайно разсейване, подчинявайки се на закона на кривата на нормалното разпределение

(21)

Къде е най-често срещаното събитие. По правило във формула (21) вместо параметъра, . Освен това, колкото по-дълга е експерименталната серия, толкова по-малко параметърът ще се различава от математическото очакване. Площта под кривата (фиг. 9.11) се приема за равна на единица. Площта, съответстваща на всеки интервал от оста x, е числено равна на вероятността случаен резултат да попадне в този интервал.


ориз. 9.11.

Нормалната функция на разпределение има формата


(22)

Обърнете внимание, че нормалната крива (фиг. 9.11) е симетрична по отношение на правата линия и асимптотично се доближава до оста OX при .

Нека изчислим математическото очакване за нормалния закон


(23)

Свойства на нормалното разпределение

Нека разгледаме основните свойства на това важно разпределение.

Имот 1. Нормалната функция на плътност на разпределение (21) е дефинирана по цялата ос x.

Имот 2. Нормалната функция на плътност на разпределение (21) е по-голяма от нула за която и да е област на дефиниция ().

Имот 3. При безкрайно нарастване (намаляване) функцията на разпределение (21) клони към нула .

Имот 4. Когато функцията на разпределение, дадена от (21), има най-голяма стойност, равна на

(24)

Имот 5. Графиката на функцията (фиг. 9.11) е симетрична спрямо правата линия.

Имот 6. Графиката на функцията (фиг. 9.11) има две инфлексни точки, симетрични по отношение на правата линия:

(25)

Имот 7. Всички нечетни централни моменти са нула. Обърнете внимание, че като се използва свойство 7, асиметрията на функцията се определя от формулата. Ако, тогава те заключават, че изследваното разпределение е симетрично по отношение на правата линия. Ако , тогава те казват, че серията е изместена надясно (десният клон на графиката е по-плосък или стегнат). Ако , тогава серията се счита за изместена наляво (по-плоският ляв клон на графиката на фиг. 9.12).


ориз. 9.12.

Имот 8. Ексцесът на разпределението е равен на 3. На практика той често се изчислява и степента на „компресия“ или „размазване“ на графиката се определя от близостта на тази стойност до нула (фиг. 9.13). И тъй като е свързано с , в крайна сметка характеризира степента на честотна дисперсия на данните. И тъй като определя

(истински, строго положителен)

Нормално разпределение, наричан още Гаусово разпределениеили Гаус - Лаплас- вероятностно разпределение, което в едномерния случай се определя от функцията за плътност на вероятността, съвпадаща с функцията на Гаус:

f (x) = 1 σ 2 π e − (x − μ) 2 2 σ 2 , (\displaystyle f(x)=(\frac (1)(\sigma (\sqrt (2\pi ))))\ ;e^(-(\frac ((x-\mu)^(2))(2\sigma ^(2)))),)

където параметърът μ е очакването (средна стойност), медианата и модата на разпределението, а параметърът σ е стандартното отклонение (σ² е дисперсията) на разпределението.

По този начин, едномерното нормално разпределение е двупараметърно семейство от разпределения. Многовариантният случай е описан в статията „Многовариантно нормално разпределение“.

Стандартно нормално разпределениесе нарича нормално разпределение с математическо очакване μ = 0 и стандартно отклонение σ = 1.

Енциклопедичен YouTube

  • 1 / 5

    Важността на нормалното разпределение в много области на науката (например математическа статистика и статистическа физика) следва от централната гранична теорема на теорията на вероятностите. Ако резултатът от едно наблюдение е сумата от много произволни слабо взаимозависими величини, всяка от които има малък принос спрямо общата сума, тогава с нарастването на броя на членовете разпределението на центрирания и нормализиран резултат има тенденция да бъде нормално. Този закон на теорията на вероятностите води до широкото разпространение на нормалното разпределение, което е една от причините за името му.

    Свойства

    Моменти

    Ако случайни променливи X 1 (\displaystyle X_(1))И X 2 (\displaystyle X_(2))са независими и имат нормално разпределение с математически очаквания μ 1 (\displaystyle \mu _(1))И μ 2 (\displaystyle \mu _(2))и вариации σ 1 2 (\displaystyle \sigma _(1)^(2))И σ 2 2 (\displaystyle \sigma _(2)^(2))съответно тогава X 1 + X 2 (\displaystyle X_(1)+X_(2))също има нормално разпределение с математическо очакване μ 1 + μ 2 (\displaystyle \mu _(1)+\mu _(2))и дисперсия σ 1 2 + σ 2 2 .(\displaystyle \sigma _(1)^(2)+\sigma _(2)^(2).)

    От това следва, че една нормална случайна променлива може да бъде представена като сума от произволен брой независими нормални случайни променливи.

    Максимална ентропия

    Нормалното разпределение има максимална диференциална ентропия сред всички непрекъснати разпределения, чиято дисперсия не надвишава дадена стойност.

    Моделиране на нормални псевдослучайни променливи Най-простите методи за приблизително моделиране се основават на централната гранична теорема. А именно, ако добавите няколко независими еднакво разпределени количества с крайна дисперсия, тогава сумата ще бъде разпределенаприблизително Добре. Например, ако добавите 100 независими като стандарт равномерно   разпределени случайни променливи, тогава разпределението на сумата ще бъде приблизително.

    За програмно генериране на нормално разпределени псевдослучайни променливи е за предпочитане да се използва трансформацията на Box-Muller. Тя ви позволява да генерирате една нормално разпределена стойност въз основа на една равномерно разпределена стойност.

    Нормално разпространение в природата и приложения

    Нормалното разпределение често се среща в природата. Например следните случайни променливи са добре моделирани от нормалното разпределение:

    • отклонение при стрелба.
    • грешки при измерване (обаче грешките на някои измервателни уреди нямат нормално разпределение).
    • някои характеристики на живите организми в популацията.

    Това разпределение е толкова широко разпространено, защото е безкрайно делимо непрекъснато разпределение с крайна дисперсия. Следователно някои други се доближават до него в границата, например бином и Поасон. Това разпределение моделира много недетерминирани физически процеси.

    Връзка с други дистрибуции

    • Нормалното разпределение е разпределение тип XI на Пиърсън.
    • Съотношението на двойка независими стандартни нормално разпределени случайни променливи има разпределение на Коши. Тоест, ако случайната променлива X (\displaystyle X)представлява отношението X = Y / Z (\displaystyle X=Y/Z)(Къде Y (\displaystyle Y)И Z (\displaystyle Z)- независими стандартни нормални случайни променливи), тогава ще има разпределение на Коши.
    • Ако z 1 , … , z k (\displaystyle z_(1),\ldots ,z_(k))- съвместно независими стандартни нормални случайни променливи, т.е z i ∼ N (0 , 1) (\displaystyle z_(i)\sim N\left(0,1\right)), след това случайната променлива x = z 1 2 + … + z k 2 (\displaystyle x=z_(1)^(2)+\ldots +z_(k)^(2))има разпределение хи-квадрат с k степени на свобода.
    • Ако случайната променлива X (\displaystyle X)подлежи на логнормално разпределение, тогава неговият естествен логаритъм има нормално разпределение. Тоест, ако X ∼ L o g N (μ , σ 2) (\displaystyle X\sim \mathrm (LogN) \left(\mu ,\sigma ^(2)\right)), Това Y = ln ⁡ (X) ∼ N (μ , σ 2) (\displaystyle Y=\ln \left(X\right)\sim \mathrm (N) \left(\mu ,\sigma ^(2)\right )). И обратното, ако Y ∼ N (μ , σ 2) (\displaystyle Y\sim \mathrm (N) \left(\mu ,\sigma ^(2)\right)), Това X = exp ⁡ (Y) ∼ L o g N (μ, σ 2) (\displaystyle X=\exp \left(Y\right)\sim \mathrm (LogN) \left(\mu ,\sigma ^(2) \точно)).
    • Съотношението на квадратите на две стандартни нормални случайни променливи има

    Нормално разпределение ( нормално разпределение) - играе важна роля при анализа на данни.

    Понякога вместо термина нормално разпространениеизползвайте термина Гаусово разпределениев чест на К. Гаус (по-стари термини, които практически не се използват днес: закон на Гаус, разпределение на Гаус-Лаплас).

    Едномерно нормално разпределение

    Нормалното разпределение има плътност::

    В тази формула фиксираните параметри са средно, - стандартен отклонение.

    Дадени са графики на плътност за различни параметри.

    Характеристичната функция на нормалното разпределение има формата:

    Разграничаване на характерната функция и настройка t = 0, получаваме моменти от всякакъв ред.

    Нормалната крива на плътност на разпределение е симетрична по отношение на и има единичен максимум в тази точка, равен на

    Параметърът на стандартното отклонение варира от 0 до ∞.

    Средно варира от -∞ до +∞.

    С увеличаването на параметъра кривата се разпространява по оста X, като се доближи до 0, той се свива около средната стойност (параметърът характеризира разпространението, разсейването).

    При смяна кривата се измества по оста X(вижте графиките).

    Променяйки параметрите и , получаваме различни модели на случайни променливи, които възникват в телефонията.

    Типично приложение на нормалния закон при анализа на, например, телекомуникационни данни е моделиране на сигнали, описващи шум, смущения, грешки и трафик.

    Графики на едномерно нормално разпределение

    Фигура 1. Диаграма на плътността на нормалното разпределение: средната стойност е 0, стандартното отклонение е 1

    Фигура 2. Диаграма на плътността на стандартното нормално разпределение с региони, съдържащи 68% и 95% от всички наблюдения

    Фигура 3. Графики на плътност на нормални разпределения с нулева средна стойност и различни отклонения (=0,5, =1, =2)

    Фигура 4 Графики на две нормални разпределения N(-2,2) и N(3,2).

    Забележете, че центърът на разпределението се е изместил при промяна на параметъра.

    Коментирайте

    В програмата STATISTICAОзначението N(3,2) се отнася до нормалния или Гаусов закон с параметрите: средно = 3 и стандартно отклонение =2.

    В литературата понякога вторият параметър се тълкува като дисперсия, т.е. квадратстандартно отклонение.

    Изчисляване на процентни точки на нормалното разпределение с помощта на вероятностен калкулатор STATISTICA

    Използване на вероятностен калкулатор STATISTICAМожете да изчислите различни характеристики на разпределенията, без да прибягвате до тромавите таблици, използвани в старите книги.

    Стъпка 1.Да стартираме Анализ / Калкулатор на вероятностите / Разпределения.

    В секцията за разпространение изберете нормално.

    Фигура 5. Стартиране на калкулатора на вероятностното разпределение

    Стъпка 2.Посочваме параметрите, които ни интересуват.

    Например, искаме да изчислим 95% квантил на нормално разпределение със средна стойност 0 и стандартно отклонение 1.

    Нека посочим тези параметри в полетата на калкулатора (вижте полетата на калкулатора средно и стандартно отклонение).

    Да въведем параметъра p=0.95.

    Квадратче за отметка „Обратно f.r.“ ще се появи автоматично. Поставете отметка в квадратчето „График“.

    Кликнете върху бутона „Изчисли“ в горния десен ъгъл.

    Фигура 6. Параметри за настройка

    Стъпка 3.В полето Z получаваме резултата: стойността на квантила е 1,64 (вижте следващия прозорец).

    Фигура 7. Преглед на резултата от калкулатора

    Фигура 8. Графики на плътност и функции на разпределение. Права линия x=1,644485

    Фигура 9. Графики на функцията на нормалното разпределение. Вертикални пунктирани линии - x=-1.5, x=-1, x=-0.5, x=0

    Фигура 10. Графики на функцията на нормалното разпределение. Вертикални пунктирани линии - x=0.5, x=1, x=1.5, x=2

    Оценка на параметрите на нормалното разпределение

    Стойностите на нормалното разпределение могат да бъдат изчислени с помощта на интерактивен калкулатор.

    Двумерно нормално разпределение

    Едномерното нормално разпределение естествено се обобщава до двуизмереннормално разпределение.

    Например, ако разглеждате сигнал само в една точка, тогава ви е достатъчно едномерно разпределение, в две точки - двумерно, в три точки - триизмерно и т.н.

    Общата формула за двумерното нормално разпределение е:

    Къде е двойната корелация между X 1И X 2;

    X 1съответно;

    Средно и стандартно отклонение на променлива X 2съответно.

    Ако случайни променливи X 1И X 2са независими, тогава корелацията е 0, = 0, съответно средният член в експонентата изчезва и имаме:

    f(x 1,x 2) = f(x 1)*f(x 2)

    За независими величини двумерната плътност се разлага на произведението на две едномерни плътности.

    Графики на плътност на двумерни нормални разпределения

    Фигура 11. График на плътност на двумерно нормално разпределение (нулев вектор на средните стойности, единична ковариационна матрица)

    Фигура 12. Разрез на графиката на плътността на двумерно нормално разпределение с равнина z=0.05

    Фигура 13. График на плътност на двумерно нормално разпределение (нулев вектор на очакваната стойност, ковариационна матрица с 1 на главния диагонал и 0,5 на страничния диагонал)

    Фигура 14. Разрез на графиката на плътността на двумерно нормално разпределение (нулев вектор на математическото очакване, ковариационна матрица с 1 на главния диагонал и 0,5 на страничния диагонал) по равнина z= 0,05

    Фигура 15. Диаграма на плътност на двумерно нормално разпределение (нулев вектор на очакваната стойност, ковариационна матрица с 1 на главния диагонал и -0,5 на страничния диагонал)

    Фигура 16. Разрез на графиката на плътността на двумерно нормално разпределение (нулев вектор на математическото очакване, ковариационна матрица с 1 на главния диагонал и -0,5 на страничния диагонал) по равнина z=0,05

    Фигура 17. Секции от графики на плътност на двумерно нормално разпределение с равнина z=0,05

    За да разберете по-добре двумерното нормално разпределение, опитайте да разрешите следния проблем.

    Задача. Погледнете графиката на двумерното нормално разпределение. Помислете, може ли да се представи като ротация на графиката на едномерно нормално разпределение? Кога трябва да използвате техниката на деформация?

    ) играе особено важна роля в теорията на вероятностите и най-често се използва при решаване на практически проблеми. Неговата основна характеристика е, че той е ограничаващ закон, към който други закони на разпределение се доближават при много общи типични условия. Например сумата от достатъчно голям брой независими (или слабо зависими) случайни променливи приблизително се подчинява на нормалния закон и това е вярно, колкото по-точно, колкото повече случайни променливи се сумират.

    Експериментално е доказано, че грешките при измерване, отклоненията в геометричните размери и положението на елементите на строителната конструкция по време на тяхното производство и монтаж, както и променливостта на физико-механичните характеристики на материалите и натоварванията, действащи върху строителните конструкции, са подчинени на нормалния закон.

    Почти всички случайни променливи са обект на разпределението на Гаус, чието отклонение от средните стойности е причинено от голям набор от случайни фактори, всеки от които поотделно е незначителен (централна гранична теорема).

    Нормално разпределениесе нарича разпределение на случайна непрекъсната променлива, за която плътността на вероятността има формата (фиг. 18.1).

    ориз. 18.1. Нормален закон за разпределение при 1< a 2 .

    (18.1)

    където a и са параметри на разпределението.

    Вероятностните характеристики на случайна променлива, разпределени по нормалния закон, са равни на:

    Математическо очакване (18.2)

    Дисперсия (18.3)

    Стандартно отклонение (18,4)

    Коефициент на асиметрия А = 0(18.5)

    Излишък д= 0. (18.6)

    Параметърът σ, включен в разпределението на Гаус, е равен на средното квадратично отношение на случайната променлива. величина Аопределя позицията на разпределителния център (виж фиг. 18.1) и стойността А— ширина на разпределение (фиг. 18.2), т.е. статистически разпределение около средната стойност.

    ориз. 18.2. Нормален закон на разпределение при σ 1< σ 2 < σ 3

    Вероятността за попадане в даден интервал (от x 1 до x 2) за нормално разпределение, както във всички случаи, се определя от интеграла на вероятностната плътност (18.1), който не се изразява чрез елементарни функции и се представя от специална функция, наречена функция на Лаплас (интеграл на вероятността).

    Едно от представянията на вероятностния интеграл:

    (18.7)

    величина Инаречен квантил

    Вижда се, че Ф(х) е нечетна функция, т.е. Ф(-х) = -Ф(х) . Стойностите на тази функция се изчисляват и представят под формата на таблици в техническа и учебна литература.


    Функцията на разпределение на нормалния закон (фиг. 18.3) може да се изрази чрез вероятностния интеграл:

    (18.9)

    ориз. 18.2. Нормална функция на разпределение.

    Вероятността случайна променлива, разпределена по нормален закон, да попадне в интервала от X.към x, се определя от израза:

    Трябва да се отбележи, че

    Ф(0) = 0; Ф(∞) = 0,5; Ф(-∞) = -0,5.

    Когато се решават практически задачи, свързани с разпределението, често е необходимо да се вземе предвид вероятността за попадане в интервал, който е симетричен по отношение на математическото очакване, ако дължината на този интервал, т.е. ако самият интервал има граница от до , имаме:

    При решаване на практически задачи границите на отклоненията на случайните променливи се изразяват чрез стандарта, стандартното отклонение, умножено по определен коефициент, който определя границите на областта на отклонения на случайната променлива.

    Вземайки и използвайки формула (18.10) и таблица Ф(х) (Приложение № 1), получаваме

    Тези формули показватче ако една случайна променлива има нормално разпределение, тогава вероятността нейното отклонение от средната стойност с не повече от σ е 68,27%, с не повече от 2σ е 95,45% и с не повече от 3σ - 99,73%.

    Тъй като стойността на 0,9973 е близка до единица, се счита за практически невъзможно нормалното разпределение на случайна променлива да се отклони от математическото очакване с повече от 3σ. Това правило, което е валидно само за нормалното разпределение, се нарича правило на трите сигми. Вероятно е нарушението му P = 1 - 0,9973 = 0,0027. Това правило се използва при установяване на границите на допустимите отклонения на допустимите отклонения на геометричните характеристики на продуктите и конструкциите.