Нормализирани случайни променливи. Числени характеристики на система от две случайни величини. Ковариация и коефициент на корелация Центрирана стойност

По-горе се запознахме със законите на разпределение на случайни променливи. Всеки закон за разпределение изчерпателно описва свойствата на вероятностите на случайна променлива и прави възможно изчисляването на вероятностите за всякакви събития, свързани със случайна променлива. Въпреки това, в много практически въпроси няма нужда от такова пълно описание и често е достатъчно да се посочат само отделни числени параметри, които характеризират съществените характеристики на разпределението. Например средната стойност, около която са разпръснати стойностите на случайна променлива, някакво число, характеризиращо големината на това разсейване. Тези числа имат за цел да изразят в сбита форма най-съществените характеристики на разпределението и се наричат числени характеристики на случайна променлива.

Сред числовите характеристики на случайните променливи, ние разглеждаме предимно характеристиките, които фиксират позицията на случайната променлива върху числовата ос, т.е. някаква средна стойност на случайна променлива, около която са групирани нейните възможни стойности. От характеристиките на позицията в теорията на вероятностите най-голяма роля играят математическо очакване, което понякога се нарича просто средна стойност на случайната променлива.

Да приемем, че дискретният SV? x ( , x 2 ,..., x nс вероятности r j, p 2,... в Ptvтези. дадени по серии за разпространение

Възможно е при тези експерименти стойността x xнаблюдавани N (пъти, стойност x 2 - N 2пъти,..., стойност x n - N nведнъж. В същото време + N 2 +... + N n = N.

Средно аритметично на резултатите от наблюдението

Ако Нстрахотно, т.е. Н- "О, тогава

описващ центъра на разпространение. Средната стойност на случайна величина, получена по този начин, ще се нарича математическо очакване. Нека дадем словесна формулировка на определението.

Определение 3.8. Математическо очакване (MO) дискретно SV% е число, равно на сумата от продуктите на всички негови възможни стойности и вероятностите на тези стойности (нотация M;):

Сега разгледайте случая, когато броят на възможните стойности на дискретния SV? имаме RR

Формулата за математическото очакване остава същата, само в горната граница на сумата псе заменя с оо, т.е.

В този случай вече получаваме серия, която може да се разминава, т.е. съответният CB^ може да няма математическо очакване.

Пример 3.8. SV?, дадени от серията за разпространение

Нека намерим MO на този SV.

Решение.По определение. тези. планинатане съществува.

По този начин, в случай на изброим брой стойности на SV, получаваме следната дефиниция.

Определение 3.9. Математическо очакване, или средна стойност, дискретно SV,имащ изброим брой стойности е число, равно на сумата от поредица от продукти на всички възможни стойности със съответните вероятности, при условие че тази серия се сближава абсолютно, т.е.

Ако този ред се разминава или се сближава условно, тогава те казват, че CB ^ няма математическо очакване.

Нека преминем от дискретна SV към непрекъсната с плътност p(x).

Определение 3.10. Математическо очакване, или средна стойност, непрекъснат CBсе нарича число, равно на

при условие, че този интеграл се сближава абсолютно.

Ако този интеграл се разминава или се сближава условно, тогава те казват, че непрекъснатият SV няма математическо очакване.

Забележка 3.8.Ако всички възможни стойности на случайната променлива J;

принадлежат само на интервала ( А; б),това

Математическото очакване не е единствената характеристика на позицията, използвана в теорията на вероятностите. Понякога те се използват, например, като мода и медиана.

Определение 3.11. Мода CB^ (обозначение Мот,)нейната най-вероятна стойност се нарича, т.е. това, за което вероятността p iили плътност на вероятността p(x)достига най-голямата си стойност.

Определение 3.12. Медиана SV?, (обозначение срещнах)неговата стойност се нарича за което P(t> Met) = P(? > срещнах) = 1/2.

Геометрично, за непрекъснат NE, медианата е абсцисата на тази точка на оста оза който площите, лежащи отляво и отдясно на него, са еднакви и равни на 1/2.

Пример 3.9. NEт,има серия за разпространение

Нека намерим математическото очакване, модата и медианата на SV

Решение. МЪ,= 0-0,1 + 1 0,3 + 2 0,5 + 3 0,1 = 1,6. L/o? = 2. Аз(?) не съществува.

Пример 3.10. Непрекъснатият CB% има плътност

Нека намерим математическото очакване, медианата и модата.

Решение.

p(x)достига максимум, тогава Очевидно е, че медианата също е равна, тъй като площите от дясната и лявата страна на линията, минаваща през точката, са равни.

В допълнение към характеристиките на позицията в теорията на вероятностите се използват редица числени характеристики за различни цели. Сред тях началните и централните моменти са от особено значение.

Определение 3.13. Начален момент от k-ти ред SV?, наречено математическо очакване к-тоградуси на това количество: =M(t>k).

От дефинициите на математическото очакване за дискретни и непрекъснати случайни променливи следва, че


Забележка 3.9.Очевидно началният момент на 1-ви ред е математическото очакване.

Преди да дефинираме централния момент, въвеждаме нова концепция за центрирана случайна променлива.

Определение 3.14. Центрирано SV е отклонението на случайна променлива от нейното математическо очакване, т.е.

Лесно е да се провери това

Центрирането на случайна променлива очевидно е еквивалентно на преместване на началото в точка M;. Моментите на центрирана случайна величина се наричат централни точки.

Определение 3.15. Централен момент от k-ти ред SV% се нарича математическо очакване к-тостепен на центрирана случайна променлива:

От определението за математическо очакване следва, че


Очевидно за всяка случайна променлива ^ централният момент от 1-ви ред е равен на нула: c x= M(? 0) = 0.

Втората централна точка е от особено значение за практиката. с 2.Нарича се дисперсия.

Определение 3.16. Дисперсия SV?, се нарича математическото очакване на квадрата на съответната центрирана величина (нотация D?)

За да изчислите дисперсията, можете да получите следните формули директно от дефиницията:


Трансформирайки формула (3.4), можем да получим следната формула за изчисление DL;.

SV дисперсията е характеристика дисперсия, разсейването на стойностите на случайна променлива около нейното математическо очакване.

Дисперсията има размерността на квадрата на случайна променлива, което не винаги е удобно. Следователно за по-голяма яснота е удобно да се използва число, чиято размерност съвпада с размерността на случайната променлива като характеристика на дисперсията. За да направите това, вземете корен квадратен от дисперсията. Получената стойност се нарича стандартно отклонениеслучайна променлива. Ще го обозначим с a: a = l/s.

За неотрицателен SV? понякога се използва като характеристика коефициент на вариация, равно на отношението на стандартното отклонение към математическото очакване:

Познавайки математическото очакване и стандартното отклонение на случайна променлива, можете да получите приблизителна представа за обхвата на възможните му стойности. В много случаи можем да предположим, че стойностите на случайната променлива% само понякога попадат извън интервала M; ± За. Това правило за нормалното разпределение, което ще обосновем по-късно, се нарича правило три сигма.

Очакването и дисперсията са най-често използваните числени характеристики на случайна променлива. От определението за математическо очакване и дисперсия следват някои прости и доста очевидни свойства на тези числени характеристики.

Протозоисвойства на математическото очакване и дисперсията.

1. Математическо очакване на неслучайна стойност сравна на самата стойност c: M(s) = s.

Наистина, тъй като стойността сприема само една стойност с вероятност 1, тогава M(c) = с 1 = s.

2. Дисперсията на неслучайната величина c е равна на нула, т.е. D(c) = 0.

наистина Dc = M(s - Mc) 2 = M(s- в) 2 = М( 0) = 0.

3. Като знак на математическото очакване може да се изведе неслучаен множител: M(c^) = cМ(?,).

Нека демонстрираме валидността на това свойство, използвайки примера на дискретна SV.

Нека SV е дадено от серия на разпределение

Тогава

следователно

Свойството се доказва по подобен начин за непрекъсната случайна променлива.

4. Неслучайният множител може да бъде изваден от знака на квадратната дисперсия:

Колкото повече моменти на една случайна променлива са известни, толкова по-подробно разбиране на закона за разпределение имаме.

В теорията на вероятностите и нейните приложения се използват още две числови характеристики на случайна променлива, базирани на централните моменти от 3-ти и 4-ти ред – коефициент на асиметрия, или m x.

За дискретни случайни променливи математическо очакване :

Сумата от стойностите на съответната стойност по вероятността на случайни променливи.

Мода (Mod) на случайна променлива X е нейната най-вероятна стойност.

За дискретна случайна променлива. За непрекъсната случайна променлива.


Унимодално разпределение


Мултимодална дистрибуция

Като цяло, Mod and математическо очакване не

мач.

Медиана (Med) на случайна променлива X е стойност, за която вероятността P(X Мед). Всяко разпределение на Med може да има само едно.


Med разделя площта под кривата на 2 равни части. В случай на едномодално и симетрично разпределение

Моменти.

Най-често в практиката се използват моменти от два вида: начален и централен.

Начален момент. Редът на дискретна случайна променлива X се нарича сума от формата:

За непрекъсната случайна променлива X началният момент на подреждане се нарича интеграл , очевидно е, че математическото очакване на случайна променлива е първият начален момент.

Използвайки знака (оператора) M, началният момент на тита поръчка може да бъде представен като мат. очакване на степен th на някаква случайна променлива.

Центрирано Случайната променлива на съответната случайна променлива X е отклонението на случайната променлива X от нейното математическо очакване:

Математическото очакване на центрирана случайна променлива е 0.

За дискретни случайни променливи имаме:


Моментите на центрирана случайна величина се наричат Централни моменти

Централен момент на реда случайна променлива X се нарича математическо очакване на степен th на съответната центрирана случайна променлива.

За дискретни случайни променливи:

За непрекъснати случайни променливи:

Връзка между централни и начални моменти от различни порядъци

От всички моменти като характеристика на случайна величина най-често се използват първият момент (математическо очакване) и вторият централен момент.

Вторият централен момент се нарича дисперсия случайна променлива. Има означение:

Според определението

За дискретна случайна променлива:

За непрекъсната случайна променлива:

Дисперсията на случайна променлива е характеристика на дисперсията (разсейването) на случайните променливи X около нейното математическо очакване.

дисперсияозначава дисперсия. Дисперсията има размерността на квадрата на случайната променлива.

За визуално характеризиране на дисперсията е по-удобно да се използва количеството m y същото като размерността на случайната променлива. За тази цел коренът се взема от дисперсията и стойност, наречена - стандартно отклонение (RMS) случайна променлива X и се въвежда обозначението:

Стандартното отклонение понякога се нарича „стандарт“ на случайната променлива X.

Математическо очакванедискретна случайна променлива е сумата от продуктите на всички възможни стойности и техните вероятности

Коментирайте.От дефиницията следва, че математическото очакване на дискретна случайна променлива е неслучайна (постоянна) величина.

Математическото очакване на непрекъсната случайна променлива може да се изчисли с помощта на формулата

M(X) =
.

Математическото очакване е приблизително равно на(колкото по-точно, толкова по-голям е броят на тестовете) средно аритметично от наблюдаваните стойности на случайна променлива.

Свойства на математическото очакване.

Имот 1. Математическото очакване на постоянна стойност е равно на самата константа:

Имот 2. Постоянният фактор може да бъде изваден от знака за математическо очакване:

Имот 3. Математическото очакване на произведението на две независими случайни променливи е равно на произведението на техните математически очаквания:

M(XY) =M(X) *M(Y).

Имот 4. Математическото очакване на сумата от две случайни променливи е равно на сумата на математическите очаквания на членовете:

M(X+Y) =M(X) +M(Y).

12.1. Дисперсия на случайна величина и нейните свойства.

На практика често е необходимо да се открие разсейването на случайна променлива около нейната средна стойност. Например в артилерията е важно да се знае колко близо ще паднат снарядите близо до целта, която трябва да бъде ударена.

На пръв поглед може да изглежда, че най-лесният начин за оценка на дисперсията е да се изчислят всички възможни отклонения на случайна променлива и след това да се намери тяхната средна стойност. Този път обаче няма да даде нищо, тъй като средната стойност на отклонението, т.е. M, за всяка случайна променлива е нула.

Затова най-често те поемат по друг път - използват дисперсията, за да го изчислят.

Дисперсия(разсейване) на случайна променлива е математическото очакване на квадрата на отклонението на случайна променлива от нейното математическо очакване:

D(X) = M2.

За да се изчисли дисперсията, често е удобно да се използва следната теорема.

Теорема. Дисперсията е равна на разликата между математическото очакване на квадрата на случайната променлива X и квадрата на нейното математическо очакване.

D(X) = M(X 2) – 2.

Свойства на дисперсията.

Имот 1. Дисперсия на постоянна стойностВравно на нула:

Имот 2. Константният коефициент може да се повдигне до знака на дисперсията, като се повдигне на квадрат:

D(CX) =C 2 D(X).

Имот 3. Дисперсията на сумата от две независими случайни променливи е равна на сумата от дисперсиите на тези променливи:

D(X+Y) =D(X) +D(Y).

Имот 4. Дисперсията на разликата между две независими случайни променливи е равна на сумата от техните дисперсии:

D(X–Y) =D(X) +D(Y).

13.1. Нормализирани случайни променливи.

има дисперсия, равна на 1, и математическо очакване, равно на 0.

Нормализирана случайна променлива V е отношението на дадена случайна променлива X към нейното стандартно отклонение σ

Стандартно отклонениее корен квадратен от дисперсията

Математическото очакване и дисперсията на нормализираната случайна променлива V се изразяват чрез характеристиките на X, както следва:

където v е коефициентът на вариация на оригиналната случайна променлива X.

За функцията на разпределение F V (x) и плътността на разпределение f V (x) имаме:

F V (x) =F(σx), f V (x) =σf(σx),

Къде F(x)– функция на разпределение на оригиналната случайна променлива X, А f(x)– неговата плътност на вероятността.

Началните и централните моменти от различни порядки обикновено се разглеждат като числени характеристики на система от произволен двумерен вектор (X,Y).

Начален момент на поръчка k+sна система от две случайни променливи (X,Y) или двумерен случаен вектор е математическото очакване на произведението на X k от Y s

a k , s =M (1)

Централен момент на ред k+sсистема от две случайни променливи (X,Y) се нарича математическо очакване на продукта от

където , са центрирани случайни променливи.

Центриранослучайна променлива е отклонението на случайна променлива от нейното математическо очакване.

За система от дискретни случайни променливи (X,Y) получаваме

P(X=x i ,Y=y j )=p ij

За система от непрекъснати случайни променливи (X,Y)

По редначалният (или централен момент) се нарича сбор от неговите индекси k+s.

Начални моменти от първи ред:

a 1,0 = M = M[X] = m x, a 1,0 = m x

a 0.1 = M = m y , a 0.1 = m y (7)

представляват математическите очаквания на случайните променливи X и Y.

Централните моменти от първи ред естествено са равни на нула.

Начални моменти от втори ред:

Централни моменти от втори ред:

Първите два момента представляват дисперсия, а третият се нарича ковариация(или корелационен момент) случайни променливи (X,Y), означени с K xy:

По дефиниция на ковариацията

Kxy = Kyx (11)

тези. Когато индексите се разменят, ковариацията не се променя.

Дисперсията на случайните променливи може да се разглежда като специален случай на ковариация:

тези. дисперсията на случайни променливи не е нищо повече от „неговата ковариация със себе си“. (За независими случайни променливи ковариацията е 0. Докажете го сами).

Удобно е ковариацията K xy да се изрази по отношение на началните моменти от по-ниски редове:

K xy =a 1.1 -a 1.0 ×a 0.1 или K xy =M-M[X]×M[Y] (13)

Полезно е да запомните тази формула: ковариацията на две случайни променливи е равна на очакваната стойност на техния продукт минус произведението на техните очаквани стойности.

Ковариацията характеризира не само степента на зависимост на случайните величини, но и тяхната дисперсия около точката (m x ,m y).

Размерността на ковариацията е равна на произведението на размерностите на случайните величини X и Y. За да се получи безразмерна величина, която характеризира само зависимостта, ковариацията се разделя на произведението на с.с. s x s y.

r xy =K xy /s x s y (14)

Величината r xy се нарича коефициент на корелацияслучайни величини X и Y. Този коефициент характеризира само степента линеензависимости на тези величини. Зависимостта се проявява във факта, че когато една случайна променлива нараства, другата също има тенденция да се увеличава (или намалява). В първия случай, r xy >0 и се казва, че случайните променливи X и Y са положително корелирани; във втория, r xy<0, и корреляция отрицательна.


За всякакви случайни променливи X и Y

Ако ковариацията на две случайни променливи е нула: K xy =0, тогава случайните променливи X и Y се наричат некорелирани, ако K xy ¹0, тогава корелирани.

От независимостта на случайните променливи следва, че те са некорелирани; но от некорелираността на случайните променливи (r xy =0) тяхната независимост все още не следва. Ако r xy =0, това означава само липса на линейна връзкамежду случайни променливи; може да има всякакъв друг тип връзка.