Закон распределения вероятностей дискретной двумерной случайной величины. Системы случайных величин Закон и функция распределения двумерной случайной величины

двумерный дискретный распределение случайный

Зачастую результат опыта описывается несколькими случайными величинами: . Например, погоду в данном месте в определенное время суток можно охарактеризовать следующими случайными величинами: Х 1 - температура, Х 2 - давление, Х 3 - влажность воздуха, Х 4 - скорость ветра.

В этом случае говорят о многомерной случайной величине или о системе случайных величин.

Рассмотрим двумерную случайную величину, возможные значения которой есть пары чисел. Геометрически двумерную случайную величину можно истолковать как случайную точку на плоскости.

Если составляющие Х и Y - дискретные случайные величины, то - дискретная двумерная случайная величина, а если Х и Y - непрерывные, то - непрерывная двумерная случайная величина.

Законом распределения вероятностей двумерной случайной величины называют соответствие между возможными значениями и их вероятностями.

Закон распределения двумерной дискретной случайной величины может быть задан в виде таблицы с двойным входом (см. таблица 6.1), где - вероятность того, что составляющая Х приняла значение x i , а составляющая Y - значение y j .

Таблица 6.1.1.

y 1

y 2

y j

y m

x 1

p 11

p 12

p 1j

p 1m

x 2

p 21

p 22

p 2j

p 2m

x i

p i1

p i2

p ij

p im

x n

p n1

p n2

p nj

p nm

Так как события, составляют полную группу попарно несовместных событий, то сумма вероятностей равна 1, т.е.

Из таблицы 6.1 можно найти законы распределения одномерных составляющих Х и Y .

Пример 6.1.1 . Найти законы распределения составляющих Х и Y, если задано распределение двумерной случайной величины в виде таблицы 6.1.2.

Таблица 6.1.2.

Если зафиксировать значение одного из аргументов, например, то полученное распределение величины Х называется условным распределением. Аналогично определяется условное распределение Y .

Пример 6.1.2 . По распределению двумерной случайной величины, заданной табл. 6.1.2, найти: а) условный закон распределения составляющей Х при условии; б) условный закон распределения Y при условии, что.

Решение. Условные вероятности составляющих Х и Y вычисляются по формулам

Условный закон распределения Х при условии имеет вид

Контроль: .

Закон распределения двумерной случайной величины можно задать в виде функции распределения , определяющей для каждой пары чисел вероятность того, что Х примет значение, меньшее х , и при этом Y примет значение, меньшее y :

Геометрически функция означает вероятность попадания случайной точки в бесконечный квадрат с вершиной в точке (рис. 6.1.1).

Отметим свойства.

  • 1. Область значений функции - , т.е. .
  • 2. Функция - неубывающая функция по каждому аргументу.
  • 3. Имеют место предельные соотношения:

При функция распределения системы становится равной функции распределения составляющей Х , т.е. .

Аналогично, .

Зная, можно найти вероятность попадания случайной точки в пределы прямоугольника ABCD.

А именно,

Пример 6.1.3 . Двумерная дискретная случайная величина задана таблицей распределения

Найти функцию распределения.

Решение. Значение в случае дискретных составляющих Х и Y находится суммированием всех вероятностей с индексами i и j , для которых, . Тогда, если и, то (события и - невозможны). Аналогично получаем:

если и, то;

если и, то;

если и, то;

если и, то;

если и, то;

если и, то;

если и, то;

если и, то;

если и, то.

Полученные результаты оформим в виде таблицы (6.1.3) значений:

Для двумерной непрерывной случайной величины вводится понятие плотности вероятности

Геометрическая плотность вероятности представляет собой поверхность распределения в пространстве

Двумерная плотность вероятности обладает следующими свойствами:

3. Функция распределения может быть выражена через по формуле

4. Вероятность попадания непрерывной случайной величины в область равна

5. В соответствии со свойством (4) функции имеют место формулы:

Пример 6.1.4. Задана функция распределения двумерной случайной величины

Двумерной называют случайную величину (X , Y ), возможные значения которой есть пары чисел (x, у ). Составляющие X и Y , рассматриваемые одновременно, образуют систему двух случайных величин.

Двумерную величину геометрически можно истолковать как случайную точку M (Х ; Y ) на плоскости xOy либо как случайный вектор OM .

Дискретной называют двумерную величину, составляющие которой дискретны.

Непрерывной называют двумерную величину, составляющие которой непрерывны.

Законом распределения вероятностей двумерной случайной величины называют соответствие между возможными значениями и их вероятностями.

Закон распределения дискретной двумерной случайной величины может быть задан: а) в виде таблицы с двойным входом, содержащей возможные значения и их вероятности; б) аналитически, например в виде функции распределения.

Функцией распределения вероятностей двумерной случайной величины называют функцию F(x, у) , определяющую для каждой пары чисел (x, у) вероятность того, что X примет значение, меньшее x, и при этом Y примет значение, меньшее y :

F(x, у) = Р(Х < x, Y < y).

Геометрически это равенство можно истолковать так: F(х, у) есть вероятность того, что случайная точка (X, Y ) попадет в бесконечный квадрант с вершиной (x,y) , расположенный левее и ниже этой вершины.

Иногда вместо термина «функция распределения» используют термин «интегральная функция».

Функция распределения обладает следующими свойствами:

Свойство 1 . Значения функции распределения удовлетворяют двойному неравенству

0 ≤ F (x, у) ≤ 1.

Свойство 2 . Функция распределения есть неубывающая функция по каждому аргументу :

F(x 2 , y) ≥ F(x 1 , y), если x 2 > x 1 ,

F(x, y 2) ≥ F(x, y 1), если y 2 > y 1 .

Свойство 3 . Имеют место предельные соотношения :

1) F(–∞, y) = 0,

3) F(–∞, –∞) = 0,

2) F(x, –∞) = 0,

4) F(∞, ∞) = 1.

Свойство 4 . а) При у =∞ функция распределения системы становится функцией распределения составляющей X :

F(x, ∞) = F 1 (x).

б) При x = ∞ функция распределения системы становится функцией распределения составляющей Y :



F(∞, y) = F 2 (y).

Используя функцию распределения, можно найти вероятность попадания случайной точки в прямоугольник x 1 < X < x 2 , y 1 < Y < у 2 :

P(x 1 < X < x 2 , y 1 < Y < у 2) = – .

Плотностью совместного распределения вероятностей (двумерной плотностью вероятности) непрерывной двумерной случайной величины называют вторую смешанную производную от функции распределения:

Иногда вместо термина «двумерная плотность вероятности» используют термин «дифференциальная функция системы».

Плотность совместного распределения можно рассматривать как предел отношения вероятности попадания случайной точки в прямоугольник со сторонами Dx и Dy к площади этого прямоугольника, когда обе его стороны стремятся к нулю; геометрически ее можно истолковать как поверхность, которую называют поверхностью распределения .

Зная плотность распределения, можно найти функцию распределения по формуле

Вероятность попадания случайной точки (X, Y) в область D определяется равенством

Двумерная плотность вероятности обладает следующими свойствами:

Свойство 1 . Двумерная плотность вероятности неотрицательна :

f(x,y) ≥ 0.

Свойство 2 . Двойной несобственный интеграл с бесконечными пределами от двумерной плотности вероятности равен единице :

В частности, если все возможные значения (X, У) принадлежат конечной области D, то

226. Задано распределение вероятностей дискретной двумерной случайной величины:

Найти законы распределения составляющих.

228. Задана функция распределения двумерной случайной величины

Найти вероятность попадания случайной точки (X, Y x = 0, x = p/4, y = p/6, y = p/3.

229. Найти вероятность попадания случайной точки (X, Y ) в прямоугольник, ограниченный прямыми x = 1, x = 2, y = 3, y = 5, если известна функция распределения

230. Задана функция распределения двумерной случайной величины

Найти двумерную плотность вероятности системы.

231. В круге x 2 + y 2 ≤ R 2 двумерная плотность вероятности ; вне круга f(x, y)= 0. Найти: а) постоянную C ; б) вероятность попадания случайной точки (X, Y ) в круг радиуса r = 1 с центром в начале координат, если R = 2.

232. В первом квадранте задана функция распределения системы двух случайных величин F(x, y) = 1 + 2 - x – 2 - y + 2 - x- y . Найти: а) двумерную плотность вероятности системы; б) вероятность попадания случайной точки (X, Y ) в треугольник с вершинами A (1; 3), B (3; 3), C (2; 8).

8.2. Условные законы распределения вероятностей составляющих
дискретной двумерной случайной величины

Пусть составляющие X и Y дискретны и имеют соответственно следующие возможные значения: x 1 , x 2 , …, x n ; y 1 , y 2 , …, y m .

Условным распределением составляющей X при Y=y j (j сохраняет одно и то же значение при всех возможных значениях X) называют совокупность условных вероятностей

p(x 1 |y j), p(x 2 |y j), …, p(x n |y j).

Аналогично определяется условное распределение Y.

Условные вероятности составляющих X и Y вычисляют соответственно по формулам

Для контроля вычислений целесообразно убедиться, что сумма вероятностей условного распределения равна единице.

233. Задана дискретная двумерная случайная величина (X, Y ):

Найти: а) условный закон распределения X при условии, что Y =10; б) условный закон распределения Y при условии, что X =6.

8.3. Отыскание плотностей и условных законов распределения
составляющих непрерывной двумерной случайной величины

Плотность распределения одной из составляющих равна несобственному интегралу с бесконечными пределами от плотности совместного распределения системы, причем переменная интегрирования соответствует другой составляющей:

Здесь предполагается, что возможные значения каждой из составляющих принадлежат всей числовой оси; если же возможные значения принадлежат конечному интервалу, то в качестве пределов интегрирования принимают соответствующие конечные числа.

Условной плотностью распределения составляющей X при заданном значении Y = y называют отношение плотности совместного распределения системы к плотности распределения составляющей Y :

Аналогично определяется условная плотность распределения составляющей Y :

Если условные плотности распределения случайных величин X и Y равны их безусловным плотностям, то такие величины независимы.

Равномерным называют распределение двумерной непрерывной случайной величины (X, Y ), если в области, которой принадлежат все возможные значения (x, у ), плотность совместного распределения вероятностей сохраняет постоянное значение.

235. Задана плотность совместного распределения непрерывной двумерной случайной величины (X, Y)

Найти: а) плотности распределения составляющих; б) условные плотности распределения, составляющих.

236. Плотность совместного распределения непрерывной двумерной случайной величины (X, Y )

Найти: а) постоянный множитель C ; б) плотности распределения составляющих; в) условные плотности распределения составляющих.

237. Непрерывная двумерная случайная величина (X, У ) распределена равномерно внутри прямоугольника с центром симметрии в начале координат и сторонами 2а и 2b, параллельными координатным осям. Найти: а) двумерную плотность вероятности системы; б) плотности распределения составляющих.

238. Непрерывная двумерная случайная величина (X, У ) равномерно распределена внутри прямоугольного треугольника с вершинами O (0; 0), А (0; 8), В (8;0). Найти: а) двумерную плотность вероятности системы; б) плотности и условные плотности распределения составляющих.

8.4. Числовые характеристики непрерывной системы
двух случайных величин

Зная плотности распределения составляющих X и Y непрерывной двумерной случайной величины (X, У), можно найти их математические ожидания и дисперсии:

Иногда удобнее использовать формулы, содержащие двумерную плотность вероятности (двойные интегралы берутся по области возможных значений системы):

Начальным, моментом n k, s порядка k+s системы (X, Y ) называют математическое ожидание произведения X k Y s :

n k, s = M.

В частности,

n 1,0 = M(X), n 0,1 = M(Y).

Центральным моментом m k, s порядка k+s системы (X, Y ) называют математическое ожидание произведения отклонений соответственно k -й и s -й степеней:

m k, s = M{ k ∙ s }.

В частности,

m 1,0 =M = 0, m 0,1 = M = 0;

m 2,0 =M 2 = D(X), m 0,2 = M 2 = D(Y);

Корреляционным моментом m xу системы (X, Y ) называют центральный момент m 1,1 порядка 1 + 1:

m xу = M{ ∙ }.

Коэффициентом корреляции величин X и Y называют отношение корреляционного момента к произведению средних квадратических отклонений этих величин:

r xy = m xy / (s x s y).

Коэффициент корреляции – безразмерная величина, причем |r xy | ≤ 1. Коэффициент корреляции служит для оценки тесноты линейной связи между X и Y : чем ближе абсолютная величина коэффициента корреляции к единице, тем связь сильнее; чем ближе абсолютная величина коэффициента корреляции к нулю, тем связь слабее.

Коррелированными называют две случайные величины, если их корреляционный момент отличен от нуля.

Некоррелированными называют две случайные величины, если их корреляционный момент равен нулю.

Две коррелированные величины также и зависимы; если две величины зависимы, то они могут быть как коррелированными, так и некоррелированными. Из независимости двух величин следует их некоррелированность, но из некоррелированности еще нельзя сделать вывод о независимости этих величин (для нормально распределенных величин из некоррелированности этих величин вытекает их независимость).

Для непрерывных величин X и Y корреляционный момент может быть найден по формулам:

239. Задана плотность совместного распределения непрерывной двумерной случайной величины (X, Y):

Найти: а) математические ожидания; б) дисперсии составляющих X и Y.

240. Задана плотность совместного распределения непрерывной двумерной случайной величины (X, Y):

Найти математические ожидания и дисперсии составляющих.

241. Задана плотность совместного распределения непрерывной двумерной случайной величины (X, Y): f(x, y) = 2 cosx cosy в квадрате 0 ≤ x ≤p/4, 0 ≤ y ≤p/4; вне квадрата f(x, y) = 0. Найти математические ожидания составляющих.

242. Доказать, что если двумерную плотность вероятности системы случайных величин (X, Y ) можно представить в виде произведения двух функций, одна из которых зависит только от x , а другая – только от y , то величины X и Y независимы.

243. Доказать, что если X и Y связаны линейной зависимостью Y = aX + b , то абсолютная величина коэффициента корреляции равна единице.

Решение . По определению коэффициента корреляции,

r xy = m xy / (s x s y).

m xу = M{ ∙ }. (*)

Найдем математическое ожидание Y :

M(Y) = M = aM(X) + b. (**)

Подставив (**) в (*), после элементарных преобразований получим

m xу = aM 2 = aD(X) = as 2 x .

Учитывая, что

Y – M(Y) = (aX + b) – (aM(X) + b) = a,

найдем дисперсию Y :

D(Y) = M 2 = a 2 M 2 = a 2 s 2 x .

Отсюда s y = |a|s x . Следовательно, коэффициент корреляции

Если a > 0, то r xy = 1; если a < 0, то r xy = –1.

Итак, |r xy | = 1, что и требовалось доказать.

Упорядоченная пара (X , Y) случайных величин X и Y называется двумерной случайной величиной, или случайным вектором двумерного пространства. Двумерная случайная величина (X,Y) называется также системой случайных величина X и Y. Множество всех возможных значений дискретной случайной величины с их вероятностями называется законом распределения этой случайной величины. Дискретная двумерная случайная величина (X , Y) считается заданной, если известен ее закон распределения:

P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2...,m

Назначение сервиса . С помощью сервиса по заданному закону распределения можно найти:

  • ряды распределения X и Y, математическое ожидание M[X], M[Y], дисперсию D[X], D[Y];
  • ковариацию cov(x,y), коэффициент корреляции r x,y , условный ряд распределения X, условное математическое ожидание M;
Кроме этого, дается ответ на вопрос, "зависимы ли случайные величины X и Y ?".

Инструкция . Укажите размерность матрицы распределения вероятностей (количество строк и столбцов) и ее вид. Полученное решение сохраняется в файле Word .

Пример №1 . Двумерная дискретная случайная величина имеет таблицу распределения:

Y/X 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 q
Найти величину q и коэффициент корреляции этой случайной величины.

Решение. Величину q найдем из условия Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0.91+q = 1. Откуда q = 0.09

Пользуясь формулой ∑P(xi ,yj ) = pi (j=1..n), находим ряд распределения X.

Математическое ожидание M[Y] .
M[y] = 1*0.05 + 2*0.46 + 3*0.34 + 4*0.15 = 2.59
Дисперсия D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Среднее квадратическое отклонение σ(y) = sqrt(D[Y]) = sqrt(0.64) = 0.801

Ковариация cov(X,Y) = M - M[X]·M[Y] = 2·10·0.11 + 3·10·0.12 + 4·10·0.03 + 2·20·0.13 + 3·20·0.09 + 4·20·0.02 + 1·30·0.02 + 2·30·0.11 + 3·30·0.08 + 4·30·0.01 + 1·40·0.03 + 2·40·0.11 + 3·40·0.05 + 4·40·0.09 - 25.2 · 2.59 = -0.068
Коэффициент корреляции r xy = cov(x,y)/σ(x)&sigma(y) = -0.068/(11.531*0.801) = -0.00736

Пример 2 . Данные статистической обработки сведений относительно двух показателей X и Y отражены в корреляционной таблице. Требуется:

  1. написать ряды распределения для X и Y и вычислить для них выборочные средние и выборочные средние квадратические отклонения;
  2. написать условные ряды распределения Y/x и вычислить условные средние Y/x;
  3. изобразить графически зависимость условных средних Y/x от значений X;
  4. рассчитать выборочный коэффициент корреляции Y на X;
  5. написать выборочное уравнение прямой регрессии;
  6. изобразить геометрически данные корреляционной таблицы и построить прямую регрессии.
Решение . Упорядоченная пара (X,Y) случайных величин X и Y называется двумерной случайной величиной, или случайным вектором двумерного пространства. Двумерная случайная величина (X,Y) называется также системой случайных величина X и Y.
Множество всех возможных значений дискретной случайной величины с их вероятностями называется законом распределения этой случайной величины.
Дискретная двумерная случайная величина (X,Y) считается заданной, если известен ее закон распределения:
P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2..,m
X / Y 20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
События (X=x i , Y=y j) образуют полную группу событий, поэтому сумма всех вероятностей p ij (i=1,2...,n, j=1,2..,m ), указанных в таблице, равна 1.
1. Зависимость случайных величин X и Y .
Находим ряды распределения X и Y.
Пользуясь формулой ∑P(xi ,yj ) = pi (j=1..n), находим ряд распределения X. Математическое ожидание M[Y] .
M[y] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14)/100 = 42.3
Дисперсия D[Y] .
D[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42.3 2 = 99.71
Среднее квадратическое отклонение σ(y) .

Поскольку, P(X=11,Y=20) = 2≠2·6, то случайные величины X и Y зависимы .
2. Условный закон распределения X .
Условный закон распределения X(Y=20) .
P(X=11/Y=20) = 2/6 = 0.33
P(X=16/Y=20) = 4/6 = 0.67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Условное математическое ожидание M = 11*0.33 + 16*0.67 + 21*0 + 26*0 + 31*0 + 36*0 = 14.33
Условная дисперсия D = 11 2 *0.33 + 16 2 *0.67 + 21 2 *0 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 14.33 2 = 5.56
Условный закон распределения X(Y=30) .
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0.67
P(X=21/Y=30) = 3/9 = 0.33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Условное математическое ожидание M = 11*0 + 16*0.67 + 21*0.33 + 26*0 + 31*0 + 36*0 = 17.67
Условная дисперсия D = 11 2 *0 + 16 2 *0.67 + 21 2 *0.33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17.67 2 = 5.56
Условный закон распределения X(Y=40) .
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0.11
P(X=26/Y=40) = 45/55 = 0.82
P(X=31/Y=40) = 4/55 = 0.0727
P(X=36/Y=40) = 0/55 = 0
Условное математическое ожидание M = 11*0 + 16*0 + 21*0.11 + 26*0.82 + 31*0.0727 + 36*0 = 25.82
Условная дисперсия D = 11 2 *0 + 16 2 *0 + 21 2 *0.11 + 26 2 *0.82 + 31 2 *0.0727 + 36 2 *0 - 25.82 2 = 4.51
Условный закон распределения X(Y=50) .
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0.13
P(X=26/Y=50) = 8/16 = 0.5
P(X=31/Y=50) = 6/16 = 0.38
P(X=36/Y=50) = 0/16 = 0
Условное математическое ожидание M = 11*0 + 16*0 + 21*0.13 + 26*0.5 + 31*0.38 + 36*0 = 27.25
Условная дисперсия D = 11 2 *0 + 16 2 *0 + 21 2 *0.13 + 26 2 *0.5 + 31 2 *0.38 + 36 2 *0 - 27.25 2 = 10.94
Условный закон распределения X(Y=60) .
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0.29
P(X=31/Y=60) = 7/14 = 0.5
P(X=36/Y=60) = 3/14 = 0.21
Условное математическое ожидание M = 11*0 + 16*0 + 21*0 + 26*0.29 + 31*0.5 + 36*0.21 = 30.64
Условная дисперсия D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0.29 + 31 2 *0.5 + 36 2 *0.21 - 30.64 2 = 12.37
3. Условный закон распределения Y .
Условный закон распределения Y(X=11) .
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Условное математическое ожидание M = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Условная дисперсия D = 20 2 *1 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 20 2 = 0
Условный закон распределения Y(X=16) .
P(Y=20/X=16) = 4/10 = 0.4
P(Y=30/X=16) = 6/10 = 0.6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Условное математическое ожидание M = 20*0.4 + 30*0.6 + 40*0 + 50*0 + 60*0 = 26
Условная дисперсия D = 20 2 *0.4 + 30 2 *0.6 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 26 2 = 24
Условный закон распределения Y(X=21) .
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0.27
P(Y=40/X=21) = 6/11 = 0.55
P(Y=50/X=21) = 2/11 = 0.18
P(Y=60/X=21) = 0/11 = 0
Условное математическое ожидание M = 20*0 + 30*0.27 + 40*0.55 + 50*0.18 + 60*0 = 39.09
Условная дисперсия D = 20 2 *0 + 30 2 *0.27 + 40 2 *0.55 + 50 2 *0.18 + 60 2 *0 - 39.09 2 = 44.63
Условный закон распределения Y(X=26) .
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0.79
P(Y=50/X=26) = 8/57 = 0.14
P(Y=60/X=26) = 4/57 = 0.0702
Условное математическое ожидание M = 20*0 + 30*0 + 40*0.79 + 50*0.14 + 60*0.0702 = 42.81
Условная дисперсия D = 20 2 *0 + 30 2 *0 + 40 2 *0.79 + 50 2 *0.14 + 60 2 *0.0702 - 42.81 2 = 34.23
Условный закон распределения Y(X=31) .
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0.24
P(Y=50/X=31) = 6/17 = 0.35
P(Y=60/X=31) = 7/17 = 0.41
Условное математическое ожидание M = 20*0 + 30*0 + 40*0.24 + 50*0.35 + 60*0.41 = 51.76
Условная дисперсия D = 20 2 *0 + 30 2 *0 + 40 2 *0.24 + 50 2 *0.35 + 60 2 *0.41 - 51.76 2 = 61.59
Условный закон распределения Y(X=36) .
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Условное математическое ожидание M = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Условная дисперсия D = 20 2 *0 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *1 - 60 2 = 0
Ковариация .
cov(X,Y) = M - M[X]·M[Y]
cov(X,Y) = (20·11·2 + 20·16·4 + 30·16·6 + 30·21·3 + 40·21·6 + 50·21·2 + 40·26·45 + 50·26·8 + 60·26·4 + 40·31·4 + 50·31·6 + 60·31·7 + 60·36·3)/100 - 25.3 · 42.3 = 38.11
Если случайные величины независимы, то их ковариации равна нулю. В нашем случае cov(X,Y) ≠ 0.
Коэффициент корреляции .


Уравнение линейной регрессии с y на x имеет вид:

Уравнение линейной регрессии с x на y имеет вид:

Найдем необходимые числовые характеристики.
Выборочные средние:
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42.3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25.3
Дисперсии:
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3))/100 - 42.3 2 = 99.71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36 2 (3))/100 - 25.3 2 = 24.01
Откуда получаем среднеквадратические отклонения:
σ x = 9.99 и σ y = 4.9
и ковариация:
Cov(x,y) = (20·11·2 + 20·16·4 + 30·16·6 + 30·21·3 + 40·21·6 + 50·21·2 + 40·26·45 + 50·26·8 + 60·26·4 + 40·31·4 + 50·31·6 + 60·31·7 + 60·36·3)/100 - 42.3 · 25.3 = 38.11
Определим коэффициент корреляции:


Запишем уравнения линий регрессии y(x):

и вычисляя, получаем:
y x = 0.38 x + 9.14
Запишем уравнения линий регрессии x(y):

и вычисляя, получаем:
x y = 1.59 y + 2.15
Если построить точки, определяемые таблицей и линии регрессии, увидим, что обе линии проходят через точку с координатами (42.3; 25.3) и точки расположены близко к линиям регрессии.
Значимость коэффициента корреляции .

По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=100-m-1 = 98 находим t крит:
t крит (n-m-1;α/2) = (98;0.025) = 1.984
где m = 1 - количество объясняющих переменных.
Если t набл > t критич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).
Поскольку t набл > t крит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим.

Задание . Количество попаданий пар значений случайных величин X и Y в соответствующие интервалы приведены в таблице. По этим данным найти выборочный коэффициент корреляции и выборочные уравнения прямых линий регрессии Y на X и X на Y .
Решение

Пример . Распределение вероятностей двумерной случайной величины (X, Y) задано таблицей. Найти законы распределения составляющих величин X, Y и коэффициент корреляции p(X, Y).
Скачать решение

Задание . Двумерная дискретная величина (X, Y) задана законом распределения. Найти законы распределения составляющих X и Y, ковариацию и коэффициент корреляции.