Двумерна случайна променлива. Закон за разпределение на вероятностите за дискретна двумерна случайна променлива

Нека е дадена двумерна случайна променлива $(X,Y)$.

Определение 1

Законът за разпределение на двумерна случайна променлива $(X,Y)$ е множеството от възможни двойки числа $(x_i,\ y_j)$ (където $x_i \epsilon X,\ y_j \epsilon Y$) и техните вероятности $p_(ij)$ .

Най-често законът за разпределение на двумерна случайна променлива се записва под формата на таблица (Таблица 1).

Фигура 1. Закон за разпределение на двумерна случайна променлива.

Да си спомним сега теоремата за събирането на вероятности от независими събития.

Теорема 1

Вероятността за сумата от краен брой независими събития $(\A)_1$, $(\A)_2$, ... ,$\(\A)_n$ се ​​изчислява по формулата:

Използвайки тази формула, можете да получите законите за разпределение за всеки компонент на двумерна случайна променлива, тоест:

От това ще следва, че сумата от всички вероятности на двумерна система има следния вид:

Нека разгледаме подробно (стъпка по стъпка) проблема, свързан с концепцията за закона за разпределение на двумерна случайна променлива.

Пример 1

Законът за разпределение на двумерна случайна променлива е даден от следната таблица:

Фигура 2.

Намерете законите на разпределение на случайните променливи $X,\ Y$, $X+Y$ и проверете във всеки случай дали общата сума на вероятностите е равна на единица.

  1. Нека първо намерим разпределението на случайната променлива $X$. Случайната променлива $X$ може да приема стойностите $x_1=2,$ $x_2=3$, $x_3=5$. За да намерим разпределението, ще използваме теорема 1.

Нека първо намерим сумата от вероятностите $x_1$, както следва:

Фигура 3.

По същия начин намираме $P\left(x_2\right)$ и $P\left(x_3\right)$:

\ \

Фигура 4.

  1. Нека сега намерим разпределението на случайната променлива $Y$. Случайната променлива $Y$ може да приема стойностите $x_1=1, $$x_2=3$, $x_3=4$. За да намерим разпределението, ще използваме теорема 1.

Нека първо намерим сумата от вероятностите $y_1$, както следва:

Фигура 5.

По същия начин намираме $P\left(y_2\right)$ и $P\left(y_3\right)$:

\ \

Това означава, че законът за разпределение на стойността $X$ има следния вид:

Фигура 6.

Нека проверим равенството на общата сума на вероятностите:

  1. Остава да намерим закона за разпределение на случайната величина $X+Y$.

За удобство нека го обозначим с $Z$: $Z=X+Y$.

Първо, нека намерим какви стойности може да приеме това количество. За да направим това, ще добавим стойностите на $X$ и $Y$ по двойки. Получаваме следните стойности: 3, 4, 6, 5, 6, 8, 6, 7, 9. Сега, като изхвърлим съответстващите стойности, откриваме, че случайната променлива $X+Y$ може да приема стойностите $z_1 =3,\ z_2=4 ,\ z_3=5,\ z_4=6,\ z_5=7,\ z_6=8,\ z_7=9.\ $

Нека първо намерим $P(z_1)$. Тъй като стойността на $z_1$ е единица, тя се намира, както следва:

Фигура 7.

Всички вероятности с изключение на $P(z_4)$ се намират по подобен начин:

Нека сега намерим $P(z_4)$ както следва:

Фигура 8.

Това означава, че законът за разпределение на стойността $Z$ има следния вид:

Фигура 9.

Нека проверим равенството на общата сума на вероятностите:

Подредена двойка (X, Y) от случайни променливи X и Y се нарича двумерна случайна променлива или случаен вектор в двумерно пространство. Двумерна случайна променлива (X, Y) се нарича още система от случайни променливи X и Y. Наборът от всички възможни стойности на дискретна случайна променлива с техните вероятности се нарича закон за разпределение на тази случайна променлива. Дискретна двумерна случайна променлива (X, Y) се счита за дадена, ако е известен нейният закон за разпределение:

P(X=x i, Y=y j) = p ij, i=1,2...,n, j=1,2...,m

Цел на услугата. Използвайки услугата, съгласно даден закон за разпространение, можете да намерите:

  • серии на разпределение X и Y, математическо очакване M[X], M[Y], дисперсия D[X], D[Y];
  • ковариация cov(x,y), коефициент на корелация r x,y, условна серия на разпределение X, условно очакване M;
Освен това е даден отговор на въпроса „Зависят ли случайните променливи X и Y?“

Инструкции. Посочете размерността на матрицата на вероятностното разпределение (брой редове и колони) и нейния тип. Полученото решение се записва във файл на Word.

Пример №1. Двумерна дискретна случайна променлива има таблица на разпределение:

Y/X 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 р
Намерете стойността на q и коефициента на корелация на тази случайна променлива.

Решение. Стойността на q намираме от условието Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0,91+q = 1. Откъде идва q = 0,09?

Използвайки формулата ∑P(x азй) = p аз(j=1..n), намираме серията на разпределение X.

Очакване M[Y].
M[y] = 1*0,05 + 2*0,46 + 3*0,34 + 4*0,15 = 2,59
Дисперсия D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Стандартно отклонениеσ(y) = sqrt(D[Y]) = sqrt(0,64) = 0,801

Ковариация cov(X,Y) = M - M[X] M[Y] = 2 10 0,11 + 3 10 0,12 + 4 10 0,03 + 2 20 0,13 + 3 20 0,09 + 4 ·20·0,02 + 1·30·0,02 + 2·30·0,11 + 3·30·0,08 + 4·30·0,01 + 1·40·0,03 + 2·40·0,11 + 3·40·0,05 + 4·40 ·0,09 - 25,2 · 2,59 = -0,068
Коефициент на корелация r xy = cov(x,y)/σ(x)&sigma(y) = -0,068/(11,531*0,801) = -0,00736

Пример 2. данни статистическа обработкаинформация относно два показателя X и Y са отразени в корелационната таблица. Задължително:

  1. напишете серии на разпределение за X и Y и изчислете примерни средни стойности и примерни стандартни отклонения за тях;
  2. напишете условни серии на разпределение Y/x и изчислете условни средни Y/x;
  3. изобразяват графично зависимостта на условните средни Y/x от X стойностите;
  4. изчислете примерния коефициент на корелация Y върху X;
  5. напишете примерно уравнение за предна регресия;
  6. изобразете геометрично данните от корелационната таблица и изградете регресионна линия.
Решение. Подредена двойка (X,Y) от случайни променливи X и Y се нарича двумерна случайна променлива или случаен вектор в двумерно пространство. Двумерна случайна променлива (X,Y) се нарича още система от случайни променливи X и Y.
Наборът от всички възможни стойности на дискретна случайна променлива с техните вероятности се нарича закон за разпределение на тази случайна променлива.
Дискретна двумерна случайна променлива (X,Y) се счита за дадена, ако е известен нейният закон за разпределение:
P(X=x i, Y=y j) = p ij, i=1,2...,n, j=1,2..,m
X/Y20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Събитията (X=x i, Y=y j) образуват пълна група от събития, следователно сумата от всички вероятности p ij ( i=1,2...,n, j=1,2..,m), посочено в таблицата, е равно на 1.
1. Зависимост на случайните величини X и Y.
Намерете сериите на разпределение X и Y.
Използвайки формулата ∑P(x азй) = p аз(j=1..n), намираме серията на разпределение X. Очакване M[Y].
M[y] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14)/100 = 42,3
Дисперсия D[Y].
D[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42,3 2 = 99,71
Стандартно отклонение σ(y).

Тъй като P(X=11,Y=20) = 2≠2 6, тогава случайните променливи X и Y зависим.
2. Закон за условно разпределение X.
Закон за условно разпределение X(Y=20).
P(X=11/Y=20) = 2/6 = 0,33
P(X=16/Y=20) = 4/6 = 0,67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Условно математическо очакване M = 11*0,33 + 16*0,67 + 21*0 + 26*0 + 31*0 + 36*0 = 14,33
Условна дисперсия D = 11 2 *0,33 + 16 2 *0,67 + 21 2 *0 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 14,33 2 = 5,56
Закон за условно разпределение X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0,67
P(X=21/Y=30) = 3/9 = 0,33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Условно математическо очакване M = 11*0 + 16*0,67 + 21*0,33 + 26*0 + 31*0 + 36*0 = 17,67
Условна дисперсия D = 11 2 *0 + 16 2 *0,67 + 21 2 *0,33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17,67 2 = 5,56
Закон за условно разпределение X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0,11
P(X=26/Y=40) = 45/55 = 0,82
P(X=31/Y=40) = 4/55 = 0,0727
P(X=36/Y=40) = 0/55 = 0
Условно математическо очакване M = 11*0 + 16*0 + 21*0,11 + 26*0,82 + 31*0,0727 + 36*0 = 25,82
Условна дисперсия D = 11 2 *0 + 16 2 *0 + 21 2 *0,11 + 26 2 *0,82 + 31 2 *0,0727 + 36 2 *0 - 25,82 2 = 4,51
Закон за условно разпределение X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0,13
P(X=26/Y=50) = 8/16 = 0,5
P(X=31/Y=50) = 6/16 = 0,38
P(X=36/Y=50) = 0/16 = 0
Условно математическо очакване M = 11*0 + 16*0 + 21*0,13 + 26*0,5 + 31*0,38 + 36*0 = 27,25
Условна дисперсия D = 11 2 *0 + 16 2 *0 + 21 2 *0,13 + 26 2 *0,5 + 31 2 *0,38 + 36 2 *0 - 27,25 2 = 10,94
Закон за условно разпределение X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0,29
P(X=31/Y=60) = 7/14 = 0,5
P(X=36/Y=60) = 3/14 = 0,21
Условно математическо очакване M = 11*0 + 16*0 + 21*0 + 26*0,29 + 31*0,5 + 36*0,21 = 30,64
Условна дисперсия D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0,29 + 31 2 *0,5 + 36 2 *0,21 - 30,64 2 = 12,37
3. Закон за условно разпределение Y.
Закон за условно разпределение Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Условно математическо очакване M = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Условна дисперсия D = 20 2 *1 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 20 2 = 0
Закон за условно разпределение Y(X=16).
P(Y=20/X=16) = 4/10 = 0,4
P(Y=30/X=16) = 6/10 = 0,6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Условно математическо очакване M = 20*0,4 + 30*0,6 + 40*0 + 50*0 + 60*0 = 26
Условна дисперсия D = 20 2 *0,4 + 30 2 *0,6 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 26 2 = 24
Закон за условно разпределение Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0,27
P(Y=40/X=21) = 6/11 = 0,55
P(Y=50/X=21) = 2/11 = 0,18
P(Y=60/X=21) = 0/11 = 0
Условно математическо очакване M = 20*0 + 30*0,27 + 40*0,55 + 50*0,18 + 60*0 = 39,09
Условна дисперсия D = 20 2 *0 + 30 2 *0,27 + 40 2 *0,55 + 50 2 *0,18 + 60 2 *0 - 39,09 2 = 44,63
Закон за условно разпределение Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0,79
P(Y=50/X=26) = 8/57 = 0,14
P(Y=60/X=26) = 4/57 = 0,0702
Условно математическо очакване M = 20*0 + 30*0 + 40*0,79 + 50*0,14 + 60*0,0702 = 42,81
Условна дисперсия D = 20 2 *0 + 30 2 *0 + 40 2 *0,79 + 50 2 *0,14 + 60 2 *0,0702 - 42,81 2 = 34,23
Закон за условно разпределение Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0,24
P(Y=50/X=31) = 6/17 = 0,35
P(Y=60/X=31) = 7/17 = 0,41
Условно математическо очакване M = 20*0 + 30*0 + 40*0,24 + 50*0,35 + 60*0,41 = 51,76
Условна дисперсия D = 20 2 *0 + 30 2 *0 + 40 2 *0,24 + 50 2 *0,35 + 60 2 *0,41 - 51,76 2 = 61,59
Закон за условно разпределение Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Условно математическо очакване M = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Условна дисперсия D = 20 2 *0 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *1 - 60 2 = 0
Ковариация.
cov(X,Y) = M - M[X]·M[Y]
cov(X,Y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 25,3 42,3 = 38,11
Ако случайните променливи са независими, тогава тяхната ковариация е нула. В нашия случай cov(X,Y) ≠ 0.
Коефициент на корелация.


Уравнението на линейната регресия от y до x е:

Уравнението на линейната регресия от x към y е:

Нека намерим необходимите числени характеристики.
Примерни средни стойности:
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42,3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25,3
Разлики:
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3) )/100 - 42,3 2 = 99,71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36 2 (3))/100 - 25,3 2 = 24,01
Откъде получаваме стандартните отклонения:
σ x = 9,99 и σ y = 4,9
и ковариация:
Cov(x,y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 42,3 25,3 = 38,11
Нека да определим коефициента на корелация:


Нека напишем уравненията на регресионните линии y(x):

и изчислявайки, получаваме:
y x = 0,38 x + 9,14
Нека запишем уравненията на регресионните линии x(y):

и изчислявайки, получаваме:
x y = 1,59 y + 2,15
Ако нанесем точките, определени от таблицата и регресионните линии, ще видим, че и двете линии минават през точката с координати (42.3; 25.3) и точките са разположени близо до регресионните линии.
Значение на коефициента на корелация.

Използвайки таблицата на Стюдънт с ниво на значимост α=0,05 и степени на свобода k=100-m-1 = 98, намираме t crit:
t crit (n-m-1;α/2) = (98;0,025) = 1,984
където m = 1 е броят на обяснителните променливи.
Ако t наблюдавано > t критично, тогава получената стойност на корелационния коефициент се счита за значима (нулевата хипотеза, според която корелационният коефициент е равен на нула, се отхвърля).
Тъй като t obs > t crit, ние отхвърляме хипотезата, че коефициентът на корелация е равен на 0. С други думи, коефициентът на корелация е статистически значим.

Упражнение. Броят на ударите на двойки стойности на случайни променливи X и Y в съответните интервали е даден в таблицата. Използвайки тези данни, намерете примерния коефициент на корелация и примерните уравнения на прави регресионни линии на Y върху X и X върху Y.
Решение

Пример. Вероятностното разпределение на двумерна случайна променлива (X, Y) е дадено от таблица. Намерете законите на разпределение на компонентните величини X, Y и корелационния коефициент p(X, Y).
Изтеглете решение

Упражнение. Двуизмерен дискретно количество(X, Y) се дава от закона за разпределение. Намерете законите на разпределение на компонентите X и Y, ковариацията и коефициента на корелация.

двумерно дискретно разпределение случайно

Често резултатът от експеримента се описва с няколко случайни променливи: . Например, времето на дадено място в определен час от деня може да се характеризира със следните случайни променливи: X 1 - температура, X 2 - налягане, X 3 - влажност на въздуха, X 4 - скорост на вятъра.

В този случай говорим за многомерна случайна величина или система от случайни величини.

Помислете за двумерна случайна променлива, чиито възможни стойности са двойки числа. Геометрично, двумерна случайна променлива може да се интерпретира като произволна точка в равнина.

Ако компонентите XИ Yса дискретни случайни променливи, тогава - дискретна двумерна случайна променлива и ако XИ Yса непрекъснати, тогава е непрекъсната двумерна случайна променлива.

Законът за разпределение на вероятностите на двумерна случайна променлива е съответствието между възможните стойности и техните вероятности.

Законът за разпределение на двумерна дискретна случайна променлива може да бъде определен под формата на таблица с двоен вход (виж таблица 6.1), където е вероятността компонентът Xпридоби значението х аз, и компонента Y- значение г й .

Таблица 6.1.1.

г 1

г 2

г й

г м

х 1

стр 11

стр 12

стр 1j

стр

х 2

стр 21

стр 22

стр 2j

стр

х аз

стр i1

стр i2

стр ij

стр им

х п

стр n1

стр n2

стр nj

стр nm

Тъй като събитията представляват пълна група от несъвместими по двойки събития, сумата от вероятностите е равна на 1, т.е.

От таблица 6.1 можете да намерите законите на разпределение на едномерните компоненти XИ Y.

Пример 6.1.1 . Намерете законите за разпределение на компонентите XИ Y,ако разпределението на двумерна случайна променлива е дадено под формата на таблица 6.1.2.

Таблица 6.1.2.

Ако фиксираме стойността на един от аргументите, например, тогава полученото разпределение на стойността Xнаречено условно разпределение. Условното разпределение се определя по подобен начин Y.

Пример 6.1.2 . Според разпределението на двумерна случайна величина, дадено в табл. 6.1.2, намерете: а) условния закон за разпределение на компонента Xпредвид това; б) закон за условно разпределение Yпри условие че.

Решение. Условни вероятности на компоненти XИ Yизчислени с помощта на формули

Закон за условно разпределение Xпри условие, че има формата

Контрол: .

Законът за разпределение на двумерна случайна променлива може да бъде определен във формата разпределителни функции, което определя за всяка двойка числа вероятността, че Xще вземе стойност по-малка от X, и в същото време Yще вземе стойност по-малка от г:

Геометрично, функцията означава вероятността произволна точка да попадне в безкраен квадрат с върха си в точката (фиг. 6.1.1).

Нека отбележим свойствата.

  • 1. Диапазонът от стойности на функцията е , т.е. .
  • 2. Функция - ненамаляваща функция за всеки аргумент.
  • 3. Има ограничителни отношения:

Когато функцията на разпределение на системата стане равна на функцията на разпределение на компонента X, т.е. .

По същия начин,.

Като знаете това, можете да намерите вероятността произволна точка да попадне в правоъгълника ABCD.

а именно

Пример 6.1.3. Двумерна дискретна случайна променлива се определя от таблица на разпределение

Намерете функцията на разпределение.

Решение. Стойност в случай на дискретни компоненти XИ Yсе намира чрез сумиране на всички вероятности с индекси азИ й, за което, . Тогава, ако и, тогава (събитията и са невъзможни). По същия начин получаваме:

ако и, тогава;

ако и, тогава;

ако и, тогава;

ако и, тогава;

ако и, тогава;

ако и, тогава;

ако и, тогава;

ако и, тогава;

ако и, тогава.

Нека представим получените резултати под формата на таблица (6.1.3) със стойности:

За двумерен непрекъснатслучайна променлива се въвежда концепцията за плътност на вероятността

Геометричната плътност на вероятността е разпределителна повърхност в пространството

Двумерната плътност на вероятността има следните свойства:

3. Функцията на разпределение може да се изрази чрез формулата

4. Вероятността непрекъсната случайна променлива да попадне в региона е равна на

5. В съответствие със свойство (4) на функцията са валидни следните формули:

Пример 6.1.4.Дадена е функцията на разпределение на двумерна случайна променлива

Определение.Ако две случайни променливи са дадени в едно и също пространство от елементарни събития XИ Y,тогава казват, че се дава двумерна случайна променлива (X,Y) .

Пример.Машината щампова стоманени керемиди. Контролирана дължина Xи ширина Y. − двумерен SV.

NE XИ Yимат свои собствени разпределителни функции и други характеристики.

Определение. Функция на разпределение на двумерна случайна променлива (X,Y) наречена функция.

Определение. Законът за разпределение на дискретна двумерна случайна променлива (X, Y) наречена маса

За двумерна дискретна SV.

Свойства:

2) ако , тогава ; ако , тогава ;

4) − функция на разпределение X;

− функция на разпределение Y.

Вероятност двумерните SV стойности да попаднат в правоъгълник:

Определение.Двумерна случайна променлива (X,Y)наречен непрекъснато , ако неговата функция на разпределение е непрекъснат на и има навсякъде (освен, може би, краен брой криви) непрекъсната смесена частична производна от 2-ри ред .

Определение. Плътността на съвместното разпределение на вероятностите на двумерен непрекъснат SV наречена функция.

Тогава очевидно .

Пример 1.Двумерен непрекъснат SV се определя от функцията на разпределение

Тогава плътността на разпределение има формата

Пример 2.Двумерен непрекъснат SV се определя от плътността на разпределение

Нека намерим неговата функция на разпределение:

Свойства:

3) за всяка област.

Нека е известна плътността на разпределение на ставите. Тогава плътността на разпределение на всеки от компонентите на двумерния SV се намира, както следва:

Пример 2 (продължение).

Някои автори наричат ​​плътност на разпределение на двумерните SW компоненти маргиналенплътности на разпределение на вероятностите .

Условни закони на разпределение на компонентите на система от дискретни SV.

Условна вероятност, където .

Условен закон за разпределение на компонента Xв:

X
Р

По същия начин за , където .

Нека създадем закон за условно разпределение Xпри Y= 2.

След това законът за условно разпределение

X -1
Р

Определение. Условна плътност на разпределение на компонента X при дадена стойност Y=yнаречен .

Подобни: .

Определение. Условно математически в очакване на дискретно SV Y at се нарича , където − виж по-горе.

Следователно, .

За непрекъснато NE Y .

Очевидно това е функция на аргумента X. Тази функция се нарича регресионна функция на Y върху X .

Определено по подобен начин регресионна функция X върху Y : .

Теорема 5. (За функцията на разпределение на независими SV)

NE XИ Y

Последица.Непрекъснато SV XИ Yса независими тогава и само ако .

В пример 1 на . Поради това СВ XИ Yнезависима.

Числени характеристики на компонентите на двумерна случайна величина

За дискретно SV:

За непрекъснат CB: .

Дисперсията и стандартното отклонение за всички SV се определят с помощта на същите формули, които са ни известни:

Определение.Точката се нарича център на дисперсия двумерен SV.

Определение. Ковариация (момент на корелация) SV се нарича

За дискретни SV: .

За непрекъснат CB: .

Формула за изчисление: .

За независими SV.

Неудобството на характеристиката е нейната размерност (квадратът на мерната единица на компонентите). Следното количество е без този недостатък.

Определение. Коефициент на корелация NE XИ Yнаречен

За независими SV.

За всяка двойка SV . Известно е, че ако и само ако, кога, къде.

Определение. NE XИ Yсе наричат некорелирани , Ако .

Връзка между корелация и SV зависимост:

− ако СВ XИ Yкорелирани, т.е. , тогава те са зависими; обратното не е вярно;

− ако СВ XИ Yзначи са независими ; обратното не е вярно.

Бележка 1.Ако NE XИ Yразпределени през нормален законИ , тогава те са независими.

Бележка 2.Практическо значение като мярка за зависимост е оправдано само когато съвместното разпределение на двойката е нормално или приблизително нормално. За произволни SV XИ Yможете да стигнете до погрешно заключение, т.е. Може би дори когато XИ Yса свързани чрез строга функционална зависимост.

Бележка3.В математическата статистика корелацията е вероятностна (статистическа) зависимост между величини, която най-общо казано няма строго функционален характер. Корелационната зависимост възниква, когато една от величините зависи не само от втората, но и от редица случайни фактори или когато сред условията, от които зависи една или друга величина, има условия, общи и за двете.

Пример 4.За СВ XИ Yот пример 3 намерете .

Решение.

Пример 5.Дадена е плътността на съвместното разпределение на двумерния SV.

Подредена двойка (X, Y) от случайни променливи X и Y се нарича двумерна случайна променлива или случаен вектор в двумерно пространство. Двумерна случайна променлива (X, Y) се нарича още система от случайни променливи X и Y. Наборът от всички възможни стойности на дискретна случайна променлива с техните вероятности се нарича закон за разпределение на тази случайна променлива. Дискретна двумерна случайна променлива (X, Y) се счита за дадена, ако е известен нейният закон за разпределение:

P(X=x i, Y=y j) = p ij, i=1,2...,n, j=1,2...,m

Цел на услугата. Използвайки услугата, съгласно даден закон за разпространение, можете да намерите:

  • серии на разпределение X и Y, математическо очакване M[X], M[Y], дисперсия D[X], D[Y];
  • ковариация cov(x,y), коефициент на корелация r x,y, условна серия на разпределение X, условно очакване M;
Освен това е даден отговор на въпроса „Зависят ли случайните променливи X и Y?“

Инструкции. Посочете размерността на матрицата на вероятностното разпределение (брой редове и колони) и нейния тип. Полученото решение се записва във файл на Word.

Пример №1. Двумерна дискретна случайна променлива има таблица на разпределение:

Y/X 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 р
Намерете стойността на q и коефициента на корелация на тази случайна променлива.

Решение. Стойността на q намираме от условието Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0,91+q = 1. Откъде идва q = 0,09?

Използвайки формулата ∑P(x азй) = p аз(j=1..n), намираме серията на разпределение X.

Очакване M[Y].
M[y] = 1*0,05 + 2*0,46 + 3*0,34 + 4*0,15 = 2,59
Дисперсия D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Стандартно отклонениеσ(y) = sqrt(D[Y]) = sqrt(0,64) = 0,801

Ковариация cov(X,Y) = M - M[X] M[Y] = 2 10 0,11 + 3 10 0,12 + 4 10 0,03 + 2 20 0,13 + 3 20 0,09 + 4 ·20·0,02 + 1·30·0,02 + 2·30·0,11 + 3·30·0,08 + 4·30·0,01 + 1·40·0,03 + 2·40·0,11 + 3·40·0,05 + 4·40 ·0,09 - 25,2 · 2,59 = -0,068
Коефициент на корелация r xy = cov(x,y)/σ(x)&sigma(y) = -0,068/(11,531*0,801) = -0,00736

Пример 2. Данните от статистическата обработка на информацията по два показателя X и Y са отразени в корелационната таблица. Задължително:

  1. напишете серии на разпределение за X и Y и изчислете примерни средни стойности и примерни стандартни отклонения за тях;
  2. напишете условни серии на разпределение Y/x и изчислете условни средни Y/x;
  3. изобразяват графично зависимостта на условните средни Y/x от X стойностите;
  4. изчислете примерния коефициент на корелация Y върху X;
  5. напишете примерно уравнение за предна регресия;
  6. изобразете геометрично данните от корелационната таблица и изградете регресионна линия.
Решение. Подредена двойка (X,Y) от случайни променливи X и Y се нарича двумерна случайна променлива или случаен вектор в двумерно пространство. Двумерна случайна променлива (X,Y) се нарича още система от случайни променливи X и Y.
Наборът от всички възможни стойности на дискретна случайна променлива с техните вероятности се нарича закон за разпределение на тази случайна променлива.
Дискретна двумерна случайна променлива (X,Y) се счита за дадена, ако е известен нейният закон за разпределение:
P(X=x i, Y=y j) = p ij, i=1,2...,n, j=1,2..,m
X/Y20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Събитията (X=x i, Y=y j) образуват пълна група от събития, следователно сумата от всички вероятности p ij ( i=1,2...,n, j=1,2..,m), посочено в таблицата, е равно на 1.
1. Зависимост на случайните величини X и Y.
Намерете сериите на разпределение X и Y.
Използвайки формулата ∑P(x азй) = p аз(j=1..n), намираме серията на разпределение X. Очакване M[Y].
M[y] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14)/100 = 42,3
Дисперсия D[Y].
D[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42,3 2 = 99,71
Стандартно отклонение σ(y).

Тъй като P(X=11,Y=20) = 2≠2 6, тогава случайните променливи X и Y зависим.
2. Закон за условно разпределение X.
Закон за условно разпределение X(Y=20).
P(X=11/Y=20) = 2/6 = 0,33
P(X=16/Y=20) = 4/6 = 0,67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Условно математическо очакване M = 11*0,33 + 16*0,67 + 21*0 + 26*0 + 31*0 + 36*0 = 14,33
Условна дисперсия D = 11 2 *0,33 + 16 2 *0,67 + 21 2 *0 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 14,33 2 = 5,56
Закон за условно разпределение X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0,67
P(X=21/Y=30) = 3/9 = 0,33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Условно математическо очакване M = 11*0 + 16*0,67 + 21*0,33 + 26*0 + 31*0 + 36*0 = 17,67
Условна дисперсия D = 11 2 *0 + 16 2 *0,67 + 21 2 *0,33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17,67 2 = 5,56
Закон за условно разпределение X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0,11
P(X=26/Y=40) = 45/55 = 0,82
P(X=31/Y=40) = 4/55 = 0,0727
P(X=36/Y=40) = 0/55 = 0
Условно математическо очакване M = 11*0 + 16*0 + 21*0,11 + 26*0,82 + 31*0,0727 + 36*0 = 25,82
Условна дисперсия D = 11 2 *0 + 16 2 *0 + 21 2 *0,11 + 26 2 *0,82 + 31 2 *0,0727 + 36 2 *0 - 25,82 2 = 4,51
Закон за условно разпределение X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0,13
P(X=26/Y=50) = 8/16 = 0,5
P(X=31/Y=50) = 6/16 = 0,38
P(X=36/Y=50) = 0/16 = 0
Условно математическо очакване M = 11*0 + 16*0 + 21*0,13 + 26*0,5 + 31*0,38 + 36*0 = 27,25
Условна дисперсия D = 11 2 *0 + 16 2 *0 + 21 2 *0,13 + 26 2 *0,5 + 31 2 *0,38 + 36 2 *0 - 27,25 2 = 10,94
Закон за условно разпределение X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0,29
P(X=31/Y=60) = 7/14 = 0,5
P(X=36/Y=60) = 3/14 = 0,21
Условно математическо очакване M = 11*0 + 16*0 + 21*0 + 26*0,29 + 31*0,5 + 36*0,21 = 30,64
Условна дисперсия D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0,29 + 31 2 *0,5 + 36 2 *0,21 - 30,64 2 = 12,37
3. Закон за условно разпределение Y.
Закон за условно разпределение Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Условно математическо очакване M = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Условна дисперсия D = 20 2 *1 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 20 2 = 0
Закон за условно разпределение Y(X=16).
P(Y=20/X=16) = 4/10 = 0,4
P(Y=30/X=16) = 6/10 = 0,6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Условно математическо очакване M = 20*0,4 + 30*0,6 + 40*0 + 50*0 + 60*0 = 26
Условна дисперсия D = 20 2 *0,4 + 30 2 *0,6 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 26 2 = 24
Закон за условно разпределение Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0,27
P(Y=40/X=21) = 6/11 = 0,55
P(Y=50/X=21) = 2/11 = 0,18
P(Y=60/X=21) = 0/11 = 0
Условно математическо очакване M = 20*0 + 30*0,27 + 40*0,55 + 50*0,18 + 60*0 = 39,09
Условна дисперсия D = 20 2 *0 + 30 2 *0,27 + 40 2 *0,55 + 50 2 *0,18 + 60 2 *0 - 39,09 2 = 44,63
Закон за условно разпределение Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0,79
P(Y=50/X=26) = 8/57 = 0,14
P(Y=60/X=26) = 4/57 = 0,0702
Условно математическо очакване M = 20*0 + 30*0 + 40*0,79 + 50*0,14 + 60*0,0702 = 42,81
Условна дисперсия D = 20 2 *0 + 30 2 *0 + 40 2 *0,79 + 50 2 *0,14 + 60 2 *0,0702 - 42,81 2 = 34,23
Закон за условно разпределение Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0,24
P(Y=50/X=31) = 6/17 = 0,35
P(Y=60/X=31) = 7/17 = 0,41
Условно математическо очакване M = 20*0 + 30*0 + 40*0,24 + 50*0,35 + 60*0,41 = 51,76
Условна дисперсия D = 20 2 *0 + 30 2 *0 + 40 2 *0,24 + 50 2 *0,35 + 60 2 *0,41 - 51,76 2 = 61,59
Закон за условно разпределение Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Условно математическо очакване M = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Условна дисперсия D = 20 2 *0 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *1 - 60 2 = 0
Ковариация.
cov(X,Y) = M - M[X]·M[Y]
cov(X,Y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 25,3 42,3 = 38,11
Ако случайните променливи са независими, тогава тяхната ковариация е нула. В нашия случай cov(X,Y) ≠ 0.
Коефициент на корелация.


Уравнението на линейната регресия от y до x е:

Уравнението на линейната регресия от x към y е:

Нека намерим необходимите числени характеристики.
Примерни средни стойности:
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42,3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25,3
Разлики:
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3) )/100 - 42,3 2 = 99,71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36 2 (3))/100 - 25,3 2 = 24,01
Откъде получаваме стандартните отклонения:
σ x = 9,99 и σ y = 4,9
и ковариация:
Cov(x,y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 42,3 25,3 = 38,11
Нека да определим коефициента на корелация:


Нека напишем уравненията на регресионните линии y(x):

и изчислявайки, получаваме:
y x = 0,38 x + 9,14
Нека запишем уравненията на регресионните линии x(y):

и изчислявайки, получаваме:
x y = 1,59 y + 2,15
Ако нанесем точките, определени от таблицата и регресионните линии, ще видим, че и двете линии минават през точката с координати (42.3; 25.3) и точките са разположени близо до регресионните линии.
Значение на коефициента на корелация.

Използвайки таблицата на Стюдънт с ниво на значимост α=0,05 и степени на свобода k=100-m-1 = 98, намираме t crit:
t crit (n-m-1;α/2) = (98;0,025) = 1,984
където m = 1 е броят на обяснителните променливи.
Ако t наблюдавано > t критично, тогава получената стойност на корелационния коефициент се счита за значима (нулевата хипотеза, според която корелационният коефициент е равен на нула, се отхвърля).
Тъй като t obs > t crit, ние отхвърляме хипотезата, че коефициентът на корелация е равен на 0. С други думи, коефициентът на корелация е статистически значим.

Упражнение. Броят на ударите на двойки стойности на случайни променливи X и Y в съответните интервали е даден в таблицата. Използвайки тези данни, намерете примерния коефициент на корелация и примерните уравнения на прави регресионни линии на Y върху X и X върху Y.
Решение

Пример. Вероятностното разпределение на двумерна случайна променлива (X, Y) е дадено от таблица. Намерете законите на разпределение на компонентните величини X, Y и корелационния коефициент p(X, Y).
Изтеглете решение

Упражнение. Двумерна дискретна величина (X, Y) се дава от закон за разпределение. Намерете законите на разпределение на компонентите X и Y, ковариацията и коефициента на корелация.