Dvodimenzionalna slučajna varijabla. Zakon distribucije vjerojatnosti diskretne dvodimenzionalne slučajne varijable Diskretna dvodimenzionalna slučajna varijabla i njena distribucija

Definicija 2.7. je par nasumičnih brojeva (X, Y), ili točku na koordinatnoj ravnini (sl. 2.11).

Riža. 2.11.

Dvodimenzionalna slučajna varijabla poseban je slučaj multivarijatne slučajne varijable ili slučajnog vektora.

Definicija 2.8. Slučajni vektor - Ovaj slučajna funkcija?,(/) s konačnim skupom mogućih vrijednosti argumenata t,čija vrijednost za bilo koju vrijednost t je slučajna varijabla.

Dvodimenzionalna slučajna varijabla naziva se kontinuiranom ako su joj koordinate kontinuirane, a diskretnom ako su joj koordinate diskretne.

Postaviti zakon raspodjele dvodimenzionalnih slučajnih varijabli znači uspostaviti korespondenciju između njegovih mogućih vrijednosti i vjerojatnosti tih vrijednosti. Prema načinu određivanja slučajne varijable se dijele na kontinuirane i diskretne, iako postoje opći načini određivanja zakona raspodjele bilo koje slučajne varijable.

Diskretna dvodimenzionalna slučajna varijabla

Diskretna dvodimenzionalna slučajna varijabla određena je pomoću tablice distribucije (tablica 2.1).

Tablica 2.1

Distribucijska tablica (zajednička distribucija) SV ( X, U)

Elementi tablice određeni su formulom

Svojstva elemenata distribucijske tablice:

Distribucija po svakoj koordinati naziva se jednodimenzionalni ili rubni:

r 1> = P(X =.g,) - rubna raspodjela SV X;

p^2) = P(Y= y,)- rubna distribucija SV U.

Odnos između zajedničke raspodjele CB X i Y, određen skupom vjerojatnosti [p () ), tj = 1,..., n,j = 1,..., T(tablica distribucije), i rubna distribucija.


Slično za SV U p- 2)= X r, g

Problem 2.14. dano:

Kontinuirana dvodimenzionalna slučajna varijabla

/(X, y)dxdy- element vjerojatnosti za dvodimenzionalnu slučajnu varijablu (X, Y) - vjerojatnost da slučajna varijabla (X, Y) padne u pravokutnik sa stranicama cbc, dy na dx, dy -* 0:

f(x, y) - gustoća distribucije dvodimenzionalna slučajna varijabla (X, Y). Zadatak /(x, y) dajemo pune informacije o distribuciji dvodimenzionalne slučajne varijable.

Granične raspodjele specificirane su na sljedeći način: za X - gustoćom raspodjele SV X/,(x); Po Y- gustoća distribucije SV U f>(y).

Zadavanje zakona raspodjele dvodimenzionalne slučajne varijable funkcijom raspodjele

Univerzalni način određivanja zakona distribucije za diskretnu ili kontinuiranu dvodimenzionalnu slučajnu varijablu je distribucijska funkcija F(x, y).

Definicija 2.9. Funkcija distribucije F(x, y)- vjerojatnost zajedničke pojave događaja (Xy), tj. F(x 0 ,y n) = = P(X y), nabačen koordinatna ravnina, ući u beskonačni kvadrant s vrhom u točki M(x 0, y i)(u zasjenjenom području na sl. 2.12).

Riža. 2.12. Ilustracija funkcije distribucije F( x, y)

Svojstva funkcije F(x, y)

  • 1) 0 1;
  • 2) F(-oo,-oo) = F(x,-oo) = F(-oo, y) = 0; F( oo, oo) = 1;
  • 3) F(x, y)- neopadajući za svaki argument;
  • 4) F(x, y) - kontinuirano lijevo i dolje;
  • 5) dosljednost distribucija:

F(x, X: F(x, oo) = F, (x); F(y, oo) - granična raspodjela preko Y F( Oh, y) = F 2 (y). Veza /(x, y) S F(x, y):

Odnos između gustoće zgloba i rubne gustoće. Dana f(x, y). Uzmimo marginalne gustoće distribucije f(x),f 2 (y)".


Slučaj neovisnih koordinata dvodimenzionalne slučajne varijable

Definicija 2.10. NE X I Yneovisna(nz), ako su bilo koji događaji povezani sa svakim od ovih SV neovisni. Iz definicije NS SV slijedi:

  • 1 )Pij = p X) pf
  • 2 )F(x,y) = F l (x)F 2 (y).

Ispada da za neovisne SV X I Y dovršen i

3 )f(x,y) = J(x)f,(y).

Dokažimo to za neovisne SV X I Y 2) 3). Dokaz, a) Neka je 2 zadovoljeno, tj.

istovremeno F(x,y) = f J f(u,v)dudv, dakle 3);

b) neka se sada 3) ispuni, tada


one. istina 2).

Razmotrimo zadatke.

Problem 2.15. Distribucija je data sljedećom tablicom:

Konstruiramo marginalne distribucije:

Dobivamo P(X = 3, U = 4) = 0,17 * P(X = 3)P(U = 4) = 0,1485 => => SV X i Zavisni.

Funkcija distribucije:


Problem 2.16. Distribucija je data sljedećom tablicom:

Dobivamo P tl = 0,2 0,3 = 0,06; R12 = 0,2? 0,7 = 0,14; P2l = 0,8 ? 0,3 = = 0,24; R 22 - 0,8 0,7 = 0,56 => NE X I Y nz.

Problem 2.17. Dana /(x, y) = 1. iskustvo| -0,5(d" + 2xy + 5g/ 2)]. Pronaći Oh) I /Da)-

Otopina

(izbrojte sami).

Neka je dana dvodimenzionalna slučajna varijabla $(X,Y)$.

Definicija 1

Zakon distribucije dvodimenzionalne slučajne varijable $(X,Y)$ je skup mogućih parova brojeva $(x_i,\ y_j)$ (gdje je $x_i \epsilon X,\ y_j \epsilon Y$) i njihovih vjerojatnosti $p_(ij)$ .

Najčešće se zakon raspodjele dvodimenzionalne slučajne varijable zapisuje u obliku tablice (tablica 1).

Slika 1. Zakon distribucije dvodimenzionalne slučajne varijable.

Prisjetimo se sada teorem o zbrajanju vjerojatnosti neovisnih događaja.

Teorem 1

Vjerojatnost zbroja konačnog broja neovisnih događaja $(\A)_1$, $(\A)_2$, ... ,$\(\A)_n$ izračunava se formulom:

Pomoću ove formule možete dobiti zakone distribucije za svaku komponentu dvodimenzionalne slučajne varijable, to jest:

Iz ovoga slijedi da zbroj svih vjerojatnosti dvodimenzionalnog sustava ima sljedeći oblik:

Razmotrimo detaljno (korak po korak) problem povezan s konceptom zakona distribucije dvodimenzionalne slučajne varijable.

Primjer 1

Zakon raspodjele dvodimenzionalne slučajne varijable dan je sljedećom tablicom:

Slika 2.

Nađite zakone raspodjele slučajnih varijabli $X,\ Y$, $X+Y$ i provjerite u svakom slučaju da je ukupni zbroj vjerojatnosti jednak jedan.

  1. Najprije pronađimo distribuciju slučajne varijable $X$. Slučajna varijabla $X$ može poprimiti vrijednosti $x_1=2,$ $x_2=3$, $x_3=5$. Za pronalaženje distribucije koristit ćemo teorem 1.

Najprije pronađimo zbroj vjerojatnosti $x_1$ na sljedeći način:

Slika 3.

Slično, nalazimo $P\lijevo(x_2\desno)$ i $P\lijevo(x_3\desno)$:

\ \

Slika 4.

  1. Nađimo sada distribuciju slučajne varijable $Y$. Slučajna varijabla $Y$ može poprimiti vrijednosti $x_1=1, $$x_2=3$, $x_3=4$. Za pronalaženje distribucije koristit ćemo teorem 1.

Najprije pronađimo zbroj vjerojatnosti $y_1$ na sljedeći način:

Slika 5.

Slično, nalazimo $P\left(y_2\right)$ i $P\left(y_3\right)$:

\ \

To znači da zakon raspodjele vrijednosti $X$ ima sljedeći oblik:

Slika 6.

Provjerimo jednakost ukupnog zbroja vjerojatnosti:

  1. Ostaje pronaći zakon raspodjele slučajne varijable $X+Y$.

Radi praktičnosti, označimo ga sa $Z$: $Z=X+Y$.

Prvo, pronađimo koje vrijednosti ova količina može poprimiti. Da bismo to učinili, zbrojit ćemo vrijednosti $X$ i $Y$ u parovima. Dobivamo sljedeće vrijednosti: 3, 4, 6, 5, 6, 8, 6, 7, 9. Sada, odbacujući podudarne vrijednosti, nalazimo da slučajna varijabla $X+Y$ može poprimiti vrijednosti $z_1 =3,\ z_2=4 ,\ z_3=5,\ z_4=6,\ z_5=7,\ z_6=8,\ z_7=9.\ $

Najprije pronađimo $P(z_1)$. Budući da je vrijednost $z_1$ jedan, nalazi se na sljedeći način:

Slika 7.

Sve vjerojatnosti osim $P(z_4)$ nalaze se na sličan način:

Pronađimo sada $P(z_4)$ na sljedeći način:

Slika 8.

To znači da zakon raspodjele vrijednosti $Z$ ima sljedeći oblik:

Slika 9.

Provjerimo jednakost ukupnog zbroja vjerojatnosti:

Uređeni par (X, Y) slučajnih varijabli X i Y naziva se dvodimenzionalna slučajna varijabla ili slučajni vektor u dvodimenzionalnom prostoru. Dvodimenzionalna slučajna varijabla (X,Y) naziva se i sustav slučajnih varijabli X i Y. Skup svih mogućih vrijednosti diskretne slučajne varijable s njihovim vjerojatnostima naziva se zakon distribucije ove slučajne varijable. Diskretna dvodimenzionalna slučajna varijabla (X, Y) smatra se danom ako je poznat njen zakon distribucije:

P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2...,m

Svrha usluge. Korištenjem usluge, prema zadanom distribucijskom zakonu, možete pronaći:

  • serija distribucije X i Y, matematičko očekivanje M[X], M[Y], varijanca D[X], D[Y];
  • kovarijanca cov(x,y), koeficijent korelacije r x,y, serija uvjetne distribucije X, uvjetno očekivanje M;
Dodatno je dan odgovor na pitanje "Jesu li slučajne varijable X i Y ovisne?"

upute. Odredite dimenziju matrice distribucije vjerojatnosti (broj redaka i stupaca) i njen tip. Dobiveno rješenje sprema se u Word datoteku.

Primjer br. 1. Dvodimenzionalna diskretna slučajna varijabla ima tablicu distribucije:

Y/X 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 q
Pronađite vrijednost q i koeficijent korelacije ove slučajne varijable.

Otopina. Vrijednost q nalazimo iz uvjeta Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0,91+q = 1. Odakle dolazi q = 0,09?

Koristeći formulu ∑P(x ja,y j) = str ja(j=1..n), nalazimo niz distribucije X.

Očekivanje M[G].
M[y] = 1*0,05 + 2*0,46 + 3*0,34 + 4*0,15 = 2,59
Varijanca D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Prosjek standardna devijacija σ(y) = sqrt(D[Y]) = sqrt(0,64) = 0,801

Kovarijanca cov(X,Y) = M - M[X] M[Y] = 2 10 0,11 + 3 10 0,12 + 4 10 0,03 + 2 20 0,13 + 3 20 0,09 + 4 ·20·0,02 + 1·30·0,02 + 2·30·0,11 + 3·30·0,08 + 4·30·0,01 + 1·40·0,03 + 2·40·0,11 + 3·40·0,05 + 4·40 ·0,09 - 25,2 · 2,59 = -0,068
Koeficijent korelacije r xy = cov(x,y)/σ(x)&sigma(y) = -0,068/(11,531*0,801) = -0,00736

Primjer 2. Podaci iz statističke obrade informacija o dva pokazatelja X i Y prikazani su u korelacijskoj tablici. Potreban:

  1. napisati serije distribucije za X i Y i izračunati srednje vrijednosti uzorka i standardne devijacije uzorka za njih;
  2. napisati niz uvjetne distribucije Y/x i izračunati uvjetne prosjeke Y/x;
  3. grafički prikazati ovisnost uvjetnih prosjeka Y/x o X vrijednostima;
  4. izračunati koeficijent korelacije uzorka Y na X;
  5. napisati oglednu jednadžbu regresije;
  6. geometrijski prikazati podatke korelacijske tablice i konstruirati regresijsku liniju.
Otopina. Uređeni par (X,Y) slučajnih varijabli X i Y naziva se dvodimenzionalna slučajna varijabla ili slučajni vektor u dvodimenzionalnom prostoru. Dvodimenzionalna slučajna varijabla (X,Y) naziva se i sustav slučajnih varijabli X i Y.
Skup svih mogućih vrijednosti diskretne slučajne varijable s njihovim vjerojatnostima naziva se zakon distribucije ove slučajne varijable.
Diskretna dvodimenzionalna slučajna varijabla (X,Y) smatra se danom ako je poznat njen zakon distribucije:
P(X=x i, Y=y j) = p ij, i=1,2...,n, j=1,2..,m
X/Y20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Događaji (X=x i, Y=y j) tvore potpunu grupu događaja, stoga je zbroj svih vjerojatnosti p ij ( i=1,2...,n, j=1,2..,m) naveden u tablici jednak je 1.
1. Ovisnost slučajnih varijabli X i Y.
Nađite niz distribucije X i Y.
Koristeći formulu ∑P(x ja,y j) = str ja(j=1..n), nalazimo niz distribucije X. Očekivanje M[G].
M[y] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14)/100 = 42,3
Varijanca D[Y].
D[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42,3 2 = 99,71
Standardna devijacija σ(y).

Kako je P(X=11,Y=20) = 2≠2 6, tada su slučajne varijable X i Y ovisan.
2. Uvjetni zakon distribucije X.
Zakon uvjetne distribucije X(Y=20).
P(X=11/Y=20) = 2/6 = 0,33
P(X=16/Y=20) = 4/6 = 0,67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Uvjetno matematičko očekivanje M = 11*0,33 + 16*0,67 + 21*0 + 26*0 + 31*0 + 36*0 = 14,33
Uvjetna varijanca D = 11 2 *0,33 + 16 2 *0,67 + 21 2 *0 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 14,33 2 = 5,56
Zakon uvjetne distribucije X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0,67
P(X=21/Y=30) = 3/9 = 0,33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Uvjetno matematičko očekivanje M = 11*0 + 16*0,67 + 21*0,33 + 26*0 + 31*0 + 36*0 = 17,67
Uvjetna varijanca D = 11 2 *0 + 16 2 *0,67 + 21 2 *0,33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17,67 2 = 5,56
Zakon uvjetne distribucije X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0,11
P(X=26/Y=40) = 45/55 = 0,82
P(X=31/Y=40) = 4/55 = 0,0727
P(X=36/Y=40) = 0/55 = 0
Uvjetno matematičko očekivanje M = 11*0 + 16*0 + 21*0,11 + 26*0,82 + 31*0,0727 + 36*0 = 25,82
Uvjetna varijanca D = 11 2 *0 + 16 2 *0 + 21 2 *0,11 + 26 2 *0,82 + 31 2 *0,0727 + 36 2 *0 - 25,82 2 = 4,51
Zakon uvjetne distribucije X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0,13
P(X=26/Y=50) = 8/16 = 0,5
P(X=31/Y=50) = 6/16 = 0,38
P(X=36/Y=50) = 0/16 = 0
Uvjetno matematičko očekivanje M = 11*0 + 16*0 + 21*0,13 + 26*0,5 + 31*0,38 + 36*0 = 27,25
Uvjetna varijanca D = 11 2 *0 + 16 2 *0 + 21 2 *0,13 + 26 2 *0,5 + 31 2 *0,38 + 36 2 *0 - 27,25 2 = 10,94
Zakon uvjetne distribucije X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0,29
P(X=31/Y=60) = 7/14 = 0,5
P(X=36/Y=60) = 3/14 = 0,21
Uvjetno matematičko očekivanje M = 11*0 + 16*0 + 21*0 + 26*0,29 + 31*0,5 + 36*0,21 = 30,64
Uvjetna varijanca D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0,29 + 31 2 *0,5 + 36 2 *0,21 - 30,64 2 = 12,37
3. Zakon uvjetne distribucije Y.
Zakon uvjetne distribucije Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Uvjetno matematičko očekivanje M = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Uvjetna varijanca D = 20 2 *1 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 20 2 = 0
Zakon uvjetne distribucije Y(X=16).
P(Y=20/X=16) = 4/10 = 0,4
P(Y=30/X=16) = 6/10 = 0,6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Uvjetno matematičko očekivanje M = 20*0,4 + 30*0,6 + 40*0 + 50*0 + 60*0 = 26
Uvjetna varijanca D = 20 2 *0,4 + 30 2 *0,6 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 26 2 = 24
Zakon uvjetne distribucije Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0,27
P(Y=40/X=21) = 6/11 = 0,55
P(Y=50/X=21) = 2/11 = 0,18
P(Y=60/X=21) = 0/11 = 0
Uvjetno matematičko očekivanje M = 20*0 + 30*0,27 + 40*0,55 + 50*0,18 + 60*0 = 39,09
Uvjetna varijanca D = 20 2 *0 + 30 2 *0,27 + 40 2 *0,55 + 50 2 *0,18 + 60 2 *0 - 39,09 2 = 44,63
Zakon uvjetne distribucije Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0,79
P(Y=50/X=26) = 8/57 = 0,14
P(Y=60/X=26) = 4/57 = 0,0702
Uvjetno matematičko očekivanje M = 20*0 + 30*0 + 40*0,79 + 50*0,14 + 60*0,0702 = 42,81
Uvjetna varijanca D = 20 2 *0 + 30 2 *0 + 40 2 *0,79 + 50 2 *0,14 + 60 2 *0,0702 - 42,81 2 = 34,23
Zakon uvjetne distribucije Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0,24
P(Y=50/X=31) = 6/17 = 0,35
P(Y=60/X=31) = 7/17 = 0,41
Uvjetno matematičko očekivanje M = 20*0 + 30*0 + 40*0,24 + 50*0,35 + 60*0,41 = 51,76
Uvjetna varijanca D = 20 2 *0 + 30 2 *0 + 40 2 *0,24 + 50 2 *0,35 + 60 2 *0,41 - 51,76 2 = 61,59
Zakon uvjetne distribucije Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Uvjetno matematičko očekivanje M = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Uvjetna varijanca D = 20 2 *0 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *1 - 60 2 = 0
Kovarijanca.
cov(X,Y) = M - M[X]·M[Y]
cov(X,Y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 25,3 42,3 = 38,11
Ako su slučajne varijable nezavisne, tada je njihova kovarijanca nula. U našem slučaju, cov(X,Y) ≠ 0.
Koeficijent korelacije.


Jednadžba linearna regresija od y do x izgleda ovako:

Jednadžba linearne regresije od x do y je:

Pronađimo potrebne numeričke karakteristike.
Primjeri prosjeka:
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42,3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25,3
Odstupanja:
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3) )/100 - 42,3 2 = 99,71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36 2 (3))/100 - 25,3 2 = 24,01
Odakle dobivamo standardne devijacije:
σ x = 9,99 i σ y = 4,9
i kovarijanca:
Cov(x,y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 42,3 25,3 = 38,11
Odredimo koeficijent korelacije:


Zapišimo jednadžbe regresijskih linija y(x):

i računajući, dobivamo:
y x = 0,38 x + 9,14
Zapišimo jednadžbe regresijskih linija x(y):

i računajući, dobivamo:
x y = 1,59 y + 2,15
Ucrtamo li točke određene tablicom i regresijskim linijama, vidjet ćemo da obje linije prolaze kroz točku s koordinatama (42.3; 25.3) i da se točke nalaze blizu regresijskih linija.
Značaj koeficijenta korelacije.

Koristeći Studentovu tablicu s razinom značajnosti α=0,05 i stupnjevima slobode k=100-m-1 = 98, nalazimo t crit:
t krit (n-m-1;α/2) = (98;0,025) = 1,984
gdje je m = 1 broj eksplanatornih varijabli.
Ako je promatrano t > t kritično, tada se rezultirajuća vrijednost korelacijskog koeficijenta smatra značajnom (nulta hipoteza koja tvrdi da je korelacijski koeficijent jednak nuli se odbacuje).
Budući da je t obs > t crit, odbacujemo hipotezu da je korelacijski koeficijent jednak 0. Drugim riječima, koeficijent korelacije je statistički značajan.

Vježbajte. Broj pogodaka parova vrijednosti slučajnih varijabli X i Y u odgovarajućim intervalima dat je u tablici. Pomoću ovih podataka pronađite koeficijent korelacije uzorka i jednadžbe uzorka ravnih regresijskih linija Y na X i X na Y.
Otopina

Primjer. Distribucija vjerojatnosti dvodimenzionalne slučajne varijable (X, Y) dana je tablicom. Naći zakone raspodjele komponenata veličina X, Y i koeficijenta korelacije p(X, Y).
Preuzmite rješenje

Vježbajte. Dvodimenzionalna diskretna veličina (X, Y) dana je zakonom raspodjele. Naći zakone raspodjele komponenti X i Y, kovarijancu i koeficijent korelacije.

Prilično često, kada proučavamo slučajne varijable, imamo posla s dvije, tri ili čak velik broj slučajne varijable. Na primjer, dvodimenzionalna slučajna varijabla $\left(X,\ Y\right)$ opisat će točku udara projektila, gdje su slučajne varijable $X,\ Y$ apscisa, odnosno ordinata. Uspješnost nasumično odabranog studenta tijekom sesije karakterizira $n$-dimenzionalna slučajna varijabla $\left(X_1,\ X_2,\ \dots ,\ X_n\right)$, gdje su slučajne varijable $X_1,\ X_2,\ \dots ,\ X_n $ su ocjene unesene u bilježnicu za različite discipline.

Poziva se skup od $n$ slučajnih varijabli $\left(X_1,\ X_2,\ \dots ,\ X_n\right)$ slučajni vektor. Ograničit ćemo se na razmatranje slučaja $\left(X,\ Y\right)$.

Neka $X$ bude diskretna slučajna varijabla s mogućim vrijednostima $x_1,x_2,\ \dots ,\ x_n$, a $Y$ bude diskretna slučajna varijabla s mogućim vrijednostima $y_1,y_2,\ \dots , \ y_n$.

Tada diskretna dvodimenzionalna slučajna varijabla $\left(X,\ Y\right)$ može poprimiti vrijednosti $\left(x_i,\ y_j\right)$ s vjerojatnostima $p_(ij)=P\left(\ lijevo(X=x_i \desno)\lijevo(Y=y_j\desno)\desno)=P\lijevo(X=x_i\desno)P\lijevo(Y=y_j|X=x_i\desno)$. Ovdje je $P\left(Y=y_j|X=x_i\right)$ uvjetna vjerojatnost da će slučajna varijabla $Y$ poprimiti vrijednost $y_j$, pod uvjetom da slučajna varijabla $X$ poprimi vrijednost $x_i$ .

Vjerojatnost da će slučajna varijabla $X$ poprimiti vrijednost $x_i$ jednaka je $p_i=\sum_j(p_(ij))$. Vjerojatnost da će slučajna varijabla $Y$ poprimiti vrijednost $y_j$ jednaka je $q_j=\sum_i(p_(ij))$.

$$P\lijevo(X=x_i|Y=y_j\desno)=((P\lijevo(\lijevo(X=x_i\desno)\lijevo(Y=y_j\desno)\desno))\preko (P\ lijevo(Y=y_j\desno)))=((p_(ij))\preko (q_j)).$$

$$P\lijevo(Y=y_j|X=x_i\desno)=((P\lijevo(\lijevo(X=x_i\desno)\lijevo(Y=y_j\desno)\desno))\preko (P\ lijevo(X=x_i\desno)))=((p_(ij))\preko (p_i)).$$

Primjer 1 . Dana je raspodjela dvodimenzionalne slučajne varijable:

$\begin(niz)(|c|c|)
\hline
X\obrnuta kosa crta Y & 2 & 3 \\
\hline
-1 & 0,15 & 0,25 \\
\hline
0 & 0,28 & 0,13 \\
\hline
1 & 0,09 & 0,1 \\
\hline
\end(niz)$

Definirajmo zakone raspodjele slučajnih varijabli $X$ i $Y$. Nađimo uvjetne distribucije slučajne varijable $X$ pod uvjetom $Y=2$ i slučajne varijable $Y$ pod uvjetom $X=0$.

Ispunimo sljedeću tablicu:

$\begin(niz)(|c|c|)
\hline
X\obrnuta kosa crta Y & 2 & 3 & p_i & p_(ij)/q_1 \\
\hline
-1 & 0,15 & 0,25 & 0,4 & 0,29 \\
\hline
0 & 0,28 & 0,13 & 0,41 & 0,54 \\
\hline
1 & 0,09 & 0,1 & 0,19 & 0,17 \\
\hline
q_j & 0,52 & 0,48 & 1 & \\
\hline
p_(ij)/p_2 & 0,68 & 0,32 & & \\
\hline
1 & 0,09 & 0,1 \\
\hline
\end(niz)$

Objasnimo kako se tablica popunjava. Vrijednosti prva tri stupca prva četiri retka preuzete su iz uvjeta. Označavamo zbroj brojeva u $2$th i $3$th stupcima $2$th ($3$th) retka u $4$th stupcu $2$th ($3$th) retka. Označavamo zbroj brojeva u $2$th i $3$th stupcima $4$th retka u $4$th stupcu $4$th retka.

Zbroj brojeva u $2$th, $3$th i $4$th redovima $2$th ($3$th) stupca upisujemo u $5$th redak $2$th ($3$th) stupca. Svaki broj u $2$tom stupcu podijelimo s $q_1=0,52$, zaokružimo rezultat na dvije decimale i upišemo ga u $5$th stupac. Brojeve iz $2$-tog i $3$-tog stupca $3$-tog reda podijelimo s $p_2=0,41$, rezultat zaokružimo na dvije decimale i upišemo u zadnji red.

Tada zakon raspodjele slučajne varijable $X$ ima sljedeći oblik.

$\begin(niz)(|c|c|)
\hline
X & -1 & 0 & 1 \\
\hline
p_i & 0,4 & 0,41 & 0,19 \\
\hline
\end(niz)$

Zakon raspodjele slučajne varijable $Y$.

$\begin(niz)(|c|c|)
\hline
Y&2&3\\
\hline
q_j & 0,52 & 0,48 \\
\hline
\end(niz)$

Uvjetna raspodjela slučajne varijable $X$ pod uvjetom $Y=2$ ima sljedeći oblik.

$\begin(niz)(|c|c|)
\hline
X & -1 & 0 & 1 \\
\hline
p_(ij)/q_1 & 0,29 & 0,54 & 0,17 \\
\hline
\end(niz)$

Uvjetna raspodjela slučajne varijable $Y$ pod uvjetom $X=0$ ima sljedeći oblik.

$\begin(niz)(|c|c|)
\hline
Y&2&3\\
\hline
p_(ij)/p_2 & 0,68 & 0,32 \\
\hline
\end(niz)$

Primjer 2 . Imamo šest olovaka, uključujući dvije crvene. Olovke smo stavili u dvije kutije. Prvi sadrži $2$ komada, a drugi također sadrži dva. $X$ je broj crvenih olovaka u prvoj kutiji, a $Y$ - u drugoj. Napišite zakon distribucije sustava slučajnih varijabli $(X,\ Y)$.

Neka je diskretna slučajna varijabla $X$ broj crvenih olovaka u prvom polju, a diskretna slučajna varijabla $Y$ broj crvenih olovaka u drugom polju. Moguće vrijednosti slučajnih varijabli $X,\ Y$ su redom $X:0,\ 1,\ 2$, $Y:0,\ 1,\ 2$. Tada diskretna dvodimenzionalna slučajna varijabla $\left(X,\ Y\right)$ može poprimiti vrijednosti $\left(x,\ y\right)$ s vjerojatnostima $P=P\left(\left(X =x\desno) \times \lijevo(Y=y\desno)\desno)=P\lijevo(X=x\desno)\times P\lijevo(Y=y|X=x\desno)$, gdje je $ P\left(Y =y|X=x\right)$ je uvjetna vjerojatnost da će slučajna varijabla $Y$ poprimiti vrijednost $y$, pod uvjetom da slučajna varijabla $X$ ima vrijednost $x$. Predstavimo korespondenciju između vrijednosti $\left(x,\ y\right)$ i vjerojatnosti $P\left(\left(X=x\right)\times \left(Y=y\right) \right)$ u obliku sljedećih tablica.

$\begin(niz)(|c|c|)
\hline
X\obrnuta kosa crta Y & 0 & 1 & 2 \\
\hline
0 & ((1)\preko (15)) & ((4)\preko (15)) & ((1)\preko (15)) \\
\hline
1 & ((4)\preko (15)) & ((4)\preko (15)) & 0 \\
\hline
2 & ((1)\preko (15)) & 0 & 0 \\
\hline
\end(niz)$

Redovi takve tablice označavaju vrijednosti $X$, a stupci vrijednosti $Y$, zatim vjerojatnosti $P\left(\left(X=x\right)\times \left( Y=y\right)\right)$ naznačeni su na sjecištu odgovarajućeg retka i stupca. Izračunajmo vjerojatnosti koristeći klasičnu definiciju vjerojatnosti i teorem o umnošku vjerojatnosti zavisnih događaja.

$$P\lijevo(\lijevo(X=0\desno)\lijevo(Y=0\desno)\desno)=((C^2_4)\preko (C^2_6))\cdot ((C^2_2) \preko (C^2_4))=((6)\preko (15))\cdot ((1)\preko (6))=((1)\preko (15));$$

$$P\lijevo(\lijevo(X=0\desno)\lijevo(Y=1\desno)\desno)=((C^2_4)\preko (C^2_6))\cdot ((C^1_2\ cdot C^1_2)\preko (C^2_4))=((6)\preko (15))\cdot ((2\cdot 2)\preko (6))=((4)\preko (15)) ;$$

$$P\lijevo(\lijevo(X=0\desno)\lijevo(Y=2\desno)\desno)=((C^2_4)\preko (C^2_6))\cdot ((C^2_2) \preko (C^2_4))=((6)\preko (15))\cdot ((1)\preko (6))=((1)\preko (15));$$

$$P\lijevo(\lijevo(X=1\desno)\lijevo(Y=0\desno)\desno)=((C^1_2\cdot C^1_4)\preko (C^2_6))\cdot ( (C^2_3)\preko (C^2_4))=((2\cdot 4)\preko (15))\cdot ((3)\preko (6))=((4)\preko (15)) ;$$

$$P\lijevo(\lijevo(X=1\desno)\lijevo(Y=1\desno)\desno)=((C^1_2\cdot C^1_4)\preko (C^2_6))\cdot ( (C^1_1\cdot C^1_3)\preko (C^2_4))=((2\cdot 4)\preko (15))\cdot ((1\cdot 3)\preko (6))=(( 4)\preko (15));$$

$$P\lijevo(\lijevo(X=2\desno)\lijevo(Y=0\desno)\desno)=((C^2_2)\preko (C^2_6))\cdot ((C^2_4) \preko (C^2_4))=((1)\preko (15))\cdot 1=((1)\preko (15)).$$

Budući da u zakonu distribucije (rezultirajuća tablica) cijeli skup događaja tvori potpunu grupu događaja, zbroj vjerojatnosti mora biti jednak 1. Provjerimo ovo:

$$\sum_(i,\ j)(p_(ij))=((1)\preko (15))+((4)\preko (15))+((1)\preko (15))+ ((4)\preko (15))+((4)\preko (15))+((1)\preko (15))=1.$$

Funkcija distribucije dvodimenzionalne slučajne varijable

Funkcija distribucije dvodimenzionalna slučajna varijabla $\left(X,\ Y\right)$ je funkcija $F\left(x,\ y\right)$, koja za bilo koju realni brojevi$x$ i $y$ jednaka je vjerojatnosti zajedničkog izvršenja dva događaja $\left\(X< x\right\}$ и $\left\{Y < y\right\}$. Таким образом, по определению

$$F\lijevo(x,\y\desno)=P\lijevo\(X< x,\ Y < y\right\}.$$

Za diskretnu dvodimenzionalnu slučajnu varijablu, funkcija distribucije nalazi se zbrajanjem svih vjerojatnosti $p_(ij)$ za koje $x_i< x,\ y_j < y$, то есть

$$F\lijevo(x,\y\desno)=\zbir_(x_i< x}{\sum_{y_j < y}{p_{ij}}}.$$

Svojstva funkcije distribucije dvodimenzionalne slučajne varijable.

1 . Funkcija distribucije $F\lijevo(x,\ y\desno)$ je ograničena, to jest $0\le F\lijevo(x,\ y\desno)\le 1$.

2 . $F\lijevo(x,\ y\desno)$ je neopadajući za svaki od svojih argumenata s drugim fiksiranim, to jest, $F\lijevo(x_2,\ y\desno)\ge F\lijevo(x_1, \ y\right )$ za $x_2>x_1$, $F\left(x,\ y_2\right)\ge F\left(x,\ y_1\right)$ za $y_2>y_1$.

3 . Ako barem jedan od argumenata ima vrijednost $-\infty $, tada će funkcija distribucije biti jednaka nuli, to jest $F\left(-\infty ,\ y\right)=F\left(x, \ -\infty \desno ),\ F\lijevo(-\infty ,\ -\infty \desno)=0$.

4 . Ako oba argumenta imaju vrijednost $+\infty $, tada će funkcija distribucije biti jednaka $1$, odnosno $F\left(+\infty ,\ +\infty \right)=1$.

5 . U slučaju kada točno jedan od argumenata ima vrijednost $+\infty $, funkcija distribucije $F\left(x,\ y\right)$ postaje funkcija distribucije slučajne varijable koja odgovara drugom elementu, tj. , $F\lijevo(x ,\ +\infty \desno)=F_1\lijevo(x\desno)=F_X\lijevo(x\desno),\ F\lijevo(+\infty ,\ y\desno)=F_y \lijevo(y\desno) =F_Y\lijevo(y\desno)$.

6 . $F\lijevo(x,\ y\desno)$ je lijevo kontinuirano za svaki svoj argument, tj

$$(\mathop(lim)_(x\to x_0-0) F\lijevo(x,\y\desno)\ )=F\lijevo(x_0,\y\desno),\ (\mathop(lim) _(y\do y_0-0) F\lijevo(x,\y\desno)\ )=F\lijevo(x,\y_0\desno).$$

Primjer 3 . Neka je diskretna dvodimenzionalna slučajna varijabla $\left(X,\ Y\right)$ dana nizom distribucije.

$\begin(niz)(|c|c|)
\hline
X\obrnuta kosa crta Y & 0 & 1 \\
\hline
0 & ((1)\preko (6)) & ((2)\preko (6)) \\
\hline
1 & ((2)\preko (6)) & ((1)\preko (6)) \\
\hline
\end(niz)$

Zatim funkcija distribucije:

$F(x,y)=\lijevo\(\početak(matrica)
0,\ na\ x\le 0,\ y\le 0\\
0,\ na\ x\le 0,\ 0< y\le 1 \\
0,\ at\ x\le 0,\ y>1\\
0,\ na\ 0< x\le 1,\ y\le 0 \\
((1)\preko (6)),\na\0< x\le 1,\ 0 < y\le 1 \\
((1)\preko (6))+((2)\preko (6))=((1)\preko (2)),\na\0< x\le 1,\ y>1 \\
0,\ za\ x>1,\ y\le 0\\
((1)\preko (6))+((2)\preko (6))=((1)\preko (2)),\ at\ x>1,\ 0< y\le 1 \\
((1)\preko (6))+((2)\preko (6))+((2)\preko (6))+((1)\preko (6))=1,\ at\ x >1,\ y>1 \\
\end(matrica)\desno.$

Uređeni par (X, Y) slučajnih varijabli X i Y naziva se dvodimenzionalna slučajna varijabla ili slučajni vektor u dvodimenzionalnom prostoru. Dvodimenzionalna slučajna varijabla (X,Y) naziva se i sustav slučajnih varijabli X i Y. Skup svih mogućih vrijednosti diskretne slučajne varijable s njihovim vjerojatnostima naziva se zakon distribucije ove slučajne varijable. Diskretna dvodimenzionalna slučajna varijabla (X, Y) smatra se danom ako je poznat njen zakon distribucije:

P(X=x i , Y=y j) = p ij , i=1,2...,n, j=1,2...,m

Svrha usluge. Korištenjem usluge, prema zadanom distribucijskom zakonu, možete pronaći:

  • serija distribucije X i Y, matematičko očekivanje M[X], M[Y], varijanca D[X], D[Y];
  • kovarijanca cov(x,y), koeficijent korelacije r x,y, serija uvjetne distribucije X, uvjetno očekivanje M;
Dodatno je dan odgovor na pitanje "Jesu li slučajne varijable X i Y ovisne?"

upute. Odredite dimenziju matrice distribucije vjerojatnosti (broj redaka i stupaca) i njen tip. Dobiveno rješenje sprema se u Word datoteku.

Primjer br. 1. Dvodimenzionalna diskretna slučajna varijabla ima tablicu distribucije:

Y/X 1 2 3 4
10 0 0,11 0,12 0,03
20 0 0,13 0,09 0,02
30 0,02 0,11 0,08 0,01
40 0,03 0,11 0,05 q
Pronađite vrijednost q i koeficijent korelacije ove slučajne varijable.

Otopina. Vrijednost q nalazimo iz uvjeta Σp ij = 1
Σp ij = 0,02 + 0,03 + 0,11 + … + 0,03 + 0,02 + 0,01 + q = 1
0,91+q = 1. Odakle dolazi q = 0,09?

Koristeći formulu ∑P(x ja,y j) = str ja(j=1..n), nalazimo niz distribucije X.

Očekivanje M[G].
M[y] = 1*0,05 + 2*0,46 + 3*0,34 + 4*0,15 = 2,59
Varijanca D[Y] = 1 2 *0.05 + 2 2 *0.46 + 3 2 *0.34 + 4 2 *0.15 - 2.59 2 = 0.64
Standardna devijacijaσ(y) = sqrt(D[Y]) = sqrt(0,64) = 0,801

Kovarijanca cov(X,Y) = M - M[X] M[Y] = 2 10 0,11 + 3 10 0,12 + 4 10 0,03 + 2 20 0,13 + 3 20 0,09 + 4 ·20·0,02 + 1·30·0,02 + 2·30·0,11 + 3·30·0,08 + 4·30·0,01 + 1·40·0,03 + 2·40·0,11 + 3·40·0,05 + 4·40 ·0,09 - 25,2 · 2,59 = -0,068
Koeficijent korelacije r xy = cov(x,y)/σ(x)&sigma(y) = -0,068/(11,531*0,801) = -0,00736

Primjer 2. Podaci iz statističke obrade informacija o dva pokazatelja X i Y prikazani su u korelacijskoj tablici. Potreban:

  1. napisati serije distribucije za X i Y i izračunati srednje vrijednosti uzorka i standardne devijacije uzorka za njih;
  2. napisati niz uvjetne distribucije Y/x i izračunati uvjetne prosjeke Y/x;
  3. grafički prikazati ovisnost uvjetnih prosjeka Y/x o X vrijednostima;
  4. izračunati koeficijent korelacije uzorka Y na X;
  5. napisati oglednu jednadžbu regresije;
  6. geometrijski prikazati podatke korelacijske tablice i konstruirati regresijsku liniju.
Otopina. Uređeni par (X,Y) slučajnih varijabli X i Y naziva se dvodimenzionalna slučajna varijabla ili slučajni vektor u dvodimenzionalnom prostoru. Dvodimenzionalna slučajna varijabla (X,Y) naziva se i sustav slučajnih varijabli X i Y.
Skup svih mogućih vrijednosti diskretne slučajne varijable s njihovim vjerojatnostima naziva se zakon distribucije ove slučajne varijable.
Diskretna dvodimenzionalna slučajna varijabla (X,Y) smatra se danom ako je poznat njen zakon distribucije:
P(X=x i, Y=y j) = p ij, i=1,2...,n, j=1,2..,m
X/Y20 30 40 50 60
11 2 0 0 0 0
16 4 6 0 0 0
21 0 3 6 2 0
26 0 0 45 8 4
31 0 0 4 6 7
36 0 0 0 0 3
Događaji (X=x i, Y=y j) tvore potpunu grupu događaja, stoga je zbroj svih vjerojatnosti p ij ( i=1,2...,n, j=1,2..,m) naveden u tablici jednak je 1.
1. Ovisnost slučajnih varijabli X i Y.
Nađite niz distribucije X i Y.
Koristeći formulu ∑P(x ja,y j) = str ja(j=1..n), nalazimo niz distribucije X. Očekivanje M[G].
M[y] = (20*6 + 30*9 + 40*55 + 50*16 + 60*14)/100 = 42,3
Varijanca D[Y].
D[Y] = (20 2 *6 + 30 2 *9 + 40 2 *55 + 50 2 *16 + 60 2 *14)/100 - 42,3 2 = 99,71
Standardna devijacija σ(y).

Kako je P(X=11,Y=20) = 2≠2 6, tada su slučajne varijable X i Y ovisan.
2. Uvjetni zakon distribucije X.
Zakon uvjetne distribucije X(Y=20).
P(X=11/Y=20) = 2/6 = 0,33
P(X=16/Y=20) = 4/6 = 0,67
P(X=21/Y=20) = 0/6 = 0
P(X=26/Y=20) = 0/6 = 0
P(X=31/Y=20) = 0/6 = 0
P(X=36/Y=20) = 0/6 = 0
Uvjetno matematičko očekivanje M = 11*0,33 + 16*0,67 + 21*0 + 26*0 + 31*0 + 36*0 = 14,33
Uvjetna varijanca D = 11 2 *0,33 + 16 2 *0,67 + 21 2 *0 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 14,33 2 = 5,56
Zakon uvjetne distribucije X(Y=30).
P(X=11/Y=30) = 0/9 = 0
P(X=16/Y=30) = 6/9 = 0,67
P(X=21/Y=30) = 3/9 = 0,33
P(X=26/Y=30) = 0/9 = 0
P(X=31/Y=30) = 0/9 = 0
P(X=36/Y=30) = 0/9 = 0
Uvjetno matematičko očekivanje M = 11*0 + 16*0,67 + 21*0,33 + 26*0 + 31*0 + 36*0 = 17,67
Uvjetna varijanca D = 11 2 *0 + 16 2 *0,67 + 21 2 *0,33 + 26 2 *0 + 31 2 *0 + 36 2 *0 - 17,67 2 = 5,56
Zakon uvjetne distribucije X(Y=40).
P(X=11/Y=40) = 0/55 = 0
P(X=16/Y=40) = 0/55 = 0
P(X=21/Y=40) = 6/55 = 0,11
P(X=26/Y=40) = 45/55 = 0,82
P(X=31/Y=40) = 4/55 = 0,0727
P(X=36/Y=40) = 0/55 = 0
Uvjetno matematičko očekivanje M = 11*0 + 16*0 + 21*0,11 + 26*0,82 + 31*0,0727 + 36*0 = 25,82
Uvjetna varijanca D = 11 2 *0 + 16 2 *0 + 21 2 *0,11 + 26 2 *0,82 + 31 2 *0,0727 + 36 2 *0 - 25,82 2 = 4,51
Zakon uvjetne distribucije X(Y=50).
P(X=11/Y=50) = 0/16 = 0
P(X=16/Y=50) = 0/16 = 0
P(X=21/Y=50) = 2/16 = 0,13
P(X=26/Y=50) = 8/16 = 0,5
P(X=31/Y=50) = 6/16 = 0,38
P(X=36/Y=50) = 0/16 = 0
Uvjetno matematičko očekivanje M = 11*0 + 16*0 + 21*0,13 + 26*0,5 + 31*0,38 + 36*0 = 27,25
Uvjetna varijanca D = 11 2 *0 + 16 2 *0 + 21 2 *0,13 + 26 2 *0,5 + 31 2 *0,38 + 36 2 *0 - 27,25 2 = 10,94
Zakon uvjetne distribucije X(Y=60).
P(X=11/Y=60) = 0/14 = 0
P(X=16/Y=60) = 0/14 = 0
P(X=21/Y=60) = 0/14 = 0
P(X=26/Y=60) = 4/14 = 0,29
P(X=31/Y=60) = 7/14 = 0,5
P(X=36/Y=60) = 3/14 = 0,21
Uvjetno matematičko očekivanje M = 11*0 + 16*0 + 21*0 + 26*0,29 + 31*0,5 + 36*0,21 = 30,64
Uvjetna varijanca D = 11 2 *0 + 16 2 *0 + 21 2 *0 + 26 2 *0,29 + 31 2 *0,5 + 36 2 *0,21 - 30,64 2 = 12,37
3. Zakon uvjetne distribucije Y.
Zakon uvjetne distribucije Y(X=11).
P(Y=20/X=11) = 2/2 = 1
P(Y=30/X=11) = 0/2 = 0
P(Y=40/X=11) = 0/2 = 0
P(Y=50/X=11) = 0/2 = 0
P(Y=60/X=11) = 0/2 = 0
Uvjetno matematičko očekivanje M = 20*1 + 30*0 + 40*0 + 50*0 + 60*0 = 20
Uvjetna varijanca D = 20 2 *1 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 20 2 = 0
Zakon uvjetne distribucije Y(X=16).
P(Y=20/X=16) = 4/10 = 0,4
P(Y=30/X=16) = 6/10 = 0,6
P(Y=40/X=16) = 0/10 = 0
P(Y=50/X=16) = 0/10 = 0
P(Y=60/X=16) = 0/10 = 0
Uvjetno matematičko očekivanje M = 20*0,4 + 30*0,6 + 40*0 + 50*0 + 60*0 = 26
Uvjetna varijanca D = 20 2 *0,4 + 30 2 *0,6 + 40 2 *0 + 50 2 *0 + 60 2 *0 - 26 2 = 24
Zakon uvjetne distribucije Y(X=21).
P(Y=20/X=21) = 0/11 = 0
P(Y=30/X=21) = 3/11 = 0,27
P(Y=40/X=21) = 6/11 = 0,55
P(Y=50/X=21) = 2/11 = 0,18
P(Y=60/X=21) = 0/11 = 0
Uvjetno matematičko očekivanje M = 20*0 + 30*0,27 + 40*0,55 + 50*0,18 + 60*0 = 39,09
Uvjetna varijanca D = 20 2 *0 + 30 2 *0,27 + 40 2 *0,55 + 50 2 *0,18 + 60 2 *0 - 39,09 2 = 44,63
Zakon uvjetne distribucije Y(X=26).
P(Y=20/X=26) = 0/57 = 0
P(Y=30/X=26) = 0/57 = 0
P(Y=40/X=26) = 45/57 = 0,79
P(Y=50/X=26) = 8/57 = 0,14
P(Y=60/X=26) = 4/57 = 0,0702
Uvjetno matematičko očekivanje M = 20*0 + 30*0 + 40*0,79 + 50*0,14 + 60*0,0702 = 42,81
Uvjetna varijanca D = 20 2 *0 + 30 2 *0 + 40 2 *0,79 + 50 2 *0,14 + 60 2 *0,0702 - 42,81 2 = 34,23
Zakon uvjetne distribucije Y(X=31).
P(Y=20/X=31) = 0/17 = 0
P(Y=30/X=31) = 0/17 = 0
P(Y=40/X=31) = 4/17 = 0,24
P(Y=50/X=31) = 6/17 = 0,35
P(Y=60/X=31) = 7/17 = 0,41
Uvjetno matematičko očekivanje M = 20*0 + 30*0 + 40*0,24 + 50*0,35 + 60*0,41 = 51,76
Uvjetna varijanca D = 20 2 *0 + 30 2 *0 + 40 2 *0,24 + 50 2 *0,35 + 60 2 *0,41 - 51,76 2 = 61,59
Zakon uvjetne distribucije Y(X=36).
P(Y=20/X=36) = 0/3 = 0
P(Y=30/X=36) = 0/3 = 0
P(Y=40/X=36) = 0/3 = 0
P(Y=50/X=36) = 0/3 = 0
P(Y=60/X=36) = 3/3 = 1
Uvjetno matematičko očekivanje M = 20*0 + 30*0 + 40*0 + 50*0 + 60*1 = 60
Uvjetna varijanca D = 20 2 *0 + 30 2 *0 + 40 2 *0 + 50 2 *0 + 60 2 *1 - 60 2 = 0
Kovarijanca.
cov(X,Y) = M - M[X]·M[Y]
cov(X,Y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 25,3 42,3 = 38,11
Ako su slučajne varijable nezavisne, tada je njihova kovarijanca nula. U našem slučaju, cov(X,Y) ≠ 0.
Koeficijent korelacije.


Jednadžba linearne regresije od y do x je:

Jednadžba linearne regresije od x do y je:

Pronađimo potrebne numeričke karakteristike.
Primjeri prosjeka:
x = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 42,3
y = (20(2 + 4) + 30(6 + 3) + 40(6 + 45 + 4) + 50(2 + 8 + 6) + 60(4 + 7 + 3))/100 = 25,3
Odstupanja:
σ 2 x = (20 2 (2 + 4) + 30 2 (6 + 3) + 40 2 (6 + 45 + 4) + 50 2 (2 + 8 + 6) + 60 2 (4 + 7 + 3) )/100 - 42,3 2 = 99,71
σ 2 y = (11 2 (2) + 16 2 (4 + 6) + 21 2 (3 + 6 + 2) + 26 2 (45 + 8 + 4) + 31 2 (4 + 6 + 7) + 36 2 (3))/100 - 25,3 2 = 24,01
Odakle dobivamo standardne devijacije:
σ x = 9,99 i σ y = 4,9
i kovarijanca:
Cov(x,y) = (20 11 2 + 20 16 4 + 30 16 6 + 30 21 3 + 40 21 6 + 50 21 2 + 40 26 45 + 50 26 8 + 60 26 4 + 40 31 4 + 50 31 6 + 60 31 7 + 60 36 3)/100 - 42,3 25,3 = 38,11
Odredimo koeficijent korelacije:


Zapišimo jednadžbe regresijskih linija y(x):

i računajući, dobivamo:
y x = 0,38 x + 9,14
Zapišimo jednadžbe regresijskih linija x(y):

i računajući, dobivamo:
x y = 1,59 y + 2,15
Ucrtamo li točke određene tablicom i regresijskim linijama, vidjet ćemo da obje linije prolaze kroz točku s koordinatama (42.3; 25.3) i da se točke nalaze blizu regresijskih linija.
Značaj koeficijenta korelacije.

Koristeći Studentovu tablicu s razinom značajnosti α=0,05 i stupnjevima slobode k=100-m-1 = 98, nalazimo t crit:
t krit (n-m-1;α/2) = (98;0,025) = 1,984
gdje je m = 1 broj eksplanatornih varijabli.
Ako je promatrano t > t kritično, tada se rezultirajuća vrijednost korelacijskog koeficijenta smatra značajnom (nulta hipoteza koja tvrdi da je korelacijski koeficijent jednak nuli se odbacuje).
Budući da je t obs > t crit, odbacujemo hipotezu da je korelacijski koeficijent jednak 0. Drugim riječima, koeficijent korelacije je statistički značajan.

Vježbajte. Broj pogodaka parova vrijednosti slučajnih varijabli X i Y u odgovarajućim intervalima dat je u tablici. Pomoću ovih podataka pronađite koeficijent korelacije uzorka i jednadžbe uzorka ravnih regresijskih linija Y na X i X na Y.
Otopina

Primjer. Distribucija vjerojatnosti dvodimenzionalne slučajne varijable (X, Y) dana je tablicom. Naći zakone raspodjele komponenata veličina X, Y i koeficijenta korelacije p(X, Y).
Preuzmite rješenje

Vježbajte. Dvodimenzionalna diskretna veličina (X, Y) dana je zakonom raspodjele. Naći zakone raspodjele komponenti X i Y, kovarijancu i koeficijent korelacije.