Normalna distribucija slučajne varijable i pravilo tri sigme. Normalna razdioba slučajne varijable Funkcija gustoće vjerojatnosti normalne razdiobe

Zakon normalne distribucije, tzv. Gaussov zakon, jedan je od najčešćih zakona. Ovo je temeljni zakon u teoriji vjerojatnosti i njezinoj primjeni. Normalna raspodjela se najčešće nalazi u proučavanju prirodnih i društveno-ekonomskih pojava. Drugim riječima, većina statističkih agregata u prirodi i društvu pokorava se zakonu normalne distribucije. Sukladno tome možemo reći da agregati veliki broj veliki uzorci podliježu zakonu normalne distribucije. One populacije koje odstupaju od normalne distribucije kao rezultat posebnih transformacija mogu se približiti normali. S tim u vezi treba podsjetiti da je temeljna značajka ovog zakona u odnosu na druge zakone raspodjele da je on zakon granice kojoj se drugi zakoni raspodjele približavaju u određenim (standardnim) uvjetima.

Treba napomenuti da pojam “normalna distribucija” ima konvencionalno značenje, kao pojam općeprihvaćen u matematičkoj i statističkoj literaturi. Tvrdnja da se jedna ili druga karakteristika bilo kojeg fenomena pokorava zakonu normalne distribucije uopće ne znači nepovredivost normi koje su navodno svojstvene fenomenu koji se proučava, a klasificiranje potonjeg kao druge vrste zakona ne znači neku vrstu abnormalnosti ove pojave. U tom smislu izraz "normalna distribucija" nije sasvim prikladan.

Normalna distribucija (Gauss-Laplaceov zakon) je vrsta kontinuirane distribucije. Gdje je Moivre (tisuću sedamsto sedamdeset i tri, Francuska) izveo normalni zakon distribucije vjerojatnosti. Osnovne ideje ovog otkrića prvi su upotrijebili u teoriji pogrešaka K. Gauss (1809., Njemačka) i A. Laplace (1812., Francuska), koji su dali značajan teorijski doprinos razvoju samog prava. Konkretno, K. Gauss je u svom razvoju pošao od spoznaje da je najvjerojatnija vrijednost slučajne varijable aritmetička sredina. Opće uvjete za nastanak normalne distribucije utvrdio je A.M. Dokazao je da ako je karakteristika koja se proučava rezultat ukupnog utjecaja mnogih čimbenika, od kojih je svaki malo povezan s većinom ostalih, a utjecaj svakog čimbenika na konačni rezultat uvelike se preklapa ukupnim utjecajem svih ostalih čimbenika, tada distribucija postaje blizu normalne.

Distribucija vjerojatnosti kontinuirane slučajne varijable naziva se normalnom i ima gustoću:

1 +1 (& #) 2

/ (x, x,<т) = - ^ е 2 st2

gdje je x matematičko očekivanje ili prosječna vrijednost. Kao što vidite, normalnu distribuciju određuju dva parametra: x i °. Za definiranje normalne distribucije dovoljno je znati matematičko očekivanje ili srednju vrijednost i prosjek standardna devijacija. Ove dvije veličine određuju središte grupiranja i oblik

krivulja na grafu. Graf funkcije u (xx, b) naziva se normalna krivulja (Gaussova krivulja) s parametrima x i b (slika 12).

Krivulja normalne distribucije ima točke infleksije na X ± 1. Ako je prikazana grafički, tada između X = +l i 1 = -1 je 0,683 dijela cijele površine krivulje (tj. 68,3%). Unutar granica X = + 2 i X- 2. nalazi se 0,954 područja (95,4%), a između X = + 3 i X = - 3 - 0,997 dijelova cjelokupnog područja rasprostranjenja (99,7%). Na sl. Slika 13 ilustrira prirodu normalne distribucije s granicama od jedne, dvije i tri sigme.

Uz normalnu distribuciju, aritmetička sredina, mod i medijan bit će međusobno jednaki. Oblik normalne krivulje ima oblik simetrične krivulje s jednim vrhom, čije se grane asimptotski približavaju apscisnoj osi. Najveća ordinata krivulje odgovara x = 0. U ovoj točki na apscisnoj osi nalazi se numerička vrijednost karakteristika jednaka aritmetičkoj sredini, modi i medijanu. S obje strane vrha krivulje dolaze njezini ogranci, mijenjajući oblik konveksnosti u konkavnost na određenim točkama. Ove točke su simetrične i odgovaraju vrijednostima x = ± 1, odnosno vrijednostima karakteristika čija su odstupanja od prosjeka brojčano jednaka standardnoj devijaciji. Ordinata, koja odgovara aritmetičkoj sredini, dijeli cijelo područje između krivulje i apscise na pola. Dakle, vjerojatnosti pojave vrijednosti proučavane karakteristike veće i manje od prosjeka

aritmetika će biti jednaka 0,50, to jest, x, (~ ^ x) = 0,50 V

Slika 12. Krivulja normalne distribucije (Gaussova krivulja)

Oblik i položaj normalne krivulje određuju vrijednost srednje vrijednosti i prosjeka kvadratno odstupanje. Matematički je dokazano da promjena vrijednosti prosjeka (matematičko očekivanje) ne mijenja oblik normalne krivulje, već samo dovodi do njenog pomaka duž apscisne osi. Krivulja se pomiče udesno ako ~ raste, a ulijevo ako ~ dolazi.

Slika 14. Krivulje normalne distribucije s različitim vrijednostima parametaraV

O promjeni oblika grafa normalne krivulje pri promjeni

standardna devijacija može se procijeniti prema maksimumu

diferencijalna funkcija normalne distribucije, jednaka 1

Kao što se može vidjeti, kako se vrijednost ° povećava, najveća ordinata krivulje će se smanjivati. Posljedično, krivulja normalne distribucije će se stisnuti prema x-osi i poprimiti ravniji oblik.

I, obrnuto, kada se parametar β smanji, normalna krivulja se produžuje u pozitivnom smjeru ordinatne osi, a oblik "zvona" postaje šiljatiji (Sl. 14). Imajte na umu da je, bez obzira na vrijednosti parametara ~ i , područje ograničeno apscisnom osi i krivuljom uvijek jednako jedinici (svojstvo gustoće distribucije). To je jasno ilustrirano grafikonom (Sl. 13).

Gore navedene značajke manifestacije "normalnosti" distribucije omogućuju nam da identificiramo niz zajedničkih svojstava koja imaju krivulje normalne distribucije:

1) bilo koja normalna krivulja doseže maksimalnu točku (X= x) dolazi kontinuirano desno i lijevo od njega, postupno se približavajući x-osi;

2) svaka normalna krivulja je simetrična u odnosu na ravnu liniju,

paralelna s osi ordinata i prolazi kroz maksimalnu točku (X= x)

najveća ordinata je ^^^ i;

3) svaka normalna krivulja ima oblik "zvona", ima konveksitet koji je usmjeren prema gore do maksimalne točke. U točkama x ~ ° i x + b mijenja konveksnost, i što je manji a, to je "zvono" oštrije, a što je veće, to je vrh "zvona" oštriji (slika 14). Promjena matematičkog očekivanja (s konstantnom vrijednošću

c) ne dovodi do modifikacije oblika krivulje.

Kada je x = 0 i ° = 1, normalna krivulja se naziva normalizirana krivulja ili normalna distribucija u kanonskom obliku.

Normalizirana krivulja opisana je sljedećom formulom:

Konstrukcija normalne krivulje na temelju empirijskih podataka provodi se pomoću formule:

pi 1 - "" = --- 7 = e

gdje je i ™ teorijska frekvencija svakog intervala (skupine) distribucije; "- Zbroj frekvencija jednak volumenu populacije; "- intervalni korak;

isti - omjer opsega kruga i njegovog promjera, koji je

e - baza prirodnih logaritama, jednaka 2,71828;

Drugi i treći dio formule) je funkcija

normalizirano odstupanje CN), koje se može izračunati za bilo koju vrijednost X. Tablice CN vrijednosti) obično se nazivaju "ordinatne tablice normalne krivulje" (Dodatak 3). Kada se koriste ove funkcije, radna formula za normalnu distribuciju poprima jednostavan oblik:

Primjer. Razmotrimo slučaj konstruiranja normalne krivulje na primjeru podataka o raspodjeli 57 radnika po visini dnevnih primanja (tablica 42). Prema tablici 42 nalazimo aritmetičku sredinu:

~ = ^ = I6 54 =

Izračunavamo standardnu ​​devijaciju:

Za svaki redak tablice nalazimo vrijednost normaliziranog odstupanja

x i ~x | 12 g => - = - ^ 2 = 1,92

A 6.25 (dd I prvog intervala itd.).

U stupcu 8 tablice. 42 zapisujemo tabličnu vrijednost funkcije Di) iz aplikacije, na primjer, za prvi interval X = 1,92 nalazimo “1,9” u odnosu na “2” (0,0632).

Za izračun teoretskih frekvencija, odnosno ordinata krivulje normalne distribucije, izračunava se množitelj:

* = ^ = 36,5 a 6.25

Množimo sve pronađene tablične vrijednosti funkcije / (r) s 36,5. Dakle, za prvi interval dobivamo 0,0632x36,5 = 2,31 tona

frekvencije (n"<5) kombinirati (u našem primjeru - prva dva i zadnja dva intervala).

Ako se ekstremne teorijske frekvencije značajno razlikuju od nule, razlika između zbroja empirijskih i teorijskih frekvencija može biti značajna.

Graf distribucije empirijskih i teorijskih frekvencija (normalna krivulja) prema razmatranom primjeru prikazan je na slici 15.

Razmotrimo primjer određivanja frekvencija normalne distribucije za slučaj kada nema frekvencije u ekstremnim intervalima (tablica 43). Ovdje empirijski

X - normalizirano odstupanje, (c) a - standardna devijacija.

frekvencija prvog intervala je nula. Rezultirajući zbroj neodređenih frekvencija nije jednak zbroju njihovih empirijskih vrijednosti (56 * 57). U ovom slučaju, teorijska frekvencija se izračunava za pranje dobivenih vrijednosti središta intervala, normaliziranog odstupanja i njegove funkcije.

U tablici 43 te su vrijednosti zaokružene pravokutnikom. Kod crtanja normalne krivulje, u takvim slučajevima nastavlja se teorijska krivulja. U slučaju koji se razmatra, normalna krivulja će se nastaviti prema negativnim odstupanjima od prosjeka, budući da je prva neodređena frekvencija jednaka 5. Izračunata teorijska frekvencija (pojašnjena) za prvi interval bit će jednaka jedinici. Zbroj rafiniranih frekvencija podudara se s empirijskim

Tablica 42

Izračunate vrijednosti

Statistički parametri

Interval,

Broj jedinica

x) 2

normalizirani odjeli

teoretski

učestalost serije normalne distribucije,

/ 0) x - A

>>

Tisuću šeststo pedeset četiri

a = 6,25

^i=36,5 A

Tablica 43

Izračun frekvencija normalne distribucije (usklađivanje empirijskih frekvencija prema normalnom zakonu)

Broj jedinica

Izračunate vrijednosti

Statistički parametri

Interval (i-2)

Srednja vrijednost (središte) intervala,

(je, -xf

^ x t-x) 1 n i

normalizirano odstupanje

xs- X

t= x --L

tablična vrijednost funkcije, f (t)

teoretski

učestalost serije normalne distribucije

pojašnjena teorijska vrijednost frekvencije,

w

-

-

-

-

-

o = 2,41

Riža. 15. Empirijska distribucija(1) i normalna krivulja (2)

Krivulja normalne distribucije za populaciju koja se proučava može se konstruirati na drugi način (za razliku od onog koji je gore razmotren). Dakle, ako je potrebno imati približnu predodžbu o podudarnosti stvarne distribucije s normalnom, izračuni se provode u sljedećem nizu. Odredite maksimalnu ordinatu, koja odgovara prosječnoj veličini obilježja), zatim, izračunavši standardnu ​​devijaciju, izračunajte koordinate točaka krivulje normalne distribucije prema shemi prikazanoj u tablicama 42 i 43. Dakle, prema prema početnim i izračunatim podacima u tablici 43, prosjek bi trebao biti ~ = 26. Ova srednja vrijednost poklapa se sa središtem četvrtog intervala (25-27). Dakle, frekvencija ovog intervala "20" može se uzeti (prilikom crtanja grafikona) kao maksimalna ordinata). Imajući izračunatu disperziju (β = 2,41 cm, tablica 43), izračunavamo koordinatne vrijednosti svih potrebnih točaka krivulje normalne distribucije (tablice 44, 45). Koristeći dobivene koordinate nacrtamo normalnu krivulju (slika 16), uzimajući frekvenciju četvrtog intervala kao maksimalnu ordinatu.

Konzistentnost empirijske distribucije s normalnom može se utvrditi i pojednostavljenim izračunima. Dakle, ako omjer pokazatelja stupnja asimetrije (^) i njegove srednje kvadratne pogreške sh a "ili omjer indikatora kurtoze (E x) i njegove srednje kvadratne pogreške t & prelazi broj "3" u apsolutnoj vrijednosti, dolazi se do zaključka o neslaganju između empirijske distribucije i prirode normalne distribucije (tj.

A tz E X

Ako A>3 ili w e "> 3).

Postoje i druge metode koje nisu radno intenzivne za utvrđivanje "normalnosti" distribucije: a) usporedba aritmetičke sredine s modom i medijanom; b) korištenje Westergardovih figura; c) primjena grafičke slike pomoću polulogaritamske mreže Turbina; d) izračun posebnih kriterija podudaranja itd.

Tablica 44

Koordinate 7 točaka krivulje normalne distribucije

Tablica 45

Izračunavanje koordinata točaka krivulje normalne distribucije

x- 1,5 (7 =

X - a = 23,6

X - 0,5 (7 = = 24,8

x + 0,5st = 27,2

X + a = 28,4

X+1,5 (7 =

Slika 16. Krivulja normalne distribucije iscrtana pomoću sedam točaka

U praksi, kada se proučava populacija kako bi se njezina distribucija uskladila s normalnom, često se koristi "pravilo 3cr".

Matematički je dokazano da je vjerojatnost da će odstupanje od prosjeka u apsolutnoj vrijednosti biti manje od trostruke standardne devijacije jednaka 0,9973, odnosno da je vjerojatnost da apsolutna vrijednost odstupanja premaši trostruku standardnu ​​devijaciju 0,0027 ili vrlo mala. Na temelju načela nemogućnosti malo vjerojatnih događaja, “slučaj prekoračenja” članka 3. može se smatrati praktički nemogućim. Ako slučajna varijabla raspodijeljen normalno, tada apsolutna vrijednost njegovog odstupanja od matematičkog očekivanja (prosjek) ne prelazi trostruku standardnu ​​devijaciju.

U praktičnim izračunima rade na ovaj način. Ako se, s obzirom na nepoznatu prirodu distribucije slučajne varijable koja se proučava, izračunata vrijednost odstupanja od srednje vrijednosti pokaže manje od vrijednosti 3 ST, to jest, postoji razlog za vjerovanje da je karakteristika koja se proučava normalno raspoređena. Ako navedeni parametar premašuje brojčanu vrijednost od 3 ST, možemo pretpostaviti da distribucija vrijednosti koja se proučava nije u skladu s normalnom distribucijom.

Izračun teoretskih frekvencija za proučavani empirijski niz distribucije obično se naziva poravnanje empirijskih krivulja prema normalnom (ili bilo kojem drugom) zakonu distribucije. Ovaj proces je važan i teorijski i praktični značaj. Usklađivanje empirijskih podataka otkriva obrazac u njihovoj distribuciji, koji se može prikriti slučajnim oblikom njegove manifestacije. Ovako uspostavljen obrazac može se koristiti za rješavanje niza praktičnih problema.

S raspodjelom bliskom normalnoj, istraživač se susreće razna polja znanost i područja praktične ljudske djelatnosti. U ekonomiji je ovakva raspodjela rjeđa nego, recimo, u tehnici ili biologiji. To je zbog same prirode društveno-ekonomskih pojava, koje karakterizira velika složenost međusobno povezanih i povezanih čimbenika, kao i prisutnost niza uvjeta koji ograničavaju slobodnu "igru" slučajeva. Ali ekonomist se mora pozivati ​​na normalnu distribuciju, analizirajući strukturu empirijskih distribucija, kao na neku vrstu standarda. Takva usporedba omogućuje razjašnjenje prirode onih unutarnjih uvjeta koji određuju ovu brojku distribucije.

Prodor sfere statistička istraživanja u polje društveno-ekonomskih pojava omogućilo otkrivanje postojanja velika količina različite vrste distribucijskih krivulja. Međutim, ne treba pretpostaviti da je teorijski koncept krivulje normalne distribucije općenito od male koristi u statističkoj i matematičkoj analizi ove vrste fenomena. Ne mora uvijek biti prihvatljivo u analizi određenog statistička distribucija, ali na području teorije i prakse metoda uzorkovanja istraživanje je od iznimne važnosti.

Navedimo glavne aspekte primjene normalne distribucije u statističkoj i matematičkoj analizi.

1. Odrediti vjerojatnost određene vrijednosti obilježja. Ovo je neophodno kada se testiraju hipoteze o podudarnosti određene empirijske distribucije s normalnom.

2. Pri procjeni niza parametara, na primjer, prosjeka, korištenjem metode najveće vjerojatnosti. Njegova bit leži u definiciji zakona kojemu podliježe cjelokupnost. Također je određena procjena koja daje maksimalne vrijednosti. Najbolja aproksimacija parametara stanovništva daje relaciju:

y = - 2 = e 2

3. Odrediti vjerojatnost uzoraka srednjih vrijednosti u odnosu na opće srednje vrijednosti.

4. Pri određivanju intervala pouzdanosti u kojem se nalazi približna vrijednost obilježja opće populacije.

U praksi, većina slučajnih varijabli na koje utječe veliki broj slučajnih čimbenika pridržava se normalnog zakona distribucije vjerojatnosti. Stoga je u različitim primjenama teorije vjerojatnosti ovaj zakon od posebne važnosti.

Slučajna varijabla $X$ poštuje normalni zakon distribucije vjerojatnosti ako njezina gustoća distribucije vjerojatnosti ima sljedeći oblik

$$f\lijevo(x\desno)=((1)\preko (\sigma \sqrt(2\pi )))e^(-(((\lijevo(x-a\desno))^2)\preko ( 2(\sigma )^2)))$$

Graf funkcije $f\lijevo(x\desno)$ shematski je prikazan na slici i naziva se “Gaussova krivulja”. Desno od ovog grafikona nalazi se njemačka novčanica od 10 maraka, koja se koristila prije uvođenja eura. Ako bolje pogledate, na ovoj novčanici možete vidjeti Gaussovu krivulju i njenog pronalazača, najvećeg matematičara Carla Friedricha Gaussa.

Vratimo se našoj funkciji gustoće $f\left(x\right)$ i dajmo neka objašnjenja u vezi s parametrima distribucije $a,\ (\sigma )^2$. Parametar $a$ karakterizira središte disperzije vrijednosti slučajne varijable, odnosno ima značenje matematičkog očekivanja. Kada se parametar $a$ promijeni, a parametar $(\sigma )^2$ ostane nepromijenjen, možemo uočiti pomak na grafu funkcije $f\lijevo(x\desno)$ duž apscise, dok graf gustoće sama ne mijenja svoj oblik.

Parametar $(\sigma )^2$ je varijanca i karakterizira oblik krivulje grafikona gustoće $f\lijevo(x\desno)$. Kada mijenjamo parametar $(\sigma )^2$ s nepromijenjenim parametrom $a$, možemo promatrati kako graf gustoće mijenja svoj oblik, sažimajući se ili rastežući, bez pomicanja duž apscisne osi.

Vjerojatnost da normalno distribuirana slučajna varijabla padne u zadani interval

Kao što je poznato, vjerojatnost da slučajna varijabla $X$ padne u interval $\left(\alpha ;\ \beta \right)$ može se izračunati $P\left(\alpha< X < \beta \right)=\int^{\beta }_{\alpha }{f\left(x\right)dx}$. Для нормального распределения случайной величины $X$ с параметрами $a,\ \sigma $ справедлива следующая формула:

$$P\lijevo(\alfa< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right)$$

Ovdje je funkcija $\Phi \left(x\right)=((1)\over (\sqrt(2\pi )))\int^x_0(e^(-t^2/2)dt)$ Laplaceova funkcija. Vrijednosti ove funkcije preuzete su iz . Mogu se primijetiti sljedeća svojstva funkcije $\Phi \left(x\right)$.

1 . $\Phi \left(-x\right)=-\Phi \left(x\right)$, odnosno funkcija $\Phi \left(x\right)$ je neparna.

2 . $\Phi \left(x\right)$ je monotono rastuća funkcija.

3 . $(\mathop(lim)_(x\to +\infty ) \Phi \lijevo(x\desno)\ )=0,5$, $(\mathop(lim)_(x\to -\infty ) \ Phi \ lijevo(x\desno)\ )=-0,5$.

Za izračun vrijednosti funkcije $\Phi \left(x\right)$ također možete koristiti čarobnjak za funkciju $f_x$ u Excelu: $\Phi \left(x\right)=NORMDIST\left(x ;0;1;1\desno )-0,5$. Na primjer, izračunajmo vrijednosti funkcije $\Phi \left(x\right)$ za $x=2$.

Vjerojatnost da normalno distribuirana slučajna varijabla $X\in N\left(a;\ (\sigma )^2\right)$ padne u interval simetričan s obzirom na matematičko očekivanje $a$ može se izračunati pomoću formule

$$P\lijevo(\lijevo|X-a\desno|< \delta \right)=2\Phi \left({{\delta }\over {\sigma }}\right).$$

Pravilo tri sigme. Gotovo je sigurno da će normalno distribuirana slučajna varijabla $X$ pasti u interval $\left(a-3\sigma ;a+3\sigma \right)$.

Primjer 1 . Slučajna varijabla $X$ podliježe normalnom zakonu distribucije vjerojatnosti s parametrima $a=2,\ \sigma =3$. Nađite vjerojatnost da $X$ padne u interval $\left(0.5;1\right)$ i vjerojatnost zadovoljenja nejednakosti $\left|X-a\right|< 0,2$.

Korištenje formule

$$P\lijevo(\alfa< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right),$$

nalazimo $P\lijevo(0,5;1\desno)=\Phi \lijevo(((1-2)\preko (3))\desno)-\Phi \lijevo(((0,5-2)\ preko (3 ))\desno)=\Phi \lijevo(-0,33\desno)-\Phi \lijevo(-0,5\desno)=\Phi \lijevo(0,5\desno)-\Phi \lijevo(0,33\desno)=0,191- 0,129=0,062 dolara.

$$P\lijevo(\lijevo|X-a\desno|< 0,2\right)=2\Phi \left({{\delta }\over {\sigma }}\right)=2\Phi \left({{0,2}\over {3}}\right)=2\Phi \left(0,07\right)=2\cdot 0,028=0,056.$$

Primjer 2 . Pretpostavimo da je tijekom godine cijena dionica određenog poduzeća slučajna varijabla raspoređena prema normalnom zakonu s matematičkim očekivanjem jednakim 50 konvencionalnih novčanih jedinica i standardnom devijacijom jednakom 10. Kolika je vjerojatnost da na slučajno odabranom dan razdoblja o kojem se raspravlja cijena za promociju će biti:

a) više od 70 konvencionalnih novčanih jedinica?

b) ispod 50 po dionici?

c) između 45 i 58 konvencionalnih novčanih jedinica po dionici?

Neka je slučajna varijabla $X$ cijena dionica nekog poduzeća. Prema uvjetu, $X$ podliježe normalnom zakonu raspodjele s parametrima $a=50$ - matematičko očekivanje, $\sigma =10$ - standardna devijacija. Vjerojatnost $P\lijevo(\alfa< X < \beta \right)$ попадания $X$ в интервал $\left(\alpha ,\ \beta \right)$ будем находить по формуле:

$$P\lijevo(\alfa< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right).$$

$$a)\ P\lijevo(X>70\desno)=\Phi \lijevo(((\infty -50)\preko (10))\desno)-\Phi \lijevo(((70-50)\ preko (10))\desno)=0,5-\Phi \lijevo(2\desno)=0,5-0,4772=0,0228.$$

$$b)\P\lijevo(X< 50\right)=\Phi \left({{50-50}\over {10}}\right)-\Phi \left({{-\infty -50}\over {10}}\right)=\Phi \left(0\right)+0,5=0+0,5=0,5.$$

$$in)\ P\lijevo(45< X < 58\right)=\Phi \left({{58-50}\over {10}}\right)-\Phi \left({{45-50}\over {10}}\right)=\Phi \left(0,8\right)-\Phi \left(-0,5\right)=\Phi \left(0,8\right)+\Phi \left(0,5\right)=$$

Najpoznatiji i najčešće korišteni zakon u teoriji vjerojatnosti je zakon normalne distribucije ili Gaussov zakon .

Glavna značajka Normalni zakon distribucije je da je on ograničavajući zakon za druge zakone distribucije.

Imajte na umu da za normalnu distribuciju integralna funkcija ima oblik:

.

Pokažimo sada da je vjerojatnosno značenje parametara sljedeće: A je matematičko očekivanje, - standardna devijacija (tj.) normalne distribucije:

a) prema definiciji matematičkog očekivanja kontinuirane slučajne varijable, imamo

Stvarno

,

budući da se pod integralnim znakom nalazi neparna funkcija, a granice integracije su simetrične oko ishodišta;

- Poissonov integral .

Dakle, matematičko očekivanje normalne distribucije jednako je parametru A .

b) definicijom varijance kontinuirane slučajne varijable i, uzimajući u obzir da , možemo napisati

.

Integriranje po dijelovima, stavljanje , hajde da nađemo

Stoga .

Dakle, standardna devijacija normalne distribucije jednaka je parametru.

Ako je distribucija također normalna, naziva se normalizirana (ili standardna normalna) distribucija. Tada će, očito, normalizirana gustoća (diferencijal) i normalizirana funkcija integralne distribucije biti redom napisane u obliku:

(Funkcija se, kao što znate, naziva Laplaceova funkcija (vidi PREDAVANJE 5) ili integral vjerojatnosti. Obje funkcije, tj. , tabelarno i njihove vrijednosti su zabilježene u odgovarajućim tablicama).

Svojstva normalne distribucije (svojstva normalne krivulje):

1. Očito, funkcija na cijelom brojevnom pravcu.

2. , odnosno normalna krivulja nalazi se iznad osi Oh .

3. , odnosno os Oh služi kao horizontalna asimptota grafa.

4. Normalna krivulja je simetrična u odnosu na ravnu liniju x = a (prema tome, graf funkcije je simetričan u odnosu na os Oh ).

Stoga možemo pisati: .

5. .

6. Lako je pokazati da točke I su točke infleksije normalne krivulje (dokažite sami).

7.Očito je da

ali budući da , To . Osim toga , dakle, svi neparni momenti su jednaki nuli.

Za parne trenutke možemo napisati:

8. .

9. .

10. , Gdje .

11. Za negativne vrijednosti slučajne varijable: , gdje je .


13. Vjerojatnost da slučajna varijabla padne u presjek simetričan u odnosu na središte distribucije jednaka je:

PRIMJER 3. Pokažite da je normalno distribuirana slučajna varijabla X odstupa od matematičkog očekivanja M(X) ne više od .

Otopina. Za normalnu distribuciju: .

Drugim riječima, vjerojatnost da apsolutna vrijednost odstupanja premašit će trostruka standardna devijacija je vrlo mala, odnosno jednaka 0,0027. To znači da se to može dogoditi samo u 0,27% slučajeva. Takvi se događaji, temeljeni na načelu nemogućnosti malo vjerojatnih događaja, mogu smatrati praktički nemogućima.

Dakle, događaj s vjerojatnošću od 0,9973 može se smatrati praktički pouzdanim, odnosno slučajna varijabla ne odstupa od matematičkog očekivanja za najviše .

PRIMJER 4. Poznavanje karakteristika normalne raspodjele slučajne varijable X - vlačna čvrstoća čelika: kg/mm2 i kg/mm2, pronađite vjerojatnost dobivanja čelika vlačne čvrstoće od 31 kg/mm2 do 35 kg/mm2.

Otopina.

3. Eksponencijalna distribucija (zakon eksponencijalne distribucije)

Eksponencijalna je distribucija vjerojatnosti kontinuirane slučajne varijable. X , koja je opisana diferencijalnom funkcijom (gustoća distribucije)

gdje je konstantna pozitivna vrijednost.

Definirana je eksponencijalna distribucija jedan parametar. Ovo svojstvo eksponencijalne distribucije ukazuje na njenu prednost u odnosu na distribucije ovisne o više parametri. Obično su parametri nepoznati i potrebno je pronaći njihove procjene (približne vrijednosti); Naravno, lakše je ocijeniti jedan parametar nego dva, tri, itd.

Lako je napisati funkciju integralne eksponencijalne distribucije:

Definirali smo eksponencijalnu distribuciju pomoću diferencijalne funkcije; jasno je da se može odrediti korištenjem integralne funkcije.

Komentar: Razmotrimo kontinuiranu slučajnu varijablu T - duljina vremena neprekidnog rada proizvoda. Njegove prihvaćene vrijednosti označene su sa t , . Funkcija kumulativne distribucije definira vjerojatnost neuspjeha proizvoda tijekom određenog vremenskog razdoblja t . Posljedično, vjerojatnost rada bez greške tijekom istog vremena, trajanje t , odnosno vjerojatnost suprotnog događaja jednaka je

U članku se detaljno prikazuje što je zakon normalne distribucije slučajne varijable i kako ga koristiti pri rješavanju praktičnih problema.

Normalna distribucija u statistici

Povijest prava seže 300 godina unatrag. Prvi pronalazač bio je Abraham de Moivre, koji je do aproksimacije došao još 1733. godine. Mnogo godina kasnije, Carl Friedrich Gauss (1809.) i Pierre-Simon Laplace (1812.) izveli su matematičke funkcije.

Laplace je također otkrio izvanredan obrazac i formulirao središnji granični teorem (CPT), prema kojem zbroj velikog broja malih i neovisnih veličina ima normalnu raspodjelu.

Normalni zakon nije fiksna jednadžba ovisnosti jedne varijable o drugoj. Bilježi se samo priroda ove ovisnosti. Specifični oblik raspodjele zadaje se posebnim parametrima. Na primjer, y = sjekira + b je jednadžba ravne linije. Međutim, gdje točno prolazi i pod kojim kutom određuju parametri A I b. Isto je i s normalnom distribucijom. Jasno je da se radi o funkciji koja opisuje tendenciju da vrijednosti budu visoko koncentrirane oko središta, ali njezin točan oblik određuju posebni parametri.

Gaussova krivulja normalne distribucije izgleda ovako.

Grafikon normalne distribucije nalikuje zvonu, zbog čega biste mogli vidjeti naziv zvonasta krivulja. Graf ima "grbu" u sredini i oštro smanjenje gustoće na rubovima. Ovo je bit normalne distribucije. Vjerojatnost da će slučajna varijabla biti blizu središta puno je veća nego da će jako odstupiti od središta.

Gornja slika prikazuje dva područja ispod Gaussove krivulje: plavo i zeleno. Razlozi, tj. Intervali su jednaki za obje dionice. Ali visine su primjetno drugačije. Plavi dio je udaljeniji od središta i znatno je niže visine od zelenog dijela koji se nalazi u samom središtu distribucije. Posljedično se razlikuju i površine, odnosno vjerojatnosti upadanja u zadane intervale.

Formula za normalnu distribuciju (gustoću) je sljedeća.

Formula se sastoji od dvije matematičke konstante:

π – pi broj 3,142;

e– baza prirodni logaritam 2,718;

dva promjenjiva parametra koji definiraju oblik određene krivulje:

m– matematičko očekivanje (u različitim izvorima mogu se koristiti i druge oznake, npr. µ ili a);

σ 2– disperzija;

i sama varijabla x, za koje se izračunava gustoća vjerojatnosti.

Specifični oblik normalne distribucije ovisi o 2 parametra: ( m) i ( σ 2). Ukratko naznačeno N(m, σ 2) ili N(m, σ). Parametar m(očekivanje) određuje središte distribucije, koje odgovara maksimalnoj visini grafa. Disperzija σ 2 karakterizira opseg varijacije, odnosno "razmazanost" podataka.

Parametar matematičkog očekivanja pomiče središte distribucije udesno ili ulijevo bez utjecaja na oblik same krivulje gustoće.

Ali disperzija određuje oštrinu krivulje. Kada podaci imaju malu raspršenost, tada je sva njihova masa koncentrirana u središtu. Ako podaci imaju veliku raspršenost, tada su "rasprostranjeni" u širokom rasponu.

Gustoća distribucije nema izravnu praktična primjena. Da biste izračunali vjerojatnosti, morate integrirati funkciju gustoće.

Vjerojatnost da će slučajna varijabla biti manja od određene vrijednosti x, utvrđuje se funkcija normalne distribucije:

Koristeći matematička svojstva bilo koje kontinuirane distribucije, lako je izračunati sve druge vjerojatnosti, budući da

P(a ≤ X< b) = Ф(b) – Ф(a)

Standardna normalna distribucija

Normalna distribucija ovisi o parametrima sredine i varijance, zbog čega su njena svojstva slabo vidljiva. Bilo bi lijepo imati neki standard distribucije koji ne ovisi o mjerilu podataka. I postoji. Nazvana standardna normalna distribucija. Zapravo, radi se o običnoj normalnoj distribuciji, samo s parametrima matematičko očekivanje 0 i varijanca 1, ukratko napisano N(0, 1).

Svaka normalna distribucija može se lako pretvoriti u standardnu ​​distribuciju normalizacijom:

Gdje z– nova varijabla koja se koristi umjesto x;
m– matematičko očekivanje;
σ – standardna devijacija.

Za uzorke podataka uzimaju se procjene:

Aritmetička sredina i varijanca nove varijable z sada su također 0 odnosno 1. To se lako može provjeriti pomoću elementarnih algebarskih transformacija.

Ime se pojavljuje u literaturi z-rezultat. To je to – normalizirani podaci. Z-rezultat mogu se izravno usporediti s teorijskim vjerojatnostima, jer njegova se ljestvica poklapa sa standardnom.

Pogledajmo sada kako izgleda gustoća standardne normalne distribucije (npr z-rezultati). Podsjećam vas da Gaussova funkcija ima oblik:

Umjesto toga zamijenimo (x-m)/σ pismo z, a umjesto toga σ – jedan, dobivamo funkcija gustoće standardne normalne distribucije:

Grafikon gustoće:

Središte je, očekivano, u točki 0. U istoj točki Gaussova funkcija doseže svoj maksimum, što odgovara slučajnoj varijabli koja prihvaća svoju prosječnu vrijednost (tj. x-m=0). Gustoća u ovom trenutku je 0,3989, što se može izračunati čak iu vašoj glavi, jer e 0 =1 i sve što preostaje je izračunati omjer 1 prema korijenu 2 pi.

Dakle, grafikon jasno pokazuje da se vrijednosti koje imaju mala odstupanja od prosjeka pojavljuju češće od ostalih, a one koje su jako udaljene od središta pojavljuju se puno rjeđe. Ljestvica osi x mjeri se standardnim odstupanjima, što vam omogućuje da se riješite mjernih jedinica i dobijete univerzalnu strukturu normalne distribucije. Gaussova krivulja za normalizirane podatke savršeno pokazuje druga svojstva normalne distribucije. Na primjer, da je simetričan u odnosu na ordinatnu os. Većina svih vrijednosti koncentrirana je unutar ±1σ od aritmetičke sredine (za sada procjenjujemo na oko). Većina podataka je unutar ±2σ. Gotovo svi podaci su unutar ±3σ. Posljednje svojstvo nadaleko je poznato kao pravilo tri sigme za normalnu distribuciju.

Standardna funkcija normalne distribucije omogućuje vam izračunavanje vjerojatnosti.

Jasno je da nitko ne broji ručno. Sve je izračunato i smješteno u posebne tablice, koje se nalaze na kraju svakog udžbenika statistike.

Tablica normalne distribucije

Postoje dvije vrste tablica normalne distribucije:

- stol gustoća;

- stol funkcije(integral gustoće).

Stol gustoća rijetko korišten. Ipak, da vidimo kako to izgleda. Recimo da trebamo dobiti gustoću za z = 1, tj. gustoća vrijednosti odvojena od očekivanja za 1 sigmu. Ispod je dio tablice.

Ovisno o organizaciji podataka koje tražimo željenu vrijednost po imenima stupaca i redaka. U našem primjeru uzimamo liniju 1,0 i stupac 0 , jer nema stotinki. Vrijednost koju tražite je 0,2420 (0 prije 2420 je izostavljena).

Gaussova funkcija je simetrična u odnosu na ordinatnu os. Eto zašto φ(z)= φ(-z), tj. gustoća za 1 identičan je gustoći za -1 , što je jasno vidljivo na slici.

Kako bi se izbjeglo rasipanje papira, tablice se ispisuju samo za pozitivne vrijednosti.

U praksi se češće koriste vrijednosti funkcije standardna normalna distribucija, odnosno vjerojatnost za različite z.

Takve tablice također sadrže samo pozitivne vrijednosti. Stoga, razumjeti i pronaći bilo koji treba znati tražene vjerojatnosti svojstva standardne normalne distribucije.

Funkcija F(z) simetričan oko svoje vrijednosti 0,5 (a ne ordinatne osi, kao gustoća). Dakle, jednakost je istinita:

Ova činjenica je prikazana na slici:

Vrijednosti funkcije F(-z) I F(z) podijeliti graf na 3 dijela. Štoviše, gornji i donji dio su jednaki (označeno kvačicama). Da dopuni vjerojatnost F(z) na 1, samo dodajte vrijednost koja nedostaje F(-z). Dobivate jednakost naznačenu gore.

Ako trebate pronaći vjerojatnost pada u interval (0; z), odnosno vjerojatnost odstupanja od nule u pozitivnom smjeru do određenog iznosa standardne devijacije, dovoljno je oduzeti 0,5 od vrijednosti standardne funkcije normalne distribucije:

Radi jasnoće, možete pogledati crtež.

Na Gaussovoj krivulji, ova ista situacija izgleda kao područje od središta desno do z.

Vrlo često analitičara zanima vjerojatnost odstupanja u oba smjera od nule. A budući da je funkcija simetrična oko središta, prethodna formula se mora pomnožiti s 2:

Slika ispod.

Ispod Gaussove krivulje ovo je središnji dio ograničen odabranom vrijednošću –z lijevo i z pravo.

Ova svojstva treba uzeti u obzir, jer tablične vrijednosti rijetko odgovaraju intervalu od interesa.

Da bi se zadatak olakšao, udžbenici obično objavljuju tablice za funkcije oblika:

Ako vam je potrebna vjerojatnost odstupanja u oba smjera od nule, tada se, kao što smo upravo vidjeli, tablična vrijednost za ovu funkciju jednostavno pomnoži s 2.

Sada pogledajmo konkretne primjere. Ispod je tablica standardne normalne distribucije. Pronađimo tablične vrijednosti za tri z: 1.64, 1.96 i 3.

Kako razumjeti značenje ovih brojeva? Počnimo s z=1,64, za koju je tablična vrijednost 0,4495 . Značenje je najlakše objasniti na slici.

To jest, vjerojatnost da standardizirana normalno distribuirana slučajna varijabla padne unutar intervala od 0 do 1,64 , jednak je 0,4495 . Kada rješavate probleme, obično morate izračunati vjerojatnost odstupanja u oba smjera, pa pomnožimo vrijednost 0,4495 za 2 i dobijemo približno 0,9. Zauzeto područje ispod Gaussove krivulje prikazano je u nastavku.

Dakle, 90% svih normalno raspodijeljenih vrijednosti spada u interval ±1,64σ od aritmetičke sredine. Nisam slučajno odabrao značenje z=1,64, jer susjedstvo oko aritmetičke sredine, koje zauzima 90% cijele površine, ponekad se koristi za izračun intervali povjerenja. Ako vrijednost koja se testira ne spada unutar označenog područja, tada je njezino pojavljivanje malo vjerojatno (samo 10%).

Za testiranje hipoteza, međutim, češće se koristi interval koji pokriva 95% svih vrijednosti. Pola šanse 0,95 - Ovo 0,4750 (pogledajte drugu istaknutu vrijednost u tablici).

Za ovu vjerojatnost z=1,96. one. unutar gotovo ±2σ 95% vrijednosti je iz prosjeka. Samo 5% je izvan ovih granica.

Još jedna zanimljiva i često korištena tablična vrijednost odgovara z=3, jednako je prema našoj tablici 0,4986 . Pomnožimo s 2 i dobijemo 0,997 . Dakle, unutar ±3σ Gotovo sve vrijednosti izvedene su iz aritmetičke sredine.

Ovako izgleda pravilo 3 sigme za normalnu distribuciju u dijagramu.

Pomoću statističkih tablica možete dobiti bilo koju vjerojatnost. Međutim, ova metoda je vrlo spora, nezgodna i vrlo zastarjela. Danas se sve radi na računalu. Zatim prelazimo na praksu izračuna u Excelu.

Normalna distribucija u Excelu

Excel ima nekoliko funkcija za izračunavanje vjerojatnosti ili inverza normalne distribucije.

Funkcija NORMAL DIST

Funkcija NORM.ST.DIST. dizajniran za izračunavanje gustoće ϕ(z) ili vjerojatnosti Φ(z) prema normaliziranim podacima ( z).

=NORM.ST.DIST(z;integral)

z– vrijednost standardizirane varijable

sastavni– ako je 0, izračunava se gustoćaϕ(z) , ako je 1 vrijednost funkcije F(z), tj. vjerojatnost P(Z

Izračunajmo gustoću i vrijednost funkcije za razne z: -3, -2, -1, 0, 1, 2, 3(naznačit ćemo ih u ćeliji A2).

Za izračun gustoće trebat će vam formula =NORM.ST.DIST(A2;0). Na donjem dijagramu ovo je crvena točka.

Za izračun vrijednosti funkcije =NORM.ST.DIST(A2;1). Dijagram prikazuje osjenčano područje ispod normalne krivulje.

U stvarnosti je češće potrebno izračunati vjerojatnost da slučajna varijabla neće prijeći određene granice prosjeka (u standardnim odstupanjima koja odgovaraju varijabli z), tj. P(|Z| .

Odredimo vjerojatnost da slučajna varijabla padne unutar granica ±1z, ±2z i ±3z od nule. Treba formula 2F(z)-1, u Excelu =2*NORM.ST.DIST(A2;1)-1.

Dijagram jasno prikazuje glavna osnovna svojstva normalne distribucije, uključujući pravilo tri sigme. Funkcija NORM.ST.DIST. je automatska tablica normalnih vrijednosti funkcije distribucije u Excelu.

Može postojati i obrnuti problem: prema raspoloživoj vjerojatnosti P(Z pronaći standardiziranu vrijednost z, odnosno kvantil standardne normalne distribucije.

Funkcija NORMAL REV

NORM.ST.REV izračunava inverznu funkciju standardne normalne distribucije. Sintaksa se sastoji od jednog parametra:

=NORM.ST.REV(vjerojatnost)

vjerojatnost je vjerojatnost.

Ova se formula koristi jednako često kao i prethodna, jer upotrebom istih tablica morate tražiti ne samo vjerojatnosti, već i kvantile.

Na primjer, kod izračunavanja intervala pouzdanosti navedena je vjerojatnost pouzdanosti prema kojoj je potrebno izračunati vrijednost z.

S obzirom da se interval pouzdanosti sastoji od gornje i donje granice te da je normalna distribucija simetrična oko nule, dovoljno je dobiti gornju granicu (pozitivno odstupanje). Donja granica se uzima s negativnim predznakom. Označimo vjerojatnost pouzdanja kao γ (gama), tada se gornja granica intervala pouzdanosti izračunava pomoću sljedeće formule.

Izračunajmo vrijednosti u Excelu z(što odgovara odstupanju od prosjeka u sigmi) za nekoliko vjerojatnosti, uključujući i one koje svaki statističar zna napamet: 90%, 95% i 99%. U ćeliji B2 označavamo formulu: =NORM.ST.REV((1+A2)/2). Promjenom vrijednosti varijable (vjerojatnost u ćeliji A2) dobivamo različite granice intervala.

Interval pouzdanosti od 95% je 1,96, odnosno gotovo 2 standardne devijacije. Odavde je lako, čak i mentalno, procijeniti moguće širenje normalne slučajne varijable. Općenito, intervali pouzdanosti od 90%, 95% i 99% odgovaraju intervalima pouzdanosti od ±1,64, ±1,96 i ±2,58σ.

Općenito, funkcije NORM.ST.DIST i NORM.ST.REV omogućuju izvođenje bilo kojeg izračuna koji se odnosi na normalnu distribuciju. Ali kako bi olakšao i smanjio broj koraka, Excel ima nekoliko drugih značajki. Na primjer, možete koristiti NORMU POVJERANJA za izračun intervala pouzdanosti za srednju vrijednost. Za provjeru aritmetičke sredine postoji formula Z.TEST.

Pogledajmo još nekoliko korisnih formula s primjerima.

Funkcija NORMAL DIST

Funkcija NORMALNA DIST. različito od NORM.ST.DIST. samo zato što se koristi za obradu podataka bilo koje razine, a ne samo normaliziranih. Parametri normalne distribucije navedeni su u sintaksi.

=NORM.DIST(x,prosjek,standardna_devijacija,integral)

prosjek– matematičko očekivanje koje se koristi kao prvi parametar modela normalne distribucije

standard_off– standardna devijacija – drugi parametar modela

sastavni– ako je 0, računa se gustoća, ako je 1 – vrijednost funkcije, tj. P(X

Na primjer, gustoća za vrijednost 15, koja je izdvojena iz normalnog uzorka s očekivanim 10, standardnom devijacijom 3, izračunava se na sljedeći način:

Ako je zadnji parametar postavljen na 1, tada dobivamo vjerojatnost da će normalna slučajna varijabla biti manja od 15 za dane parametre distribucije. Stoga se vjerojatnosti mogu izračunati izravno iz izvornih podataka.

funkcija NORM.REV

Ovo je kvantil normalne distribucije, tj. vrijednost inverzne funkcije. Sintaksa je sljedeća.

=NORM.REV(vjerojatnost,prosjek,standardna_devijacija)

vjerojatnost- vjerojatnost

prosjek– matematičko očekivanje

standard_off– standardna devijacija

Svrha je ista kao NORM.ST.REV, samo funkcija radi s podacima bilo koje razine.

Primjer je prikazan u videu na kraju članka.

Modeliranje normalne distribucije

Neki problemi zahtijevaju generiranje normalnih nasumičnih brojeva. Ne postoji gotova funkcija za to. Međutim, Excel ima dvije funkcije koje vraćaju nasumične brojeve: SLUČAJ IZMEĐU I RAND. Prvi proizvodi nasumične, ravnomjerno raspoređene cijele brojeve unutar određenih granica. Druga funkcija generira ravnomjerno distribuirane slučajne brojeve između 0 i 1. Da biste napravili umjetni uzorak s bilo kojom distribucijom, potrebna vam je funkcija RAND.

Recimo da je za provođenje eksperimenta potrebno dobiti uzorak iz normalno raspoređene populacije s očekivanjem od 10 i standardnom devijacijom od 3. Za jednu slučajnu vrijednost napisat ćemo formulu u Excelu.

NORM.INV(RAND();10;3)

Proširimo ga na potreban broj stanica i normalni uzorak je spreman.

Za modeliranje standardiziranih podataka trebali biste koristiti NORM.ST.REV.

Proces pretvaranja uniformnih brojeva u normalne brojeve može se prikazati na sljedećem dijagramu. Iz uniformnih vjerojatnosti koje generira RAND formula, vodoravne linije se povlače na grafikon funkcije normalne distribucije. Zatim se iz točaka sjecišta vjerojatnosti s grafom projekcije spuštaju na vodoravnu os.

u usporedbi s drugim vrstama distribucija. Glavna značajka ove raspodjele je da svi ostali zakoni raspodjele teže ovom zakonu s beskonačnim ponavljanjem broja testova. Kako dolazi do ove distribucije?

Zamislimo da se, uzevši ručni dinamometar, nalazite na najgušćem mjestu u vašem gradu. I nudiš svakome tko prolazi da odmjeri snagu stiskanjem dinamometra desnom ili lijevom rukom. Pažljivo zapisujete očitanja dinamometra. Nakon nekog vremena, s dovoljno velikim brojem testova, na apscisnu os ucrtali ste očitanja dinamometra, a na ordinatnu os broj ljudi koji su to očitanje "iscijedili". Rezultirajuće točke povezane su glatkom linijom. Rezultat je krivulja prikazana na sl. 9.8. Izgled ove krivulje neće se puno promijeniti kako se vrijeme eksperimenta povećava. Štoviše, od određene točke nadalje, nove vrijednosti će samo poboljšati krivulju bez promjene njenog oblika.


Riža. 9.8.

Sada premjestimo naš dinamometar u atletsku dvoranu i ponovimo eksperiment. Sada će se maksimum krivulje pomaknuti udesno, lijevi kraj će biti nešto zategnutiji, dok će desni kraj biti strmiji (slika 9.9).


Riža. 9.9.

Imajte na umu da će maksimalna učestalost za drugu distribuciju (točka B) biti niža od maksimalne frekvencije za prvu distribuciju (točka A). To se može objasniti činjenicom da će ukupan broj ljudi koji posjećuju atletsku dvoranu biti manji od broja ljudi koji su prošli pored eksperimentatora u prvom slučaju (u centru grada na prilično gužvi). Maksimum je pomaknut udesno, budući da atletske teretane posjećuju fizički jači ljudi u odnosu na opću pozadinu.

I na kraju, obići ćemo škole, vrtiće i staračke domove s istim ciljem: otkriti snagu ruku posjetitelja ovih mjesta. I opet će krivulja raspodjele imati sličan oblik, ali sada će očito njen lijevi kraj biti strmiji, a desni kraj izvučeniji. I kao u drugom slučaju, maksimum (točka C) će biti ispod točke A (Sl. 9.10).


Riža. 9.10.

Ovo izvanredno svojstvo normalne distribucije - zadržavanje oblika krivulje gustoće vjerojatnosti (sl. 8 - 10) primijetio je i opisao 1733. Moivre, a zatim ga je proučavao Gauss.

U znanstvenim istraživanjima, u tehnologiji, u masovnim pojavama ili eksperimentima, kada govorimo o opetovano ponavljajućim slučajnim varijablama pod stalnim eksperimentalnim uvjetima, kažu da rezultati ispitivanja prolaze kroz nasumično raspršenje, pokoravajući se zakonu krivulje normalne distribucije.

(21)

Gdje je najčešći događaj. U pravilu, u formuli (21) umjesto parametra, . Štoviše, što je eksperimentalna serija duža, to će se parametar manje razlikovati od matematičkog očekivanja. Pretpostavlja se da je površina ispod krivulje (slika 9.11) jednaka jedinici. Područje koje odgovara bilo kojem intervalu x-osi brojčano je jednako vjerojatnosti da slučajni rezultat padne u taj interval.


Riža. 9.11.

Funkcija normalne distribucije ima oblik


(22)

Imajte na umu da je normalna krivulja (slika 9.11) simetrična u odnosu na ravnu liniju i asimptotski se približava osi OX na .

Izračunajmo matematičko očekivanje za normalni zakon


(23)

Svojstva normalne distribucije

Razmotrimo osnovna svojstva ove važne distribucije.

Svojstvo 1. Funkcija gustoće normalne distribucije (21) definirana je na cijeloj x-osi.

Svojstvo 2. Funkcija gustoće normalne distribucije (21) veća je od nule za bilo koju domenu definicije ().

Svojstvo 3. S beskonačnim porastom (opadanjem) funkcija raspodjele (21) teži nuli .

Svojstvo 4. Kada funkcija raspodjele dana (21) ima najveću vrijednost jednaku

(24)

Svojstvo 5. Graf funkcije (sl. 9.11) je simetričan u odnosu na ravnu liniju.

Svojstvo 6. Graf funkcije (slika 9.11) ima dvije točke infleksije simetrične u odnosu na ravnu liniju:

(25)

Svojstvo 7. Svi neparni središnji momenti su nula. Imajte na umu da korištenjem svojstva 7 asimetričnost funkcije određuje formula. Ako, tada zaključuju da je distribucija koja se proučava simetrična u odnosu na ravnu liniju. Ako je , onda kažu da je serija pomaknuta udesno (desna grana grafa je ravnija ili zategnutija). Ako je , tada se serija smatra pomaknutom ulijevo (ravnija lijeva grana grafa na slici 9.12).


Riža. 9.12.

Svojstvo 8. Kurtosis distribucije jednak je 3. U praksi se često izračunava i stupanj "kompresije" ili "zamućenja" grafa određuje se blizinom te vrijednosti nuli (slika 9.13). A budući da je povezan s , u konačnici karakterizira stupanj disperzije frekvencije podataka. A budući da određuje