Statistički nizovi intervalnih varijacija. Varijacijski i statistički nizovi distribucije. Za što se koristi Spearmanov koeficijent?

Metoda grupiranja također vam omogućuje mjerenje varijacija(varijabilnost, fluktuacija) znakova. Kada je broj jedinica u populaciji relativno mali, varijacija se mjeri na temelju rangiranog broja jedinica koje čine populaciju. Serija se zove rangiran, ako su jedinice poredane uzlaznim (silaznim) redoslijedom obilježja.

No, rangirane serije su prilično indikativne kada je to potrebno komparativne karakteristike varijacije. Osim toga, u mnogim slučajevima imamo posla sa statističkim populacijama koje se sastoje od velikog broja jedinica, koje je praktički teško prikazati u obliku određene serije. U tom smislu, radi početnog općeg upoznavanja sa statističkim podacima, a posebno radi lakšeg proučavanja varijacija karakteristika, pojave i procesi koji se proučavaju obično se spajaju u skupine, a rezultati grupiranja prikazuju se u obliku skupnih tablica.

Ako grupna tablica ima samo dva stupca - grupe prema odabranom svojstvu (opcije) i broj grupa (učestalost ili učestalost), naziva se blizu distribucije.

Raspon distribucije - najjednostavniji tip strukturnog grupiranja na temelju jedne karakteristike, prikazan u grupnoj tablici s dva stupca koji sadrže varijante i učestalosti obilježja. U mnogim slučajevima, s takvim strukturnim grupiranjem, t.j. Sastavljanjem serija distribucije počinje proučavanje polazne statističke građe.

Strukturno grupiranje u obliku niza distribucije može se pretvoriti u pravo strukturno grupiranje ako su odabrane skupine karakterizirane ne samo učestalostima, već i drugim statističkim pokazateljima. Glavna svrha serija distribucije je proučavanje varijacija karakteristika. Teorija serija distribucije detaljno je razvijena matematičkom statistikom.

Distribucijske serije dijele se na atributivni(grupiranje prema atributskim karakteristikama, npr. podjela stanovništva po spolu, nacionalnosti, bračno stanje itd.) i varijacijski(grupiranje po kvantitativnim obilježjima).

Varijacijski nizovi je skupna tablica koja sadrži dva stupca: grupiranje jedinica prema jednom kvantitativnom svojstvu i broj jedinica u svakoj skupini. Intervali u varijacijskom nizu obično su jednaki i zatvoreni. Niz varijacija je sljedeće grupiranje ruskog stanovništva prema prosječnom novčanom dohotku po glavi stanovnika (Tablica 3.10).

Tablica 3.10

Raspodjela stanovništva Rusije prema prosječnom dohotku po glavi stanovnika u razdoblju 2004.-2009.

Skupine stanovništva prema prosječnom novčanom dohotku po stanovniku, rub./mjesec

Stanovništvo u skupini, % od ukupnog broja

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Preko 25.000,00

Cijelo stanovništvo

Varijacijski nizovi se pak dijele na diskretne i intervalne. Diskretan serije varijacija kombiniraju varijante diskretnih karakteristika koje variraju unutar uskih granica. Primjer niza diskretnih varijacija je distribucija Ruske obitelji prema broju raspoložive djece.

Interval Serije varijacija kombiniraju varijante ili kontinuiranih karakteristika ili diskretnih karakteristika koje variraju u širokom rasponu. Interval je varijacijske serije raspodjela ruskog stanovništva prema prosječnom novčanom dohotku po glavi stanovnika.

Diskretni varijacijski nizovi se ne koriste često u praksi. U međuvremenu, njihovo sastavljanje nije teško, budući da je sastav skupina određen specifičnim varijantama koje proučavane karakteristike grupiranja zapravo imaju.

Nizovi intervalnih varijacija su rašireniji. Prilikom njihovog sastavljanja postavlja se teško pitanje o broju grupa, kao io veličini intervala koje treba uspostaviti.

Načela za rješavanje ovog pitanja navedena su u poglavlju o metodologiji za izradu statističkih grupa (vidi paragraf 3.3).

Varijacijski nizovi su sredstvo sažimanja ili sažimanja različitih informacija u kompaktni oblik; iz njih se može donijeti prilično jasan sud o prirodi varijacije i proučavati razlike u karakteristikama fenomena uključenih u skup koji se proučava. Ali najvažnije značenje varijacijskih nizova je to što se na njihovoj osnovi izračunavaju posebne generalizirajuće karakteristike varijacije (vidi Poglavlje 7).

Skupina brojeva objedinjenih nekim obilježjem naziva se u cjelini.

Kao što je gore navedeno, primarni statistički sportski materijal je skupina različitih brojeva koji treneru ne daju ideju o biti fenomena ili procesa. Izazov je ovu zbirku pretvoriti u sustav i pomoću njezinih pokazatelja dobiti potrebne informacije.

Sastavljanje varijacijskog niza upravo je formiranje određene matematičke

Primjer 2. 34 skijaša zabilježila su sljedeće vrijeme oporavka otkucaja srca nakon završetka udaljenosti (u sekundama):

81; 78: 84; 90; 78; 74; 84; 85; 81; 84: 79; 84; 74; 84; 84;

85; 81; 84; 78: 81; 74; 84; 81; 84; 85; 81; 78; 81; 81; 84;

kao što vidite, ovu grupu brojke ne daju nikakvu informaciju.

Da bismo sastavili niz varijacija, prvo izvodimo operaciju poredak - slaganje brojeva u rastućem ili padajućem redoslijedu. Na primjer, uzlaznim redoslijedom poredak rezultira sljedećim;

78; 78; 78; 78; 78; 78;

81; 81; 81; 81; 81; 81; 81; 81; 81;

84; 84; 84; 84; 84; 84; 84; 84; 84; 84; 84;

Silaznim redoslijedom, poredak rezultira ovom skupinom brojeva:

84; 84; 84; 84; 84; 84; 84; 84: 84: 84; 84;

81; 81; 81; 81; 8!; 81: 81; 81; 81;

78; 78; 78; 78; 78; 78;

Nakon rangiranja postaje očita iracionalnost pisanja ove skupine brojeva – isti se brojevi ponavljaju mnogo puta. Stoga se javlja prirodna ideja da se zapis transformira na način da se pokaže koji se broj koliko puta ponavlja. Na primjer, s obzirom na poredak uzlaznim redoslijedom:

Ovdje s lijeve strane je broj koji označava vrijeme oporavka pulsa sportaša, s desne strane je broj ponavljanja ovog očitanja u danoj skupini od 34 sportaša.

U skladu s navedenim pojmovima o matematičkim simbolima, razmatranu skupinu mjera označit ćemo nekim slovom, na primjer x. S obzirom na rastući redoslijed brojeva u ovoj skupini: x 1 -74 s; x 2 - 78 s; x 3 - 81 s; x 4 - 84 s; x 5 - 85 s; x 6 - x n - 90 s, svaki razmatrani broj može se označiti simbolom X i.

Označimo broj ponavljanja razmatranih mjerenja slovom n. Zatim:

n1=4; n2=6; n3=9; n4=11; n 5 =3; n 6 =n n =1, a svaki broj ponavljanja može se označiti kao n i.

Ukupan broj uzeta mjerenja, kao što slijedi iz uvjeta primjera, su 34. To znači da je zbroj svih n jednak 34. Ili u simboličkom izrazu:

Označimo ovaj iznos jednim slovom - n. Tada se početni podaci primjera koji se razmatra mogu napisati u ovom obliku (tablica 1).

Rezultirajuća skupina brojeva je transformirani niz kaotično raštrkanih očitanja koje je trener dobio na početku rada.

Tablica 1

x i n i
n=34

Takva skupina predstavlja određeni sustav čiji parametri karakteriziraju provedena mjerenja. Pozivaju se brojevi koji predstavljaju rezultate mjerenja (x i). mogućnosti; n i - broj njihovih ponavljanja - nazivaju se frekvencije; n - zbroj svih frekvencija - da volumen stanovništva.

Cjelokupni rezultirajući sustav naziva se varijacijske serije. Ponekad se te serije nazivaju empirijskim ili statističkim.

Lako je vidjeti da je poseban slučaj varijacijskog niza moguć kada su sve frekvencije jednake jedan n i ==1, to jest, svako mjerenje u danoj skupini brojeva događa se samo jednom.

Rezultirajući niz varijacija, kao i svaki drugi, može se prikazati grafički. Za iscrtavanje grafa dobivenog niza potrebno je prije svega dogovoriti mjerilo na vodoravnoj i okomitoj osi.

U ovom problemu ćemo na vodoravnoj osi iscrtati vrijednosti vremena oporavka pulsa (x 1) na način da jedinica duljine, odabrana proizvoljno, odgovara vrijednosti jedne sekunde. Počet ćemo odgađati ove vrijednosti od 70 sekundi, uvjetno se povlačeći od sjecišta dviju osi 0.

Na okomitoj osi crtamo vrijednosti frekvencije naše serije (n i), uzimajući ljestvicu: jedinica duljine jednaka je jedinici frekvencije.

Nakon što smo tako pripremili uvjete za konstruiranje grafa, počinjemo raditi s rezultirajućim nizom varijacija.

Prvi par brojeva x 1 =74, n 1 =4 ucrtavamo na graf ovako: na x os; nađi x 1 =74 i vratimo okomicu iz ove točke, na osi n nalazimo n 1 = 4 i povlačimo vodoravnu crtu od nje dok se ne siječe s prethodno obnovljenom okomicom. Obje crte - okomita i vodoravna - su pomoćne linije i zato se na crtežu crtaju točkasto. Točka njihovog sjecišta predstavlja, u mjerilu ovog grafikona, omjer X 1 =74 i n 1 =4.

Sve ostale točke na grafu iscrtavaju se na isti način. Zatim su povezani ravnim segmentima. Da bi graf imao zatvoren izgled, ekstremne točke povezujemo segmentima sa susjednim točkama horizontalne osi.

Dobivena slika je graf našeg niza varijacija (slika 1).

Potpuno je jasno da je svaka serija varijacija predstavljena vlastitim grafikonom.

Riža. 1. Grafički prikaz varijacijskog niza.

Na sl. 1 vidljivo:

1) od svih ispitanih najveću skupinu činili su sportaši čije je vrijeme oporavka srčanog ritma bilo 84 s;

2) za mnoge ovo vrijeme iznosi 81 s;

3) najmanja skupina bili su sportaši s kratkim vremenom oporavka otkucaja srca - 74 s i dugim - 90 s.

Dakle, nakon završetka niza testova, trebali biste rangirati dobivene brojeve i sastaviti niz varijacija, koji je određeni matematički sustav. Radi jasnoće, niz varijacija može se ilustrirati grafikonom.

Gornji varijacijski niz također se naziva diskretan pokraj njega – onaj u kojem je svaka opcija izražena jednim brojem.

Navedimo još nekoliko primjera sastavljanja nizova varijacija.

Primjer 3. 12 strijelaca izvodeći vježbu ležeći od 10 hitaca pokazalo je sljedeće rezultate (u bodovima):

94; 91; 96; 94; 94; 92; 91; 92; 91; 95; 94; 94.

Da bismo formirali niz varijacija, rangirat ćemo ove brojeve;

94; 94; 94; 94; 94;

Nakon rangiranja sastavljamo niz varijacija (tablica 3).

Stanje:

Postoje podaci o starosnom sastavu radnika (godine): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

    1. Konstruirajte niz intervalne distribucije.
    2. Konstruirajte grafički prikaz niza.
    3. Grafički odredi modu i medijan.

Otopina:

1) Prema Sturgessovoj formuli, stanovništvo se mora podijeliti u 1 + 3,322 lg 30 = 6 grupa.

Najviša dob - 38, minimalna - 18.

Širina intervala Budući da krajevi intervala moraju biti cijeli brojevi, populaciju dijelimo u 5 skupina. Širina intervala - 4.

Radi lakšeg izračuna podatke ćemo posložiti uzlaznim redoslijedom: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29, 29, 30, 30, 31, 32, 32, 33, 34, 35, 38, 38.

Dobna distribucija radnika

Grafički, serija se može prikazati kao histogram ili poligon. Histogram - stupčasti grafikon. Baza stupca je širina intervala. Visina stupca jednaka je frekvenciji.

Poligon (ili poligon distribucije) - frekvencijski grafikon. Da bismo ga izgradili pomoću histograma, spojimo sredine gornjih strana pravokutnika. Zatvaramo poligon na osi Ox na udaljenostima jednakim polovici intervala od ekstremnih vrijednosti x.

Mod (Mo) je vrijednost karakteristike koja se proučava, a koja se najčešće pojavljuje u određenoj populaciji.

Za određivanje moda iz histograma potrebno je odabrati najviši pravokutnik, povući crtu od desnog vrha tog pravokutnika do gornjeg desnog kuta prethodnog pravokutnika, a od lijevog vrha modalnog pravokutnika povući crtu do lijevi vrh sljedećeg pravokutnika. Iz sjecišta ovih linija povucite okomicu na x-os. Apscisa će biti moda. Mo ≈ 27,5. To znači da je najčešća dob u ovoj populaciji 27-28 godina.

Medijan (Me) je vrijednost karakteristike koja se proučava, a koja je u sredini uređenog niza varijacija.

Srednju vrijednost nalazimo pomoću kumulata. Cumulates - graf akumuliranih frekvencija. Apscise su varijante niza. Ordinate su akumulirane frekvencije.

Da bismo odredili medijan preko kumulata, nalazimo točku duž ordinatne osi koja odgovara 50% akumuliranih frekvencija (u našem slučaju, 15), povlačimo ravnu liniju kroz nju, paralelnu s osi Ox, i iz točke njegovo sjecište s kumulatom povucite okomicu na x os. Apscisa je medijan. Ja ≈ 25.9. To znači da je polovica radnika u ovoj populaciji mlađa od 26 godina.

Skup vrijednosti parametra koji se proučava u danom eksperimentu ili opažanju, rangiran prema vrijednosti (povećanje ili smanjenje) naziva se serija varijacija.

Pretpostavimo da smo mjerili krvni tlak kod deset pacijenata kako bi se dobilo gornji prag BP: sistolički tlak, tj. samo jedan broj.

Zamislimo da niz opažanja (statistička ukupnost) arterijskog sistoličkog tlaka u 10 promatranja ima sljedeći oblik (tablica 1):

Tablica 1

Komponente niza varijacija nazivaju se varijante. Opcije predstavljaju numeričku vrijednost karakteristike koja se proučava.

Konstruiranje serije varijacija iz statističkog skupa opažanja samo je prvi korak prema razumijevanju karakteristika cijelog skupa. Zatim morate odrediti srednja razina kvantitativna karakteristika koja se proučava (prosječna razina proteina u krvi, prosječna težina pacijenata, prosječno vrijeme početka anestezije, itd.)

Prosječna razina mjeri se pomoću kriterija koji se nazivaju prosjeci. Prosječna vrijednost je generalizirajuća numerička karakteristika kvalitativno homogenih vrijednosti, koja jednim brojem karakterizira cjelokupnu statističku populaciju prema jednom kriteriju. Prosječna vrijednost izražava ono što je zajedničko karakteristici u danom skupu opažanja.

Postoje tri vrste prosjeka u uobičajenoj upotrebi: način (), medijan () i aritmetička sredina ().

Za određivanje bilo koje prosječne vrijednosti potrebno je koristiti rezultate pojedinačnih promatranja, bilježeći ih u obliku varijacijskog niza (tablica 2).

Moda- vrijednost koja se najčešće pojavljuje u nizu opažanja. U našem primjeru, mod = 120. Ako u nizu varijacija nema ponavljajućih vrijednosti, onda kažu da nema moda. Ako se nekoliko vrijednosti ponavlja isti broj puta, tada se kao način rada uzima najmanja od njih.

Medijan- vrijednost koja dijeli distribuciju na dva jednaka dijela, središnja ili srednja vrijednost niza opažanja poredanih uzlaznim ili silaznim redoslijedom. Dakle, ako postoji 5 vrijednosti u nizu varijacija, tada je njegov medijan jednak trećem članu niza varijacija; ako postoji paran broj članova u nizu, tada je medijan aritmetička sredina njegova dva centralna promatranja, tj. ako postoji 10 promatranja u nizu, tada je medijan jednak aritmetičkoj sredini 5. i 6. promatranja. U našem primjeru.

Primijetimo važnu značajku moda i medijana: na njihove vrijednosti ne utječu numeričke vrijednosti ekstremnih varijanti.

Aritmetička sredina izračunava se formulom:

gdje je promatrana vrijednost u -tom promatranju, a je broj promatranja. Za naš slučaj.

Aritmetička sredina ima tri svojstva:

Prosjek zauzima srednju poziciju u nizu varijacija. U strogo simetričnom redu.

Prosjek je generalizirajuća vrijednost i iza prosjeka nisu vidljive slučajne fluktuacije i razlike u pojedinačnim podacima. Odražava ono što je tipično za cijelu populaciju.

Zbroj odstupanja svih opcija od prosjeka je nula: . Navedeno je odstupanje opcije od prosjeka.

Niz varijacija sastoji se od varijanti i njima odgovarajućih učestalosti. Od deset dobivenih vrijednosti, broj 120 se pojavio 6 puta, 115 - 3 puta, 125 - 1 put. Učestalost () - apsolutni broj pojedinačnih varijanti u agregatu, koji pokazuje koliko se puta pojavljuje ovu opciju u nizu varijacija.

Serije varijacija mogu biti jednostavne (učestalosti = 1) ili grupirane i skraćene, s 3-5 opcija. Jednostavna serija se koristi kada postoji mali broj promatranja (), grupiran - kada veliki broj opažanja().

Primjer rješavanja testa iz matematičke statistike

Problem 1

Početni podaci : studenti određene grupe od 30 osoba položili su ispit iz kolegija “Informatika”. Ocjene koje su dobili učenici čine sljedeći niz brojeva:

I. Kreirajmo niz varijacija

m x

w x

m x nak

w x nak

Ukupno:

II. Grafički prikaz statističkih informacija.

III. Numeričke karakteristike uzorka.

1. Aritmetička sredina

2. Geometrijska sredina

3. Moda

4. Medijan

222222333333333 | 3 34444444445555

5. Varijanca uzorka

7. Koeficijent varijacije

8. Asimetrija

9. Koeficijent asimetrije

10. Višak

11. Koeficijent kurtoze

Problem 2

Početni podaci : Učenici određene skupine pisali su završni kolokvijum. Grupa se sastoji od 30 osoba. Bodovi koje su osvojili učenici čine sljedeći niz brojeva

Otopina

I. Budući da karakteristika poprima mnogo različitih vrijednosti, za nju ćemo konstruirati niz intervalnih varijacija. Da biste to učinili, prvo postavite vrijednost intervala h. Poslužimo se Stangerovom formulom

Kreirajmo intervalnu ljestvicu. U ovom slučaju uzet ćemo kao gornju granicu prvog intervala vrijednost određenu formulom:

Određujemo gornje granice sljedećih intervala pomoću sljedeće rekurentne formule:

, Zatim

Završili smo s konstrukcijom intervalne ljestvice, jer je gornja granica sljedećeg intervala postala veća ili jednaka maksimalnoj vrijednosti uzorka
.

II. Grafički prikaz serija varijacija intervala

III. Numeričke karakteristike uzorka

Za određivanje brojčanih karakteristika uzorka sastavit ćemo pomoćnu tablicu

Iznos:

1. Aritmetička sredina

2. Geometrijska sredina

3. Moda

4. Medijan

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. Varijanca uzorka

6. Standardna devijacija uzorka

7. Koeficijent varijacije

8. Asimetrija

9. Koeficijent asimetrije

10. Višak

11. Koeficijent kurtoze

Problem 3

Stanje : vrijednost podjeljka na skali ampermetra je 0,1 A. Očitanja su zaokružena na najbliži cijeli podjeljak. Nađite vjerojatnost da će tijekom očitavanja biti napravljena pogreška veća od 0,02 A.

Otopina.

Pogreška zaokruživanja uzorka može se smatrati slučajnom varijablom X, koji je ravnomjerno raspoređen u intervalu između dva susjedna cjelobrojna dijeljenja. Uniformna gustoća distribucije

,

Gdje
- duljina intervala koji sadrži moguće vrijednosti X; izvan ovog intervala
U ovom problemu duljina intervala koji sadrži moguće vrijednosti je X, jednak je 0,1, dakle

Pogreška očitanja će premašiti 0,02 ako je u intervalu (0,02; 0,08). Zatim

Odgovor: r=0,6

Problem 4

Početni podaci: matematičko očekivanje i standardna devijacija normalno raspodijeljene karakteristike X redom jednak 10 i 2. Odredite vjerojatnost da kao rezultat testa Xće uzeti vrijednost sadržanu u intervalu (12, 14).

Otopina.

Upotrijebimo formulu

I teorijske frekvencije

Otopina

Za X njegovo matematičko očekivanje je M(X), a varijanca D(X). Otopina. Nađimo funkciju distribucije F(x) slučajna varijabla... pogreška uzorkovanja). Sastavljajmo varijacijski redŠirina intervala bit će: Za svaku vrijednost red Izračunajmo koliko...

  • Rješenje: odvojiva jednadžba

    Otopina

    U obliku Da biste pronašli kvocijent rješenja nehomogena jednadžba pomirimo se sustav Riješimo dobiveni sustav... ; +47; +61; +10; -8. Interval izgradnje varijacijski red. Dajte statističke procjene prosječne vrijednosti...

  • Rješenje: Izračunajmo lančana i osnovna apsolutna povećanja, stope rasta, stope rasta. Dobivene vrijednosti sumiramo u tablici 1

    Otopina

    Obujam proizvodnje. Otopina: Aritmetička sredina intervala varijacijski red izračunava se na sljedeći način: za... Granična pogreška uzorkovanja s vjerojatnošću 0,954 (t=2) bit će: Δ w = t*μ = 2*0,0146 = 0,02927 Definirajmo granice...

  • Otopina. Znak

    Otopina

    O čijem radnom iskustvu i izmišljena uzorak. Uzorak prosječnog radnog iskustva... ovih zaposlenika i izmišljena uzorak. Prosječno trajanje za uzorak... 1,16, razina značajnosti α = 0,05. Otopina. Varijacijski red ovog uzorka izgleda: 0,71 ...

  • Radni kurikulum iz biologije za 10-11 razred Sastavio: Polikarpova S. V.

    radim nastavni plan i program

    Najjednostavnije sheme križanja" 5 L.r. " Otopina elementarni genetski problemi" 6 L.b. " Otopina elementarni genetski problemi" 7 L.r. "..., 110, 115, 112, 110. Sastaviti varijacijski red, crtati varijacijski krivulja, nađi prosječna vrijednost znak...