Standardna devijacija karakterizira. Standardna devijacija

Vrijedno je napomenuti da ovaj izračun varijance ima nedostatak - ispada da je pristran, tj. njegovo matematičko očekivanje nije jednako pravoj vrijednosti varijance. Pročitajte više o ovome. Pritom nije sve tako loše. Kako se veličina uzorka povećava, ona se i dalje približava svom teoretskom analogu, tj. je asimptotski nepristran. Stoga, kada radite s velikim uzorcima, možete koristiti gornju formulu.

Korisno je prevesti jezik znakova na jezik riječi. Ispada da je varijanca prosječni kvadrat odstupanja. To jest, prvo se izračuna prosječna vrijednost, zatim se razlika između svake izvorne i prosječne vrijednosti uzima, kvadrira, zbraja, a zatim dijeli s brojem vrijednosti u populaciji. Razlika između pojedinačne vrijednosti i prosjeka odražava mjeru odstupanja. Kvadrira se tako da sva odstupanja postanu isključivo pozitivni brojevi i da se izbjegne međusobno uništavanje pozitivnih i negativnih odstupanja pri njihovom zbrajanju. Zatim, s obzirom na kvadrat odstupanja, jednostavno izračunamo aritmetičku sredinu. Prosjek - kvadrat - odstupanja. Odstupanja se kvadriraju i izračunava se prosjek. Rješenje leži u samo tri riječi.

Međutim, u svom čistom obliku, kao što je aritmetička sredina ili indeks, disperzija se ne koristi. To je više pomoćni i srednji pokazatelj koji je neophodan za druge vrste statističkih analiza. Nema ni normalnu mjernu jedinicu. Sudeći po formuli, ovo je kvadrat mjerne jedinice izvornih podataka. Bez boce, kako kažu, ne možete shvatiti.

(modul 111)

Kako bi se varijanca vratila u stvarnost, odnosno iskoristila u prizemnije svrhe, iz nje se vadi kvadratni korijen. Ispada tzv prosjek standardna devijacija(RMS). Postoje nazivi "standardna devijacija" ili "sigma" (od naziva grčkog slova). Formula standardne devijacije je:

Da biste dobili ovaj pokazatelj za uzorak, upotrijebite formulu:

Kao i kod varijance, postoji nešto drugačija opcija izračuna. Ali kako uzorak raste, razlika nestaje.

Standardna devijacija, očito, također karakterizira mjeru disperzije podataka, ali se sada (za razliku od disperzije) može usporediti s izvornim podacima, budući da imaju iste mjerne jedinice (to je jasno iz formule za izračun). Ali ovaj pokazatelj u svom čistom obliku nije jako informativan, jer sadrži previše srednjih izračuna koji su zbunjujući (odstupanje, kvadrat, zbroj, prosjek, korijen). Međutim, već je moguće raditi izravno sa standardnom devijacijom, jer su svojstva ovog pokazatelja dobro proučena i poznata. Na primjer, postoji ovo pravilo tri sigme, koji navodi da je 997 od 1000 vrijednosti podataka unutar ±3 sigme od aritmetičke sredine. Standardna devijacija, kao mjera nesigurnosti, također je uključena u mnoge statističke izračune. Uz njegovu pomoć određuje se stupanj točnosti različitih procjena i prognoza. Ako je varijacija vrlo velika, tada će i standardna devijacija biti velika, pa će stoga prognoza biti netočna, što će se izraziti, primjerice, u vrlo širokim intervalima pouzdanosti.

Koeficijent varijacije

Prosjek standardna devijacija daje apsolutnu procjenu mjere disperzije. Stoga, da bi se razumjelo koliki je raspon u odnosu na same vrijednosti (tj., bez obzira na njihovu skalu), potreban je relativni pokazatelj. Ovaj pokazatelj se zove koeficijent varijacije i izračunava se pomoću sljedeće formule:

Koeficijent varijacije se mjeri kao postotak (ako se pomnoži sa 100%). Pomoću ovog pokazatelja možete usporediti različite pojave, bez obzira na njihovu ljestvicu i mjerne jedinice. Ova činjenica i čini koeficijent varijacije tako popularnim.

U statistici je prihvaćeno da ako je vrijednost koeficijenta varijacije manja od 33%, tada se populacija smatra homogenom, a ako je veća od 33%, onda je heterogena. Teško mi je ovdje bilo što komentirati. Ne znam tko je to definirao i zašto, ali to se smatra aksiomom.

Osjećam da me zanosi suhoparna teorija i da moram donijeti nešto vizualno i figurativno. S druge strane, svi pokazatelji varijacije opisuju približno istu stvar, samo se drugačije izračunavaju. Stoga je teško pokazati različite primjere samo vrijednosti pokazatelja, ali ne i njihovu suštinu. Dakle, usporedimo kako se vrijednosti različitih pokazatelja varijacije razlikuju za isti skup podataka. Uzmimo primjer izračuna prosječnog linearnog odstupanja (od ). Evo izvornih podataka:

I raspored za podsjećanje.

Pomoću tih podataka izračunavamo različite pokazatelje varijacije.

Prosječna vrijednost je uobičajeni aritmetički prosjek.

Raspon varijacije je razlika između maksimuma i minimuma:

Prosječno linearno odstupanje izračunava se pomoću formule:

Standardna devijacija:

Sažmimo izračun u tablicu.

Kao što se može vidjeti, linearni prosjek i standardna devijacija daju slična značenja stupanj varijacije podataka. Varijanca je sigma kvadrat, tako da će uvijek biti relativna velik broj, što zapravo ne znači ništa. Raspon varijacije je razlika između ekstremnih vrijednosti i može mnogo govoriti.

Rezimirajmo neke rezultate.

Varijacija pokazatelja odražava varijabilnost procesa ili pojave. Njegov stupanj može se mjeriti pomoću nekoliko pokazatelja.

1. Raspon varijacije - razlika između maksimuma i minimuma. Odražava raspon mogućih vrijednosti.
2. Prosječna linearna devijacija – odražava prosjek apsolutnih (modulo) devijacija svih vrijednosti analizirane populacije od njihove prosječne vrijednosti.
3. Disperzija - prosječni kvadrat odstupanja.
4. Standardna devijacija je korijen disperzije (srednji kvadrat odstupanja).
5. Koeficijent varijacije je najuniverzalniji pokazatelj koji odražava stupanj raspršenosti vrijednosti, bez obzira na njihovu skalu i mjerne jedinice. Koeficijent varijacije se mjeri kao postotak i može se koristiti za usporedbu varijacija različitih procesa i pojava.

Dakle, u statistička analiza postoji sustav pokazatelja koji odražavaju homogenost pojava i stabilnost procesa. Indikatori varijacije često nemaju samostalno značenje i koriste se za daljnju analizu podataka (izračun intervali povjerenja

Definira se kao generalizirajuća karakteristika veličine varijacije svojstva u agregatu. Jednak je kvadratnom korijenu prosječnog kvadratnog odstupanja pojedinačnih vrijednosti atributa od aritmetičke sredine, tj. Korijen i može se pronaći ovako:

1. Za primarni red:

2. Za seriju varijacija:

Transformacija formule standardne devijacije dovodi je u oblik pogodniji za praktične izračune:

Standardna devijacija određuje koliko u prosjeku određene opcije odstupaju od svoje prosječne vrijednosti, a također je i apsolutna mjera varijabilnosti obilježja i izražava se u istim jedinicama kao i opcije, te se stoga dobro tumači.

Primjeri pronalaženja standardne devijacije: ,

Za alternativne karakteristike, formula standardne devijacije izgleda ovako:

gdje je p udio jedinica u populaciji koje imaju određenu karakteristiku;

q je udio jedinica koje nemaju ovo svojstvo.

Pojam prosječnog linearnog odstupanja

Prosječno linearno odstupanje definira se kao aritmetička sredina apsolutnih vrijednosti odstupanja pojedinih opcija od .

1. Za primarni red:

2. Za seriju varijacija:

gdje je zbroj n zbroj učestalosti varijacijskih nizova.

Primjer pronalaženja prosječnog linearnog odstupanja:

Prednost srednjeg apsolutnog odstupanja kao mjere disperzije u rasponu varijacije je očita, jer se ova mjera temelji na uzimanju u obzir svih mogućih odstupanja. Ali ovaj pokazatelj ima značajne nedostatke. Proizvoljno odbacivanje algebarskih znakova odstupanja može dovesti do činjenice da su matematička svojstva ovog pokazatelja daleko od elementarnih. Zbog toga je vrlo teško koristiti srednju apsolutnu devijaciju pri rješavanju problema koji uključuju probabilističke izračune.

Stoga se prosječno linearno odstupanje kao mjera varijacije obilježja rijetko koristi u statističkoj praksi, naime kada zbrajanje pokazatelja bez uzimanja u obzir predznaka ima ekonomskog smisla. Pomoću njega analizira se npr. promet vanjske trgovine, sastav radnika, ritam proizvodnje itd.

Srednji kvadrat

Primijenjen srednji kvadrat, na primjer, za izračunavanje prosječne veličine stranica n kvadratnih dijelova, prosječnih promjera debla, cijevi itd. Dijeli se na dvije vrste.

Jednostavan srednji kvadrat. Ako, prilikom zamjene pojedinačnih vrijednosti karakteristike s prosječna vrijednost Ako je potrebno održati zbroj kvadrata izvornih vrijednosti konstantnim, tada će prosjek biti kvadratna prosječna vrijednost.

To je kvadratni korijen kvocijenta dijeljenja zbroja kvadrata pojedinačnih vrijednosti atributa njihovim brojem:

Ponderirani srednji kvadrat izračunava se pomoću formule:

gdje je f znak težine.

Prosječna kubna

Primjenjuje se prosječni kubni, na primjer, pri određivanju prosječne duljine stranice i kocke. Dijeli se na dvije vrste.
Prosječna kubna jednostavna:

Pri izračunavanju prosjeka i odstupanja u intervalni redovi distribucije, prave vrijednosti obilježja zamijenjene su središnjim vrijednostima intervala, koje se razlikuju od prosjeka aritmetičke vrijednosti uključeni u interval. To dovodi do sustavne pogreške pri izračunavanju varijance. V.F. Sheppard je to utvrdio greška u izračunu varijance, uzrokovan korištenjem grupiranih podataka, iznosi 1/12 kvadrata vrijednosti intervala, kako u smjeru povećanja tako iu smjeru smanjenja veličine disperzije.

Sheppardov amandman treba koristiti ako je distribucija blizu normalne, odnosi se na karakteristiku s kontinuiranom prirodom varijacije i temelji se na značajnoj količini početnih podataka (n > 500). Međutim, na temelju činjenice da se u nekim slučajevima obje pogreške, djelujući u različitim smjerovima, kompenziraju jedna drugu, ponekad je moguće odbiti uvođenje ispravaka.

Što su manja varijanca i standardna devijacija, to će populacija biti homogenija i prosjek će biti tipičniji.
U praksi statistike često postoji potreba za usporedbom varijacija različitih karakteristika. Na primjer, veliki interes prikazuje usporedbu varijacija u dobi radnika i njihovim kvalifikacijama, radnom stažu i veličini plaće, trošak i dobit, radni staž i produktivnost rada itd. Za takve usporedbe pokazatelji apsolutne varijabilnosti karakteristika nisu prikladni: nemoguće je usporediti varijabilnost radnog iskustva, izraženu u godinama, s varijabilnošću plaća, izraženu u rubljima.

Za provođenje takvih usporedbi, kao i usporedbi varijabilnosti istog svojstva u više populacija s različitim aritmetičkim prosjecima, koristi se relativni pokazatelj varijacije - koeficijent varijacije.

Strukturni prosjeci

Za karakterizaciju središnje tendencije u statističkim distribucijama često je racionalno koristiti, zajedno s aritmetičkom sredinom, određenu vrijednost karakteristike X, koja, zbog određenih značajki svog položaja u nizu distribucije, može karakterizirati njezinu razinu.

Ovo je posebno važno kada u seriji distribucije ekstremne vrijednosti karakteristike imaju nejasne granice. S tim u vezi, točno određivanje aritmetičke sredine obično je nemoguće ili vrlo teško. U takvim slučajevima srednja razina može se odrediti uzimanjem, na primjer, vrijednosti značajke koja se nalazi u sredini frekvencijskog niza ili koja se najčešće pojavljuje u trenutnom nizu.

Takve vrijednosti ovise samo o prirodi frekvencija, tj. o strukturi distribucije. Tipične su lokacije u nizu frekvencija, stoga se takve vrijednosti smatraju karakteristikama središta distribucije i stoga su dobile definiciju strukturnih prosjeka. Koriste se za učenje unutarnja struktura i struktura niza distribucije vrijednosti atributa. Takvi pokazatelji uključuju:

Prema istraživanju uzorka, štediše su grupirane prema veličini depozita u gradskoj Sberbanci:

Definirati:

1) opseg varijacije;

2) prosječna veličina depozita;

3) prosječno linearno odstupanje;

4) disperzija;

5) standardna devijacija;

6) koeficijent varijacije doprinosa.

Otopina:

Ovaj niz distribucije sadrži otvorene intervale. U takvim nizovima vrijednost intervala prve skupine konvencionalno se pretpostavlja jednakom vrijednosti intervala sljedeće, a vrijednost intervala posljednje skupine jednaka je vrijednosti intervala prethodni.

Vrijednost intervala druge grupe je jednaka 200, dakle, vrijednost prve grupe je također jednaka 200. Vrijednost intervala pretposljednje grupe je jednaka 200, što znači da će i zadnji interval također biti jednak 200. imaju vrijednost 200.

1) Definirajmo raspon varijacije kao razliku između najvećeg i najniža vrijednost znak:

Raspon varijacija u veličini depozita je 1000 rubalja.

2) Prosječna veličina doprinosa bit će određena pomoću formule ponderirane aritmetičke sredine.

Najprije odredimo diskretnu vrijednost atributa u svakom intervalu. Da bismo to učinili, koristeći jednostavnu formulu aritmetičke sredine, nalazimo sredine intervala.

Prosječna vrijednost prvog intervala bit će:

drugi - 500, itd.

Upišimo rezultate izračuna u tablicu:

Iznos depozita, rub.Broj deponenata, fSredina intervala, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Ukupno 400 - 312000

Prosječni depozit u gradskoj Sberbanci bit će 780 rubalja:

3) Prosječno linearno odstupanje je aritmetička sredina apsolutnih odstupanja pojedinih vrijednosti obilježja od ukupnog prosjeka:

Postupak za izračunavanje prosječnog linearnog odstupanja u seriji intervalne distribucije je sljedeći:

1. Izračunava se ponderirana aritmetička sredina, kao što je prikazano u stavku 2).

2. Apsolutna odstupanja od prosjeka utvrđuju se:

3. Rezultirajuća odstupanja se množe s frekvencijama:

4. Pronađite zbroj ponderiranih odstupanja bez uzimanja u obzir predznaka:

5. Zbroj ponderiranih odstupanja dijeli se sa zbrojem frekvencija:

Prikladno je koristiti tablicu podataka za izračun:

Iznos depozita, rub.Broj deponenata, fSredina intervala, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Ukupno 400 - - - 81280

Prosječno linearno odstupanje veličine depozita klijenata Sberbanke iznosi 203,2 rublja.

4) Disperzija je aritmetička sredina kvadrata odstupanja svake vrijednosti atributa od aritmetičke sredine.

Izračun varijance u serijama intervalne distribucije provodi se pomoću formule:

Postupak za izračunavanje varijance u ovom slučaju je sljedeći:

1. Odredite ponderiranu aritmetičku sredinu, kao što je prikazano u paragrafu 2).

2. Pronađite odstupanja od prosjeka:

3. Kvadrat odstupanja svake opcije od prosjeka:

4. Pomnožite kvadrate odstupanja s težinama (frekvencijama):

5. Zbrojite dobivene produkte:

6. Dobiveni iznos se dijeli sa zbrojem težina (učestalosti):

Stavimo izračune u tablicu:

Iznos depozita, rub.Broj deponenata, fSredina intervala, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Ukupno 400 - - - 23040000

Standardna devijacija

Najsavršenija karakteristika varijacije je srednja kvadratna devijacija, koja se naziva standard (ili standardna devijacija). Standardna devijacija() jednak je kvadratnom korijenu prosječnog kvadratnog odstupanja pojedinačnih vrijednosti atributa od aritmetičke sredine:

Standardna devijacija je jednostavna:

Ponderirana standardna devijacija primjenjuje se na grupirane podatke:

Sljedeći omjer postoji između srednje kvadratne i srednje linearne devijacije pod normalnim uvjetima distribucije: ~ 1,25.

Standardna devijacija, kao glavna apsolutna mjera varijacije, koristi se u određivanju ordinatnih vrijednosti krivulje normalne distribucije, u proračunima koji se odnose na organizaciju promatranja uzorka i utvrđivanje točnosti karakteristika uzorka, kao i u procjeni granice varijacije obilježja u homogenoj populaciji.

18. Varijanca, njene vrste, standardna devijacija.

Varijanca slučajne varijable- mjera širenja zadane slučajne varijable, odnosno njezino odstupanje od matematičkog očekivanja. U statistici se često koristi oznaka ili. Kvadratni korijen iz varijance se obično zove standardna devijacija, standardna devijacija ili standardni namaz.

Ukupna varijanca (σ 2) mjeri varijaciju svojstva u cijelosti pod utjecajem svih čimbenika koji su uzrokovali tu varijaciju. U isto vrijeme, zahvaljujući metodi grupiranja, moguće je identificirati i mjeriti varijaciju zbog karakteristike grupiranja i varijaciju koja nastaje pod utjecajem neobračunatih čimbenika.

Međugrupna varijanca (σ 2 m.gr) karakterizira sustavnu varijaciju, tj. razlike u vrijednosti proučavanog svojstva koje nastaju pod utjecajem svojstva - čimbenika koji čini osnovu skupine.

Standardna devijacija(sinonimi: standardna devijacija, standardna devijacija, kvadratno odstupanje; povezani pojmovi: standardna devijacija, standardni namaz) - u teoriji vjerojatnosti i statistici, najčešći pokazatelj disperzije vrijednosti slučajne varijable u odnosu na njezino matematičko očekivanje. S ograničenim nizovima vrijednosti uzorka, umjesto matematičkog očekivanja koristi se aritmetička sredina skupa uzoraka.

Standardna devijacija se mjeri u mjernim jedinicama same slučajne varijable i koristi se pri izračunavanju standardne pogreške aritmetičke sredine, pri konstruiranju intervala pouzdanosti, pri statističkom testiranju hipoteza, pri mjerenju linearnog odnosa između slučajne varijable. Definira se kao kvadratni korijen varijance slučajne varijable.

Standardna devijacija:

Standardna devijacija(procjena standardne devijacije slučajne varijable x u odnosu na svoje matematičko očekivanje temeljeno na nepristranoj procjeni njegove varijance):

gdje je disperzija; - ja element selekcije; - veličina uzorka; - aritmetička sredina uzorka:

Treba napomenuti da su obje procjene pristrane. U općem slučaju nemoguće je konstruirati nepristranu procjenu. U ovom slučaju, procjena temeljena na nepristranoj procjeni varijance je dosljedna.

19. Bit, opseg i postupak određivanja modusa i medijana.

Osim prosjeka snage u statistici, za relativnu karakterizaciju vrijednosti varirajućeg obilježja i unutarnje strukture serije distribucije koriste se strukturni prosjeci, koji su uglavnom predstavljeni moda i medijan.

Moda- Ovo je najčešća varijanta serije. Moda se koristi, primjerice, pri određivanju veličine odjeće i obuće za kojima su kupci najtraženiji. Način rada za diskretnu seriju je varijanta s najvećom frekvencijom. Prilikom izračunavanja moda za niz intervalnih varijacija, izuzetno je važno prvo odrediti modalni interval (po maksimalnoj frekvenciji), a zatim - vrijednost modalne vrijednosti atributa pomoću formule:

§ - značenje mode

§ - donja granica modalnog intervala

§ - vrijednost intervala

§ - frekvencija modalnog intervala

§ - učestalost intervala koji prethodi modalnom

§ - učestalost intervala nakon modalnog

Medijan - ova vrijednost atributa, ĸᴏᴛᴏᴩᴏᴇ leži u osnovi rangirane serije i dijeli ovu seriju na dva dijela jednaka po broju.

Za određivanje medijana u diskretnoj seriji ako su frekvencije dostupne, prvo izračunajte poluzbroj frekvencija, a zatim odredite koja vrijednost varijante pada na nju. (Ako sortirana serija sadrži neparan broj karakteristika, tada se srednji broj izračunava pomoću formule:

M e = (n (ukupan broj značajki) + 1)/2,

u slučaju parnog broja obilježja, medijan će biti jednak prosjeku dvaju obilježja u sredini reda).

Pri računanju medijana za niz intervalnih varijacija Najprije odredite interval medijana unutar kojeg se nalazi medijan, a zatim odredite vrijednost medijana pomoću formule:

§ - traženi medijan

§ - donja granica intervala koji sadrži medijan

§ - vrijednost intervala

§ - zbroj frekvencija ili broj članova serije

§ - zbroj akumuliranih frekvencija intervala koji prethode medijanu

§ - učestalost srednjeg intervala

Primjer. Pronađite modus i medijan.

Otopina: U ovom primjeru modalni interval je unutar dobne skupine od 25-30 godina, budući da ovaj interval ima najveću frekvenciju (1054).

Izračunajmo veličinu moda:

To znači da je modalna dob učenika 27 godina.

Izračunajmo medijan. Interval medijana je u dobnoj skupini od 25-30 godina, jer unutar ovog intervala postoji opcija͵ koja populaciju dijeli na dva jednaka dijela (Σf i /2 = 3462/2 = 1731). Zatim zamijenimo potrebne numeričke podatke u formulu i dobijemo vrijednost medijana:

To znači da je polovica studenata mlađa od 27,4 godine, a druga polovica starija od 27,4 godine.

Uz modu i medijan, koriste se indikatori kao što su kvartili, koji dijele rangirani niz na 4 jednaka dijela, decili - 10 dijelova i percentili - na 100 dijelova.

20. Pojam promatranja uzorka i njegov opseg.

Selektivno promatranje primjenjuje se kada se koristi kontinuirani nadzor fizički nemoguće zbog velike količine podataka ili nije ekonomski isplativo. Fizička nemogućnost javlja se, primjerice, pri proučavanju tokova putnika, tržišnih cijena i obiteljskih proračuna. Ekonomska nesvrsishodnost javlja se pri procjeni kvalitete robe povezane s njihovim uništenjem, na primjer, kušanjem, ispitivanjem opeke na čvrstoću itd.

Statističke jedinice odabrane za promatranje su uzorak populacije ili uzorak, i cijeli njihov niz - opća populacija(GS). Istovremeno broj jedinica u uzorku označiti n, au cijelom GS-u N. Stav n/N obično se zove relativna veličina ili uzorak udio.

Kvaliteta rezultata promatranja uzorka ovisi o reprezentativnost uzorka, odnosno koliko je reprezentativan u GS. Kako bi se osigurala reprezentativnost uzorka, iznimno je važno pridržavati se princip slučajnog odabira jedinica, što pretpostavlja da na uključivanje HS jedinice u uzorak ne može utjecati niti jedan čimbenik osim slučajnosti.

postoji 4 načina slučajnog odabira za uzorak:

  1. Zapravo nasumično selekcija ili "loto metoda", kada se statističkim vrijednostima dodjeljuju serijski brojevi, bilježe na određenim predmetima (na primjer, bačve), koji se zatim miješaju u spremniku (na primjer, u vrećici) i odabiru nasumično. U praksi se ova metoda provodi pomoću generatora slučajnih brojeva ili matematičkih tablica slučajnih brojeva.
  2. Mehanički izbor prema kojem svaki ( N/n)-tu vrijednost opće populacije. Na primjer, ako sadrži 100.000 vrijednosti, a trebate odabrati 1.000, tada će svaka 100.000 / 1000 = 100. vrijednost biti uključena u uzorak. Štoviše, ako nisu rangirani, prvi se odabire slučajnim odabirom od prvih sto, a brojevi ostalih bit će sto veći. Na primjer, ako je prva jedinica bila broj 19, onda bi sljedeća trebala biti broj 119, zatim broj 219, zatim broj 319 itd. Ako su jedinice populacije rangirane, tada se prvo bira broj 50, zatim broj 150, zatim broj 250 i tako dalje.
  3. Izvodi se odabir vrijednosti iz heterogenog niza podataka stratificiran(stratificirana) metoda, kada se populacija najprije podijeli u homogene skupine na koje se primjenjuje slučajna ili mehanička selekcija.
  4. Posebna metoda uzorkovanja je serijski selekcija, pri kojoj se nasumično ili mehanički odabiru ne pojedinačne vrijednosti, već njihove serije (nizovi od nekog broja do nekog broja u nizu), unutar kojih se provodi kontinuirano promatranje.

Kvaliteta promatranja uzorka također ovisi o vrsta uzorka: ponovljeno ili neponovljiv. Na ponovni odabir Statističke vrijednosti ili njihove serije uključene u uzorak vraćaju se općoj populaciji nakon upotrebe, s mogućnošću uključivanja u novi uzorak. Štoviše, sve vrijednosti u općoj populaciji imaju istu vjerojatnost uključivanja u uzorak. Izbor koji se ne ponavlja znači da se statističke vrijednosti ili njihove serije uključene u uzorak ne vraćaju u opću populaciju nakon uporabe, pa se stoga za preostale vrijednosti potonjih povećava vjerojatnost da budu uključene u sljedeći uzorak.

Uzorkovanje koje se ne ponavlja daje točnije rezultate i stoga se češće koristi. Ali postoje situacije kada se ne može primijeniti (proučavanje tokova putnika, potražnje potrošača itd.) i tada se provodi ponovljena selekcija.

21. Maksimalna pogreška uzorkovanja promatranja, prosječna pogreška uzorkovanja, postupak njihova izračuna.

Razmotrimo detaljno gore navedene metode formiranja uzorak populacije i rezultirajuće pogreške reprezentativnosti. Ispravno nasumično uzorkovanje se temelji na odabiru jedinica iz populacije nasumično bez ikakvih sustavnih elemenata. Tehnički gledano, stvarni slučajni odabir provodi se izvlačenjem ždrijeba (na primjer, lutrija) ili korištenjem tablice slučajnih brojeva.

Pravilan slučajni odabir “u svom čistom obliku” rijetko se koristi u praksi selektivnog promatranja, ali je početni među ostalim vrstama odabira; njime se implementiraju osnovni principi selektivnog promatranja. Razmotrimo neka teorijska pitanja metoda uzorkovanja i formule pogreške za jednostavno slučajno uzorkovanje.

Pristranost uzorkovanja- ϶ᴛᴏ razlika između vrijednosti parametra u općoj populaciji i njegove vrijednosti izračunate iz rezultata promatranja uzorka. Važno je napomenuti da je za prosječno kvantitativno obilježje pogreška uzorkovanja određena prema

Indikator se obično naziva najveća pogreška uzorkovanja. Prosječna vrijednost uzorka je slučajna varijabla koja može poprimiti različite vrijednosti ovisno o tome koje su jedinice uključene u uzorak. Stoga su greške uzorkovanja također slučajne varijable i mogu poprimiti različite vrijednosti. Iz tog razloga se određuje prosjek mogućih pogrešaka - prosječna greška uzorkovanja, što ovisi o:

· veličina uzorka: što je veći broj, to je manja prosječna pogreška;

· stupanj promjene svojstva koje se proučava: što je manja varijacija obilježja, a time i disperzija, to je manja prosječna pogreška uzorkovanja.

Na slučajni ponovni odabir izračunava se prosječna greška. U praksi se opća varijanca ne zna točno, ali je u teoriji vjerojatnosti dokazano da . Budući da je vrijednost za dovoljno veliki n blizu 1, možemo pretpostaviti da je . Zatim treba izračunati prosječnu pogrešku uzorkovanja: . Ali u slučajevima malog uzorka (s n<30) коэффициент крайне важно учитывать, и среднюю ошибку малой выборки рассчитывать по формуле .

Na slučajno uzorkovanje bez ponavljanja zadane formule su prilagođene vrijednosti . Tada je prosječna greška uzorkovanja koja se ne ponavlja: I . Jer je uvijek manji od , tada je množitelj () uvijek manji od 1. To znači da je prosječna pogreška kod ponovljenog odabira uvijek manja nego kod ponovljenog odabira. Mehaničko uzorkovanje koristi se kada je opća populacija na neki način poredana (primjerice, popisi birača po abecednom redu, brojevi telefona, brojevi kuća i stanova). Odabir jedinica provodi se u određenom intervalu, koji je jednak inverznoj vrijednosti postotka uzorkovanja. Dakle, s uzorkom od 2% odabire se svakih 50 jedinica = 1/0,02, s uzorkom od 5% svakih 1/0,05 = 20 jedinica opće populacije.

Referentna točka se bira na različite načine: nasumično, od sredine intervala, s promjenom referentne točke. Glavna stvar je izbjeći sustavnu pogrešku. Na primjer, s uzorkom od 5%, ako je prva jedinica 13., onda su sljedeće 33, 53, 73 itd.

U smislu točnosti, mehanički odabir je blizak stvarnom slučajnom uzorkovanju. Iz tog razloga, za određivanje prosječne pogreške mehaničkog uzorkovanja koriste se odgovarajuće formule za slučajni odabir.

Na tipičan izbor populacija koja se ispituje preliminarno je podijeljena u homogene, slične skupine. Na primjer, kada se istražuju poduzeća, to su industrije, podsektori; kada se proučava stanovništvo, to su regije, društvene ili dobne skupine. Zatim se vrši neovisni odabir iz svake skupine mehanički ili čisto nasumično.

Tipično uzorkovanje daje točnije rezultate od drugih metoda. Tipizacijom opće populacije osigurava se zastupljenost svake tipološke skupine u uzorku, čime je moguće eliminirati utjecaj međugrupne varijance na prosječnu pogrešku uzorkovanja. Stoga je pri pronalaženju pogreške tipičnog uzorka prema pravilu zbrajanja varijanci () iznimno važno uzeti u obzir samo prosjek varijanci grupe. Zatim prosječna pogreška uzorkovanja: s ponovljenim uzorkovanjem, s neponovljivim uzorkovanjem , Gdje – prosjek varijanci unutar grupe u uzorku.

Izbor serije (ili gnijezda). koristi se kada je populacija podijeljena u serije ili skupine prije početka istraživanja uzorka. Ove serije uključuju pakiranje gotovih proizvoda, studentskih grupa i brigada. Serije za ispitivanje odabiru se mehanički ili čisto slučajno, a unutar serije provodi se kontinuirano ispitivanje jedinica. Iz tog razloga prosječna pogreška uzorkovanja ovisi samo o varijanci između grupa (između serija), koja se izračunava pomoću formule: gdje je r broj odabranih serija; – prosjek i-te serije. Izračunava se prosječna pogreška serijskog uzorkovanja: s ponovljenim uzorkovanjem, s neponovljivim uzorkovanjem , gdje je R ukupan broj serija. Kombinirano selekcija je kombinacija razmatranih selekcijskih metoda.

Prosječna pogreška uzorkovanja za bilo koju metodu uzorkovanja ovisi uglavnom o apsolutnoj veličini uzorka i, u manjoj mjeri, o postotku uzorka. Pretpostavimo da je u prvom slučaju napravljeno 225 opažanja iz populacije od 4500 jedinica, au drugom iz populacije od 225000 jedinica. Varijance u oba slučaja jednake su 25. Tada će u prvom slučaju, s izborom od 5%, pogreška uzorkovanja biti: U drugom slučaju, s odabirom od 0,1%, to će biti jednako:

Međutim, kada je postotak uzorkovanja smanjen za 50 puta, pogreška uzorkovanja se malo povećala, jer se veličina uzorka nije promijenila. Pretpostavimo da je veličina uzorka povećana na 625 opažanja. U ovom slučaju, greška uzorkovanja je: Povećanje uzorka za 2,8 puta uz istu veličinu populacije smanjuje veličinu pogreške uzorkovanja za više od 1,6 puta.

22.Metode i načini formiranja ogledne populacije.

U statistici se koriste različite metode formiranja uzoraka populacija, što je određeno ciljevima istraživanja i ovisi o specifičnostima predmeta proučavanja.

Glavni uvjet za provođenje istraživanja uzorka je spriječiti pojavu sustavnih pogrešaka koje proizlaze iz kršenja načela jednakih mogućnosti za svaku jedinicu opće populacije koja bi bila uključena u uzorak. Prevencija sustavnih pogrešaka postiže se korištenjem znanstveno utemeljenih metoda formiranja uzorka populacije.

Postoje sljedeće metode odabira jedinica iz opće populacije: 1) individualna selekcija - odabiru se pojedinačne jedinice za uzorak; 2) grupni odabir - uzorak uključuje kvalitativno homogene skupine ili nizove jedinica koje se proučavaju; 3) kombinirana selekcija je kombinacija individualne i grupne selekcije. Metode odabira određene su pravilima za formiranje uzorka populacije.

Uzorak bi trebao biti:

  • zapravo nasumično sastoji se u tome što je uzorak populacije nastao kao rezultat slučajnog (nenamjernog) odabira pojedinih jedinica iz opće populacije. U tom se slučaju broj jedinica odabranih u uzorku populacije obično određuje na temelju prihvaćenog udjela uzorka. Omjer uzorka je omjer broja jedinica u populaciji uzorka n prema broju jedinica u općoj populaciji N, ᴛ.ᴇ.
  • mehanički sastoji se u tome što se izbor jedinica u uzorku populacije vrši iz opće populacije, podijeljene na jednake intervale (skupine). U tom slučaju veličina intervala u populaciji jednaka je recipročnoj vrijednosti udjela uzorka. Dakle, kod uzorka od 2% bira se svaka 50. jedinica (1:0,02), kod uzorka od 5% svaka 20. jedinica (1:0,05) itd. Međutim, u skladu s prihvaćenim omjerom selekcije, opća populacija je takoreći mehanički podijeljena u skupine jednake veličine. Iz svake skupine odabire se samo jedna jedinica za uzorak.
  • tipično – u kojoj se opća populacija prvo dijeli na homogene tipične skupine. Zatim se iz svake tipične skupine koristi čisto slučajni ili mehanički uzorak za pojedinačni odabir jedinica u populaciju uzorka. Važna značajka tipičnog uzorka je da daje preciznije rezultate u usporedbi s drugim metodama odabira jedinica u uzorku populacije;
  • serijski- u kojoj je opća populacija podijeljena u skupine jednake veličine - serije. Serije su odabrane u uzorku populacije. Unutar niza provodi se kontinuirano promatranje jedinica uključenih u niz;
  • kombinirani- uzorkovanje treba biti dvostupanjsko. U ovom slučaju, populacija se najprije podijeli u skupine. Zatim se odabiru skupine, a unutar njih pojedine jedinice.

U statistici se razlikuju sljedeće metode za odabir jedinica u uzorku populacije:

  • jednostupanjska uzorkovanje - svaka odabrana jedinica odmah se podvrgava proučavanju prema zadanom kriteriju (pravilno slučajno i serijsko uzorkovanje);
  • višestupanjski uzorkovanje - vrši se selekcija iz opće populacije pojedinih skupina, a iz skupina odabiru pojedine jedinice (tipično uzorkovanje mehaničkom metodom odabira jedinica u uzorku populacije).

Osim toga, postoje:

  • ponovni odabir- prema shemi vraćene lopte. U tom slučaju, svaka jedinica ili serija uključena u uzorak vraća se općoj populaciji i stoga ima priliku ponovno biti uključena u uzorak;
  • ponoviti odabir- prema shemi nevraćene lopte. Ima preciznije rezultate s istom veličinom uzorka.

23. Određivanje izuzetno važne veličine uzorka (koristeći Studentovu t-tablicu).

Jedno od znanstvenih načela u teoriji uzorkovanja je osigurati odabir dovoljnog broja jedinica. Teorijski, iznimna važnost poštivanja ovog načela prikazana je u dokazima graničnih teorema u teoriji vjerojatnosti, koji omogućuju da se utvrdi koji volumen jedinica treba odabrati iz populacije da bude dovoljan i osigura reprezentativnost uzorka.

Smanjenje standardne pogreške uzorkovanja, a time i povećanje točnosti procjene, uvijek je povezano s povećanjem veličine uzorka, stoga je već u fazi organiziranja promatranja uzorka potrebno odlučiti koja je veličina uzorka populacije treba biti kako bi se osigurala potrebna točnost rezultata promatranja. Izračun iznimno važnog volumena uzorka konstruiran je pomoću formula izvedenih iz formula za najveće pogreške uzorkovanja (A), koje odgovaraju određenoj vrsti i metodi odabira. Dakle, za nasumično ponovljenu veličinu uzorka (n) imamo:

Bit ove formule je da je uz nasumično ponovljeno uzorkovanje iznimno važnih brojeva veličina uzorka izravno proporcionalna kvadratu koeficijenta pouzdanosti. (t2) i varijance varijacijske karakteristike (?2) i obrnuto je proporcionalna kvadratu najveće pogreške uzorkovanja (?2). Konkretno, s povećanjem najveće pogreške za faktor dva, potrebna veličina uzorka trebala bi se smanjiti za faktor četiri. Od tri parametra, dva (t i?) postavlja istraživač. Pritom istraživač na temelju cilja

a problemi anketnog uzorka moraju riješiti pitanje: u kojoj kvantitativnoj kombinaciji je bolje uključiti ove parametre kako bi se osigurala optimalna opcija? U jednom slučaju može biti zadovoljniji pouzdanošću dobivenih rezultata (t) nego mjerom točnosti (?), u drugom - obrnuto. Teže je riješiti pitanje vrijednosti maksimalne pogreške uzorkovanja, budući da istraživač nema ovaj pokazatelj u fazi osmišljavanja uzorka, stoga je u praksi uobičajeno odrediti vrijednost maksimalne pogreške uzorkovanja , obično unutar 10% očekivane prosječne razine atributa . Utvrđivanju procijenjenog prosjeka može se pristupiti na različite načine: korištenjem podataka iz sličnih prethodnih istraživanja ili korištenjem podataka iz okvira uzorkovanja i provođenjem malog pilot uzorka.

Najteže je utvrditi pri izradi promatranja uzorka treći parametar u formuli (5.2) - varijancu uzorka populacije. U ovom slučaju iznimno je važno koristiti sve podatke dostupne istraživaču, dobivene u prethodnim sličnim i pilot istraživanjima.

Pitanje određivanja iznimno važne veličine uzorka postaje kompliciranije ako istraživanje uzorka uključuje proučavanje nekoliko karakteristika jedinica uzorkovanja. U ovom slučaju, prosječne razine svake od karakteristika i njihove varijacije, u pravilu, su različite, te je u tom smislu odlučiti kojoj varijanci od kojih karakteristika dati prednost moguće je samo uzimajući u obzir svrhu i ciljeve ankete.

Pri izradi uzorka promatranja pretpostavlja se unaprijed određena vrijednost dopuštene pogreške uzorkovanja u skladu s ciljevima pojedine studije i vjerojatnosti zaključaka na temelju rezultata promatranja.

Općenito, formula za najveću pogrešku prosjeka uzorka omogućuje nam da odredimo:

‣‣‣ veličina mogućih odstupanja pokazatelja opće populacije od pokazatelja uzorka populacije;

‣‣‣ potrebna veličina uzorka kako bi se osigurala zahtijevana točnost, pri kojoj granice moguće pogreške ne prelaze određenu specificiranu vrijednost;

‣‣‣ vjerojatnost da će greška u uzorku imati specificiranu granicu.

Distribucija učenika u teoriji vjerojatnosti, to je jednoparametarska obitelj apsolutno kontinuiranih distribucija.

24. Dinamički niz (interval, moment), završni dinamički niz.

Dinamička serija- to su vrijednosti statističkih pokazatelja koji su prikazani određenim kronološkim slijedom.

Svaka vremenska serija sadrži dvije komponente:

1) pokazatelji vremenskih razdoblja(godine, kvartali, mjeseci, dani ili datumi);

2) pokazatelji koji karakteriziraju predmet koji se proučava za vremenska razdoblja ili na odgovarajuće datume, koji se nazivaju razine serije.

Nivoi serije izražavaju se i apsolutnim i prosječnim ili relativnim vrijednostima. Uzimajući u obzir ovisnost o prirodi pokazatelja, izgrađuju se dinamički nizovi apsolutnih, relativnih i prosječnih vrijednosti. Dinamički nizovi relativnih i prosječnih vrijednosti konstruirani su na temelju izvedenih nizova apsolutnih vrijednosti. Postoje intervalni i momentni nizovi dinamike.

Dinamičke intervalne serije sadrži vrijednosti pokazatelja za određena vremenska razdoblja. U intervalnom nizu razine se mogu zbrajati, čime se dobiva obujam pojave u dužem razdoblju ili tzv. akumulirani zbrojevi.

Niz dinamičkih trenutaka odražava vrijednosti pokazatelja u određenom trenutku (datum vremena). U trenutnim nizovima istraživača može zanimati samo razlika u pojavama koja odražava promjenu razine niza između određenih datuma, budući da zbroj razina ovdje nema pravi sadržaj. Ovdje se ne računaju kumulativni zbrojevi.

Najvažniji uvjet za ispravnu konstrukciju vremenske serije je usporedivost razina serije koji pripadaju različitim razdobljima. Razine moraju biti prikazane u homogenim količinama, te mora postojati jednaka cjelovitost obuhvata različitih dijelova fenomena.

Kako bi se izbjegla distorzija stvarne dinamike, u statističkim istraživanjima provode se preliminarni proračuni (zatvaranje dinamičke serije), koji prethode statističkoj analizi vremenske serije. Pod zatvaranje niza dinamike Općenito je prihvaćeno razumijevanje kombinacije u jednu seriju dvije ili više serija, čije su razine izračunate različitim metodologijama ili ne odgovaraju teritorijalnim granicama itd. Zatvaranje dinamičkog niza također može značiti dovođenje apsolutnih razina dinamičkog niza na zajedničku osnovu, čime se neutralizira neusporedivost razina dinamičkog niza.

25. Pojam usporedivosti dinamičkih nizova, koeficijenata, rasta i stopa rasta.

Dinamička serija- to je niz statističkih pokazatelja koji karakteriziraju razvoj prirodnih i društvenih pojava tijekom vremena. Statističke zbirke koje objavljuje Državni odbor za statistiku Rusije sadrže veliki broj dinamičkih serija u tabelarnom obliku. Dinamički nizovi omogućuju prepoznavanje obrazaca razvoja fenomena koji se proučavaju.

Dinamičke serije sadrže dvije vrste indikatora. Indikatori vremena(godine, kvartali, mjeseci itd.) ili točke u vremenu (na početku godine, na početku svakog mjeseca itd.). Indikatori razine retka. Pokazatelji razina dinamičke serije mogu se izraziti u apsolutnim vrijednostima (proizvodnja proizvoda u tonama ili rubljima), relativnim vrijednostima (udio gradskog stanovništva u %) i prosječnim vrijednostima (prosječna plaća radnika u industriji po godinama , itd.). U tabelarnom obliku, vremenska serija sadrži dva stupca ili dva retka.

Ispravna konstrukcija vremenske serije zahtijeva ispunjenje niza zahtjeva:

  1. svi pokazatelji niza dinamika moraju biti znanstveno potkrijepljeni i pouzdani;
  2. indikatori niza dinamike moraju biti usporedivi tijekom vremena, ᴛ.ᴇ. moraju se izračunati za ista vremenska razdoblja ili na iste datume;
  3. indikatori niza dinamika moraju biti usporedivi na cijelom teritoriju;
  4. pokazatelji niza dinamike moraju biti sadržajno usporedivi, ᴛ.ᴇ. izračunati prema jedinstvenoj metodologiji, na isti način;
  5. pokazatelji brojnih dinamika trebali bi biti usporedivi u nizu farmi koje se uzimaju u obzir. Svi pokazatelji niza dinamike moraju biti navedeni u istim mjernim jedinicama.

Statistički pokazatelji mogu karakterizirati ili rezultate procesa koji se proučava tijekom određenog vremenskog razdoblja ili stanje fenomena koji se proučava u određenoj vremenskoj točki, ᴛ.ᴇ. pokazatelji mogu biti intervalni (periodični) i trenutni. Prema tome, u početku su dinamičke serije ili intervalne ili trenutne. Nizovi dinamike trenutaka pak dolaze s jednakim i nejednakim vremenskim intervalima.

Izvorni dinamički niz može se transformirati u niz prosječnih vrijednosti i niz relativnih vrijednosti (lančanih i osnovnih). Takve vremenske serije nazivaju se izvedene vremenske serije.

Metodologija za izračun prosječne razine u dinamičkom nizu je različita, ovisno o vrsti dinamičkog niza. Koristeći primjere, razmotrit ćemo vrste dinamičkih serija i formule za izračun prosječne razine.

Apsolutna povećanja (Δy) pokazuju koliko se jedinica promijenila sljedeća razina niza u odnosu na prethodnu (gr. 3. - lančana apsolutna povećanja) ili u odnosu na početnu razinu (gr. 4. - osnovna apsolutna povećanja). Formule za izračun mogu se napisati na sljedeći način:

Kada se apsolutne vrijednosti niza smanjuju, doći će do "smanjenja" odnosno "smanjenja".

Apsolutni pokazatelji rasta pokazuju da je npr. 1998. god. proizvodnja proizvoda "A" povećana je u odnosu na 1997. godinu. za 4 tisuće tona, au odnosu na 1994. ᴦ. - za 34 tisuće tona; za ostale godine vidi tablicu. 11,5 gr.
Objavljeno na ref.rf
3 i 4.

Stopa rasta pokazuje koliko se puta razina niza promijenila u odnosu na prethodnu (gr. 5 - lančani koeficijenti rasta ili pada) ili u odnosu na početnu razinu (gr. 6 - osnovni koeficijenti rasta ili pada). Formule za izračun mogu se napisati na sljedeći način:

Stopa rasta pokazuju koliki je postotak sljedeća razina niza u usporedbi s prethodnom (gr. 7 - lančane stope rasta) ili u usporedbi s početnom razinom (gr. 8 - osnovne stope rasta). Formule za izračun mogu se napisati na sljedeći način:

Tako je npr. 1997. god. obujam proizvodnje proizvoda "A" u odnosu na 1996. ᴦ. iznosila 105,5% (

Stopa rasta pokazuju za koliko se postotaka povećala razina izvještajnog razdoblja u odnosu na prethodno (stupac 9 - lančane stope rasta) ili u odnosu na početnu razinu (stupac 10 - osnovne stope rasta). Formule za izračun mogu se napisati na sljedeći način:

T pr = T r - 100% ili T pr = apsolutni rast / razina prethodnog razdoblja * 100%

Tako je npr. 1996. god. u odnosu na 1995. ᴦ. Proizvoda „A“ proizvedeno je više za 3,8% (103,8% - 100%) ili (8:210)x100%, au odnosu na 1994. ᴦ. - za 9% (109% - 100%).

Ako se apsolutne razine u nizu smanjuju, tada će stopa biti manja od 100% i, sukladno tome, doći će do stope pada (stopa porasta s predznakom minus).

Apsolutna vrijednost povećanja od 1%.(gr.
Objavljeno na ref.rf
11) pokazuje koliko jedinica treba proizvesti u određenom razdoblju da se razina prethodnog razdoblja poveća za 1%. U našem primjeru, 1995. ᴦ. bilo je potrebno proizvesti 2,0 tisuće tona, a 1998. ᴦ. - 2,3 tisuće tona, ᴛ.ᴇ. mnogo više.

Apsolutna vrijednost rasta od 1% može se odrediti na dva načina:

§ razina prethodnog razdoblja podijeljena sa 100;

§ lančana apsolutna povećanja dijele se s odgovarajućim lančanim stopama rasta.

Apsolutna vrijednost povećanja od 1% =

U dinamici, osobito u dugom razdoblju, važna je zajednička analiza stope rasta sa sadržajem svakog postotka povećanja ili smanjenja.

Imajte na umu da je razmatrana metodologija za analizu vremenskih serija primjenjiva i za vremenske serije, čije su razine izražene u apsolutnim vrijednostima (t, tisuća rubalja, broj zaposlenika itd.), i za vremenske serije, čije su razine izražavaju se u relativnim pokazateljima (% nedostataka, % pepela u ugljenu itd.) ili prosječnim vrijednostima (prosječni prinos u c/ha, prosječna plaća itd.).

Uz razmatrane analitičke pokazatelje, izračunate za svaku godinu u usporedbi s prethodnom ili početnom razinom, pri analizi dinamičkih serija iznimno je važno izračunati prosječne analitičke pokazatelje za razdoblje: prosječnu razinu serije, prosječnu godišnju apsolutnu razinu, prosječnu godišnju apsolutnu razinu, prosječnu godišnju apsolutnu razinu, prosječnu godišnju razinu. povećanje (smanjenje) i prosječna godišnja stopa rasta i stopa rasta .

Metode za izračunavanje prosječne razine niza dinamike raspravljene su gore. U intervalnoj dinamičkoj seriji koju razmatramo, prosječna razina serije izračunava se pomoću jednostavne formule aritmetičke sredine:

Prosječna godišnja proizvodnja proizvoda za 1994-1998. iznosio 218,4 tisuća tona.

Prosječni godišnji apsolutni prirast također se izračunava pomoću formule aritmetičke sredine

Standardna devijacija - pojam i vrste. Klasifikacija i značajke kategorije "Srednje kvadratno odstupanje" 2017., 2018.

Disperzija. Standardna devijacija

Disperzija je aritmetička sredina kvadrata odstupanja svake vrijednosti atributa od ukupnog prosjeka. Ovisno o izvornim podacima, varijanca može biti neponderirana (jednostavna) ili ponderirana.

Varijanca se izračunava pomoću sljedećih formula:

· za negrupirane podatke

· za grupirane podatke

Postupak za izračunavanje ponderirane varijance:

1. odrediti aritmetički ponderirani prosjek

2. utvrđuju se odstupanja varijante od prosjeka

3. kvadrirati odstupanje svake opcije od prosjeka

4. pomnožite kvadrate odstupanja s težinama (frekvencijama)

5. rezimirati dobivene produkte

6. dobiveni iznos se podijeli sa zbrojem ljestvica

Formula za određivanje varijance može se pretvoriti u sljedeću formulu:

- jednostavno

Postupak za izračunavanje varijance je jednostavan:

1. odrediti aritmetičku sredinu

2. kvadrirati aritmetičku sredinu

3. kvadrirajte svaku opciju u redu

4. pronađite opciju zbroja kvadrata

5. zbroj kvadrata podijeliti njihovim brojem, tj. odrediti srednji kvadrat

6. odrediti razliku između srednjeg kvadrata karakteristike i kvadrata srednje vrijednosti

Također, formula za određivanje ponderirane varijance može se pretvoriti u sljedeću formulu:

one. disperzija je jednaka razlici između prosjeka kvadrata vrijednosti atributa i kvadrata aritmetičke sredine. Pri korištenju transformirane formule eliminira se dodatni postupak za izračunavanje odstupanja pojedinih vrijednosti karakteristike od x i eliminira se pogreška u izračunu povezana sa zaokruživanjem odstupanja

Disperzija ima niz svojstava, od kojih neka olakšavaju izračun:

1) varijanca konstantne vrijednosti je nula;

2) ako su sve varijante vrijednosti atributa smanjene za isti broj, tada se varijanca neće smanjiti;

3) ako su sve varijante vrijednosti atributa smanjene za isti broj puta (put), tada će se varijanca smanjiti za faktor

Standardna devijacija S- predstavlja kvadratni korijen varijance:

· za negrupirane podatke:

;

· za serije varijacija:

Raspon varijacije, linearna srednja vrijednost i standardna devijacija nazivaju se veličinama. Imaju iste mjerne jedinice kao i pojedinačne karakteristične vrijednosti.

Varijanca i standardna devijacija najčešće su korištene mjere varijacije. To se objašnjava činjenicom da su uključeni u većinu teorema teorije vjerojatnosti, koja služi kao temelj matematičke statistike. Osim toga, varijanca se može rastaviti na sastavne elemente, omogućujući procjenu utjecaja različitih čimbenika koji određuju varijaciju svojstva.

Izračun pokazatelja varijacije za banke grupirane prema profitnoj marži prikazan je u tablici.

Iznos dobiti, milijun rubalja. Broj banaka izračunati pokazatelji
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Ukupno: 121,70 17,640 23,126

Prosječna linearna i standardna devijacija pokazuju koliko vrijednost karakteristike u prosjeku fluktuira među jedinicama i populacijom koja se proučava. Dakle, u ovom slučaju, prosječna fluktuacija dobiti je: prema prosječnom linearnom odstupanju, 0,882 milijuna rubalja; standardnom devijacijom - 1,075 milijuna rubalja. Standardna devijacija uvijek je veća od srednje linearne devijacije. Ako je distribucija karakteristike blizu normalne, tada postoji odnos između S i d: S=1,25d, odnosno d=0,8S. Standardna devijacija pokazuje kako se većina jedinica populacije nalazi u odnosu na aritmetičku sredinu. Bez obzira na oblik distribucije, 75 vrijednosti atributa spada u interval x 2S, a najmanje 89 od svih vrijednosti spada u interval x 3S (teorem P.L. Chebysheva).