Standardna devijacija. Prosječno linearno odstupanje

Aproksimativna metoda za procjenu varijabilnosti varijacijske serije- određivanje granice i amplitude, ali ne uzimaju u obzir vrijednosti opcije unutar serije. Glavna općeprihvaćena mjera varijabilnosti kvantitativnog obilježja unutar niza varijacija je standardna devijacija (σ - sigma). Što je prosjek veći standardna devijacija, veći je stupanj fluktuacije ove serije.

Metoda izračuna standardne devijacije uključuje sljedeće korake:

1. Pronađite aritmetičku sredinu (M).

2. Utvrditi odstupanja pojedinih opcija od aritmetičke sredine (d=V-M). U medicinskoj statistici odstupanja od prosjeka označavaju se s d (deviate). Zbroj svih odstupanja je nula.

3. Kvadratirajte svako odstupanje d 2.

4. Pomnožite kvadrate odstupanja s odgovarajućim frekvencijama d 2 *p.

5. Nađi zbroj umnožaka å(d 2 *p)

6. Izračunajte standardnu ​​devijaciju pomoću formule:

Kada je n veći od 30 ili kada je n manji ili jednak 30, gdje je n broj svih opcija.

Vrijednost standardne devijacije:

1. Standardna devijacija karakterizira širenje varijante u odnosu na prosječna veličina(tj. fluktuacija niza varijacija). Što je sigma veća, to je veći stupanj raznolikosti ove serije.

2. Prosjek standardna devijacija koristi se za komparativnu procjenu stupnja podudarnosti aritmetičke sredine s nizom varijacija za koji je izračunata.

Varijacije masovnih pojava pokoravaju se zakonu normalna distribucija. Krivulja koja predstavlja ovu distribuciju izgleda kao glatka simetrična krivulja u obliku zvona (Gaussova krivulja). Prema teoriji vjerojatnosti, u pojavama koje se pokoravaju zakonu normalne distribucije, postoji strogi matematički odnos između vrijednosti aritmetičke sredine i standardne devijacije. Teorijska distribucija varijante u homogenom nizu varijacija pridržava se pravila tri sigme.

Ako su u sustavu pravokutnih koordinata na apscisnu os nanesene vrijednosti kvantitativnog obilježja (varijante), a na ordinatnu os učestalost pojavljivanja varijante u nizu varijacija, tada su varijante s većim i manjim vrijednosti su ravnomjerno smještene na stranama aritmetičke sredine.



Utvrđeno je da uz normalnu raspodjelu svojstva:

68,3% vrijednosti varijante je unutar M±1s

95,5% varijantnih vrijednosti je unutar M±2s

99,7% vrijednosti je unutar M±3s

3. Standardna devijacija omogućuje vam određivanje normalnih vrijednosti za kliničke i biološke parametre. U medicini se interval M±1s obično uzima kao normalni raspon za fenomen koji se proučava. Odstupanje procijenjene vrijednosti od aritmetičke sredine za više od 1 s ukazuje na odstupanje proučavanog parametra od norme.

4. U medicini se pravilo tri sigme koristi u pedijatriji za individualnu procjenu stupnja tjelesnog razvoja djece (metoda sigma odstupanja), za izradu standarda za dječju odjeću.

5. Standardna devijacija je neophodna za karakterizaciju stupnja različitosti svojstva koje se proučava i za izračunavanje pogreške aritmetičke sredine.

Vrijednost standardne devijacije obično se koristi za usporedbu varijabilnosti serija iste vrste. Ako se usporede dvije serije s različitim karakteristikama (visina i težina, prosječno trajanje bolničkog liječenja i bolničke smrtnosti itd.), tada je izravna usporedba sigma veličina nemoguća. , jer standardna devijacija je imenovana vrijednost izražena apsolutnim brojevima. U tim slučajevima koristite koeficijent varijacije (Cv), što je relativna vrijednost: postotak standardne devijacije u odnosu na aritmetičku sredinu.

Koeficijent varijacije izračunava se pomoću formule:

Što je koeficijent varijacije veći , veća je varijabilnost ove serije. Smatra se da koeficijent varijacije veći od 30% ukazuje na kvalitativnu heterogenost populacije.

Jedan od glavnih alata statistička analiza je izračun standardne devijacije. Ovaj vam pokazatelj omogućuje procjenu standardne devijacije za uzorak ili za stanovništva. Naučimo kako koristiti formulu standardne devijacije u Excelu.

Odmah odredimo što je standardna devijacija i kako izgleda njegova formula. Ova vrijednost je kvadratni korijen prosjeka aritmetički broj kvadrata razlike između svih vrijednosti niza i njihove aritmetičke sredine. Postoji identičan naziv za ovaj indikator - standardna devijacija. Oba imena su potpuno jednaka.

Ali, naravno, u Excelu korisnik to ne mora izračunati, jer program radi sve za njega. Naučimo kako izračunati standardnu ​​devijaciju u Excelu.

Izračun u Excelu

Navedenu vrijednost možete izračunati u Excelu pomoću dvije posebne funkcije STDEV.V(na temelju uzorka populacije) i STDEV.G(na temelju opće populacije). Načelo njihovog rada je apsolutno isto, ali se mogu nazvati na tri načina, o čemu ćemo raspravljati u nastavku.

Metoda 1: Čarobnjak za funkcije


Metoda 2: Kartica Formule


Metoda 3: Ručni unos formule

Također postoji način na koji uopće nećete morati pozivati ​​prozor argumenata. Da biste to učinili, morate ručno unijeti formulu.


Kao što vidite, mehanizam za izračunavanje standardne devijacije u Excelu je vrlo jednostavan. Korisnik samo treba unijeti brojeve iz populacije ili reference na ćelije koje ih sadrže. Sve izračune izvodi sam program. Mnogo je teže razumjeti što je izračunati pokazatelj i kako se rezultati izračuna mogu primijeniti u praksi. Ali razumijevanje ovoga već se više odnosi na područje statistike nego na učenje rada sa softverom.

Osim matematičkog očekivanja slučajne varijable koja. određuje položaj središta distribucije vjerojatnosti kvantitativna karakteristika distribucije slučajne varijable je disperzija slučajne varijable;

Disperziju ćemo označiti s D [x] ili .

Riječ disperzija znači raspršenost. Disperzija je numerička karakteristika disperzije, širenje vrijednosti slučajne varijable u odnosu na njezino matematičko očekivanje.

Definicija 1. Varijanca slučajne varijable je matematičko očekivanje kvadrata razlike između slučajne varijable i njezinog matematičkog očekivanja (tj. matematičko očekivanje kvadrata odgovarajuće centrirane slučajne varijable):

Varijanca ima dimenziju kvadrata slučajne varijable. Ponekad je za karakterizaciju disperzije prikladnije koristiti veličinu čija se dimenzija podudara s dimenzijom slučajne varijable. Ova vrijednost je standardna devijacija.

Definicija 2. Korijen srednje kvadratne devijacije slučajne varijable je kvadratni korijen njezine varijance:

ili u proširenom obliku

Standardna devijacija je također označena

Napomena 1. Kada se računa varijanca, formula (1) se može prikladno transformirati na sljedeći način:

tj. varijanca je jednaka razlici između matematičkog očekivanja kvadrata slučajne varijable i kvadrata matematičkog očekivanja slučajne varijable.

Primjer 1. Ispaljen je jedan hitac u predmet. Vjerojatnost pogotka. Odredite matematičko očekivanje, disperziju i standardnu ​​devijaciju.

Otopina. Izrada tablice vrijednosti broja pogodaka

Stoga,

Da bismo predstavili značenje koncepta disperzije i standardne devijacije kao karakteristike disperzije slučajne varijable, razmotrimo primjere.

Primjer 2. Slučajna varijabla dana je sljedećim zakonom raspodjele (vidi tablicu i sliku 413):

Primjer 3. Slučajna varijabla dana je sljedećim zakonom raspodjele (vidi tablicu i sliku 414):

Odrediti: 1) matematičko očekivanje, 2) disperziju, 3) standardnu ​​devijaciju.

Disperzija, raspršenje slučajne varijable u prvom primjeru manja je od disperzije slučajne varijable u drugom primjeru (vidi sl. 414 i 415). Varijance ovih vrijednosti su 0,6 odnosno 2,4.

Primjer 4; Slučajna varijabla dana je sljedećim zakonom raspodjele (vidi tablicu i sliku 415):

Ako je slučajna varijabla raspodijeljena simetrično u odnosu na središte distribucije vjerojatnosti (sl. 411), tada je očito da će njezin središnji moment trećeg reda biti jednak nuli. Ako je središnji moment trećeg reda različit od nule, tada se slučajna varijabla ne može distribuirati simetrično.

Mudri matematičari i statističari došli su do pouzdanijeg pokazatelja, ali za nešto drugačiju svrhu - prosječno linearno odstupanje. Ovaj pokazatelj karakterizira mjeru disperzije vrijednosti skupa podataka oko njihove prosječne vrijednosti.

Kako biste prikazali mjeru raspršenosti podataka, prvo morate odlučiti prema čemu će se ta raspršenost izračunati - obično je to prosječna vrijednost. Zatim morate izračunati koliko su vrijednosti analiziranog skupa podataka daleko od prosjeka. Jasno je da svaka vrijednost odgovara određenoj vrijednosti odstupanja, ali nas zanima ukupna procjena koja pokriva cijelu populaciju. Stoga se prosječno odstupanje izračunava korištenjem uobičajene formule aritmetičke sredine. Ali! Ali da bi se izračunao prosjek odstupanja, prvo ih je potrebno zbrojiti. A ako zbrojimo pozitivne i negativne brojeve, oni će se međusobno poništiti i njihov će zbroj težiti nuli. Da bi se to izbjeglo, sva odstupanja se uzimaju modulo, odnosno svi negativni brojevi postaju pozitivni. Sada će prosječno odstupanje pokazati generaliziranu mjeru širenja vrijednosti. Kao rezultat toga, prosječno linearno odstupanje izračunat će se pomoću formule:

a– prosječno linearno odstupanje,

x– analizirani pokazatelj, crtica iznad – prosječna vrijednost pokazatelja,

n– broj vrijednosti u analiziranom skupu podataka,

Nadam se da operator zbrajanja nikoga neće uplašiti.

Prosječno linearno odstupanje izračunato pomoću navedene formule odražava prosječno apsolutno odstupanje od prosječne vrijednosti za određenu populaciju.

Na slici je crvena linija prosječna vrijednost. Odstupanja svakog opažanja od srednje vrijednosti označena su malim strelicama. Uzimaju se po modulu i zbrajaju. Zatim se sve podijeli s brojem vrijednosti.

Da bismo upotpunili sliku, moramo navesti primjer. Recimo da postoji tvrtka koja proizvodi reznice za lopate. Svaki rez bi trebao biti dugačak 1,5 m, ali, što je još važnije, svi bi trebali biti jednaki ili barem plus ili minus 5 cm, međutim, neoprezni radnici će odrezati 1,2 m ili 1,8 m. Direktor tvrtke odlučio je provesti statističku analizu duljine reznica. Odabrao sam 10 komada i izmjerio njihovu duljinu, pronašao prosjek i izračunao prosječno linearno odstupanje. Prosjek se pokazao upravo onoliko koliko je potrebno - 1,5 m, ali prosječno linearno odstupanje je bilo 0,16 m, tako da se pokazalo da je svaki rez duži ili kraći u prosjeku za 16 cm radnici . Zapravo, nisam vidio nikakvu stvarnu upotrebu ovog pokazatelja, pa sam sam smislio primjer. Međutim, postoji takav pokazatelj u statistici.

Disperzija

Poput prosječnog linearnog odstupanja, varijanca također odražava opseg širenja podataka oko srednje vrijednosti.

Formula za izračunavanje varijance izgleda ovako:

(za serije varijacija (ponderirana varijanca))

(za negrupirane podatke (jednostavna varijanca))

Gdje je: σ 2 – disperzija, Xi– analiziramo sq indikator (vrijednost karakteristike), – prosječnu vrijednost indikatora, f i – broj vrijednosti u analiziranom skupu podataka.

Disperzija je prosječni kvadrat odstupanja.

Prvo se izračuna prosječna vrijednost, zatim se razlika između svake izvorne i prosječne vrijednosti uzima, kvadrira, množi učestalošću odgovarajuće vrijednosti atributa, dodaje i zatim dijeli s brojem vrijednosti u populaciji.

Međutim, u svom čistom obliku, kao što je aritmetička sredina ili indeks, disperzija se ne koristi. To je više pomoćni i posredni pokazatelj koji se koristi za druge vrste statističkih analiza.

Pojednostavljeni način izračuna varijance

Standardna devijacija

Za korištenje varijance za analizu podataka uzima se kvadratni korijen varijance. Ispada tzv standardna devijacija.

Usput, standardna devijacija se također naziva sigma - od grčkog slova koje je označava.

Standardna devijacija, očito, također karakterizira mjeru disperzije podataka, ali se sada (za razliku od varijance) može usporediti s izvornim podacima. U pravilu, srednje kvadratne mjere u statistici daju točnije rezultate od linearnih. Stoga je standardna devijacija točnija mjera disperzije podataka od linearne srednje devijacije.

Najsavršenija karakteristika varijacije je srednja kvadratna devijacija, koja se naziva standard (ili standardna devijacija). Standardna devijacija() jednak je kvadratnom korijenu prosječnog kvadratnog odstupanja pojedinačnih vrijednosti atributa od aritmetičke sredine:

Standardna devijacija je jednostavna:

Ponderirana standardna devijacija primjenjuje se na grupirane podatke:

Između korijena srednjeg kvadrata i srednjeg linearnog odstupanja pod normalnim uvjetima distribucije pojavljuje se sljedeći omjer: ~ 1,25.

Standardna devijacija, kao glavna apsolutna mjera varijacije, koristi se u određivanju ordinatnih vrijednosti krivulje normalne distribucije, u proračunima koji se odnose na organizaciju promatranja uzorka i utvrđivanje točnosti karakteristika uzorka, kao i u procjeni granice varijacije obilježja u homogenoj populaciji.

Disperzija, njezine vrste, standardna devijacija.

Varijanca slučajne varijable— mjera širenja dane slučajne varijable, tj. njezino odstupanje od matematičkog očekivanja. U statistici se često koristi oznaka ili. Kvadratni korijen varijance naziva se standardna devijacija, standardna devijacija ili standardni raspon.

Ukupna varijanca (σ 2) mjeri varijaciju svojstva u cijelosti pod utjecajem svih čimbenika koji su uzrokovali tu varijaciju. U isto vrijeme, zahvaljujući metodi grupiranja, moguće je identificirati i mjeriti varijaciju zbog karakteristike grupiranja i varijaciju koja nastaje pod utjecajem neobračunatih čimbenika.

Međugrupna varijanca (σ 2 m.gr) karakterizira sustavnu varijaciju, tj. razlike u vrijednosti proučavane karakteristike koje nastaju pod utjecajem karakteristike - faktora koji čini osnovu grupe.

Standardna devijacija(sinonimi: standardna devijacija, standardna devijacija, kvadratna devijacija; srodni pojmovi: standardna devijacija, standardno širenje) - u teoriji vjerojatnosti i statistici, najčešći pokazatelj disperzije vrijednosti slučajne varijable u odnosu na njezino matematičko očekivanje. S ograničenim nizovima vrijednosti uzorka, umjesto matematičkog očekivanja koristi se aritmetička sredina skupa uzoraka.

Standardna devijacija se mjeri u jedinicama same slučajne varijable i koristi se pri izračunavanju standardne pogreške aritmetičke sredine, pri konstruiranju intervali povjerenja, kada se statistički testiraju hipoteze, kada se mjeri linearni odnos između slučajne varijable. Definira se kao kvadratni korijen varijance slučajne varijable.


Standardna devijacija:

Standardna devijacija(procjena standardne devijacije slučajne varijable x u odnosu na svoje matematičko očekivanje temeljeno na nepristranoj procjeni njegove varijance):

gdje je disperzija; — ja element selekcije; — veličina uzorka; — aritmetička sredina uzorka:

Treba napomenuti da su obje procjene pristrane. U općem slučaju nemoguće je konstruirati nepristranu procjenu. Međutim, procjena temeljena na nepristranoj procjeni varijance je dosljedna.

Bit, opseg i postupak određivanja modusa i medijana.

Osim prosječnih snaga u statistici za relativna obilježja vrijednosti varirajućeg obilježja i unutarnja struktura serije distribucije koriste strukturne prosjeke, koji su predstavljeni uglavnom moda i medijan.

Moda- Ovo je najčešća varijanta serije. Moda se koristi, primjerice, pri određivanju veličine odjeće i obuće koji su najtraženiji među kupcima. Način rada za diskretnu seriju je onaj s najvećom frekvencijom. Prilikom izračunavanja moda za niz varijacija intervala, prvo morate odrediti modalni interval (na temelju maksimalne frekvencije), a zatim vrijednost modalne vrijednosti atributa pomoću formule:

- - modna vrijednost

- — donja granica modalnog intervala

- — veličina intervala

- — frekvencija modalnog intervala

- — frekvencija intervala koji prethodi modalnom

- — učestalost intervala koji slijedi nakon modalnog

Medijan - ovo je vrijednost atributa koji je u osnovi rangirane serije i dijeli ovu seriju na dva jednaka dijela.

Da biste odredili medijan u diskretnom nizu u prisustvu frekvencija, prvo izračunajte poluzbroj frekvencija, a zatim odredite koja vrijednost varijante pada na njega. (Ako sortirana serija sadrži neparan broj karakteristika, tada se srednji broj izračunava pomoću formule:

M e = (n (ukupan broj značajki) + 1)/2,

u slučaju parnog broja obilježja, medijan će biti jednak prosjeku dvaju obilježja u sredini reda).

Pri proračunu medijani za niz intervalnih varijacija, prvo odredite srednji interval unutar kojeg se medijan nalazi, a zatim odredite vrijednost medijana pomoću formule:

- — traženi medijan

- - donja granica intervala koji sadrži medijan

- — veličina intervala

- — zbroj učestalosti ili broj članova serije

Zbroj akumuliranih frekvencija intervala koji prethode medijanu

- — učestalost srednjeg intervala

Primjer. Pronađite modus i medijan.

Otopina:
U ovom primjeru modalni interval je unutar dobne skupine od 25-30 godina, budući da ovaj interval ima najveću učestalost (1054).

Izračunajmo veličinu moda:

To znači da je modalna dob učenika 27 godina.

Izračunajmo medijan. Interval medijana je u dobnoj skupini od 25-30 godina, jer unutar ovog intervala postoji opcija koja populaciju dijeli na dva jednaka dijela (Σf i /2 = 3462/2 = 1731). Zatim zamijenimo potrebne numeričke podatke u formulu i dobijemo vrijednost medijana:

To znači da je polovica studenata mlađa od 27,4 godine, a druga polovica starija od 27,4 godine.

Uz način i medijan, mogu se koristiti indikatori kao što su kvartili, koji dijele rangirani niz na 4 jednaka dijela, decili- 10 dijelova i percentila - na 100 dijelova.

Pojam selektivnog promatranja i njegov opseg.

Selektivno promatranje primjenjuje se kada se koristi kontinuirani nadzor fizički nemoguće zbog velike količine podataka ili nije ekonomski isplativo. Fizička nemogućnost javlja se, primjerice, pri proučavanju tokova putnika, tržišnih cijena i obiteljskih proračuna. Ekonomska nesvrsishodnost javlja se pri procjeni kvalitete robe povezane s njihovim uništenjem, na primjer, kušanjem, ispitivanjem opeke na čvrstoću itd.

Statističke jedinice odabrane za promatranje čine okvir uzorkovanja ili uzorak, a cijeli njihov niz čini opću populaciju (GS). U ovom slučaju, broj jedinica u uzorku je označen sa n, au cijelom HS - N. Stav n/N naziva se relativna veličina ili udio uzorka.

Kvaliteta rezultata promatranja uzorka ovisi o reprezentativnosti uzorka, odnosno o tome koliko je reprezentativan u GS. Kako bi se osigurala reprezentativnost uzorka potrebno je pridržavati se princip slučajnog odabira jedinica, što pretpostavlja da na uključivanje HS jedinice u uzorak ne može utjecati niti jedan čimbenik osim slučajnosti.

postoji 4 načina slučajnog odabira za uzorak:

  1. Zapravo nasumično selekcija ili “metoda lutrije”, kada se statističkim količinama dodjeljuju serijski brojevi, bilježe na određenim predmetima (npr. bačve), koje se zatim miješaju u nekoj posudi (npr. u vrećici) i nasumično odabiru. U praksi se ova metoda provodi pomoću generatora slučajnih brojeva ili matematičkih tablica slučajnih brojeva.
  2. Mehanički izbor prema kojem svaki ( N/n)-tu vrijednost opće populacije. Na primjer, ako sadrži 100.000 vrijednosti, a trebate odabrati 1.000, tada će svaka 100.000 / 1000 = 100. vrijednost biti uključena u uzorak. Štoviše, ako nisu rangirani, prvi se odabire slučajnim odabirom od prvih sto, a brojevi ostalih bit će sto veći. Na primjer, ako je prva jedinica bila broj 19, onda bi sljedeća trebala biti broj 119, zatim broj 219, zatim broj 319 itd. Ako su jedinice populacije rangirane, tada se prvo bira broj 50, zatim broj 150, zatim broj 250 i tako dalje.
  3. Izvodi se odabir vrijednosti iz heterogenog niza podataka stratificiran(stratificirana) metoda, kada se populacija najprije podijeli u homogene skupine na koje se primjenjuje slučajna ili mehanička selekcija.
  4. Posebna metoda uzorkovanja je serijski selekcija, pri kojoj se nasumično ili mehanički odabiru ne pojedinačne vrijednosti, već njihove serije (nizovi od nekog broja do nekog broja u nizu), unutar kojih se provodi kontinuirano promatranje.

Kvaliteta promatranja uzorka također ovisi o vrsta uzorka: ponovljeno ili neponovljiv.

Na ponovni odabir Statističke vrijednosti ili njihove serije uključene u uzorak vraćaju se općoj populaciji nakon upotrebe, s mogućnošću uključivanja u novi uzorak. Štoviše, sve vrijednosti u populaciji imaju istu vjerojatnost uključivanja u uzorak.

Izbor koji se ne ponavlja znači da se statističke vrijednosti ili njihove serije uključene u uzorak ne vraćaju u opću populaciju nakon uporabe, pa se stoga za preostale vrijednosti potonjih povećava vjerojatnost da budu uključene u sljedeći uzorak.

Uzorkovanje koje se ne ponavlja daje točnije rezultate, pa se češće koristi. Ali postoje situacije kada se ne može primijeniti (proučavanje tokova putnika, potražnje potrošača itd.) i tada se provodi ponovljena selekcija.

Maksimalna pogreška uzorkovanja promatranja, prosječna pogreška uzorkovanja, postupak njihova izračuna.

Razmotrimo detaljno gore navedene metode formiranja uzorka populacije i pogreške koje pri tome nastaju. reprezentativnost .
Ispravno nasumično uzorkovanje se temelji na odabiru jedinica iz populacije nasumično bez ikakvih sustavnih elemenata. Tehnički gledano, stvarni slučajni odabir provodi se izvlačenjem ždrijeba (na primjer, lutrija) ili korištenjem tablice slučajnih brojeva.

Ispravan slučajni odabir “u svom čistom obliku” rijetko se koristi u praksi selektivnog promatranja, ali je original među ostalim vrstama odabira, implementira osnovne principe selektivnog promatranja. Razmotrimo neka teorijska pitanja metoda uzorkovanja i formule pogreške za jednostavno slučajno uzorkovanje.

Pristranost uzorkovanja je razlika između vrijednosti parametra u općoj populaciji i njegove vrijednosti izračunate iz rezultata promatranja uzorka. Za prosječno kvantitativno obilježje, pogreška uzorkovanja određena je

Pokazatelj se naziva granična pogreška uzorkovanja.
Srednja vrijednost uzorka je slučajna varijabla koja može poprimiti različite vrijednosti ovisno o tome koje su jedinice uključene u uzorak. Stoga su greške uzorkovanja također slučajne varijable i mogu poprimiti različite vrijednosti. Stoga se određuje prosjek mogućih pogrešaka - prosječna greška uzorkovanja, što ovisi o:

Veličina uzorka: što je veći broj, to je manja prosječna pogreška;

Stupanj promjene svojstva koje se proučava: što je manja varijacija obilježja, a time i disperzija, to je manja prosječna pogreška uzorkovanja.

Na slučajni ponovni odabir izračunava se prosječna greška:
.
U praksi, opća varijanca nije točno poznata, ali u teorija vjerojatnosti dokazano je da
.
Budući da je vrijednost za dovoljno veliki n blizu 1, možemo pretpostaviti da je . Tada se može izračunati prosječna pogreška uzorkovanja:
.
Ali u slučajevima malog uzorka (s n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

Na slučajno uzorkovanje bez ponavljanja zadane formule su prilagođene vrijednosti . Tada je prosječna greška uzorkovanja koja se ne ponavlja:
I .
Jer uvijek manji, tada je množitelj () uvijek manji od 1. To znači da je prosječna pogreška tijekom neponavljajućeg odabira uvijek manja nego tijekom ponovljenog odabira.
Mehaničko uzorkovanje koristi se kada je opća populacija na neki način poredana (primjerice, abecedni popisi birača, telefonski brojevi, kućni brojevi, brojevi stanova). Odabir jedinica provodi se u određenom intervalu, koji je obrnut postotku uzorkovanja. Dakle, s uzorkom od 2% odabire se svakih 50 jedinica = 1/0,02, s uzorkom od 5% svakih 1/0,05 = 20 jedinica opće populacije.

Referentna točka se bira na različite načine: nasumično, od sredine intervala, s promjenom referentne točke. Glavna stvar je izbjeći sustavnu pogrešku. Na primjer, s uzorkom od 5%, ako je prva jedinica 13., onda su sljedeće 33, 53, 73 itd.

U smislu točnosti, mehanički odabir je blizak stvarnom slučajnom uzorkovanju. Stoga se za određivanje prosječne pogreške mehaničkog uzorkovanja koriste odgovarajuće formule za slučajni odabir.

Na tipičan izbor populacija koja se ispituje preliminarno je podijeljena u homogene, slične skupine. Na primjer, kada se istražuju poduzeća, to mogu biti industrije, podsektori; kada se proučava stanovništvo, to mogu biti regije, društvene ili dobne skupine. Zatim se neovisni odabir iz svake skupine vrši mehanički ili čisto nasumično.

Tipično uzorkovanje daje točnije rezultate od drugih metoda. Tipizacijom opće populacije osigurava se zastupljenost svake tipološke skupine u uzorku, čime je moguće eliminirati utjecaj međugrupne varijance na prosječnu pogrešku uzorkovanja. Posljedično, pri pronalaženju pogreške tipičnog uzorka prema pravilu zbrajanja varijanci (), potrebno je uzeti u obzir samo prosjek grupnih varijanci. Tada je prosječna greška uzorkovanja:
pri ponovnom odabiru
,
s odabirom koji se ne ponavlja
,
Gdje - prosjek varijanci unutar grupe u uzorku.

Izbor serije (ili gnijezda). koristi se kada je populacija podijeljena u serije ili skupine prije početka istraživanja uzorka. Ove serije mogu biti pakiranja gotovih proizvoda, studentskih grupa, timova. Serije za ispitivanje odabiru se mehanički ili čisto slučajno, a unutar serije provodi se kontinuirano ispitivanje jedinica. Stoga prosječna pogreška uzorkovanja ovisi samo o međugrupnoj (međuserijskoj) varijanci koja se izračunava pomoću formule:

gdje je r broj odabranih serija;
- prosjek i-te serije.

Prosječna pogreška serijskog uzorkovanja izračunava se:

nakon ponovnog odabira:
,
s odabirom koji se ne ponavlja:
,
gdje je R ukupan broj epizoda.

Kombinirano izbor je kombinacija razmatranih metoda selekcije.

Prosječna pogreška uzorkovanja za bilo koju metodu uzorkovanja ovisi uglavnom o apsolutnoj veličini uzorka i, u manjoj mjeri, o postotku uzorka. Pretpostavimo da je u prvom slučaju napravljeno 225 opažanja iz populacije od 4500 jedinica, au drugom iz populacije od 225000 jedinica. Varijance u oba slučaja jednake su 25. Tada će u prvom slučaju, s izborom od 5%, pogreška uzorkovanja biti:

U drugom slučaju, s odabirom od 0,1%, to će biti jednako:


ovako, sa smanjenjem postotka uzorkovanja za 50 puta, pogreška uzorkovanja se malo povećala, budući da se veličina uzorka nije promijenila.
Pretpostavimo da je veličina uzorka povećana na 625 opažanja. U ovom slučaju, greška uzorkovanja je:

Povećanje uzorka za 2,8 puta uz istu veličinu populacije smanjuje veličinu pogreške uzorkovanja za više od 1,6 puta.

Metode i metode formiranja uzorka populacije.

U statistici se koriste različite metode formiranja uzoraka populacija, što je određeno ciljevima istraživanja i ovisi o specifičnostima predmeta proučavanja.

Glavni uvjet za provođenje istraživanja uzorka je spriječiti pojavu sustavnih pogrešaka koje proizlaze iz kršenja načela jednakih mogućnosti za svaku jedinicu opće populacije koja bi bila uključena u uzorak. Prevencija sustavnih pogrešaka postiže se korištenjem znanstveno utemeljenih metoda formiranja uzorka populacije.

Postoje sljedeće metode za odabir jedinica iz populacije:

1) individualni odabir - za uzorak se biraju pojedinačne jedinice;

2) grupni odabir - uzorak uključuje kvalitativno homogene skupine ili nizove jedinica koje se proučavaju;

3) kombinirana selekcija je kombinacija individualne i grupne selekcije.
Metode odabira određene su pravilima za formiranje uzorka populacije.

Uzorak može biti:

  • zapravo nasumično sastoji se u tome što je uzorak populacije nastao kao rezultat slučajnog (nenamjernog) odabira pojedinih jedinica iz opće populacije. U tom se slučaju broj jedinica odabranih u uzorku populacije obično određuje na temelju prihvaćenog udjela uzorka. Omjer uzorka je omjer broja jedinica u uzorkovanoj populaciji n prema broju jedinica u općoj populaciji N, tj.
  • mehanički sastoji se u tome što se izbor jedinica u uzorku populacije vrši iz opće populacije, podijeljene na jednake intervale (skupine). U tom je slučaju veličina intervala u populaciji jednaka obrnutoj proporciji uzorka. Dakle, kod uzorka od 2% bira se svaka 50. jedinica (1:0,02), kod uzorka od 5% svaka 20. jedinica (1:0,05) itd. Dakle, u skladu s prihvaćenim omjerom selekcije, opća populacija je takoreći mehanički podijeljena u skupine jednake veličine. Iz svake skupine odabire se samo jedna jedinica za uzorak.
  • tipično - u kojoj se opća populacija prvo dijeli na homogene tipične skupine. Zatim se iz svake tipične skupine koristi čisto slučajni ili mehanički uzorak za pojedinačni odabir jedinica u populaciju uzorka. Važna značajka tipičnog uzorka je da daje preciznije rezultate u usporedbi s drugim metodama odabira jedinica u uzorku populacije;
  • serijski- u kojoj je opća populacija podijeljena u skupine jednake veličine - serije. Serije su odabrane u uzorku populacije. Unutar niza provodi se kontinuirano promatranje jedinica uključenih u niz;
  • kombinirani- uzorkovanje može biti dvostupanjsko. U ovom slučaju, populacija se najprije podijeli u skupine. Zatim se odabiru skupine, a unutar njih pojedine jedinice.

U statistici se razlikuju sljedeće metode za odabir jedinica u uzorku populacije::

  • jednostupanjska uzorkovanje - svaka odabrana jedinica odmah se podvrgava proučavanju prema zadanom kriteriju (pravilno slučajno i serijsko uzorkovanje);
  • višestupanjski uzorkovanje - vrši se selekcija iz opće populacije pojedinih skupina, a iz skupina odabiru pojedine jedinice (tipično uzorkovanje mehaničkom metodom odabira jedinica u uzorku populacije).

Osim toga, postoje:

  • ponovni odabir- prema shemi vraćene lopte. U tom slučaju, svaka jedinica ili serija uključena u uzorak vraća se općoj populaciji i stoga ima priliku ponovno biti uključena u uzorak;
  • ponoviti odabir- prema shemi nevraćene lopte. Ima preciznije rezultate s istom veličinom uzorka.

Određivanje potrebne veličine uzorka (koristeći Studentovu t-tablicu).

Jedno od znanstvenih načela u teoriji uzorkovanja je osigurati odabir dovoljnog broja jedinica. Teoretski, potreba poštivanja ovog načela prikazana je u dokazima graničnih teorema u teoriji vjerojatnosti, koji omogućuju utvrđivanje koliki volumen jedinica treba odabrati iz populacije da bude dovoljan i da osigura reprezentativnost uzorka.

Smanjenje standardne pogreške uzorkovanja, a time i povećanje točnosti procjene, uvijek je povezano s povećanjem veličine uzorka, stoga je već u fazi organiziranja promatranja uzorka potrebno odlučiti koja je veličina uzorkovana populacija treba biti kako bi se osigurala potrebna točnost rezultata promatranja. Izračun potrebne veličine uzorka konstruira se pomoću formula izvedenih iz formula za najveće pogreške uzorkovanja (A), koje odgovaraju određenoj vrsti i metodi odabira. Dakle, za nasumično ponovljenu veličinu uzorka (n) imamo:

Bit ove formule je da je slučajnim ponovljenim odabirom traženog broja veličina uzorka izravno proporcionalna kvadratu koeficijenta pouzdanosti. (t2) i varijance varijacijske karakteristike (?2) i obrnuto je proporcionalna kvadratu najveće pogreške uzorkovanja (?2). Konkretno, s povećanjem najveće pogreške za faktor dva, potrebna veličina uzorka može se smanjiti za faktor četiri. Od tri parametra, dva (t i?) postavlja istraživač.

Pritom je istraživač na temelju Iz svrhe i ciljeva uzorka istraživanja mora se razriješiti pitanje: u kojoj kvantitativnoj kombinaciji je bolje uključiti te parametre kako bi se osigurala optimalna opcija? U jednom slučaju može biti zadovoljniji pouzdanošću dobivenih rezultata (t) nego mjerom točnosti (?), u drugom - obrnuto. Teže je riješiti pitanje vrijednosti maksimalne pogreške uzorkovanja, budući da istraživač ne raspolaže ovim pokazateljem u fazi projektiranja promatranja uzorka, stoga je u praksi uobičajeno odrediti vrijednost maksimalne pogreške uzorkovanja, obično unutar 10% očekivane prosječne razine atributa. Utvrđivanju procijenjenog prosjeka može se pristupiti na različite načine: korištenjem podataka iz sličnih prethodnih istraživanja ili korištenjem podataka iz okvira uzorkovanja i provođenjem malog pilot uzorka.

Najteže je utvrditi kod izrade uzorka promatranja treći parametar u formuli (5.2) - disperziju uzorka populacije. U tom slučaju potrebno je koristiti sve podatke kojima istraživač raspolaže, a dobivene u prethodno provedenim sličnim i pilot istraživanjima.

Pitanje o definiciji potrebna veličina uzorka postaje kompliciranija ako istraživanje uzorkovanja uključuje proučavanje nekoliko karakteristika jedinica uzorkovanja. U ovom slučaju, prosječne razine svake od karakteristika i njihove varijacije, u pravilu, su različite, pa je stoga odlučivanje kojoj varijanci od kojih karakteristika dati prednost moguće samo uzimajući u obzir svrhu i ciljeve anketa.

Pri izradi uzorka promatranja pretpostavlja se unaprijed određena vrijednost dopuštene pogreške uzorkovanja u skladu s ciljevima pojedine studije i vjerojatnosti zaključaka na temelju rezultata promatranja.

Općenito, formula za najveću pogrešku prosjeka uzorka omogućuje nam da odredimo:

Veličina mogućih odstupanja pokazatelja opće populacije od pokazatelja uzorka populacije;

Potrebna veličina uzorka, koja osigurava traženu točnost, pri kojoj granice moguće pogreške neće prijeći određenu specificiranu vrijednost;

Vjerojatnost da će greška u uzorku imati određenu granicu.

Distribucija učenika u teoriji vjerojatnosti, to je jednoparametarska obitelj apsolutno kontinuiranih distribucija.

Dinamički niz (interval, moment), završni dinamički niz.

Dinamička serija- to su vrijednosti statističkih pokazatelja koji su prikazani određenim kronološkim slijedom.

Svaka vremenska serija sadrži dvije komponente:

1) pokazatelji vremenskih razdoblja (godine, kvartali, mjeseci, dani ili datumi);

2) pokazatelji koji karakteriziraju predmet koji se proučava za vremenska razdoblja ili na odgovarajuće datume, koji se nazivaju razinama serije.

Izražene su razine serije i apsolutne i prosječne ili relativne vrijednosti. Ovisno o prirodi pokazatelja, grade se vremenski nizovi apsolutnih, relativnih i prosječnih vrijednosti. Dinamički nizovi iz relativnih i prosječnih vrijednosti konstruirani su na temelju izvedenih nizova apsolutnih vrijednosti. Postoje intervalni i momentni nizovi dinamike.

Dinamičke intervalne serije sadrži vrijednosti indikatora za određena vremenska razdoblja. U nizu intervala, razine se mogu zbrajati kako bi se dobio volumen fenomena tijekom duljeg razdoblja ili takozvani akumulirani ukupni iznosi.

Niz dinamičkih trenutaka odražava vrijednosti pokazatelja u određenom trenutku (datum vremena). U trenutnim nizovima istraživača može zanimati samo razlika u pojavama koja odražava promjenu razine niza između određenih datuma, budući da zbroj razina ovdje nema pravi sadržaj. Ovdje se ne računaju kumulativni zbrojevi.

Najvažniji uvjet za ispravnu konstrukciju vremenske serije je usporedivost razina serije koje pripadaju različitim razdobljima. Razine moraju biti prikazane u homogenim količinama, te mora postojati jednaka cjelovitost obuhvata različitih dijelova fenomena.

Kako bi se Kako bi se izbjeglo iskrivljenje stvarne dinamike, u statističkoj studiji provode se preliminarni izračuni (zatvaranje dinamičke serije), koji prethode statističkoj analizi vremenske serije. Zatvaranje dinamičke serije podrazumijeva se spajanje u jednu seriju dvije ili više serija, čije su razine izračunate različitim metodologijama ili ne odgovaraju teritorijalnim granicama, itd. Zatvaranje dinamičkog niza također može značiti dovođenje apsolutnih razina dinamičkog niza na zajedničku osnovu, čime se neutralizira neusporedivost razina dinamičkog niza.

Pojam usporedivosti dinamičkih nizova, koeficijenata, rasta i stopa rasta.

Dinamička serija- to je niz statističkih pokazatelja koji karakteriziraju razvoj prirodnih i društvenih pojava tijekom vremena. Statističke zbirke koje objavljuje Državni odbor za statistiku Rusije sadrže veliki broj dinamičkih serija u tabelarnom obliku. Dinamički nizovi omogućuju prepoznavanje obrazaca razvoja fenomena koji se proučavaju.

Dinamičke serije sadrže dvije vrste indikatora. Indikatori vremena(godine, kvartali, mjeseci itd.) ili točke u vremenu (na početku godine, na početku svakog mjeseca itd.). Indikatori razine retka. Pokazatelji razina dinamičke serije mogu se izraziti u apsolutnim vrijednostima (proizvodnja proizvoda u tonama ili rubljima), relativnim vrijednostima (udio gradskog stanovništva u %) i prosječnim vrijednostima (prosječne plaće radnika u industriji po godinama , itd.). U tabelarnom obliku, vremenska serija sadrži dva stupca ili dva retka.

Ispravna konstrukcija vremenske serije zahtijeva ispunjenje niza zahtjeva:

  1. svi pokazatelji niza dinamike moraju biti znanstveno utemeljeni i pouzdani;
  2. pokazatelji niza dinamike moraju biti usporedivi tijekom vremena, tj. moraju se izračunati za ista vremenska razdoblja ili na iste datume;
  3. indikatori niza dinamika moraju biti usporedivi na cijelom teritoriju;
  4. pokazatelji niza dinamike moraju biti sadržajno usporedivi, tj. izračunati prema jedinstvenoj metodologiji, na isti način;
  5. pokazatelji brojnih dinamika trebali bi biti usporedivi u nizu farmi koje se uzimaju u obzir. Svi pokazatelji niza dinamike moraju biti navedeni u istim mjernim jedinicama.

Statistički pokazatelji može karakterizirati ili rezultate procesa koji se proučava tijekom određenog vremenskog razdoblja ili stanje fenomena koji se proučava u određenoj vremenskoj točki, tj. pokazatelji mogu biti intervalni (periodični) i trenutni. Prema tome, početno dinamički niz može biti interval ili trenutak. Nizovi dinamike trenutaka pak mogu biti s jednakim ili nejednakim vremenskim intervalima.

Izvorni dinamički niz može se transformirati u niz prosječnih vrijednosti i niz relativnih vrijednosti (lančanih i osnovnih). Takve vremenske serije nazivaju se izvedene vremenske serije.

Metodologija za izračun prosječne razine u dinamičkom nizu je različita, ovisno o vrsti dinamičkog niza. Koristeći primjere, razmotrit ćemo vrste dinamičkih serija i formule za izračun prosječne razine.

Apsolutna povećanja (Δy) pokazuju koliko se jedinica promijenila sljedeća razina niza u odnosu na prethodnu (gr. 3. - lančana apsolutna povećanja) ili u odnosu na početnu razinu (gr. 4. - osnovna apsolutna povećanja). Formule za izračun mogu se napisati na sljedeći način:

Kada se apsolutne vrijednosti niza smanjuju, doći će do "smanjenja" odnosno "smanjenja".

Apsolutni pokazatelji rasta pokazuju da je, primjerice, u 1998. godini proizvodnja proizvoda “A” povećana za 4 tisuće tona u odnosu na 1997. godinu, odnosno za 34 tisuće tona u odnosu na 1994. godinu; za ostale godine vidi tablicu. 11,5 gr. 3 i 4.

Stopa rasta pokazuje koliko se puta razina niza promijenila u odnosu na prethodnu (gr. 5 - lančani koeficijenti rasta ili pada) ili u odnosu na početnu razinu (gr. 6 - osnovni koeficijenti rasta ili pada). Formule za izračun mogu se napisati na sljedeći način:

Stopa rasta pokazuju koliki je postotak sljedeća razina niza u usporedbi s prethodnom (gr. 7 - lančane stope rasta) ili u usporedbi s početnom razinom (gr. 8 - osnovne stope rasta). Formule za izračun mogu se napisati na sljedeći način:

Tako je, na primjer, 1997. godine obujam proizvodnje proizvoda "A" u odnosu na 1996. godinu iznosio 105,5% (

Stopa rasta pokazuju za koliko se postotaka povećala razina izvještajnog razdoblja u odnosu na prethodno (stupac 9 - lančane stope rasta) ili u odnosu na početnu razinu (stupac 10 - osnovne stope rasta). Formule za izračun mogu se napisati na sljedeći način:

T pr = T r - 100% ili T pr = apsolutni rast / razina prethodnog razdoblja * 100%

Tako je, na primjer, 1996. godine u odnosu na 1995. proizvod “A” proizveden za 3,8% (103,8% - 100%) ili (8:210)x100% više, au odnosu na 1994. godinu - za 9% (109% - 100%).

Ako se apsolutne razine u nizu smanjuju, tada će stopa biti manja od 100% i, sukladno tome, doći će do stope pada (stopa porasta s predznakom minus).

Apsolutna vrijednost povećanja od 1%.(stupac 11) pokazuje koliko se jedinica mora proizvesti u određenom razdoblju da se razina prethodnog razdoblja poveća za 1%. U našem primjeru 1995. godine bilo je potrebno proizvesti 2,0 tisuće tona, a 1998. godine 2,3 tisuće tona, tj. mnogo više.

Apsolutna vrijednost rasta od 1% može se odrediti na dva načina:

Razina prethodnog razdoblja podijeljena je sa 100;

Apsolutna lančana povećanja dijele se s odgovarajućim lančanim stopama rasta.

Apsolutna vrijednost povećanja od 1% =

U dinamici, osobito u dugom razdoblju, važna je zajednička analiza stope rasta sa sadržajem svakog postotka povećanja ili smanjenja.

Imajte na umu da je razmatrana metodologija za analizu vremenskih serija primjenjiva i za vremenske serije, čije su razine izražene u apsolutnim vrijednostima (t, tisuća rubalja, broj zaposlenika itd.), i za vremenske serije, čije su razine izražavaju se u relativnim pokazateljima (% nedostataka, % sadržaja pepela u ugljenu itd.) ili prosječnim vrijednostima (prosječni prinos u c/ha, prosječna plaća itd.).

Uz razmatrane analitičke pokazatelje, izračunate za svaku godinu u usporedbi s prethodnom ili početnom razinom, pri analizi serije dinamike potrebno je izračunati prosječne analitičke pokazatelje za razdoblje: prosječnu razinu serije, prosječni godišnji apsolutni porast (smanjenje) te prosječna godišnja stopa rasta i stopa rasta.

Metode za izračunavanje prosječne razine niza dinamike raspravljene su gore. U intervalnoj dinamičkoj seriji koju razmatramo, prosječna razina serije izračunava se pomoću jednostavne formule aritmetičke sredine:

Prosječna godišnja proizvodnja proizvoda za 1994-1998. iznosio 218,4 tisuća tona.

Prosječni godišnji apsolutni rast također se izračunava koristeći formulu jednostavne aritmetičke sredine:

Godišnji apsolutni porast varirao je kroz godine od 4 do 12 tisuća tona (vidi stupac 3), a prosječni godišnji porast proizvodnje za razdoblje 1995.-1998. iznosio 8,5 tisuća tona.

Metode za izračunavanje prosječne stope rasta i prosječne stope rasta zahtijevaju detaljnije razmatranje. Razmotrimo ih na primjeru pokazatelja razine godišnjih serija danih u tablici.

Prosječna razina dinamičke serije.

Dinamički niz (ili vremenski niz)- to su numeričke vrijednosti određenog statističkog pokazatelja u uzastopnim trenucima ili vremenskim razdobljima (tj. poredane kronološkim redom).

Nazivaju se numeričke vrijednosti jednog ili drugog statističkog pokazatelja koji čini dinamičku seriju razine serije a obično se označava slovom g. Prvi termin serije y 1 naziva se početnim ili osnovna razina, i posljednji y n - konačni. Trenuci ili razdoblja na koje se razine odnose označeni su sa t.

Dinamički nizovi obično se prikazuju u obliku tablice ili grafikona, a vremenska skala se konstruira duž apscisne osi t, a duž ordinatne osi - ljestvica razina serije g.

Prosječni pokazatelji dinamičke serije

Svaki niz dinamike može se smatrati određenim skupom n vremenski promjenjivi pokazatelji koji se mogu sažeti kao prosjeci. Takvi generalizirani (prosječni) pokazatelji posebno su potrebni kada se uspoređuju promjene pojedinog pokazatelja u različitim razdobljima, u različitim zemljama itd.

Generalizirana karakteristika niza dinamike može poslužiti, prije svega, razina srednjeg reda. Metoda izračuna prosječne razine ovisi o tome radi li se o trenutnoj seriji ili intervalnoj seriji (periodičkoj).

U slučaju interval niza, njegova prosječna razina određena je formulom jednostavne aritmetičke sredine razina niza, tj.

=
Ako je dostupno trenutak red koji sadrži n razine ( y1, y2, …, yn) s jednakim razmacima između datuma (vremena), tada se takav niz može lako pretvoriti u niz prosječnih vrijednosti. U ovom slučaju pokazatelj (razina) na početku svakog razdoblja istovremeno je pokazatelj na kraju prethodnog razdoblja. Tada se prosječna vrijednost indikatora za svako razdoblje (razmak između datuma) može izračunati kao polovica zbroja vrijednosti na na početku i na kraju razdoblja, tj. kako . Broj takvih prosjeka bit će . Kao što je ranije navedeno, za niz prosječnih vrijednosti, prosječna razina izračunava se korištenjem aritmetičke sredine.

Stoga možemo napisati:
.
Nakon transformacije brojnika dobivamo:
,

Gdje Y1 I Yn— prva i zadnja razina reda; Yi— srednje razine.

Ovaj prosjek je u statistici poznat kao prosječno kronološki za seriju trenutaka. Ime je dobio od riječi "cronos" (vrijeme, latinski), budući da se izračunava iz pokazatelja koji se mijenjaju tijekom vremena.

U slučaju nejednakih intervalima između datuma, kronološki prosjek za niz trenutaka može se izračunati kao aritmetička sredina prosječnih vrijednosti razina za svaki par trenutaka, ponderiranih udaljenostima (vremenskim intervalima) između datuma, tj.
.
U ovom slučaju pretpostavlja se da su u intervalima između datuma razine poprimile različite vrijednosti, a mi smo jedna od dvije poznate ( yi I yi+1) utvrđujemo prosjeke iz kojih zatim izračunavamo ukupni prosjek za cijelo analizirano razdoblje.
Ako se pretpostavi da svaka vrijednost yi ostaje nepromijenjen do sljedećeg (i+ 1)- trenutak, tj. Ako je poznat točan datum promjene razina, izračun se može izvesti pomoću formule ponderirane aritmetičke sredine:
,

gdje je vrijeme tijekom kojeg je razina ostala nepromijenjena.

Osim prosječne razine u dinamičkoj seriji, izračunavaju se i drugi prosječni pokazatelji - prosječna promjena razina serije (osnovna i lančana metoda), prosječna stopa promjene.

Osnovna vrijednost apsolutne promjene je kvocijent zadnje temeljne apsolutne promjene podijeljen s brojem promjena. To jest

Lanac znači apsolutnu promjenu razine niza je kvocijent dijeljenja zbroja svih lančanih apsolutnih promjena s brojem promjena, tj.

Znak prosječnih apsolutnih promjena također se koristi za prosuđivanje prirode promjene u nekoj pojavi u prosjeku: rast, pad ili stabilnost.

Iz pravila za kontrolu osnovne i lančane apsolutne promjene proizlazi da osnovna i lančana prosječna promjena moraju biti jednake.

Uz prosječnu apsolutnu promjenu, bazičnom i lančanom metodom izračunava se i relativni prosjek.

Osnovna prosječna relativna promjena određuje se formulom:

Prosječna relativna promjena u lancu određuje se formulom:

Naravno, osnovne i lančane prosječne relativne promjene moraju biti iste, a njihovom usporedbom s kriterijskom vrijednošću 1 zaključuje se kakva je priroda promjene pojave u prosjeku: rast, pad ili stabilnost.
Oduzimanjem 1 od osnovne ili lančane prosječne relativne promjene, odgovarajuća prosječna stopa promjene, prema čijem se znaku također može suditi o prirodi promjene u fenomenu koji se proučava, a koji se odražava u ovom nizu dinamike.

Sezonska kolebanja i indeksi sezonalnosti.

Sezonske fluktuacije su stabilne unutargodišnje fluktuacije.

Osnovno načelo upravljanja za postizanje maksimalnog učinka je maksimiziranje prihoda i minimiziranje troškova. Proučavanjem sezonskih kolebanja rješava se problem jednadžbe maksimuma na svakoj razini godine.

Pri proučavanju sezonskih fluktuacija rješavaju se dva međusobno povezana problema:

1. Identifikacija specifičnosti razvoja fenomena u unutargodišnjoj dinamici;

2. Mjerenje sezonskih fluktuacija s izgradnjom modela sezonskih valova;

Za mjerenje sezonskih varijacija obično se broje sezonski purani. Općenito, određuju se omjerom početnih jednadžbi dinamičkog niza i teoretskih jednadžbi, koje služe kao osnova za usporedbu.

Budući da su slučajna odstupanja superponirana sezonskim fluktuacijama, indeksi sezonalnosti su prosječni kako bi ih se eliminiralo.

U ovom slučaju, za svako razdoblje godišnjeg ciklusa utvrđuju se generalizirani pokazatelji u obliku prosječnih sezonskih indeksa:

Prosječni indeksi sezonskih fluktuacija oslobođeni su utjecaja slučajnih odstupanja glavnog trenda razvoja.

Ovisno o prirodi trenda, formula za prosječni indeks sezonalnosti može imati sljedeće oblike:

1.Za nizove međugodišnje dinamike s jasno izraženim glavnim trendom razvoja:

2. Za serije unutargodišnje dinamike u kojima nema rastućeg ili opadajućeg trenda ili je beznačajna:

Gdje je ukupni prosjek;

Metode za analizu glavnog trenda.

Na razvoj pojava tijekom vremena utječu čimbenici različite naravi i jačine utjecaja. Neki od njih su slučajne prirode, drugi imaju gotovo stalni utjecaj i tvore određeni razvojni trend u dinamici.

Važan zadatak statistike je identificirati dinamiku trenda u serijama, oslobođene utjecaja različitih slučajnih čimbenika. U tu svrhu vremenske serije se obrađuju metodama ukrupnjavanja intervala, pomičnog prosjeka i analitičkog niveliranja itd.

Metoda povećanja intervala temelji se na proširenju vremenskih razdoblja, koja uključuju razine niza dinamike, tj. je zamjena podataka koji se odnose na mala vremenska razdoblja podacima za veća razdoblja. Posebno je učinkovit kada se početne razine serije odnose na kratka vremenska razdoblja. Na primjer, nizovi indikatora koji se odnose na dnevne događaje zamjenjuju se nizovima koji se odnose na tjedne, mjesečne itd. To će se jasnije pokazati “os razvoja fenomena”. Prosjek, izračunat u povećanim intervalima, omogućuje nam da identificiramo smjer i prirodu (ubrzanje ili usporavanje rasta) glavnog trenda razvoja.

Metoda pomičnog prosjeka sličan prethodnom, ali u ovom slučaju stvarne razine zamijenjene su prosječnim razinama izračunatim za sekvencijalno pomične (klizne) povećane intervale koji pokrivaju m razine serije.

Na primjer, ako prihvatimo m=3, zatim se prvo izračuna prosjek prve tri razine serije, zatim - od istog broja razina, ali počevši od druge, zatim - počevši od treće, itd. Dakle, prosjek "klizi" duž niza dinamike, pomičući se za jedan član. Izračunato iz mčlanova, pomični prosjeci odnose se na sredinu (središte) svakog intervala.

Ova metoda eliminira samo slučajne fluktuacije. Ako niz ima sezonski val, on će postojati čak i nakon izglađivanja metodom pomičnog prosjeka.

Analitičko usklađivanje. Kako bi se eliminirale slučajne fluktuacije i identificirao trend, koristi se niveliranje razina serija pomoću analitičkih formula (ili analitičko niveliranje). Njegova bit je zamjena empirijskih (stvarnih) razina s teorijskim, koje se izračunavaju pomoću određene jednadžbe usvojene kao matematički model trenda, gdje se teorijske razine razmatraju kao funkcija vremena: . U ovom slučaju, svaka stvarna razina smatra se zbrojem dviju komponenti: , gdje je sustavna komponenta i izražena određenom jednadžbom, a slučajna varijabla koja uzrokuje fluktuacije oko trenda.

Zadatak analitičkog usklađivanja svodi se na sljedeće:

1. Određivanje, na temelju stvarnih podataka, vrste hipotetske funkcije koja može najadekvatnije odražavati trend razvoja pokazatelja koji se proučava.

2. Određivanje parametara navedene funkcije (jednadžbe) iz empirijskih podataka

3. Izračun pomoću pronađene jednadžbe teorijskih (usklađenih) razina.

Izbor pojedine funkcije provodi se, u pravilu, na temelju grafičkog prikaza empirijskih podataka.

Modeli su regresijske jednadžbe čiji su parametri izračunati metodom najmanjih kvadrata

Ispod su najčešće korištene regresijske jednadžbe za usklađivanje vremenskih nizova, s naznakom za koje su specifične razvojne trendove najprikladnije odražavati.

Za pronalaženje parametara gornjih jednadžbi postoje posebni algoritmi i računalni programi. Konkretno, za pronalaženje parametara jednadžbe pravocrtne linije može se koristiti sljedeći algoritam:

Ako se periode ili trenutke vremena numerira tako da je St = 0, tada će se gornji algoritmi značajno pojednostaviti i pretvoriti u

Poravnane razine na grafikonu nalazit će se na jednoj ravnoj liniji, koja prolazi na najbližoj udaljenosti od stvarnih razina ovog dinamičkog niza. Zbroj kvadrata odstupanja odraz je utjecaja slučajnih faktora.

Pomoću njega izračunavamo prosječnu (standardnu) pogrešku jednadžbe:

Ovdje je n broj opažanja, a m je broj parametara u jednadžbi (imamo dva od njih - b 1 i b 0).

Glavna tendencija (trend) pokazuje kako sustavni čimbenici utječu na razine niza dinamike, a fluktuacija razina oko trenda () služi kao mjera utjecaja rezidualnih čimbenika.

Za procjenu kvalitete korištenog modela vremenske serije također se koristi Fisherov F test. To je omjer dviju varijanci, odnosno omjer varijance uzrokovane regresijom, tj. faktor koji se proučava, na varijancu uzrokovanu slučajnim razlozima, tj. zaostala disperzija:

U proširenom obliku, formula za ovaj kriterij može se prikazati na sljedeći način:

gdje je n broj opažanja, tj. broj razina redova,

m je broj parametara u jednadžbi, y je stvarna razina niza,

Poravnana razina reda - razina srednjeg reda.

Model koji je uspješniji od ostalih ne mora uvijek biti dovoljno zadovoljavajući. Može se prepoznati kao takav samo u slučaju kada njegov kriterij F prijeđe poznatu kritičnu granicu. Ova granica se utvrđuje pomoću tablica F-distribucije.

Bit i klasifikacija indeksa.

U statistici, indeks se shvaća kao relativni pokazatelj koji karakterizira promjenu veličine fenomena u vremenu, prostoru ili u usporedbi s bilo kojim standardom.

Glavni element indeksne relacije je indeksirana vrijednost. Indeksirana vrijednost shvaća se kao vrijednost obilježja statističke populacije čija je promjena predmet proučavanja.

Pomoću indeksa rješavaju se tri glavna zadatka:

1) procjena promjena u složenoj pojavi;

2) utvrđivanje utjecaja pojedinih čimbenika na promjene složene pojave;

3) usporedba veličine pojave s veličinom prošlog razdoblja, veličinom drugog teritorija, kao i sa standardima, planovima i prognozama.

Indeksi su klasificirani prema 3 kriterija:

2) prema stupnju obuhvata elemenata stanovništva;

3) prema metodama za izračunavanje općih indeksa.

Po sadržaju indeksiranih veličina, indeksi se dijele na indekse kvantitativnih (volumenskih) pokazatelja i indekse kvalitativnih pokazatelja. Indeksi kvantitativnih pokazatelja - indeksi fizičkog obujma industrijskih proizvoda, fizičkog obujma prodaje, broja zaposlenih i dr. Indeksi kvalitativnih pokazatelja - indeksi cijena, troškova, proizvodnosti rada, prosječnih plaća i dr.

Prema stupnju obuhvata populacijskih jedinica indeksi se dijele u dvije klase: pojedinačne i opće. Kako bismo ih okarakterizirali, uvodimo sljedeće konvencije usvojene u praksi korištenja metode indeksa:

q- količina (volumen) bilo kojeg proizvoda u fizičkom smislu ; r- jedinična cijena; z- jedinični trošak proizvodnje; t— vrijeme utrošeno na proizvodnju jedinice proizvoda (intenzitet rada) ; w- proizvodnja vrijednosnih proizvoda po jedinici vremena; v- učinak proizvodnje u fizičkom smislu po jedinici vremena; T— ukupno utrošeno vrijeme ili broj zaposlenih.

Kako bi se razlučilo kojem razdoblju ili predmetu pripadaju indeksirane količine, uobičajeno je da se indeksi stavljaju u donjem desnom kutu odgovarajućeg simbola. Tako se npr. kod indeksa dinamike u pravilu indeks 1 koristi za razdoblja koja se uspoređuju (tekuća, izvještajna) i za razdoblja s kojima se vrši usporedba,

Individualni indeksi služe za karakterizaciju promjena pojedinih elemenata složene pojave (na primjer, promjena obujma proizvodnje jedne vrste proizvoda). Predstavljaju relativne vrijednosti dinamike, ispunjenje obveza, usporedbu indeksiranih vrijednosti.

Određuje se pojedinačni indeks fizičkog obujma proizvoda

S analitičkog gledišta, navedeni pojedinačni indeksi dinamike slični su koeficijentima (stopama) rasta i karakteriziraju promjenu indeksirane vrijednosti u tekućem razdoblju u odnosu na bazno razdoblje, tj. pokazuju koliko je puta porasla (smanjila) ili u kojem postotku je to rast (smanjenje). Vrijednosti indeksa izražavaju se u koeficijentima ili postocima.

Opći (kompozitni) indeks odražava promjene u svim elementima složene pojave.

Zbirni indeks je osnovni oblik indeksa. Naziva se agregat jer su njegov brojnik i nazivnik skup "agregata"

Prosječni indeksi, njihova definicija.

Osim agregatnih indeksa, u statistici se koristi još jedan njihov oblik - ponderirani prosječni indeksi. Njihovom se izračunu pribjegava kada raspoložive informacije ne dopuštaju izračun općeg agregatnog indeksa. Dakle, ako nema podataka o cijenama, ali postoji podatak o troškovima proizvoda u tekućem razdoblju i poznati su pojedinačni indeksi cijena za svaki proizvod, tada se opći indeks cijena ne može odrediti kao zbirni, ali je moguće izračunati ga kao prosjek pojedinačnih. Na isti način, ako nisu poznate količine pojedinih proizvedenih vrsta proizvoda, ali su poznati pojedinačni indeksi i trošak proizvodnje baznog razdoblja, tada se opći indeks fizičkog obujma proizvodnje može odrediti kao ponderirani prosjek vrijednost.

Prosječni indeks - Ovaj indeks izračunat kao prosjek pojedinačnih indeksa. Zbirni indeks osnovni je oblik općeg indeksa, pa prosječni indeks mora biti identičan zbirnom indeksu. Pri izračunavanju prosječnih indeksa koriste se dva oblika prosjeka: aritmetički i harmonijski.

Indeks aritmetičke sredine identičan je agregatnom indeksu ako su ponderi pojedinačnih indeksa članovi nazivnika agregatnog indeksa. Samo u tom slučaju vrijednost indeksa izračunata pomoću formule aritmetičke sredine bit će jednaka zbirnom indeksu.