Procjena intervala pouzdanosti za željenu funkciju. Interval pouzdanosti. Što je to i kako se može koristiti? Vrijednosti za standardne razine pouzdanosti α

Izračun intervala pouzdanosti temelji se na prosječnoj pogrešci odgovarajućeg parametra. Interval pouzdanosti pokazuje unutar kojih se granica s vjerojatnošću (1-a) nalazi prava vrijednost procijenjenog parametra. Ovdje je a razina značajnosti, (1-a) također se naziva vjerojatnost pouzdanosti.

U prvom poglavlju smo pokazali da, na primjer, za aritmetičku sredinu, prava srednja vrijednost populacije u približno 95% slučajeva leži unutar 2 standardne pogreške srednje vrijednosti. Dakle, granice intervala pouzdanosti od 95% za srednju vrijednost bit će odvojene od srednje vrijednosti uzorka dvostrukom srednjom pogreškom srednje vrijednosti, tj. množimo prosječnu pogrešku srednje s određenim koeficijentom ovisno o razini pouzdanosti. Za prosjek i razliku prosjeka uzima se Studentov koeficijent (kritična vrijednost Studentovog testa), za udio i razliku udjela kritična vrijednost z kriterija. Umnožak koeficijenta i prosječne pogreške može se nazvati maksimalnom pogreškom određenog parametra, tj. maksimum koji možemo dobiti pri njegovoj procjeni.

Interval pouzdanosti za aritmetička sredina : .

Ovdje je srednja vrijednost uzorka;

Prosječna pogreška aritmetičke sredine;

s – standardna devijacija uzorka;

n

f = n-1 (koeficijent studenta).

Interval pouzdanosti za razlike aritmetičkih sredina :

Ovdje je razlika između srednjih vrijednosti uzorka;

- prosječna pogreška razlike aritmetičkih sredina;

s 1 , s 2 – standardna odstupanja uzorka;

n1,n2

Kritična vrijednost Studentova testa za zadanu razinu značajnosti a i broj stupnjeva slobode f=n 1 +n 2-2 (koeficijent studenta).

Interval pouzdanosti za dionice :

.

Ovdje je d udio uzorka;

– prosječna pogreška razlomka;

n– veličina uzorka (veličina grupe);

Interval pouzdanosti za razlika udjela :

Ovdje je razlika u uzorcima udjela;

– prosječna pogreška razlike aritmetičkih sredina;

n1,n2– količine uzorka (broj grupa);

Kritična vrijednost z kriterija na zadanoj razini značajnosti a ( , , ).

Izračunavanjem intervala pouzdanosti za razliku između indikatora, mi, prvo, izravno vidimo moguće vrijednosti učinka, a ne samo njegovu točkastu procjenu. Drugo, možemo izvući zaključak o prihvaćanju ili odbijanju nulte hipoteze i, treće, možemo izvući zaključak o snazi ​​testa.

Kada testirate hipoteze pomoću intervala pouzdanosti, morate se pridržavati sljedećeg pravila:

Ako 100(1-a) postotni interval pouzdanosti razlike u sredinama ne sadrži nulu, tada su razlike statistički značajne na razini značajnosti a; naprotiv, ako taj interval sadrži nulu, tada razlike nisu statistički značajne.

Doista, ako taj interval sadrži nulu, to znači da indikator koji se uspoređuje može biti veći ili manji u jednoj od skupina u usporedbi s drugom, tj. uočene razlike posljedica su slučajnosti.

Snaga testa može se procijeniti prema položaju nule unutar intervala pouzdanosti. Ako je nula blizu donje ili gornje granice intervala, tada je moguće da bi s većim brojem skupina koje se uspoređuju razlike dosegle statističku značajnost. Ako je nula blizu sredine intervala, to znači da su i povećanje i smanjenje pokazatelja u eksperimentalnoj skupini jednako vjerojatni i, vjerojatno, stvarno nema razlika.

Primjeri:

Za usporedbu kirurške smrtnosti pri korištenju dvije različite vrste anestezije: 61 osoba je operirana s prvom vrstom anestezije, 8 je umrlo, s drugom vrstom – 67 osoba, 10 je umrlo.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Razlika u letalnosti uspoređivanih metoda bit će u rasponu (-0,018 - 0,122; -0,018 + 0,122) ili (-0,14; 0,104) s vjerojatnošću 100(1-a) = 95%. Interval sadrži nulu, tj. hipoteza o istoj smrtnosti u dvoje različite vrste Anestezija se ne može odbiti.

Tako se stopa smrtnosti može i hoće smanjiti na 14% i povećati na 10,4% s vjerojatnošću od 95%, tj. nula je otprilike u sredini intervala, pa se može tvrditi da se najvjerojatnije ove dvije metode stvarno ne razlikuju u letalnosti.

U ranije razmatranom primjeru uspoređeno je prosječno vrijeme prešanja tijekom testa lupkanjem četiri skupine studenti s različitim rezultatima na ispitima. Izračunajmo intervale pouzdanosti za prosječno vrijeme prešanja za studente koji su ispit položili s ocjenama 2 i 5 te interval pouzdanosti za razliku između tih prosjeka.

Studentovi koeficijenti se nalaze pomoću tablica Studentove distribucije (vidi prilog): za prvu skupinu: = t(0,05;48) = 2,011; za drugu skupinu: = t(0,05;61) = 2.000. Dakle, intervali pouzdanosti za prvu skupinu: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), za drugu skupinu (156,55- 2000*1,88 ; 156,55+2000*1,88) = (152,8 ; 160.3). Tako se za one koji su ispit položili s 2 prosječno vrijeme pritiskanja kreće od 157,8 ms do 166,6 ms s vjerojatnošću od 95%, za one koji su ispit položili s 5 – od 152,8 ms do 160,3 ms s vjerojatnošću od 95%. .

Također možete testirati nultu hipotezu koristeći intervale pouzdanosti za srednje vrijednosti, a ne samo za razliku u srednjim vrijednostima. Na primjer, kao u našem slučaju, ako se intervali pouzdanosti za srednje vrijednosti preklapaju, tada se nulta hipoteza ne može odbaciti. Za odbacivanje hipoteze na odabranoj razini značajnosti, odgovarajući intervali pouzdanosti ne smiju se preklapati.

Nađimo interval pouzdanosti za razliku prosječnog vremena prešanja u skupinama koje su ispit položile s ocjenom 2 i 5. Razlika prosjeka: 162,19 – 156,55 = 5,64. Studentov koeficijent: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Grupne standardne devijacije bit će jednake: ; . Izračunavamo prosječnu pogrešku razlike između sredina: . Interval pouzdanosti: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Dakle, razlika u prosječnom vremenu prešanja u grupama koje su položile ispit s 2 i 5 bit će u rasponu od -0,044 ms do 11,33 ms. Ovaj interval uključuje nulu, tj. Prosječno vrijeme tiska za one koji su dobro položili ispit može se povećati ili smanjiti u odnosu na one koji su ispit položili nezadovoljavajuće, tj. nulta hipoteza se ne može odbaciti. No, nula je vrlo blizu donje granice i vjerojatnije je da će se vrijeme prešanja smanjiti za one koji su dobro prošli. Dakle, možemo zaključiti da još uvijek postoje razlike u prosječnom vremenu prešanja između onih koji su prošli 2 i 5, samo ih nismo mogli otkriti s obzirom na promjenu prosječnog vremena, širenje prosječnog vremena i veličinu uzorka.

Snaga testa je vjerojatnost odbacivanja netočne nulte hipoteze, tj. pronaći razlike tamo gdje one zapravo postoje.

Snaga testa određena je na temelju razine značajnosti, veličine razlika između skupina, širenja vrijednosti u skupinama i veličine uzoraka.

Za Studentov t test i analizu varijance mogu se koristiti dijagrami osjetljivosti.

Snaga kriterija može se koristiti za preliminarno određivanje potrebnog broja grupa.

Interval pouzdanosti pokazuje unutar kojih se granica s danom vjerojatnošću nalazi prava vrijednost procijenjenog parametra.

Pomoću intervala pouzdanosti možete testirati statističke hipoteze i izvući zaključke o osjetljivosti kriterija.

KNJIŽEVNOST.

Glanz S. – Poglavlje 6,7.

Rebrova O.Yu. – str.112-114, str.171-173, str.234-238.

Sidorenko E.V. – str.32-33.

Pitanja za samotestiranje učenika.

1. Koja je snaga kriterija?

2. U kojim slučajevima je potrebno vrednovati snagu kriterija?

3. Metode proračuna snage.

6. Kako testirati statističku hipotezu pomoću intervala pouzdanosti?

7. Što se može reći o snazi ​​kriterija pri izračunavanju intervala pouzdanosti?

Zadaci.

Konstruirajmo interval pouzdanosti u MS EXCEL-u za procjenu srednje vrijednosti distribucije u slučaju poznata vrijednost odstupanja.

Naravno izbor razina povjerenja potpuno ovisi o problemu koji se rješava. Dakle, stupanj povjerenja zračnog putnika u pouzdanost zrakoplova nedvojbeno bi trebao biti veći od stupnja povjerenja kupca u pouzdanost električne žarulje.

Formulacija problema

Pretpostavimo da iz stanovništva nakon što je uzeto uzorak veličina n. Pretpostavlja se da standardna devijacija ova raspodjela je poznata. Na temelju ovoga potrebno je uzorci procijeniti nepoznato srednja vrijednost distribucije(μ, ) i konstruirajte odgovarajuće dvostrano interval pouzdanosti.

Procjena bodova

Kako je poznato iz statistika(označimo to X prosj) je nepristrana procjena srednje vrijednosti ovaj stanovništva i ima distribuciju N(μ;σ 2 /n).

Bilješka: Što učiniti ako trebate graditi interval pouzdanosti u slučaju distribucije koja nije normalan? U ovom slučaju, dolazi do spašavanja, koji navodi da s dovoljno velikom veličinom uzorci n iz distribucije ne biti normalan, uzorak distribucije statistike X prosj htjeti približno dopisivati ​​se normalna distribucija s parametrima N(μ;σ 2 /n).

Tako, bodovna procjena prosjek vrijednosti distribucije imamo - ovo srednja vrijednost uzorka, tj. X prosj. Sada počnimo interval pouzdanosti.

Konstruiranje intervala povjerenja

Obično, znajući distribuciju i njene parametre, možemo izračunati vjerojatnost da će slučajna varijabla uzeti vrijednost iz intervala koji navedemo. Sada učinimo suprotno: pronađimo interval u koji će slučajna varijabla pasti sa zadanom vjerojatnošću. Na primjer, iz svojstava normalna distribucija poznato je da s vjerojatnošću od 95%, slučajna varijabla raspodijeljena preko normalno pravo, bit će unutar raspona od približno +/- 2 od prosječna vrijednost(vidi članak o). Ovaj interval će nam poslužiti kao prototip interval pouzdanosti.

Sada da vidimo znamo li distribuciju , izračunati ovaj interval? Da bismo odgovorili na pitanje, moramo naznačiti oblik distribucije i njezine parametre.

Znamo oblik distribucije - ovo je normalna distribucija(zapamtite o čemu govorimo distribucija uzorkovanja statistika X prosj).

Parametar μ nam je nepoznat (samo ga treba procijeniti pomoću interval pouzdanosti), ali imamo njegovu procjenu X prosjek, izračunato na temelju uzorci, koji se mogu koristiti.

Drugi parametar – standardna devijacija srednje vrijednosti uzorka smatrat ćemo ga poznatim, jednak je σ/√n.

Jer ne znamo μ, tada ćemo izgraditi interval +/- 2 standardne devijacije ne od prosječna vrijednost, a iz njegove poznate procjene X prosj. one. prilikom izračunavanja interval pouzdanosti to NEĆEMO pretpostaviti X prosj spada u raspon +/- 2 standardne devijacije od μ s vjerojatnošću od 95%, a pretpostavit ćemo da je interval +/- 2 standardne devijacije iz X prosj s 95% vjerojatnosti će pokriti μ – prosjek opće populacije, iz kojeg je uzeto uzorak. Ova dva iskaza su ekvivalentna, ali nam drugi iskaz omogućuje konstruiranje interval pouzdanosti.

Nadalje, pojasnimo interval: slučajna varijabla raspodijeljena preko normalno pravo, s vjerojatnošću od 95% spada u interval +/- 1,960 standardne devijacije, ne +/- 2 standardne devijacije. To se može izračunati pomoću formule =NORM.ST.REV((1+0,95)/2), cm. primjer datoteke Sheet Interval.

Sada možemo formulirati vjerojatnosnu tvrdnju koja će nam poslužiti za oblikovanje interval pouzdanosti:
„Vjerojatnost da populacijska srednja vrijednost koji se nalazi od prosjek uzorka unutar 1.960" standardna odstupanja srednje vrijednosti uzorka", jednako 95%".

Vrijednost vjerojatnosti navedena u izjavi ima poseban naziv , koji je povezan sa razina značajnosti α (alfa) jednostavnim izrazom razina povjerenja =1 . U našem slučaju razina značajnosti α =1-0,95=0,05 .

Sada, na temelju ove vjerojatnosne izjave, pišemo izraz za izračunavanje interval pouzdanosti:

gdje je Z α/2 standard normalna distribucija(ova vrijednost slučajna varijabla z, Što P(z>=Z α/2 )=α/2).

Bilješka: Gornji α/2-kvantil definira širinu interval pouzdanosti V standardne devijacije srednja vrijednost uzorka. Gornji α/2-kvantil standard normalna distribucija uvijek veće od 0, što je vrlo zgodno.

U našem slučaju, s α=0,05, gornji α/2-kvantil jednako 1,960. Za ostale razine značajnosti α (10%; 1%) gornji α/2-kvantil Z α/2 može se izračunati pomoću formule =NORM.ST.REV(1-α/2) ili, ako je poznato razina povjerenja, =NORM.ST.OBR((1+razina povjerenja)/2).

Obično pri gradnji intervali pouzdanosti za procjenu srednje vrijednosti koristiti samo gornji α/2-kvantil i ne koristite niži α/2-kvantil. To je moguće jer standard normalna distribucija simetrično u odnosu na os x ( njegovu gustoću distribucije simetrično oko prosjek, tj.). Stoga nema potrebe kalkulirati niži α/2-kvantil(jednostavno se zove α /2-kvantil), jer jednako je gornji α/2-kvantil sa znakom minus.

Podsjetimo se da, unatoč obliku distribucije vrijednosti x, odgovarajuća slučajna varijabla X prosj distribuiran približno Fino N(μ;σ 2 /n) (vidi članak o). Stoga, općenito, gornji izraz za interval pouzdanosti samo je aproksimacija. Ako je vrijednost x raspodijeljena na normalno pravo N(μ;σ 2 /n), zatim izraz za interval pouzdanosti je točan.

Izračun intervala pouzdanosti u MS EXCEL-u

Idemo riješiti problem.
Vrijeme odgovora elektroničke komponente na ulazni signal važna je karakteristika uređaja. Inženjer želi konstruirati interval pouzdanosti za prosječno vrijeme odgovora na razini pouzdanosti od 95%. Iz prethodnog iskustva, inženjer zna da je standardna devijacija vremena odziva 8 ms. Poznato je da je za procjenu vremena odziva inženjer napravio 25 mjerenja, prosječna vrijednost bila je 78 ms.

Otopina: Inženjer želi znati vrijeme odziva elektroničkog uređaja, ali razumije da vrijeme odziva nije fiksna vrijednost, već slučajna varijabla koja ima vlastitu distribuciju. Dakle, najbolje čemu se može nadati je da odredi parametre i oblik ove distribucije.

Nažalost, iz uvjeta problema ne znamo oblik distribucije vremena odziva (ne mora biti normalan). , ova distribucija je također nepoznata. Samo on je poznat standardna devijacijaσ=8. Stoga, dok ne možemo izračunati vjerojatnosti i konstruirati interval pouzdanosti.

Međutim, unatoč tome što nam nije poznata distribucija vrijeme odvojeni odgovor, to znamo prema CPT, distribucija uzorkovanja prosječno vrijeme odziva je otprilike normalan(pretpostavit ćemo da uvjeti CPT provode se, jer veličina uzorci prilično velik (n=25)) .

Štoviše, prosjek ova raspodjela je jednaka prosječna vrijednost distribucija jednog odgovora, tj. μ. A standardna devijacija ove distribucije (σ/√n) može se izračunati pomoću formule =8/ROOT(25) .

Također je poznato da je inženjer primio bodovna procjena parametar μ jednak 78 ms (X prosj.). Dakle, sada možemo izračunati vjerojatnosti, jer znamo oblik distribucije ( normalan) i njegove parametre (X avg i σ/√n).

Inženjer želi znati matematičko očekivanjeμ raspodjele vremena odgovora. Kao što je gore navedeno, ovo μ je jednako matematičko očekivanje distribucije uzorka prosječnog vremena odgovora. Ako koristimo normalna distribucija N(H avg; σ/√n), tada će željeni μ biti u rasponu +/-2*σ/√n s vjerojatnošću od približno 95%.

Razina značajnosti jednako 1-0,95=0,05.

Na kraju, pronađimo lijevu i desnu granicu interval pouzdanosti.
Lijevi rub: =78-NORM.ST.INV(1-0,05/2)*8/ROOT(25) = 74,864
Desni rub: =78+NORM.ST.REV(1-0.05/2)*8/ROOT(25)=81.136

Lijevi rub: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Desni rub: =NORM.REV(1-0,05/2; 78; 8/ROOT(25))

Odgovor: interval pouzdanosti na 95% razina pouzdanosti i σ=8msec jednaki 78+/-3,136 ms.

U primjer datoteke na Sigma listu poznat, stvorio obrazac za obračun i konstrukciju dvostrano interval pouzdanosti za proizvoljno uzorci sa zadanim σ i razina značaja.

Funkcija CONFIDENCE.NORM().

Ako vrijednosti uzorci su u rasponu B20:B79 , A razina značajnosti jednako 0,05; zatim MS EXCEL formula:
=PROSJEK(B20:B79)-POVJERENJE.NORM(0,05;σ; BROJ(B20:B79))
vratit će lijevu granicu interval pouzdanosti.

Ista granica može se izračunati pomoću formule:
=PROSJEK(B20:B79)-NORM.ST.REV(1-0,05/2)*σ/ROOT(BROJ(B20:B79))

Bilješka: Funkcija CONFIDENCE.NORM() pojavila se u MS EXCEL 2010. U ranijim verzijama MS EXCEL-a korištena je funkcija TRUST().

Vjerojatnosti, prepoznati kao dovoljni za pouzdanu prosudbu općih parametara na temelju karakteristika uzorka, nazivaju se povjerljiv .

Obično su vrijednosti od 0,95 odabrane kao vjerojatnosti pouzdanosti; 0,99; 0,999 (obično se izražavaju u postocima - 95%, 99%, 99,9%). Što je veća razina odgovornosti, to više visoka razina razina pouzdanosti: 99% ili 99,9%.

Razina pouzdanosti od 0,95 (95%) smatra se dovoljnom u znanstveno istraživanje u području fizička kultura i sport.

Interval u kojem se uzorkovana aritmetička sredina opće populacije nalazi s danom vjerojatnošću pouzdanosti naziva se interval pouzdanosti .

Razina značajnosti procjene– mali broj α, čija vrijednost sugerira vjerojatnost da je izvan intervala pouzdanosti. U skladu s vjerojatnostima pouzdanosti: α 1 = (1-0,95) = 0,05; α 2 = (1 – 0,99) = 0,01, itd.

Interval pouzdanosti za srednju vrijednost (matematičko očekivanje) a normalna distribucija:

,

gdje je pouzdanost (vjerojatnost pouzdanosti) procjene; - prosjek uzorka; s - korigirana standardna devijacija; n – veličina uzorka; t γ je vrijednost određena iz tablice Studentove distribucije (vidi Dodatak, Tablica 1) za zadane n i γ.

Da biste pronašli granice intervala pouzdanosti srednje vrijednosti populacije, trebate:

1. Izračunaj i s.

2. Trebali biste postaviti razinu pouzdanosti (pouzdanosti) γ procjene na 0,95 (95%) ili razinu značajnosti α na 0,05 (5%)

3. Pomoću t-Studentove tablice distribucije (Dodatak, Tablica 1) pronađite granične vrijednosti t γ.

Budući da je t-distribucija simetrična u odnosu na nulta točka, dovoljno je znati samo pozitivnu vrijednost t. Na primjer, ako je veličina uzorka n=16, tada je broj stupnjeva slobode df) t– distribucije df=16 - 1=15 . Prema tablici 1 primjena t 0,05 = 2,13 .

4. Odredite granice intervala pouzdanosti za α = 0,05 i n = 16:

Granice povjerenja:

Za velike veličine uzorka (n ≥ 30) t – Raspodjela učenika postaje normalna. Stoga, interval pouzdanosti za za n ≥ 30 može se napisati na sljedeći način:

Gdje u- postotni bodovi normalizirane normalne distribucije.

Za standardne vjerojatnosti pouzdanosti (95%, 99%; 99,9%) i razine značajnosti α vrijednosti ( u) dani su u tablici 8.

Tablica 8

Vrijednosti za standardne razine pouzdanosti α

α u
0,05 1,96
0,01 2,58
0,001 3,28

Na temelju podataka iz primjera 1 odredit ćemo granice 95% interval pouzdanosti (α = 0,05) za prosječni rezultat skoka iz mjesta. U našem primjeru, veličina uzorka je n = 65, tada se preporuke za veliku veličinu uzorka mogu koristiti za određivanje granica intervala pouzdanosti.

Pustite nas veliki broj objekti s normalnim rasporedom nekih karakteristika (na primjer, puno skladište iste vrste povrća, čija veličina i težina variraju). Želite znati prosječne karakteristike cijele serije robe, ali nemate ni vremena ni želje mjeriti i vagati svako povrće. Razumijete da to nije potrebno. Ali koliko bi komada trebalo uzeti za provjeru na licu mjesta? Prije nego damo nekoliko formula korisnih za ovu situaciju, podsjetimo se nekih oznaka. Prvo, kad bismo mjerili cijelo skladište povrća (ovaj skup elemenata naziva se opća populacija), tada bismo sa svom dostupnom točnošću znali prosječnu težinu cijele serije.

S vjerojatnošću od 95%

S vjerojatnošću od 99%

.

Općenito, s vjerojatnošću P(t)

Odnos između vrijednosti t i vrijednosti vjerojatnosti P(t), s kojom želimo znati interval pouzdanosti, može se uzeti iz sljedeće tablice:

P(t) 0,683 0,950 0,954 0,990 0,997
t 1,00 1,96 2,00 2,58 3,00

Tako smo utvrdili u kojem se rasponu nalazi prosječna vrijednost za populaciju (sa zadanom vjerojatnošću).

Ne možemo to reći ako nemamo dovoljno velik uzorak stanovništva ima s = S odabir.

Osim toga, u ovom slučaju je problematična blizina uzorka normalnoj distribuciji. U ovom slučaju, oni također koriste S select umjesto s u formuli: ali vrijednost t je za fiksnu vjerojatnost

P(t) će ovisiti o broju elemenata u uzorku n. Što je n veći, to će rezultirajući interval pouzdanosti biti bliži vrijednosti danoj formulom (1). T vrijednosti u ovom slučaju preuzete su iz druge tablice (Studentov t-test), koju prikazujemo u nastavku:

n P n P
0.95 0.99 0.95 0.99
2 12.71 63.66 18 2.11 2.90
3 4.30 9.93 19 2.10 2.88
4 3.18 5.84 20 2.093 2.861
5 2.78 4.60 25 2.064 2.797
6 2.57 4.03 30 2.045 2.756
7 2.45 3.71 35 2.032 2.720
8 2.37 3.50 40 2.022 2.708
9 2.31 3.36 45 2.016 2.692
10 2.26 3.25 50 2.009 2.679
11 2.23 3.17 60 2.001 2.662
12 2.20 3.11 70 1.996 2.649
13 2.18 3.06 80 1.991 2.640
14 2.16 3.01 90 1.987 2.633
15 2.15 2.98 100 1.984 2.627
16 2.13 2.95 120 1.980 2.617
17 2.12 2.92 >120 1.960 2.576

Vrijednosti Studentovog t-testa za vjerojatnost 0,95 i 0,99  Primjer 3. Nasumično je odabrano 30 ljudi među zaposlenicima tvrtke. Prema uzorku, pokazalo se da je prosječna plaća (mjesečno) 10 tisuća rubalja s prosjekom kvadratno odstupanje 3 tisuće rubalja. Odredite prosječnu plaću u poduzeću s vjerojatnošću 0,99.

Otopina:< Х ср.ген < 32516.

Prema uvjetu imamo n = 30, X prosj. =10000, S=3000, P = 0,99. Za pronalaženje intervala pouzdanosti upotrijebit ćemo formulu koja odgovara Studentovom t testu. Iz tablice za n = 30 i P = 0,99 nalazimo t = 2,756, dakle,
one. potreban interval pouzdanosti 27484

Dakle, s vjerojatnošću od 0,99 možemo reći da interval (27484; 32516) u sebi sadrži prosječnu plaću u poduzeću. Nadamo se da ćete se poslužiti ovom metodom, a nije nužno da svaki put sa sobom imate stol. Izračuni se mogu napraviti automatski u Excelu. Dok ste u Excel datoteci, kliknite gumb fx u gornjem izborniku. Zatim među funkcijama odaberite tip “statistički”, te s predloženog popisa u prozoru - STUDAR DISCOVER. Zatim, na upit, postavljanjem pokazivača u polje "vjerojatnost", unesite vrijednost inverzne vjerojatnosti (tj. u našem slučaju, umjesto vjerojatnosti od 0,95, trebate upisati vjerojatnost od 0,05). pouzdanost. Najlakše je to objasniti na primjeru.

Pretpostavimo da trebate proučiti neku slučajnu varijablu, na primjer, brzinu odgovora poslužitelja na zahtjev klijenta. Svaki put kada korisnik upiše adresu određene stranice, poslužitelj odgovara različitim brzinama. Stoga je vrijeme odgovora koje se proučava slučajno. Dakle, interval pouzdanosti nam omogućuje da odredimo granice ovog parametra, a zatim možemo reći da će s 95% vjerojatnosti poslužitelj biti u rasponu koji smo izračunali.

Ili trebate saznati koliko ljudi zna za zaštitni znak tvrtke. Kada se izračuna interval pouzdanosti, moći će se reći npr. da je s vjerojatnošću od 95% udio potrošača koji su toga svjesni u rasponu od 27% do 34%.

Usko povezana s ovim pojmom je vrijednost vjerojatnosti povjerenja. Predstavlja vjerojatnost da je željeni parametar uključen u interval pouzdanosti. Koliko velik će biti naš željeni raspon ovisi o ovoj vrijednosti. Što je veća vrijednost koju uzima, to je uži interval pouzdanosti, i obrnuto. Obično je postavljen na 90%, 95% ili 99%. Vrijednost 95% je najpopularnija.

Na ovaj pokazatelj također utječe disperzija opažanja i njegova se definicija temelji na pretpostavci da se proučavana karakteristika pridržava ove tvrdnje koja je također poznata kao Gaussov zakon. Prema njemu, normalna je distribucija svih vjerojatnosti kontinuirane slučajne varijable koja se može opisati gustoćom vjerojatnosti. Ako je pretpostavka o normalna distribucija pokazalo se pogrešnim, procjena može biti netočna.

Prvo, shvatimo kako izračunati interval pouzdanosti za. Ovdje su moguća dva slučaja. Disperzija (stupanj širenja slučajne varijable) može, ali i ne mora biti poznata. Ako je poznat, tada se naš interval pouzdanosti izračunava pomoću sljedeće formule:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - znak,

t - parametar iz tablice Laplaceove distribucije,

σ je kvadratni korijen varijance.

Ako je varijanca nepoznata, tada se može izračunati ako znamo sve vrijednosti željenog obilježja. Za to se koristi sljedeća formula:

σ2 = h2sr - (hsr)2, gdje je

h2sr - prosječna vrijednost kvadrata proučavane karakteristike,

(hsr)2 je kvadrat ove karakteristike.

Formula po kojoj se izračunava interval pouzdanosti u ovom se slučaju malo mijenja:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - prosjek uzorka,

α - znak,

t je parametar koji se nalazi korištenjem Studentove tablice distribucije t = t(ɣ;n-1),

sqrt(n) - kvadratni korijen ukupne veličine uzorka,

s je kvadratni korijen varijance.

Razmotrite ovaj primjer. Pretpostavimo da je na temelju rezultata 7 mjerenja utvrđeno da je proučavana karakteristika jednaka 30, a varijanca uzorka jednaka 36. Potrebno je pronaći, s vjerojatnošću od 99%, interval pouzdanosti koji sadrži istinite vrijednost mjerenog parametra.

Prvo, odredimo koliko je t jednako: t = t (0,99; 7-1) = 3,71. Koristeći gornju formulu, dobivamo:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Interval pouzdanosti za varijancu izračunava se iu slučaju poznate srednje vrijednosti i kada nema podataka o matematičkom očekivanju, a poznata je samo vrijednost točkaste nepristrane procjene varijance. Ovdje nećemo dati formule za izračun, jer su prilično složene i, po želji, uvijek se mogu naći na Internetu.

Napomenimo samo da je interval pouzdanosti zgodno odrediti pomoću Excela ili mrežnog servisa koji se tako zove.