Sunteți pe pagina 1din 12
StuDocu.com C11 - INTERVAL DE INCREDERE Curs 11 Intervale de tncredere Am viiaut cum poate fi estimat un parametru folosind datele furnizate de un esantion. Para metrul din populatie mi este, in general, egal eu statistica caleulati en ajutornl esantiomal Ne punem problema cat este de bund aceasta estimare, adiea vom calcula aga nnmita marji de eroare, Presupunem ci studiem viscozitatea unci anumite substante. Prin studierea unui egan- tion s-a constatat cli media acestei caracteristici este ji 1000. Daca consider un alt esantion este aproape imposibil si obtinem acecasi estimare numeric pentru media vas- cozitatii. Nu putem spune nimic despre relatia dintre cele doua medii. Problema pe care ‘© punem este urmatoarea: valoarea reali a vascozitaitii este cuprinsit intre 900 si 1100 sau intre 990 si 1100? Raspunsul la aceasta intrebare afecteazit deciziile ulterioare legate de acest proces. Marginile unui interval plauzibil pentru valorile mediei constituie un interval cestimat. Acest interval unde biinuim cdi este situata valoarea reali a parametrului populaici stu- diate se numegte interval de ineredere. Intervalul de incredere const din: = un interval, obtinut cu ajutorul datclor furnizate de o selectie, = un nivel de incredere, care reprezint probabilitatea ca intervalul si acopere valoarea, reali a parametrul Nivelul de incredere se precizeazi. De regula se consider 0.90 sau mai mult, Se dit de obicei a, unde nivelul de incredere este 1 — a (0.95 corespunde pragului de semnificatie = 0.05). Definifia 11.0.1 Se numeste interval de ineredere penéru un parametru 6 asocial unei pop- uulatit orice interval I = [a,b] pentru care se poate estima probabilitatea ca @ € I. Dacié a este un numiir cuprins intre 0 gi gi dactt P(6 € I) > 1—a, se spune ci I este un interval de incredere pentru 0 cu un nivel de ineredere 1—a (sau echivalent, cu un nivel de ineredere (1a) 100% sau cu eroare sub 0100%}. in cele ce urmeazéi vom construi intervale de ineredere numai pentru caracteristici care urmeazii 0 distributie normal 11.1 Intervale de incredere pentru medie in cazul o cunoscut Presupunem cé realiziim o selectie populatie a edrei caracteristict studiatt urmeazi o dis- tributie normal, 1V m,@], eu e eunoseut, m necunoscut. Situatia este mai pufin intalnit% in realitate deoarece im mod normal att media cat si dispersia sunt nectmoscute, Totus! ‘vom prezenta in continuare si acest caz, ‘This docmentis avaiaie foo of chargson SEUDOCU.COM Downloaded by Bia Pop (pop bianca. comela@gmailcom) 11.1.1 Constructia intervalului de incredere Fie 21, 22,...,tq valorile variabilelor de selectie X,,X2,...,X,, obtinute dintr-o populatie care urmeazi o distributie normala, N'fm,o), + > 0 cunoscut, m necunoscut. Stim ca Z= Xm € N((0,1]. Din aceasta cauza putem serie, (evident z > 0), P(\A| <2) -ael-a P(me [x Keel) = 26 (—2) 4 O(-2) = 1-a=8(2)-8(-2) 1-4 Notiim en zg valoarea (povitiva) a lui 2 obtinuta din relatia (2) ceterminarea acestei valori se foloseste tabelul pentru funetia lui Laplace (a se vedea Anexa 1) sau programele Matlab sau Mathematica, 5: Pentra De indata ce selectia a fost realizatit si a fost calculati media de selectie obsine intervalul, : quay ‘Suntem tentati s& spunem cé 1 — o este probabilitatea ca acest interval s& cuprinda vale area exact a lui m, dar aceasta afirmatie nu este corecta. Trebuie sé tinem seama de faptul c& intervalul de ineredere este un interval aleator, el depinde de selectia facut, deci extrem- itatile sale sunt v. a. Prin urmare interpretarea corecta a lui 1 — a este urmtoarea: dacd, facern un numar foarte mare de selectii si calculi de fiecare data intervalul de ineredere cu nivelul de incredere 1 — a, atunei (1 — a) 100% din aceste intervale vor contine valoarea exact pentru m. Observain ct intervalul de incredere pentru m este centrat tn estimatia punctuala 7, Cand 1 ereste se obine un interval mai scurt pentru acelagi coeficient de ineredere. Un interval de ineredere mai scurt indied o mai mare ineredere fn 7 ca estimatie a lui m. Reludimn exemplul 7? din eapitolul 6. Exemplul 11.1.1 Punctajele obsinute de studenfi care an promovat examenul de matem- aticdi si care euantified cunostingele lor sunt: {64, 62, 76, 82, 66, 76, 72, 71, 74, 72, 71, 73, 70, 75, 77, 84, 92, 86, 62, 58, 78, 80, 79, 84, 83, 82, 66, 68, 68, 82, 84, 78, 76, 69, 7, 58, 62, 82, 85, 58, 78, 84, 94, 88, 7, 78, 88, 91, 70, 71, 78, 58, 65, 53, 60, 49, 68, 74, 71, 66, 68, 71, 73, 70, 85, 78, 65, 54, 51, 78, 89, 66, 68, 95, 94, 99, 81, 81, 92, 88, 99, 81, 81} Se presupune ei se cunoaste a = 10.99. Si se construias medie eu nivelele de incredere de 90%, 95% si 99%. 18 Rezolvare. Am caleulat 7 = = Calcukim intervalele de incredere cu nivelul de incredere de 90%, 95% si 99% Pentru 90% avem a = 0.1 si ‘A intervalele de f redere pentru &(=2) = 0.05 > — 1.6449 => zg = 1.6449. Atunei, conform (11.1), intervalul (73.0760; 77.0445] Downloaded by Bia Pop (pop.bianca.cometa@gmsilcom) este un interval de ineredere pentru m cu 90% nivel de tneredere. Pentru 95% avern a = 0.05 si @(—z) = 0.025 => 1.9599. Intervalul de ineredere pentru m este = (72.6960; 77.4245) 1 fe 1.9800 Sz + 1.9599 Vi Pentru 99% avem a = 0.01 si &(—z) = 0.005 => 23 = 2.5758, intervalul de incredere pentru m este I= [F 2.5758 = (71.9530; 78.1675 Observaim ea dacé, de exemplu, nivelul de incredere este 0.95, atunci 1.9599 trebuie si lase la dreapta sao ari egal cu $ ~ 0,025, iar la stinga o rie egala.ea 1S = 10.025 = 0.975. Aceastii modalitate de determinare a intervalului de incredere se poate sintetiza in testul Z. Algoritmul testului Z Presuprmem dati o selectie de valori independente (de volum n) dintr-o populatie de medie m nectmoscuti si dispersie o? (o > 0) cunoscuti Pasul 1. Se calculeazit 7. Pasul 2. Se considera statistica Z = X=" wm Pasul 3. Pentru un nivel de tneredere preseris (1 — a) - 100% se determin’ 23 > 0 astfel a inca @(—2g) = 2 2 Pasul 4. Se determina intervalul de incredere pentru m_ Compardm intervalele obtinute in exemplul de mai sus in functie de nivelul de ineredere (1-a)-100%) | 2g at 90% 0.05 [1619 | (73.0760; 77.04, 95% 0.025 [T. [72.6960;77 4205, 99% 0.005 [2.5758 | _ [71.9530; 78.1675 ‘This docmentis avaiaie foo of chargson SEUDOCU.COM Downloaded by Bia Pop (pop.bianca.cometa@gmsilcom) Din tabel se observa ci lungimea intervalului este invers proporfionali cu nivelul de incredere Am putea spune c& 95% dintre studenti au punctajele euprinse in intervalul (72,6960; 77.4245]? Aceasti interpretare nu este corecté deoarece valoarea exact a mediei mu este cunoscutié gi afirmatia m € [72.6960;77.4245] poate fi corect sau nu deoarece intervalul de ineredere construit este aleator, el bazdndu-se pe o selectie aleatoare. Interpretarea corectit este: daci face un numir mare de selectii si de fiecare data sulin intervalul de ineredere pentru medie eu nivelul de incredere de 95%, atunci in 95% ste intervale vor confine valoarea corecté a mediei, Deci metoda folositd ne permite si obtinem intervale pentru medie care vor contine in 95% din cazuri valoatrea corecta, Alegerea nivelului de incredere este arbitraré. Ne punem problema ce se intémpli .c& marim nivelul de incredere, de exemplu, la 99%? Este rezonabil si dorim credere. In acest caz, pentru exemplul considerat, intervalul d& decit in cazul nivelului de 95%. Daca dimensiunea esantionului si abaterea medie pitraticd sunt pAstrate constante, atunei un nivel mai inalt de incredere atrage un interval de ineredere mai mare, incredere va fi nivelul de 71.9530; 78.1675], deci va fi mai mar Lungimea intervaluilui de incredere este o misurd a preciziei estimarii. Din cele prezen- tate rezulta ci precizia este invers proportional cu nivelul de incredere. Este preferabil si obtinem un interval de incredere cit mai scurt pentru o problema pusi, dar eu un nivel de ineredere adecvat. Un mod de a atinge acest scop este alegerea dimensiunii esantionului astfel incat eu ajutorul acestei selectii si putem obtine un interval de incredere de lungime specificata gi cu nivelul de ineredere dat Intervalele de ineredere studiate pani acum sunt bilaterale in sensul ci diideau ca rezultat un interval inchis. Dac exist o informafie relativi la valoarea medie de forma c& aceasta ») si an este limitat: superior, atunci intervalul de tneredere devine de forma ( ~ 2a este un interval de incredere unilateral. 1-0 P(me (2-2 1-(-2)=1-a 6 0 In acest caz P(Z>~—2) Notim eu 2, valoarea obtinuta din relatia ®(—z) = a O situatie similar are loc dac& valoarea medie nu este limitata inferior, intervahul de incredere find ( oo, F + azz): iar valoarea 2, se obtine din relatia (2) Va 11.2 Intervale de incredere pentru medie in cazul o necunoscut Presupunem ci populatia studiata are o distributie normal cu media m si dispersia 0? necunoseute. Facem o selectie de dimensiune n. Fie valorile variabilelor de selectie Xi, X2,...,Xq. Putem calcula media de selectie 1 si dispersia de selectie modificata s? = ay. Vee s lim un interval de ineredere pentru m. Dac dispersia este cunoscutd, gtim cA Z = —™ urmeazi o distributie normal, Daca o este necunoscut 0 proceduré normal 4 Downloaded by Bia Pop (popbianca.comela@omsil.com) X-—m este de a tnlocui ¢ cu s, Statistica devine acum 7 O intrebare logica care se pune este urmatoarea: care este efectul inlocuirii lui @ cu $ asupra distributici statisticii 7? Daca n este suficient de mare, réspunsul la aceasta intrebare este: efectul este "destul de mic" si putem considera c& urmeazii o distributie normala standard. In general n trebuie sii fic cel putin 40. ‘Teorema limita centrala are loc pentru n > 30, dar marirea esantionului recomandati este la cel putin 40, deoarece inlocuirea lui a cu s in Z conduce la modificari suplimentare ale distributici. jin acest eaz intervalul de tneredere se construieste astfcl: Pasul 1, Se caleuleaz Pasul 3. Pentru un nivel de ineredere prescris (1 — a) - 100% se determina ze > 0 astfel ineat &(—zg) = §. Pasul 4. Se determina intervalul de ineredere pentru m, Daca n este mic, cum se intémpla in multe probleme din inginerie, trebuie folosita dis- tributia Student pentru construirea intervalului de ineredere. ‘Testul Student Presupunem ci populatia studiata are o distributie normal cu media m gi abaterea medie pitratict o necunoscute. Facem o selectie de dimensiune n,n mic. Vrem si caleulim un interval de ineredere pentru m. ‘Teorema 11.2.1 Fie X1,Xo,...,Xy independente, care urmeazit 0 distributie normali cu media m $i dispersiao®. Fie x1,r2,....n, reprezintis media de selectie, reprezintit abaterea medic de selectie. Statistica T = urmencit 0 distributie Student cu n—1 grade de libertate. in tabelul din Anexi pentru functia de repartitie a distributiei Student pe prima Tinie sunt date valorile lui a iar pe coloand sunt trecute gradele de libertate, Astfel calculi tain F(towe f(x)de PIT Stay unde f (2) este densitatea de probabilitate a distributi Pentru valorile negative se foloseste faptul ca Student. F (tan) — Fltan)- (11.2) Deoarece distributia Student este simetricé, avem than = —tan, Ceea ce inseamna e& in partea dreapta a lui fa.,, dar si in partea sténga a lui yan, aria este a. Pentru orice a € (0,1) se poate determina pragul tg, > 0 astfel meat P(|Tya] < a fie fiecare 5. 2 tyn-1) — 1—a, Se alege ty,,1 astfel ineat ariile colorate din figura. This documents avaiable fos otcraveon SEUDOCU.COM Downloaded by Bia Pop (pop.bianca.cometa@gmsi.com) (Rm) va inlocuind Ta = reat Pl-tgna S Ram)vi P (m € [ ~t vate Reaulta c& intervalul este un interval de fncredere pentru media m cu coeficientul de incredere 100(1 — )%. Algoritmul testului Student (mai este cunoscut sub denumirea de testul T) Fie 21,.19,...,2y 0 selectie de variabile de selectie X;,Xo,..., Xn iid. dintr-o populatie normal cu media m si dispersia a? necunoscute. Pasul 1. Se caleuleart 7 = 2S ay sis (= YS (ae -7) 4 a X-m 3 Pasul 2. Se considera statistica T — Pasul 3, Pentru un cocfcient de tncredeve preseris (1 — a)-100% se determing din tabetul funcjiei de repartitie Student sau cu ajutorul softurilor numérul tz, > 0 astfel teat P(T| iar ne) = fajana si P be 1 2 fa/2n1) = shines (n-1)? Inlocuind x2_, = in (11.4) gi obtinem: (n= 1)s? P (: ane ODS arnt) ans) Relatia (11.5) poate fi rearanjata astfel: -ye _ye (SE cee GNF) a. (16) Fapint Zeer Am obfinut astéel un interval de incredere pentru dispersie. Algoritmul de determinare a intervalului de incredere pentru dispersie Fie 11, 02,... tq 0 selectie de valori pentru variabilele de selectie Xi,X2,...,Xy, iid. dintr-o populatie normal cu media m si dispersia o? necunoscute. gelding 1 Pasul L Se caleueazai = 79 ay i 8 = (A: ; (n=) Pasul 2. Se alege statistica x2, x? cu n—1 grade de libertate, Pasul 3. Pentru wn nivel de incredere preseris (1 — a) - 100% se determind, din tabelul valorilor functiei de repartitie x? cu n—1 grade de libertate sau cu ajutorul softurilor Matlab sau Mathematica, numerele 2ry4/2-1 $1 ta/2n—1 astfel Ineat despre care se stie cd urmeazéi o distributie Phar Str-arams) =F 8h Pa S tarrnn (n=)? (n=)? Pasul 4. Se determina intervalul + Fapnt | Pia/2 si rezulta intervalnl de meredere pentru 0?, 8 Downloaded by Bia Pop (pop.bianca.cometa@gmsilcom) pentru dispersie cu un anumit nivel de incredere (1—a) 100%. Acestea sunt (- respectiy (CD) Fant Exemplul 11.3.3 Reluaim Exemplul 11.1.1. Dorim sé construim intervale de incredere pentru dispersie, Rezolvare. Avern n = 83, Calcul s = 11.3517. Consideraim statistica x2, = Rs a Pentru nivelul de incredere de 90% aver 0.933 = 62.1323 si x9 05,9 = 104.139. Intervalul de incredere pentrat dispersie este [101.468, 170.068}. Pentru nivelul de incredere de 95% avem 2p 97559 = 58.8446 gi to .025,90 = 108.937. Inter- valul de fncredere pentru dispersic este (96.998, 179.57] Pentru nivelul de incredere de 99% avem 2» 99583 = 52.7674 si to .009,90 = 118.726. Inter- valul de fncredere pentru dispersic este [89.0006, 200.251] Exemplul 11.3.4 Media crorilor de misurare a lungimilor unor baghete metalice este de 3 mm, Presupunem c& aceste crori respect Iegea normal cu media 3 mm si disper necunoseuti, Se face o selectie de volum 6: {-1, 4, 4, 1,3,1}. Se cere un interval de estimatie pentru dispersie cu nivel de meredere de 90%, Rezolvare. Avem n = 6, m= 3. Caleulam Fl 1-38) 4-3) 4-3)? 384 26 +(3- 3)? + (1-3)?) 8.6667 (n=1)s? _ 5s? a oF Pentru nivelul de ineredere de 90% avem ro 95.5 oos = 11.0705, Intervalul de meredere pentru dispersie este [2.84858; 22.698]. Se observa ci intervalul este destul de mare, deci precizia pentru dispersie este micé, chiar daca apare cu probabilitate mare, Considerim statistica x2 1.14548 gi 11.4 Intervale de incredere pentru proportii Pentru o populatie a carci membrii pot fi clasificati in fumefie de o anumitit caracteristics in dowd categorii: fic p probabilitatea de a apartine unei categorii, numit succes si 1 ~ p probabilitatea de a apartine celeilalte categorii, numita egec. Parametrul p poata denumirea_ de proportia populatiei si ipotezele asupra lui p se fac numiirand suecesele, X — > X; ( , n(1—p) > ‘Teorema 11.4.1 Dacii n este astfel inctit np > 5, n(1—p) > 5, atunci X=np B vnw(l =p) V urmeazit aprozimativ 0 distribufie normal standard. Pentru a construi un interval de incredere pentru p, observiim cA sau unde zg > 0 astfel meat &(—zs) Aceasta relatic poate fi rearanjata astfel: r(P- [POP cps Pig ph numeste eroarea standard a estimatorului punctual P. Deoarece Cantitatea marginile intervalului contin p care este necunoscut, solutie satisficitoare este inlocuirea sa cu P. Astfel objinem P (Posey

S-ar putea să vă placă și