Sunteți pe pagina 1din 21

INTERVALE DE NCREDERE (1)

Pentru nivel de ncredere 95%: ce scor z1 delimiteaz cele mai mici 2,5% valori i ce scor z2 delimiteaz cele mai mari 2,5% valori, ntr-o distribuie normal? ntotdeauna, z1 = -1,96, z2= +1,96. Distribuia mediei de selecie este N(, 2/n). Deci, pentru 95% din cazuri, x se va afla la distan cel mult 1,96 /n(1/2) de , sau: n 95% din cazuri, se va afla la distan cel mult 1,96 /n(1/2) de x
10-11 Intervale de incredere. Testele Z, T 1

INTERVALE DE NCREDERE (2)


Intervalele de ncredere au fost introduse n 1937 de Jerzy Neyman. Intervalele de ncredere pot fi folosite - cu calcule specifice - pentru estimarea oricrui parametru. Valoarea critic este independent de cazul concret - depinde doar de nivelul de ncredere.
10-11 Intervale de incredere. Testele Z, T 2

DISTRIBUIA MEDIEI DE SONDAJ (1)


Presupunem o populaie de 90000 de elevi din clasele I-IX, cte 10000 din fiecare clas. Variabila aleatoare este clasa fiecrui elev. Distribuie rectangular, media = 5, dispersia 2=6,67, deviaie standard = 2,58. Experiment: 90000 mingi de ping-pong de extras aleator dintr-o cutie: 10000 au scris pe ele 1, 10000, 2 etc. Extragem de trei ori cte dou: (2,9), (4,4), (2,7). Mediile eantioanelor sunt: 5,5; 4; 4,5. Aceste trei numere au o nou distribuie, cu media_eantion = 4,65, dispersia_eantion = 0,39, deviaie_standard_ eantion = 0,62.
10-11 Intervale de incredere. Testele Z, T 3

DISTRIBUIA MEDIEI DE SONDAJ (2)


Reguli:
Media distribuiei mediilor eantioanelor este (aproape) egal cu media populaiei iniiale; mprtierea distribuiei mediilor eantioanelor este mai mic dect mprtierea populaiei iniiale; Forma distribuiei mediilor eantioanelor este aproximativ normal (oricum, unimodal i simetric).

Teorema limit central:


Dac se iau suficient de multe eantioane, mediile mari i cele mici se echilibreaz; ansa de avea dou valori extreme ambele foarte mari sau ambele foarte mici este mic: efectul moderator al numerelor mari (mediile extreme sunt rare). Deci i mprtierea distribuiei mediilor va fi mai mic.
10-11 Intervale de incredere. Testele Z, T 4

DISTRIBUIA MEDIEI DE SONDAJ (3)


Cu eantioane de 1 individ, medii de 1 sau 9 ar fi relativ frecvente (1/9 din total). Cu eantioane de 2 indivizi, mediile de 1 sau 9 sunt mult mai rare. Cu eantioane de 10 indivizi, mediile de 1 sau 9 aproape nu mai apar. Dispersia mediilor pentru eantioane de 2 indivizi s-a apropiat de 3,33 - jumtate din dispersia eantioanelor de 1 individ (6,67). La eantioane de trei indivizi ar fi fost 2,22. Dispersia mediilor eantioanelor de n indivizi este ntotdeauna 1/n din dispersia populaiei iniiale. Pornind de la o distribuie rectangular, mediile eantioanelor au dat o distribuie aproape normal. Distribuia mediilor eantioanelor este normal dac eantioanele au cel puin 30 de indivizi sau dac populaia iniial era normal. Altfel, distribuia mediilor eantioanelor este (doar) unimodal i simetric.
10-11 Intervale de incredere. Testele Z, T 5

TESTE PENTRU MEDII DE POPULAII


1.- CUNOSCUT: TESTUL Z Exemplul II ilustreaz testul Z pentru media unei populaii distribuit normal. Condiiile testului Z:
nu se cunoate media a populaiei; se cunoate deviaia standard a populaiei.

Descrierea testului Z:
ipoteza nul este: = 0 , unde 0 este o valoare dat; statistica testului este media de sondaj standardizat

H0 adevrat Z N(0,1) (unde z e o valoare a lui Z).


10-11 Intervale de incredere. Testele Z, T 6

x n 0 z = / n

TESTUL Z: IPOTEZA ALTERNATIV


a) asimetric la dreapta. Ha: > 0. n acest caz, valoarea P este dat de P{Zz}, z fiind valoarea obinut din eantion (exemplul II). (P=P{Zz}). b) asimetric la stnga. Ha: < 0. c) simetric. Ha: 0. n acest caz, din simetria curbei normale, P=P{|Z| |z|} Toate probabilitile calculate mai sus sunt exacte pentru populaii normale i aproximative pentru altfel de populaii cu att mai exacte cu ct n este mai mare.
10-11 Intervale de incredere. Testele Z, T 7

NECUNOSCUT: TESTUL t
Deosebirea dintre testul t i testul z este c, dispersia fiind necunoscut, ea se estimeaz prin s estimatorul ei nedeplasat. Proceduri t bazate pe un eantion.
s n

se numete eroarea standard estimat a


n

mediei eantionului (cea exact nu se cunoate). Media standardizat a eantionului z = x / are distribuie N(0,1). Statistica t = x are distribuia t.
s/ n
10-11 Intervale de incredere. Testele Z, T

DISTRIBUIA t

(1)

Pentru e.a. de cardinalitate n, selectate dintr-o populaie distribuit dup N(,), statistica unix eantion t = are distribuie t cu n-1 grade s/ n de libertate. Variabila t este repartizat Student (Gosset) cu n grade de libertate dac densitatea sa de probabilitate este dat de: ((n + 1) / 2) f (t) = (1 + t 2 / n ) ( n +1) / 2 n (n / 2) M[t] = 0.
10-11 Intervale de incredere. Testele Z, T 9

DISTRIBUIA t

(2)

Teorem. Dac t este variabil aleatoare Student cu n grade de libertate, atunci irul de variabile t aleatoare t n = n /( n 2 ) , nN, tinde la N(0,1). Teorem. Statistica testului t este o v.a. t(n-1). Fiecare cardinalitate de eantion d o alt distribuie t, cu att mai apropiat de N(0,1) cu ct n (numrul de grade de libertate) este mai mare. i statistica s are n-1 grade de libertate: oricare n-1 deviaii de la medie o determin pe a n-a. t(n) are un plus de variabilitate fa de N(0,1), datorat aproximrii lui .
10-11 Intervale de incredere. Testele Z, T 10

DISTRIBUIA t

(3)

Proprieti ale distribuiei t: Media distribuiei t este 0; Distribuia este simetric fa de medie; Dispersia este mai mare dect 1. Cu ct n crete, cu att dispersia se apropie de 1; Vrful este mai puin nalt dect la N(0,1), iar cozile acoper o arie mai mare; t sunt o familie de distribuii una pentru fiecare n. Cnd n crete, t se apropie de N(0,1). Peste n=29, valorile t se consider a fi cele corespunztoare lui z la respectiv.
10-11 Intervale de incredere. Testele Z, T 11

TESTE t UNI-EANTION
Fa de testul z, singurele modificri sunt:
se nlocuiete /sqrt(n) prin s/sqrt(n): statistica z devine statistica t; valorile critice se iau din tabelele variabilei t.

Exemplu. n secolul trecut, Newcomb a msurat timpul de trecere a luminii pe o anumit distan. Cele 64 de msurtori au dat o medie de 27,750 i o eroare standard estimat s=5,083sqrt(5). Msurtorile moderne au dat o medie 33,02, considerat valoare corect. Exist diferen semnificativ n rezultatele lui Newcomb fa de rezultatul corect?
10-11 Intervale de incredere. Testele Z, T 12

TESTUL t EXEMPLUL I (valoare P)


H0 : = 33,02 ( - media tuturor msurtorilor posibile ale lui Newcomb). Ha : 33,02. x 27 , 75 33 , 02 = 8 , 29 = Statistica t: t = s/ n 5 , 083 / 64 Valoarea P (probabilitatea unor astfel de dovezi dac H0 este adevrat) este egal cu P{|t|8,29} pentru t(63). Tabelul indic: P<<0,001. Concluzie: rezultatele difer semnificativ.
10-11 Intervale de incredere. Testele Z, T 13

TESTUL t EXEMPLUL II

(nivel )

t(df,) indic valoarea t dincolo de care (la dreapta) rmne aria sub curba t cu df grade de libertate. t(df,1-) = 1-t(df,) Exemplu. Nivelul mediu al polurii cu monoxid de carbon este cel mult 4,9. Dac la 25 de citiri ale nivelului s-a obinut o medie de 5,1 i o eroare standard estimat s=10,5 , se poate respinge afirmaia de mai sus? Soluie. H0 : = 4,9 (). Ha : > 4,9. ttabel (24; 0,05) = 1,71. teantion = 0,476 ( H0!)
10-11 Intervale de incredere. Testele Z, T 14

TESTUL t EXEMPLUL II (valoare P)


Cum se estimeaz probabilitatea ca t s ia cel puin valoarea din eantion: P{t24 >0,48}, n ipoteza H0? Rezult P{t24 > 0,48} > 0,25
din tabel, P{t24 > 0,685} = 0,25; descrete.

Exerciiu. Care este valoarea P dac H0 : =55; Ha : 55; df = 15; teantion= -1,84. Soluie. P = P{t15 < -1,84} + P{t15 > 1,84} = 2P{t15 > 1,84} 0,05 < P < 0,10.
10-11 Intervale de incredere. Testele Z, T 15

INTERVAL DE NCREDERE PENTRU MEDIE, CU NECUNOSCUT


Cnd deviaia standard a populaiei se aproximeaz prin deviaia standard s a eantionului, intervalul de ncredere la nivel devine: s s
( x t ( df , / 2 ) n ; x + t ( df , / 2 ) n )

Exemplul I: interval de ncredere 99% . Valoarea critic 0,005 a lui t(63): t* = 2,660. s * x t Intervalul: : (26,06; 29,44). n 33,02 (26,06; 29,44), cu nivel de ncredere 99%.
10-11 Intervale de incredere. Testele Z, T 16

EXEMPLUL III
20 de biei de aceeai vrst arunc greutatea n medie la 6,87m, cu deviaie standard a eantionului de 1,76. S se estimeze la nivel de ncredere 0,95 distana medie la care arunc greutatea bieii de vrsta respectiv. x_medeantion=6,87, s=1,76, n=20; =0,05. Din tabel: t(19; 0,025) = 2,09. Rezult intervalul: (6,05; 7,69).
10-11 Intervale de incredere. Testele Z, T 17

TESTUL t

PENTRU PERECHI

Exemplu. 20 de profesori de francez urmeaz un curs de perfecionare. Se compar scorurile la dou teste cu ntrebri diferite: unul nainte, cellalt dup curs. Diferenele de punctaj au fost: 2; 0; 6; 6; 3; 3; 2; 3; -6; 6; 6; 6; 3; 0; 1; 1; 0; 2; 3 ; 3. A fost cursul util? Soluie. Studiem v.a. care d diferenele. x = 2,5; s = 2,89 H0 : = 0 (curs inutil). x 2,5 Ha : > 0. t= = = 3,87
s/ n 2,89 / 20

10-11

P{t19 = 3,87 / H0} = 0,00052. Se respinge H0.


Intervale de incredere. Testele Z, T

18

INFEREN PENTRU POPULAII NON-NORMALE

Inferenele pentru populaii non-normale, bazate pe eantioane mici se bazeaz pe:


Utilizarea unei distribuii non-normale pentru care exist metode de inferen; Transformarea datelor pentru a deveni simetrice i aproape normale (logaritmare); Proceduri de inferen independente de distribuie: nonparametrice.

Cel mai simplu test non-parametric este testul semnelor. Statistica ipotezelor se modific: se utilizeaz mediana i nu media.
10-11 Intervale de incredere. Testele Z, T 19

TESTUL SEMNELOR
Exemplul. 17 schimbri de scor, dintre care una negativ. Fie p probabilitatea ca un profesor s-i creasc scorul. Mediana este 0 dac are loc H0 : Ha : p > 0,5. H0 : p = 0,5 (exclusiv ansa). 17 profesori nseamn 17 experimente independente, succes nsemnnd cretere a scorului. H0 afirm c X = B(17; 0,5). Valoarea P=P{X16 / H0}=P{X=16}+P{X=17}= 16 1 17 17 0 C16 ( 0 , 5 ) ( 0 , 5 ) + C ( 0 , 5 ) ( 0 , 5 ) = 0,00014 17 17 Cum P este foarte mic, H0 se respinge.
10-11 Intervale de incredere. Testele Z, T 20

TESTUL SEMNELOR PENTRU PERECHI


Se ignor diferenele 0; Se numr perechile rmase (n); Statistica testului este numrul X de perechi cu diferen pozitiv (succese); Valorile P pentru X sunt date de B(n; 0,5), care se calculeaz sau se citesc din tabele; Se compar cu prestabilit i se decide asupra ipotezei H0 .
10-11 Intervale de incredere. Testele Z, T 21