Sunteți pe pagina 1din 7

TESTAREA IPOTEZELOR STATISTICE

IPOTEZELE STATISTICE Ipoteza nul notat cu H0 susine c toate msurtorile pe care dorim s le comparm sunt egale iar eventualele diferene se datoreaz exclusiv ntmplrii. Este ipoteza care se testeaz statistic. Ipoteza alternativ notat cu H1= nu se datoreaz doar ntmplrii ci i unor factori manipulai n statistic riscul de eroare se fixeaz de obicei la 5%. Decizia statistic se formuleaz n termenii respingerii ipotezei nule NIVELUL DE SEMNIFICAIE I EROAREA DECIZIEI Decizia de acceptare sau respingere a ipotezei nule depinde de criteriul de raritate a apariiei i de faptul c nivelurile de semnificaie de 0,05 i 0,01 sunt valori comune n aceast privin. Cnd stabilim = 0.05 , ne asumm de fapt riscul ca 5% din rezultate s cad n zona de respingere a ipotezei nule. Nivelul de semnificaie d probabilitatea de respingere a lui H 0 cnd n realitate aceasta este adevrat. Pentru a reduce riscul lurii unei decizii eronate, cercettorul poate stabili la un nivel mai sczut, de pild =0,01 sau 0,0001.

ESTIMAREA STATISTIC
TESTAREA IPOTEZELOR VERSUS ESTIMAREA Inferena statistic este procesul de extrapolare a rezultatelor nregistrate, de la nivelul eantioanelor selectate la nivelul ntregii populaii (din care au fost selectate eantioanele). inferena statistic are n vedere estimarea statistic ESTIMAREA CARACTERISTICII VERSUS ESTIMAREA INTERVALULUI un interval estimat este o plaj de valori n interiorul crora pot fi stabilite cu ncredere rezonabil poziiile parametrilor populaiei. Cu ct intervalul estimat este mai strns cu att i riscul pe care ni-l asumm n a afirma c o caracteristic va lua valori n acest interval este mai mare. ESTIMAREA INTERVALULUI DE NCREDERE I TESTAREA IPOTEZELOR 1. dac media se situeaz n afara limitelor de ncredere ale intervalului pentru valoarea specificat, atunci ipoteza nul se respinge. 2. dac media se situeaz n interiorul intervalului de ncredere pentru valoarea specificat, ipoteza nul se accept.

TESTAREA IPOTEZELOR STATISTICE PENTRU MEDIE CND ABATEREA MEDIE PTRATIC ESTE NECUNOSCUT
ABATEREA STANDARD A POPULATIEI ESTE RAREORI CUNOSCUT n cazul n care este necunoscut, procedurile pentru verificarea ipotezelor statistice se schimb, dar, secvena de etape este similar situaiei cnd este cunoscut, respectiv: precizarea ipotezei nule, a celei alternative i stabilirea nivelului de semnificaie; construirea eantionului i calcularea statisticilor necesare; stabilirea cotei de risc pentru analiza statisticii testului; luarea deciziei referitoare la ipoteza nul. TESTUL STATISTIC t Cnd nu este cunoscut, trebuie utilizat un alt test statistic iar acest test este testul t. Relaia corespunztoare statisticii t este:
t= x 0 sx

ambele formule (pentru z i t) sunt aproape similare n sensul c fiecare reflect diferena dintre media eantionului ( x ) i valoarea mediei populaiei n uniti de eroare standard a mediei ( s x sau x ). Putem constata c t folosete dou statistici ( x i s x ) n timp ce z folosete o singur statistic ( x ). GRADE DE LIBERTATE Gradele de libertate (gdl) indic numrul de informaii independente dintr-un eant S presupunem c avem un eantion constituit din trei observaii 3; 3 i 9. Media eantionului este egal cu 5 iar deviaiile de la medie sunt 2; 2 i 4. Sunt aceste deviaii independente ntre ele? Rspunsul este negativ pentru c suma lor trebuie s fie ntotdeauna egal cu zero. Cu alte cuvinte, n msura n care cunoatem dou dintre abaterile scorurilor (2 i 2), a treia abatere trebuie s fie egal cu +4 pentru ca suma lor s fie nul. Rezult c ultima abatere este ntotdeauna complet determinat de celelalte.

COMPARAREA MEDIILOR A DOU POPULAII N CAZUL EANTIOANELOR INDEPENDENTE


DE LA O MEDIE LA DOU MEDII Dou eantioane spunem c sunt independente dac nici una din observaiile unui grup nu se afl n vreun raport cu observaiile celuilalt grup. IPOTEZELE STATISTICE Folosind exemplul de mai sus, cele dou ipoteze statistice sunt:

H0: 1-2=0 H1: 1-20 Cea de-a doua ipotez poate fi detaliat astfel: H1: 1-2>0 sugereaz un efect pozitiv al nelegerii relaiei dintre itemi. H1: 1-2<0 sugereaz un efect negativ al acumulrii de informaie suplimentar despre itemi. 12.3 REPARTIIA DE SELECIE A DIFERENELOR DINTRE MEDII Ceea ce trebuie reinut este faptul c distribuia de selecie a diferenelor dintre medii este dat de distribuia frecvenelor relative a diferenelor x 1 x 2 . PROPRIETILE REPARTIIEI DE SELECIE A DIFERENELOR DINTRE MEDII Distribuia de selecie a mediilor este definit prin medie, abatere standard i form. Situaia este similar i n cazul distribuiei diferenelor dintre medii. TESTUL t PENTRU DOU EANTIOANE INDEPENDENTE Statistica t pentru dou eantioane independente are aceeai structur general n sensul c se compar rezultatul x 1 x 2 cu condiia specificat de ipoteza nul ( 1 2 ) iar ceea ce rezult se mparte la eroarea standard ( sx1 x2 ). TESTAREA IPOTEZELOR STATISTICE PENTRU MEDIILE A DOU POPULAII INDEPENDENTE Paii necesari testrii ipotezelor statistice sunt urmtorii: Pasul 1: Formularea ipotezelor i stabilirea nivelului de semnificaie . H0: 1-2=0 H1: 1-20 Pentru pragurile de semnificaie se iau n considerare de regul valorile =0,05 i =0,01. Pasul 2:Stabilirea mrimii eantionului i selectarea acestuia. Pasul 3:Calculul statisticilor necesare. Pasul 4:Identificarea regiunilor de respingere. Pasul 5:Formularea deciziei statistice i a concluziei. MRIMEA EFECTULUI La calculul mrimii efectului se recurge pentru a aprecia statistic diferena dintre dou medii. Mrimea efectului poate fi evaluat prin exprimarea sa ca msur a abaterii standard combinate. Relaia de calcul a mrimii efectului este: DISTRIBUTII NORMALE SI SCORURI STANDARD

Pentru a surprinde ceea ce este essential intr-un volum mare de informatie statistica, apparent fara semnificatie, este necesara comprimarea seriilor statistice simple in serii cu distributii de frecvente. Distributiile de frecvente sunt extrem de variate. O forma particulara este distributia normala si exista un numar mare de variabile care au tendinta sa urmeze caracteristicile sale (ex: abilitatea mentala a copiilor, greutatea indivizilor, inaltimea indivizilor etc) Galton a sesizat ca distributia normala constituie un bun si rezonabil descriptor Distributia normala ofera o descriere rezonabila si convenabila a unui numar mare de variabile. Curba normala poate descrie distributia multor statistici ale esantioanelor. PRORIETATILE CURBEI NORMALE Distributia normala reprezinta un model mathematic, un cpncept idealizat al formei distributiei. Curbele normale pot diferi intre ele, responsabile de aceste diferentieri sunt mediile si abaterile standard ale distributiilor. Proprietatile curbei normale: sunt simetrice, Unimodale Media, mediana si modulul au aceleasi valori Curba are forma de clopot Curbele normale nu intersecteaza niciodata abcisa Aceste propritati arata de ce o distributie empirica nu poate fi niciodata perfect normala SCORURI Z Solutia oferita de statistica este aceea de a transforma scorurile originale in scoruri standard- scoruri z. Un scor standard exprima pozitia unui scor in raport de media distributiei, utilizand deviatia standard ca unitate de masura. Scorul z stabileste numarul deviatiilor standard prin care scorul original se plaseaza deasupra sau sub media distributiei. Scorurile z se calculeaza dupa relatia: COMPARAREA SCORURILOR DIFERITELOR DISTRIBUTII Convertirea scorurilor originale in scoruri z conduce la distributia normala centrata si redusa, de medie 0 si ab standard =1 => convertirea in scoruri z conduce la o unica distributie statistica si permite compararea scoruruilor diferitelor distributii. ALTE SCORURI STANDARD Utilizarea scorurilor z poate constitui un inconvenient din cel putin 2 motive: 1. se lucreaza cu ambele valori positive si negative 2. scorurile z nu sunt familiare mai ales cand se incearca comunicarea rezultatelor unui public nefamiliarizat cu proprietatile acestor scoruri Scorurile t constituie o alternative pentru aceste incoveniente. Ca si scorurile z, scorurile t sunt standardizate l ao medie si abatere standard fixate. Cand convertim toate scorurile in scoruri t, media lor este 50 iar abatarea standard este 10. Scorurile t se calculeaza: t=50+10z

PROBABILITI I DISTRIBUII DE PROBABILITATE


EFECTUL NTMPLRII N DENATURAREA REZULTATELOR OBINUTE -Factorii ans inereni n formarea eantioanelor afecteaz ntotdeauna rezultatele eantioanelor. -problema eantionrii urmrete s surprind ce caracteristici rmn dac variaia datorat factorilor ntmpltori a fost eliminat. -Cnd eantioanele sunt formate ntr-o modalitate care permite ntmplrii s opereze integral, tehnicile de inferen statistic pot sesiza acest lucru. ntmplarea este de obicei tratat n termeni de probabilitate iar teoria care se ocup de studiul ntmplrii i a efectelor ei poart numele de teoria probabilitii. PROBABILITATE. STUDIUL NTMPLRII -toate deciziile implic estimri ale probabilitii producerii evenimentelor. -evalurile probabilitilor sunt subiective i conin ceva mai mult dect o impresie general asupra felului n care ceva probabil se produce. -Construirea unei baze tiinifice a inferenei statistice cere (impune) tratarea probabilitilor ntr-o manier precis i obiectiv.
DISTRIBUII DE PROBABILITATE

-Distribuia frecvenelor relative poate fi considerat ca distribuie de probabilitate. -Fiecare distribuie arat toate realizrile posibile i evenimentele la care sunt asociate realizrile. -Atta timp ct se cunoate distribuia de probabilitate sau o distribuie de probabilitate apropiat este uor de rspuns la orice ntrebare legat de probabilitate. -Probabilitatea de apariie a unui eveniment sau a altuia se obine prin adunarea probabilitilor individuale. CURBA NORMALA CA DISTRIBUTIE DE PROBABILITATE -Curba normal poate fi privit ca o distribuie teoretic de probabilitate. Aa cum am vzut, curba normal este un model matematic care specific relaia dintre suprafa i unitile de deviaie standard. -Frecvenele relative ale curbei normale sunt valori teoretice obinute prin aplicarea legilor probabilitii.

DISTRIBUIILE DE SELECIE
EANTIOANE I POPULAII -Numim populaie mulimea indivizilor care au n comun cel puin o caracteristic. Un eantion este o submulime a populaiei. -O populaie simpl se refer la orice grup despre care dorim s facem inferene, nu conteaz ct de mare sau ct de mic este.

PARAMETRII I STATISTICI -O statistic sintetizeaz o caracteristic a unui eantion. Un parametru sintetizeaz o caracteristic a unei populaii. -Statisticile i parametri se noteaz folosind diverse simboluri. De exemplu, x simbolizeaz statistica media eantionului , parametrul corespondent, media populaiei se reprezint prin simbolul grecesc , s reprezint abaterea standard a eantionului, abaterea standard a populaiei, r valoarea coeficientului de corelaie n eantion iar valoarea coeficientului de corelaie n populaie. Relaia dintre aceste simboluri este cea redat mai jos:

MODELUL SELECIEI ALEATOARE -Modelul seleciei aleatoare este folosit pentru a evalua influena factorilor ntmplrii atunci cnd rezultatele eantioanelor sunt supuse interpretrii -Trebuie s ne asigurm c eantionul a fost selectat aleator dintr-o anumit populaie de interes. Eantionul este studiat n detaliu, -Un eantion aleator este un eantion obinut dintr-o populaie n aa fel nct fiecare eantion posibil de mrimea specificat s aib aceeai ans de a fi extras. 8.3.1 REPARTIIA (DISTRIBUIA) DE SELECIE A MEDIILOR -Putem obine repartiia de selecie a mediilor dac pentru mediile eantioanelor se calculeaz frecvenele relative corespunztoare. O repartiie de selecie a mediilor este o distribuie de probabilitate. -repartiia de selecie a mediilor urmeaz o distribuie normal, cu mediile distribuite n jurul mediei populaiei CARACTERISTICILE REPARTIIEI DE SELECIE A MEDIILOR Orice repartiie de selecie a mediilor este complet definit prin caracteristicile sale: media, abaterea standard i forma. MEDIA REPARTIIEI DE SELECIE A MEDIILOR Simbolizat prin x , media repartiiei de selecie a mediilor este egal cu media populaiei scorurilor, adic x = . ABATEREA STANDARD A REPARTIIEI DE SELECIE A MEDIILOR Abaterea standard a mediei ntr-o repartiie de selecie este cunoscut sub numele de eroarea standard a mediei i reflect mrimea variaiei dintre mediile eantioanelor.

FORMA REPARTIIEI DE SELECIE A MEDIILOR Dac populaia observaiilor este distribuit normal, repartiia de selecie a mediilor va fi de asemenea distribuit normal TEOREMA LIMIT CENTRAL Repartiia de selecie a mediilor tinde ctre forma normal dac mrimea eantioanelor crete, indiferent de forma distribuiei populaiei de la care eantioanele au fost selectate aleator. IMPORTANA MRIMII EANTIONULUI -intervalul n interiorul cruia se gsesc 95% din mediile eantioanelor posibile va fi cu att mai mare cu ct volumul eantionului este mai mic. => interval de ncredere pentru media populaiei. - creterea volumului eantionului conduce la creterea acurateei n estimarea parametrilor populaiei.

S-ar putea să vă placă și