Sunteți pe pagina 1din 11

TESTE NEPARAMETRICE PENTRU DATE NOMINALE Distribuia binomial Teste z pentru proporii Lect. univ. dr. Gh.

Perea Noiuni introductive S ne imaginm c un psihoterapeut dorete s verifice eficiena unei metode de terapie anxiolitic, aplicat pe un numr de opt subieci. El poate msura eficiena ntr-unul din urmtoarele moduri: a. Aplic o scal de evaluare a anxietii nainte i dup tratament, dup care testeaz diferena dintre cele dou medii testul t pentru eantioane dependente. b. i ntreab la sfritul terapiei care este starea lor, comparativ cu perioada anterioar terapiei. Dac rspunsurile posibile sunt ameliorat i fr efect, i constat c 80% dintre subieci se declar ameliorai, poate concluziona c tratamentul psihoterapeutic a fost eficient? Rigoarea tiinific permite un rspuns pozitiv numai dac procentul de 80% este mai mare dect unul care ar fi putut rezulta din jocul hazardului. Procedura care se aplic de regul n situaia a, este una de tip parametric, deoarece se bazeaz pe estimarea unor indicatori (parametri) ai distribuiei la nivelul populaiei. n mod obinuit, parametri utilizai sunt media i unul dintre indicatorii mprtierii (abaterea standard sau dispersia). Testele parametrice se bazeaz pe precizia de estimare a acestora, situaie care presupune unele condiii, cum ar, de exemplu, normalitatea distribuiei sau omogenitatea varianei. Dar aceste condiii pot s nu fie ndeplinite, Dac avem o variabil dependent a crei distribuie este puternic asimetric, sau care are valori extreme, legitime, atunci utilizarea unui test parametric nu este recomandat. ntr-o situaie de acest gen, soluia este transformarea variabilei, avnd la dispoziie dou opiuni: pstrarea caracterului ei numeric (de exemplu, prin extragerea radicalului sau prin logaritmarea valorilor variabilei), situaie n care se va putea utiliza un test parametric, sau... transformarea ntr-o variabil de tip ordinal (nlocuirea valorilor cu rangul lor) sau categorial (mprirea valorilor n categorii, dup procedura prezentat la analiza de frecvene grupate), situaie n care se va apela la un test neparametric. Procedura care se aplic n situaia b este specific testelor de tip neparametric, deoarece se bazeaz pe probabiliti i nu pe indicatori parametrici ai distribuiilor (medie, dispersie sau abatere standard). O alt situaie problematic este aceea n care volumul eantionului este foarte mic, nelegnd prin aceasta un numr de subieci mult sub 30. n astfel de cazuri, chiar dac variabilele sunt exprimate pe scale cantitative, utilizarea testelor parametrice poate fi nesigur i nerecomandat1. Din cele spuse pn acum, reinem faptul c testele neparametrice reprezint, pe de o parte, alternative la testele parametrice, atunci cnd variabilele nu ntrunesc condiiile impuse Afirmaia intr n contradicie cu faptul c am utilizat, pentru toate testele parametrice prezentate pn acum, exemple bazate pe eantioane foarte mici. Se nelege, desigur, c acest lucru a fost dictat de raiuni didactice, pentru evitarea efecturii unor calcule manuale laborioase.
1

n practic, pentru eantioane foarte mici se ia n considerare, de regul, utilizarea unor teste neparametrice. acestora i, pe de alt parte, reprezint singura opiune atunci cnd variabila dependent este exprimat pe scal calitative (ordinale sau nominale). Aa cum am vzut, principiul care st la baza testelor parametrice este gsirea unui model teoretic (distribuia de nul), la care rezultatul cercetrii s poat fi raportat. Distribuia de nul reprezint variaia unor valori de acelai tip cu rezultatul cercetrii, dac acestea ar decurge dintr-un proces pur aleator, lipsit de influena condiiilor n care sunt msurate (obinute) datele cercetrii. n cazul testelor parametrice distribuia de nul este construit pe baza parametrilor populaiei i urmeaz o anumit lege de distribuie (normal, t, F). Odat definit distribuia de nul, urmeaz alegerea convenional a unei valori critice, delimitat de pragul alfa (maxim 0.05), cu care se compar valoarea calculat a testului, i decizia asupra semnificaiei acestuia. Acelai raionament este valabil i pentru testele neparametrice. Diferena apare doar n modul n care se fundamenteaz distribuia de nul. Aceasta se construiete pe baza legilor probabilitii aplicate la evenimentele aleatoare, fr a se mai asuma condiia distribuiei normal a variabilei dependente. Ca urmare, decizia statistic nu se mai bazeaz pe inferena asupra parametrilor distribuiei variabilei dependente. Din acest motiv, testele neparametrice sunt independente de caracteristicile distribuiei. Testele neparametrice prezint, n raport cu cele parametrice, o serie de avantaje, dar i dezavantaje. Principalele avantaje sunt:

Se pot utiliza pe scale ale cror caliti de msurare sunt slabe (ordinale, nominale). Pot fi utilizate n cazul variabilelor afectate de valori extreme care nu pot fi eliminate. Utilizarea lor nu presupune condiii la fel de restrictive ca testele parametrice (normalitatea distribuiei, omogenitatea varianei, etc.). Pentru anumite proceduri, calculele sunt relativ simple i uor de efectuat, chiar i fr utilizarea tehnicii de calcul. Conceptele i metodele statisticii neparametrice sunt uor de neles.

Printre dezavantajele testelor neparametrice, sunt de menionat:

Se bazeaz pe msurri pe scale nominale i ordinale, care sunt, prin natura lor, msurri mai puin precise dect cele pe scale cantitative (de interval sau de raport). Au o putere mai redus dect testele parametrice de a proba c ipoteza cercetrii este adevrat. Tind sa fie utilizate, datorit relativei lor simpliti, i n situaii n care se pot utiliza teste parametrice. Este important s reinem faptul c, atunci cnd sunt ntrunite condiiile pentru aplicarea unui test parametric, nu este recomandabil transformarea variabilei i utilizarea unui test neparametric. Dei se bazeaz pe calcule elementare, adesea acestea pot fi destul de complexe i de laborioase. Principiul care st la baza evalurii mrimii efectului pentru testele parametrice (proporia explicat a varianei) nu este uor de aplicat n cazul testelor neparametrice. Ca urmare, pentru multe dintre testele neparametrice nu se poate calcula un indicie de mrime a efectului.

Ca o concluzie general, utilizarea testelor neparametrice nu poate fi evitat dac variabila dependent este una de tip nominal sau ordinal. Dac, ns, este msurat pe o scal de interval/raport, se pune problema de a alege ntre un test parametric i unul neparametric. n acest caz, criteriul principal de decizie este normalitatea distribuiei la nivelul populaiei. n principiu, teorema limitei centrale ofer suportul teoretic al asumrii

acestei condiii pentru eantioane suficient de mari. Din pcate, nu avem nici un criteriu sigur de verificare a acestei condiii. Din acest motiv exist o anumit disput n legtur cu justificarea utilizrii testelor parametrice n anumite cazuri. Dac eantioanele care se apropie sau depesc 100 de valori (subieci) permit asumarea cu ncredere a condiiei de normalitate, eantioanele de mrimi medii (20-40 de subieci) sunt considerate mai puin sigure. Simulrile pe calculator au artat c exist teste parametrice mai puin vulnerabile la violarea condiiei de normalitate (testele t, de exemplu), dar i altele care devin nesigure n aceast situaie (de ex., testul F pentru omogenitatea varianei). Fr a ncerca tranarea disputei, putem reine c, mai ales pentru eantioanele mici, atunci cnd avem motive s ne ndoim de normalitatea distribuiei la nivelul populaiei, vor fi preferate testele neparametrice. Distribuia binomial Atunci cnd msurm o caracteristic pe o scal de tip cantitativ, obinem o valoare care descrie mrimea acelei caracteristici. Uneori, ns, nu facem dect s observm msura n care acea caracteristic este prezent ntr-un anumit context. De exemplu, observm caracteristica de gen (masculin, feminin) a copiilor la natere, prezenaabsena efectului unei metode psihoterapeutice sau caracterul corect greit al rspunsului la o serie de ntrebri. n acest toate aceste cazuri naterea unui biat (sau unei fete), prezena efectului, rspunsul corect sunt denumite evenimente despre care putem doar s consemnm frecvena cu care apar ntr-o anumit serie de ncercri (nateri, subieci tratai cu metoda respectiv, list de ntrebri). Distribuia evenimentelor de tip dihotomic, fiecare avnd o anumit probabilitate de apariie, constant de la o ncercare la alta, se numete distribuie binomial2. Caracteristicile distribuiei binomiale difer n funcie de numrul ncercrilor (N) i de probabilitatea de apariie a evenimentului (P), vzut ca ans teoretic de apariie a evenimentului, n raport cu toate evenimentele posibile. De exemplu, la aruncarea unei monede, o singur dat (N=1), ansa (probabilitatea) teoretic de apariie a stemei este P=1/2=0.5. Aceeai probabilitate caracterizeaz i evenimentul rspuns corect, dac rspundem la ntmplare la o ntrebare cu dou variante de rspuns, dintre care una este corect iar alta greit. S transpunem aceast problem ntr-o situaie cu relevan practic. S ne imaginm c am construit un chestionar de cunotine de statistic, compus din ntrebri cu dou variante de rspuns, una corect i una eronat. n faa rezultatelor, este firesc s ne ntrebm dac studenii au rspuns utilizndu-i cunotinele, sau la ntmplare, ncercndu-i norocul. Dac la un chestionar cu patru ntrebri un student d patru rspunsuri corecte, sunt ele un indiciu suficient c rezultatul reflect cunotinele de statistic i nu norocul de a fi ghicit de fiecare dat rspunsul corect? Pentru a ncerca s rezolvm aceasta dilem, s zicem c ne adresm unui alt student pentru a rspunde absolut la ntmplare. Ca s fim siguri c rspunsurile acestuia nu sunt alterate de cunotinele sale de statistic, i cerem s aleag rspunsul fr a vedea ntrebrile, dnd de patru ori cu banul, pentru a indica rspunsul la fiecare ntrebare. n acest caz, rspunsurile corecte decurg numai prin jocul hazardului, adic sunt evenimente aleatoare. Acestea se definesc ca raport ntre evenimentul ateptat i numrul evenimentelor posibile. Existnd doar dou variante de rspuns, probabilitatea teoretic de a rspunde corect la o ntrebare este de 0.5. Probabilitatea de a rspunde corect la toate cele patru ntrebri se calculeaz ca produs al probabilitii fiecrui element al secvenei de patru ntrebri (regula multiplicrii probabilitii evenimentelor dihotomice): 0.5*0.5*0.5*0.5*=0.0625

Sau distribuie Bernoulli , dup numele matematicianului elveian Jakob Bernoulli 1654-1705).

Constatm astfel c, rspunznd absolut la ntmplare, probabilitatea de ghici toate rspunsurile corecte este de 0.0625. Nu este o probabilitate foarte mare, dar este, totui, mai mare dect nivelul alfa minim de 0.05, cu care ne-am obinuit deja. Ca urmare, suntem nevoii s acceptm c cele patru rspunsuri corecte sunt mai degrab un rezultat al unor alegeri ntmpltoare dect al cunotinelor de statistic. Concluzia ar fi c, dac dorim s pstrm tipul de ntrebri cu dou variante de rspuns, atunci va trebui cel puin s mrim numrul ntrebrilor. Astfel, s zicem, vom ajunge n situaia de a ne pune problema dac putem avea ncredere ntr-un rezultat de 8 rspunsuri corecte din 10 ntrebri. Dar pe msur ce numrul alegerilor binare (cu dou variante posibile de rspuns) crete, calcularea probabilitii rspunsurilor ntmpltoare se complic. Din acest motiv devine necesar o anumit formalizare a situaiei. Distribuia probabilitilor pentru evenimente dihotomice aleatoare alctuiete distribuia binomial. Ea prezint interes ca distribuie de nul pentru cazuri ca cele din exemplul de mai sus. Avnd un eveniment cu doar dou variante, fiecare cu ans egal, (de ex., masculin/feminin, corect/greit), vom nota cu P probabilitatea uneia dintre variante i cu Q probabilitatea variantei complementare. ntotdeauna P+Q=1, ceea ce face posibil s-l descriem Q sub forma Q=1-P. O distribuie binomial se obine pe baza unei secvene de predicii de tip dihotomic, independente ntre ele, pentru care valoarea lui P i Q nu se modific de la o predicie la alta. O astfel de selecie este i cea fcut de studentul care a indicat rspunsurile corecte, dnd cu banul la cele patru ntrebri de statistic. Numrul total de predicii (n exemplul nostru, 4) este simbolizat cu N. Dat fiind relaia dintre P i Q, este suficient s analizm predicia pentru unul dintre cele dou evenimente posibile, s zicem pentru rspunsurile corecte, deoarece probabilitile pentru evenimentul complementar (rspunsuri greite) sunt absolut simetrice. Distribuia binomial depinde, n acelai timp, de valoare lui P i a lui N. S analizm variaia prediciilor pentru cele patru ntrebri de statistic. Toate combinaiile posibile ntre rspunsurile corecte (C) i eronate (E) se pot afla prin listarea combinaiilor i permutrile posibile (2*2*2*2=16) pentru cele patru ntrebri: CCCC CCCE CCEC CCEE CECC CECE CEEC CEEE ECCC ECCE ECEC ECEE EECC EECE EEEC EEEE

Dac analizm toate cele 16 combinaii posibile, vom observa c avem urmtoarea distribuie probabil pentru rspunsurile corecte: Nr. rsp. corecte 0 1 2 3 4 Frecvena 1 4 6 4 1 P(C)* 1/16=0.0625 4/16=0.25 6/16=0.375 4/16=0.25 1/16=0.0625 P(C) =Probabilitatea de apariie a rspunsului corect Transpuse grafic, probabilitile corespunztoare pentru frecvenele de rspuns corect se prezint ca n imaginea urmtoare:

Cu alte cuvinte, n cazul alegerii ntmpltoare a unui rspuns din dou posibile, pentru patru ntrebri, probabilitatea niciunui rspuns corect este egal cu aceea pentru patru rspunsuri corecte (0.0625). Cea mai mare probabilitate o are situaia de a rezulta dou rspunsuri corecte (0.375), n timp ce probabilitatea de a ghici 1 sau trei rspunsuri corecte este de 0.25. Nu putem s nu observm, de asemenea, forma simetric a distribuiei3. n conformitate cu teorema Moivre-Laplace, distribuia binomial a apariiei evenimentelor echiprobabile (P=Q=0.5) ntr-o serie de n de observaii independente, urmeaz forma distribuiei normale. Sau, mai exact, dup standardizarea probabilitilor acestea corespund valorilor de sub curba normal. Dar ce s-ar ntmpla dac, n loc de 4 ntrebri, chestionarul nostru de statistic ar avea 12 ntrebri? Distribuia binomial pentru N=12 este cea din graficul de mai jos:

Se observ creterea corespunztoare a numrului variantelor posibile i, n acelai timp, devine mai evident tendina distribuiei de a semna cu una normal. n mod firesc, aceast tendin se accentueaz pe msur ce numrul secvenelor de predicie crete. Dar sunt i situaii n care P i Q nu sunt egale. De exemplu, dac variantele de rspuns la fiecare ntrebare a chestionarului de statistic sunt n numr de patru, dintre care numai una este corect, atunci probabilitatea rspunsului corect (P) este =0.25. n acest caz distribuia binomial nu este simetric la valori mici ale lui N, dar tinde s devin simetric pe msur ce N crete. Nu exist un rspuns exact cu privire la valoarea lui N pentru care distribuia binomial este aproximat suficient de bine de cea normal. n general, se accept faptul c pentru P=0.5 N nu trebuie s fie mai mare de 20-25, n timp ce pentru P apropiat de 0 sau 1 se impune o valoare pentru N de cel puin 100. Din cele spuse rezult c se poate lua n considerare aproximarea distribuiei binomiale cu o distribuie normal. Aceasta nseamn c putem exprima valorile z n termeni de N, P i Q. Formula original pentru z ne amintim c este:

din care, prin substituire, se construiete formula pentru z binomial:

Distribuia binomial a fost descris de Abraham De Moivre n lucrarea Approximatio ad Summam Terminorum Binomii in Seriem Expansi, publicat n 1733. Acelai autor a publicat i un manual pentru juctorii de noroc, n care descrie principiile aritmetice pentru strategiile i probabilitile de ctig. Aceast formul poate fi utilizat pentru a afla ct ncredere putem avea n cazul n care am obine 8 rspunsuri corecte la un chestionar cu 10 ntrebri dihotomice:

Nivelul probabilitii de sub curba normal z, pentru valori ale lui z egale sau mai mari de 1.897 este 0.0294. Aceasta nseamn c putem respinge ipoteza de nul i s admitem c studentul nu a rspuns la ntmplare. Vom observa ns, c putem accepta aceast concluzie numai dac, anterior calculelor, am ales o decizie de tip unilateral, deoarece pentru o decizie bilateral ar fi fost necesar un nivel minim p=0.025. Oricum, constatarea cea mai important n acest caz este aceea c utilizarea ntrebrilor cu rspuns dihotomic nu este recomandabil, din cauza ansei prea mari de se obine un numr relativ ridicat de rspunsuri corecte prin alegeri ntmpltoare. S schimbm puin datele problemei i s punem la fiecare ntrebare nu dou, ci patru variante de rspuns, dintre care numai una este corect. n acest caz, P=1/4=0.25 iar Q=3/4=0.75. Considernd un chestionar format tot din 10 ntrebri, cu 8 rspunsuri corecte, i utiliznd formula 4.1, valoarea testului de semnificaie este:

n aceste condiii este evident c ipoteza de nul se respinge, iar ipoteza c rspunsurile se bazeaz mai mult pe cunotine dect pe hazard se accept. Fr s relum calculele, putem s ne dm seama c am obine o valoare semnificativ chiar i pentru un numr mai mic de rspunsuri corecte. Desigur, acesta este un exemplu didactic, n practic nefiind utilizate chestionare de cunotine cu un numr att de mic de ntrebri.

TESTE Z PENTRU PROPORII Testul z pentru proporia unui eantion n raport cu populaia Odat ce am gsit o modalitate de elaborare a distribuiei de nul pentru evenimente de tip binomial, se pot elabora diverse teste de inferen statistic. Unul dintre acestea este testul z pentru proporii, care este echivalentul pentru date nominale al testului z parametric pentru un singur eantion. S ne imaginm situaia n care descoperim c, pe un eantion aleator de 100 de subieci dintr-o anumit comunitate, procentul stngacilor este de 20%, n timp ce studiile la nivelul populaiei generale indic un procent de stngaci de numai 15% . n acest caz ne putem pune ntrebarea dac la nivelul acelei comuniti exist o anomalie a lateralitii. Pentru a putea utiliza formula 4.1 pentru testarea direct a proporiilor, o supunem unei transformri convenabile, prin mprirea simultan a numrtorului i numitorului cu N. Ca urmare, obinem urmtoare formul:

unde: p (mic) este probabilitatea msurat a evenimentului cercetat, P (mare) este probabilitatea aceluiai eveniment la nivelul populaiei, Q este probabilitatea complementar a lui P, N este volumul eantionului. Pentru cazul nostru, valoarea testului z pentru proporii se obine astfel:

Nivelul lui p pentru z=1.42 pe curba normal este de 0.0778, valoare care oblig la acceptarea ipotezei de nul. Cu alte cuvinte, proporia stngacilor n comunitatea cercetat nu depete semnificativ proporia la nivelul populaiei generale. Testul z pentru proporii implic testarea semnificaiei unui procent observat n raport procentul populaiei (atunci cnd este cunoscut), pentru evenimente de tip dihotomic. De exemplu, se poate rspunde la ntrebarea dac un procent 55% de nou nscui biei este neobinuit de mare, tiind care este procentul general al noilor nscui biei. Pentru situaiile n care evenimentele cercetate nu sunt de tip dihotomic, se aplic alte teste statistice, despre care vom vorbi mai trziu. Testul z pentru diferena dintre proporiile a dou eantioane independente S ne ntoarcem la exemplul de mai sus, cu privire la proporia stngacilor, i s l privim din alt perspectiv. Un studiu pe dou eantioane din dou ri diferite conduce la constatarea c proporia (p1=0.15) stngacilor a eantionului (n1=100) dintr-o ar este diferit de proporia (p2=0.25) stngacilor din eantionul corespunztor celeilalte ri (n2=90). Este firesc s ne punem ntrebarea dac exist ntr-adevr o diferena dintre proporia stngacilor din cele dou ri (pe care o vom nota cu litere mari: P1 respectiv P2) sau dac, dimpotriv, diferenele constatate sunt doar expresia variabilitii de eantionare. n acest caz:

-ipoteza cercetrii susine c proporiile la nivelul populaiilor sunt diferite (P1P2) -ipoteza de nul susine c proporiile celor dou populaii sunt identice (P1=P2) i, deci, c diferena lor este 0 (P1-P2=0) n exemplul nostru, P1 i P2 reprezint probabilitile unui eveniment aleator de tip binomial, n care evenimentul complementar (Q1, respectiv Q2) este caracteristica de a fi dreptaci (vom ignora acum faptul c pot exista i ambidextri). Distribuia ipotezei de nul pentru diferenele dintre cele dou proporii este aproximat de distribuia normal z. Testul statistic va urma modelul testului pentru diferena dintre mediile a dou eantioane independente:

unde: p1 i p2 sunt proporiile evenimentului la nivelul eantioanelor P1 i P2 sunt proporiile evenimentului la nivelul populaiei (p1-p2) este eroarea standard a distribuiei de eantionare Avnd n vedere ipoteza de nul (P1-P2=0), rezult c la numitor se va pstra doar diferena dintre proporiile eantioanelor (p1-p2). La rndul ei, eroarea standard de eantionare a diferenei proporiilor se calculeaz astfel:

unde: q1 i q2 sunt proporiile complementare ale lui p1, respectiv p2 (q1=1-p1, respectiv q2=1-p2) n1 i n2 sunt volumele celor dou eantioane Ca urmare, formula pentru testul diferenei dintre proporiile a dou eantioane independente devine:

Aceast formul este adecvat atunci cnd eantioanele sunt suficient de mari (>30). n caz contrar, numrtorul formulei suport o corecie, dup cum urmeaz:

Pentru exemplul nostru, vom utiliza formula 4.5

Dac ne-am propus un test bilateral la un nivel alfa=0.05 (pentru care z critic pe curba normal este egal cu 1.96), atunci va trebui s acceptm ipoteza de nul i s concluzionm c nu se confirm existena unei diferene semnificative ntre proporia stngacilor din cele dou comuniti. Testul semnului Ne amintim c unul dintre modelele uzuale de cercetare n psihologie este cel care se bazeaz pe eantioane perechi (corelate sau dependente), n care este evaluat o anumit variabila de dou ori pentru aceiai subieci (sau perechi de subieci). Dac rezultatul msurrii este exprimat pe o scal de interval/raport, atunci diferena dintre cele dou momente (situaii) se verific cu ajutorul testului t pentru eantioane dependente. Ce ne facem, ns, dac nu dispunem de posibilitatea unei msurri la nivel cantitativ i suntem nevoii s observm doar sensul variaiei de la un moment la altul? Soluia acestei probleme a fost gsit n anul 1710 de John Arbuthnot4, medicul personal al reginei Anna a Angliei, primul care a utilizat testul semnului n analiza retrospectiv, pe o perioad de 82 de ani, a raportului naterilor de biei i fete (13/12), nregistrate la primria Londrei. S ne imaginm urmtoarea situaie de cercetare: un psiholog clinician aplic o metod de reducere a manifestrilor de tip fobic la un grup de 8 de subieci. Dup un numr de edine el dorete s afle dac metoda lui este eficient i i ntreab pe cei 8 subieci dac se simt mai bine dect la nceputul tratamentului. Rspunsurile arat c 6 dintre ei afirm c se simt mai bine iar 2, c nu simt nici o modificare (s admitem c nimeni nu rspuns c se simte mai ru). n acest caz ipoteza cercetrii susine c metoda are efect, ceea ce nseamn c procentul de ameliorare este semnificativ mai mare dect cel al absenei oricrui efect al terapiei. Ipoteza de nul este opusul ei, fapt care se exprim prin echivalena celor dou evenimente posibile (eficiena/ineficiena terapiei) i se formalizeaz ca P=Q=0.5. Avnd o probabilitate de 6/8=0.75 pentru evenimentul ameliorare, se poate afirma c acesta este semnificativ diferit de cel al ipotezei de nul (0.5)? Pentru a verifica ipoteza, se utilizeaz formula 4.1:

Dei, principial, este corect, se impune o anumit corecie a acestei formule, corecie util mai ales pentru valori mici ale lui N. Dac privim graficele distribuiilor binomiale prezentate anterior vom observa c, spre deosebire de curba normal z, acestea au un caracter discontinuu, cu treceri n trepte la o valoare la alta. Din acest motiv se recomand aplicarea unei corecii de continuitate, prin scderea valorii 0.5 din valoarea numrtorului, luat n sens absolut. Formula definitiv devine astfel:

Arbuthnot, John. (1710), "An Argument for Divine Providence, Taken From the Constant Regularity Observed in the Births of Both Sexes," Philosophical Transactions, 27, 186-190.

Mai departe, nu ne rmne dect s nlocuim valorile i sa facem calculele pentru studiul nostru:

Mai departe, cutm valoarea lui p corespunztoare pentru z=-0.40 n tabelul distribuiei normale z, unde gsim p=0.844. Dat fiind faptul c valoarea lui p este mai mare dect 0.05, suntem nevoii s acceptm ipoteza de nul i s conchidem c, cel puin pn n acel moment, terapia antifobic nu are un efect semnificativ statistic pe lotul aflat n tratament. Desigur, rezultatul nu trebuie s fie considerat neaprat ca descurajant de ctre terapeut. Faptul c lotul investigat este att de redus conduce n mod inevitabil la nevoia unor valori foarte ridicate ale testului statistic pentru atingerea pragului de semnificaie. n cazul nostru rezultatul poate fi considerat ncurajator dac, s zicem, evaluarea eficienei s-a fcut dup un numr relativ mic de edine de terapie. Continuarea lor i refacerea testului ar putea conduce la o alt concluzie. Testul semnului (denumit astfel pentru c ia n considerare doar sensul variaiei, nu i valoarea ei) este utilizabil ca substitut al testului t pentru eantioane dependente n cazul datelor msurate pe scal nominal dihotomic. Rezumat

Distribuia binomial rezult n urma unei serii de evenimente independente, dihotomice (prezint dou stri posibile). De exemplu, fiecare natere este un eveniment independent de orice alt natere, iar nou nscuii pot lua dou stari: biat sau fat. Probabilitatea fiecrei stri este notat cu P, respectiv, Q, care sunt complementare (P+Q=1; Q=1-P). Fiecare eveniment simplu este denumit convenional ncercare. Naterile dintr-o anumit perioad, localitate etc., sunt ncercri, iar totalul ncercrilor este simbolizat cu N. Atunci cnd P i Q sunt egale (P=Q=0.5), distribuia binomial este simetric. Cu ct N este mai mare, cu att forma distribuiei se apropie mai mult de distribuia normal. Chiar i atunci cnd P i Q nu sunt egale (PQ) distribuia tinde spre forma normal dac N ia valori din ce n ce mai mari (spre infinit). Distribuia binomial fundamenteaz urmtoarele teste statistice: testul z pentru diferena proporiei unui eantion fa de proporia populaiei; testul z pentru diferena dintre dou proporii (pentru eantioane independente) i testul semnului (pentru eantioane dependente). Testul z pentru diferena dintre proporii poate fi utilizat n dou situaii: o pentru compararea proporiei unui eantion cu proporia la nivelul populaiei (de ex., procentul fumtorilor dintr-o anumit categorie de vrst, comparativ cu procentul fumtorilor din populaia general); o pentru compararea a dou proporii msurate pe dou eantioane independente (de ex., procentul fumtorilor din rndul brbailor i al femeilor, dintr-o anumit instituie). Testul semnului se utilizeaz atunci cnd sunt comparate date dependente (msurate pe acelai eantion), dar nu poate fi msurat cantitatea, ci doar direcia (semnul) diferenei. De asemenea, poate fi utilizat ca alternativ a testului t pentru eantioane dependente, atunci cnd msurarea este de nivel cantitativ, dar volumul eantionului este foarte mic, ceea ce nu susine condiia de normalitate a distribuiei.

EXERCIII (1)Presupunnd c 85% din populaie este dreptace (Q) i c 15% este stngace (P): a. Dac 27 din cei 120 de copii dintr-o coal de art sunt stngaci, care este scorul z pentru testarea ipotezei? b. Pe baza scorului z de la punctul a putem concluziona c frecvena stngacilor printre copiii cu aptitudini artistice este mai mare dect la nivelul populaiei? (alfa=0.05, bilateral) Dou grupuri de subieci, fiecare compus din 30 de persoane, particip la un experiment n care este studiat efectul stresului temporal asupra performanei de rezolvare de probleme. Primul grup are un termen limit iar celalalt, nu are un termen limit. Rezultatele cercetrii arat c 25% dintre subiecii grupului care a lucrat n criz de timp au rezolvat problema, n timp ce pentru grupul fr criz de timp, procentul rezolvrilor corecte este de 60%. Se poate afirma c stresul temporal reduce performana n rezolvarea de probleme? (alfa=0.05, bilateral)
(2)

ase studeni de la facultatea de arte plastice au fost pui s picteze dou tablouri, pe o tem imaginar. ntr-un caz au lucrat n condiii de linite, n cel de-al doilea caz au avut un fond sonor de muzic clasic. Lucrrile lor au fost evaluate de un profesor, care a apreciat c 5 dintre studeni au pictat mai creativ n condiii de muzic dect n condiii de linite. Se poate concluziona c muzica clasic favorizeaz creativitatea artistic, pentru alfa=0.05, bilateral?
(3)

S-ar putea să vă placă și