Sunteți pe pagina 1din 54

CONF.DR.

AUREL STAN

STATISTIC (II)

CUPRINS
I. CLARIFICRI NOIONALE I METODOLOGICE I.1. Populaii i eantioane I.2. Extragerea sau prelevarea eantioanelor I.3. Metode de eantionare empirice sau metode nealeatorii I.4. Anchetele diacronice I.5. Mrimea eantionului I.6. Deformrile sistematice ale rezultatelor II. PROBABILITATE I DISTRIBUIA PROBABILITILOR II.1. Consideraii preliminare II.2. Principiul abaterii centrate reduse II.3. Valoarea pragului de ncredere II.4. Controlul parametrilor de fluctuaie II.5. Intervalele de fluctuaie a mediilor provenind dintr-un eantion II.6. Inferena asupra mediilor populaiei III. TEORIA TESTELOR N STATISTIC III.1. Consideraii preliminare III.2. Teste parametrice i neparametrice III.3. Comparaia mediilor III.4. Compararea unei medii la o norm. III.5. Cazul n care variana populaiei este necunoscut III.6. Compararea a dou medii observate III.7. Compararea a dou medii provenind din eantioane independente III.8. Comparaia a dou medii provenind din dou eantioane mperechiate sau corelate III.9. Test cu o ieire, test cu dou ieiri IV. RELAIILE DE ASOCIERE DINTRE VARIABILE IV.1. Relaia dintre dou variabile nominale IV.2. Relaia dintre dou variabile ordinale IV.3. Relaia dintre dou variabile de interval IV.4. Ecuaiile de regresie

BIBLIOGRAFIE

SCOPUL UNITII DE CURS Familiarizarea cursanilor cu problemele principale ale statisticii infereniale aplicate n psihologie; Informarea cursanilor asupra principalelor tipuri de aplicaii ale statisticii infereniale n domeniul psihologic de cercetare; Informarea cursanilor asupra oportunitii aplicrii testelor statistice; Informarea cursanilor asupra deosebirii dintre interpretarea statistic-inferenial i interpretarea psihologic n domeniul cercetrii psihologice.

OBIECTIVE OPERAIONALE n urma studierii acestei uniti de curs, studenii trebuie s-i formeze urmtoarele deprinderi intelectuale: S opereze cu principalele concepte ale statisticii infereniale utilizate n domeniul cercetrii psihologice; S precizeze etapele constituirii eantioanelor i s disting specificul acestora n cazul unor cercetri concrete; S precizeze situaiile de aplicare n psihologie a conceptelor statistice referitoare la diferenierea i asocierea seriilor de valori ale unei variabile; S precizeze specificul principalelor teste statistice i s cunoasc etapele derulrii acestora; S precizeze sensul i non-sensul aplicrii teste statistice; S poat utiliza corect datele coninute n tabelul anex. EVALUAREA La sfritul semestrului evaluarea se va realiza n cadrul unui examen scris. Pentru examen se vor stabili dou tipuri de subiecte: un tip referitor la teoria statistic i un tip referitor la aplicarea n practic a cunotinelor dobndite. n cadrul activitilor tutoriale se vor exersa subiectele cu caracter practic i se va verifica realizarea exerciiilor de la sfritul capitolelor. Tipurile de subiecte pentru examen vor fi egal ponderate pentru nota final obinut la examen.

STATISTIC (II)

I. CLARIFICRI NOIONALE

I.1. POPULAII I EANTIOANE Noiunile de populaie i eantion sunt foarte frecvent utilizate n statistica inferenial, din acest motiv se cer clar precizate. n statistic inferenial, termenul de populaie are un sens aparte fa de cel curent, sens dat de specificul acestei discipline care opereaz cu mulimi de date aparinnd unor domenii foarte diferite. Ca atare, populaia nu nseamn totalitatea locuitorilor globului pmntesc sau a unei pri din acesta. ntr-o form foarte succint definim populaia ca un ansamblu de entiti care satisfac o definiie dat. Definirea prealabil a entitilor, naintea includerii lor n populaie, trebuie s fie foarte riguroas, pentru a nu da natere la confuzii. n loc de entiti se prefer n unele definiii ale populaiei termenii de indiviz sau de uniti, cu precizarea c nu este vorba de indivizi umani, ci de elemente ale diferitelor mulimi de natur foarte diferit. Fcnd aceste precizri, putem da cteva exemple de ansambluri sau grupuri care pot constitui populaii: grupuri de persoane; grupuri profesionale; grupuri etnice; grupuri religioase; grupuri de instituii; grupuri de animale; grupuri de obiecte. grupuri de itemi; Exist o mare diversitate a modalitilor n care putem s ilustrm noiunea de populaie. Domeniile care satisfac definiia individului de baz sau a unitii din cadrul populaiei formeaz un mare evantai, pornind de la cele mai banale pn la cele mai bizare. Astfel, exemplificnd din domeniul indivizilor umani, n aceast noiune statistic pot fi cuprinse: toate persoanele de naionalitate romn; toate persoanele care sunt angajate ntr-o firm; toate persoanele care se ocup cu ocrotirea minorilor din Europa; toate persoanele care folosesc un anumit tip de ampon; toate persoanele dintr-un anumit jude care posed un cine de ras; toi inginerii care sunt conductori de firme. Practic, nu exist limite ale exemplificrii noiunii de populaie statistice. Din punct de vedere al tiinei numit statistic, calitile pe care trebuie s le posede o anumit populaie trebuiesc bine stpnite i, n majoritatea cazurilor, clar cuantificate. Mrimea unei populaii poate varia de la un individ sau o unitate pn la numere de dimensiuni extrem de mari. n unele cazuri, cnd numrul unitilor
97

AUREL STAN

este foarte mare i se gsete ntr-o continu cretere cu o rat imprevizibil, se vorbete de populaii infinite. Acelai individ sau aceeai unitate poate s se regseasc n mai multe populaii, n cazul n care satisface i criteriile altor sisteme de clasificare. Astfel, o persoan poate face parte din populaia profesorilor de biologie din Moldova, din populaia credincioilor ortodoci din aceeai zon, din populaia posesorilor de computere i din cea a actorilor amatori, de exemplu. n cazul n care se calculeaz un indicator numeric din date provenind de la toi indivizii populaiei, mrimea rezultat se cheam parametru i are o valoare fix, nesupus oscilaiei. Este doar unul din sensurile noiunii de parametru. Dac avem posibilitatea s msurm n ntregime nlimea populaiei copiilor de 12 ani, de sex masculin din Romnia putem spune cu exactitate ct este media acesteia. Dar, anterior trebuie s precizm clar cnd considerm c un copil are 12 ani, deoarece foarte rar putem face msurtori exact n ziua n care acesta mplinete 12 ani. De aceea, precizm c n aceast categorie pot fi cuprini copii care la data msurtorii aveau ntre 11 ani i 180 de zile i 12 ani i 180 de zile. Precauiile metodologice sunt foarte importante dac dorim s evitm apariia unor neclariti. Un eantion poate fi definit ca un subansamblu, o parte sau o poriune dintr-o populaie, pe care se efectueaz msurtori care pot fi utilizate pentru a trage concluzii n privina ntregii populaii din care a fost extras. Msurtorile efectuate asupra eantioanelor pot oferi doar estimaia valorii parametrilor, estimaie ce poate fi destul de aproape de valorile exacte, valorile populaiei, n cazul n care se parcurg paii necesari indicai de o metodologie riguroas. Un eantion este compus din uniti de sondaj. Mrimea unui eantion este dat de numrul de uniti care l compun. n anchetele psihosociologice, unitile sunt, n general, persoane umane. Pentru alte genuri de anchete, unitile pot fi o situaie, un document, o unitate de nregistrare video sau audiovizual, un articol de ziar. Tehnicile de eantionare sunt identice, oricare ar fi natura unitilor. Maniera n care se procedeaz pentru constituirea unui eantion depinde de : existena unor informaii asupra incidenei caracteristicilor definite prealabil (De exemplu, brbaii i femeile au aceleai atitudini fa de munc? Exist o evoluie a acestor atitudini cu vrsta? Modalitatea n care exerciiile colare de nvare a lecturii difer de la ar la ar?) existena informaii asupra populaiei, adic dac aceasta are precizai indicatorii statistici? Este important, n primul caz, ca grupele comparate s fie echivalente, cu excepia variabilelor definite (variabilele anchetei). n al doilea caz este imperativ ca grupele reinute s fie constituite n aa fel nct ele s fie asemntoare populaiei de care ne interesm (denumit i populaie printe), deoarece constatrile fcute pe datele obinute n eantion urmeaz a fi generalizate prin inferen, la nivelul ntregii populaii. Se impune ca un astfel de eantion s fie reprezentativ. Dac eantionul nu este asemntor populaiei de care se intereseaz un studiu, se spune c eantionul este deformat sau contorsionat. Totdeauna exist diferene ntre populaie i eantioane, dar acestea sunt minimalizate prin tehnici specifice de prelucrare statistic. Tehnicile de eantionare vizeaz obinerea unor eantioane pe ct posibil de reprezentative. n cele mai multe cazuri n cercetrile tiinifice din domeniul psihopedagogic nu se opereaz cu un eantion, ci cu mai multe. Eantioanele de numesc independente n cazul n care indivizii care le compun nu sunt fizic aceiai n fiecare din ele. Ilustrarea cea mai clar a unor astfel de eantioane sunt cele difereniate prin sex. Eantioanele independente se folosesc n cercetare, n situaia n care cercettorul vrea s evite ca efectele adiionale ale manipulrii modalitilor variabilelor s se produc, cnd exista o complet incompatibilitate n succesiunea de manipulare a acestor modaliti i atunci cnd se dorete
98

STATISTIC (II)

a se evita efectele oboselii, scderii motivaiei i a ateniei din partea indivizilor care le compun (n cazul n care exist o mare solicitare n cadrul unor cercetri). Seriile de date se consider c aparin unor eantioane independente i cnd membrii aceluiai grup de indivizi sunt supui la o solicitare n condiii diferite. Eantioanele perechi sau dependente sunt formate din aceeai indivizi sau din grupe diferite de indivizi, care au fost anterior egalizate n privina anumitor caracteristici (vrst, sex, nivel de colarizare, arie geografic de provenien etc.) i pregtite cu grij pentru competiie. Aceste tipuri de eantioane au utilizri multiple n psihologie i pedagogie, ale cror cazuri se pot grupa n trei categorii: Cercetri n care exist necesitatea de a controla ct mai riguros un factor de variaie. n cazul cercetrilor longitudinale acelai eantion este folosit mai muli ani, sau chiar mai multe decenii n cercetrile de psihosomatic cercettorii utilizeaz acelai eantion de persoane la un interval de 20 sau 30 de ani, dup ce anterior au constatat prezena unor factori de ordin psihologic care predispun la apariia unei bolii cardiace sau de alt natur; Cercetri i studii n care diferitele etape de msur sunt legate ntre ele, n cazul n care un cercettor i propune s aprecieze efectele cumulative ale manipulrii variabilelor Exemple de studii de acest gen sunt cele efectuate n privina efectului nvrii asupra memoriei; Cercetri n care se dorete a se controla influena factorilor comuni eantioanelor. n acest tip de cercetri n care caracteristicile nu se raporteaz asupra trsturilor identice proprii indivizilor, ci asupra caracteristicilor comune ale eantioanelor. Dac n psihologie ar exista posibilitatea studierii populaiilor ntregi, statistica descriptiv ar fi suficient pentru a rezuma rezultatele observaiilor. ns, cel mai adesea, se lucreaz cu eantioane de subieci (fapt ce duce la crearea distribuiilor observate) provenind dintr-o populaie, sau din mai multe populaii diferite EXEMPLU: ntr-un studiu asupra caracteristicilor memoriei copiilor se vor putea face investigaii n mai multe clase primare pentru a observa cum se efectueaz memorarea, care este geneza i evoluia acesteia. Se va studia, n acest caz, un eantion din populaia elevilor din Romnia, avnd vrsta stabilit de cercettorii care efectueaz studiul. Dac acelai studiu se va efectua asupra elevilor de aceiai vrst din colile din Egipt i din Brazilia vor exista eantioane provenind din trei populaii diferite. ntrebarea care se pune este urmtoarea: dac n mod global (nu neaprat pentru toi indivizii, ci doar pentru majoritatea dintre ei) se observ diferene de memorare ntre dou eantioane de elevi, este posibil ca aceste diferene s existe i la nivelul populaiilor luate n ntregime? Rspunsul la aceast ntrebare este foarte important, deoarece dac se pot confirma diferenele, se poate trage concluzia existenei diferenelor ntre populaii. Dac nu se poate realiza acest lucru, nu se pot trage nici concluzii asupra diferenelor ntre populaii (n ciuda diferenelor obinute la eantioane) i se poate trage concluzia c geneza memoriei i a diferitelor sale forme este universal, c ea urmeaz aceleai faze i etape la toi copiii, indiferent din care zon a planetei provin. n alte conjuncturi i n alte situaii, miza nu poate fi la fel de important. Exist n acest caz obligaia de a arta c ceea ce s-a obinut sau observat nu este pur fortuit i ocazional, propriu doar eantionului studiat, ci c avem de-a face cu lucruri semnificative, suficient de generale, valabile pentru populaie, adic dincolo de nivelul eantionului. Faptul observat are un caracter sistematic, aplicabil nu la toi indivizii, nici la toate eantioanele de indivizi, ci la cea mai mare parte dintre acestea.
99

AUREL STAN

Demersul care const n a generaliza pentru un ansamblu mai vast (populaia), ceea ce se observ pe un ansamblu mult mai restrns (eantion) este cel mai uzual n psihologie, pentru c frecvent nu se cunosc statisticile descriind populaia n ntregime. Mai rar, cnd se cunoate populaia, problema este de ti dac un eantion observat este conform, tipic acestei populaii (compatibil cu ea) sau dac este atipic i, probabil, rezultat din alt populaie. Avem un astfel de caz cnd se testeaz un model (elaborat de un cercettor) prezicnd rspunsurile ateptate din partea subiecilor. Este vorba de a ti dac rspunsurile efective obinute cu un eantion de subieci (plasai n condiii definite prin model) sunt conforme prediciilor acestuia. n cele dou cazuri pentru a se pronuna asupra populaiei (prin inferen, plecnd de la un eantion), cercettorul poate fi condus la a utiliza un intermediar: statistica inferenial. Este necesar s fie precizate natura, statutul i rolul acestei statistici ca i distribuiile pe care ea le reprezint. Chestiunile infereniale, de generalizare sau de compatibilitate, cuprind statisticile descriptive: frecvene, medii, chiar dispersii (variane), precum i diferene de medii, de dispersii, de frecvene. Se vor trata n cadrul statisticii infereniale frecvenele i mediile, precum i diferenele lor.

I.2. EXTRAGEREA

SAU PRELEVAREA EANTIOANELOR

Operaia de construcie a eantioanelor se numete eantionare. Se mai utilizeaz termenii eantionaj i sondaj. De la nceput trebuie contientizat importana cutrii informaiei "adevrate", juste, adic a acelei informaii pe care am avea-o dac s-ar cerceta toi indivizii care compun populaia. Ca atare, eantioanele trebuie s fie ct mai reprezentative. Metodele de eantionare se divid, n mare, n eantionri aleatorii i eantionri empirice. Dintre tipurile de eantionri aleatorii cunoscute enumerm urmtoarele: Eantionarea probabilistic sau eantionarea la ntmplare. Acest tip de eantionare face apel la mecanismele de extragere aleatorie (prin tragere la sori) de indivizi care compun eantionul. Eantionarea la ntmplare const n a preleva unitile la ntmplare dintr-o anumit populaie. Aceasta presupune c cercettorul dispune de date referitoare la ansamblul populaiei, adic de baz de sondaj. n cazul cunoaterii bazei de sondaj se procedeaz prin tragere la sori a unitilor. n principiu, tragerea la sori constituie cea mai bun metod de eantionare, deoarece corespunde modelelor statistice folosite pentru analiz. Apoi se extrage, respectnd specificul aleatoriu a acestui tip de eantionare, un numr determinat de numere cuprinse ntre 1 i n (notare pentru volumul eantionului). Unitile corespondente selecionate constituie eantionul. Totui, acest tip de eantionare nu este cel mai adaptat n acele studii n care unitile de eantionare, astfel selecionate, nu sunt disponibil, mai ales cnd este vorba de persoane (este mai uor de a constitui un eantion de persoane pentru a le msura greutatea, dect de a face un eantion statistic pentru a msura atitudinile). Din motive de fezabilitate sau de cost tragerea la sori poate fi precedat de o prestructurare empiric (deci nealeatorie) a populaiei, operaie legat de cunoaterea prealabil a acesteia. Tragerea la sori elementar const n a numerota toi indivizii care compun populaia printe studiat, apoi de a extrage la ntmplare o cantitate definit din aceste numere, aceast cantitate, fiind efectiv eantionul. Se selecteaz indivizii corespunznd numerelor trase la sori, conform principiului tragerii la loto. Este modul de eantionaj cel mai probabilist, dar care are un inconvenient major care const n faptul c este foarte costisitor n timp
100

STATISTIC (II)

i bani. A inventaria toi indivizii populaiei este o operaiune deosebit de dificil, urmat de o alta la fel de dificil, aceea de a gsi pe toi indivizii trai la sori. Acest tip de eantion se poate totui utiliza n studiile de teren, n studiile efectuate pe copii unei cree, n studiul efectuat ntr-o ntreprindere sau, n general, n studiile efectuate pe mici colectiviti. Eantion prin tragere la sori secvenial sau eantion cu mai multe trepte. Este o tragere la sori care se efectueaz pe criterii succesive. n primul rnd se definete o populaie pe un criteriu dat i se extrage un prim eantion urmnd acest criteriu. Apoi se definete un al doilea criteriu n interiorul acestui eantion i se procedeaz la o nou tragere la sori pentru elementele iniial selecionate. Exemplu de tragerea la sori secvenial: n cazul efecturii unui studiu asupra stress-ului profesional n rndul infirmierelor din mediul spitalicesc public, n primul moment se selecioneaz un eantion de spitale, apoi, n al doilea moment, se extrage un eantion de infirmiere din fiecare spital selecionat. Eantionaje prin grappes. Un grappes este un ansamblu de uniti avnd o legtur natural. Exemplu: elevii unei clase, clasele aceluiai aezmnt colar, muncitorii unui atelier, atelierele unei aceleai uzine, articolele unui jurnal, jurnalele unui aceluiai grup de pres. Unitile componente ale unui grappes se aseamn mai mult ntre ele dect cu alte uniti. Baza de sondaj nu mai este atunci ansamblul unitilor susceptibile de a fi chestionate, ci grappes-urile. n anchetele asupra colii a devenit o procedur clasic faptul de a proceda mai nti la tragerea la sori prin hazard a colilor, apoi a claselor, apoi a elevilor n interiorul nivelelor colare. Este vorba, n acest caz, de o tragere la sori prin grappes de trei grade, pentru c sunt utilizate trei uniti de sondaj legate. Avantajul acestui procedeu rezid n faptul c cineva nu are nevoie de a dispune de baza de sondaj relativ la populaia printe i n faptul c se limiteaz dispersia unitilor de contactat. Este necesar, e totui, ca grappes-urile s fie de mrime suficient i n numr suficient pentru ca s se aplice legea numerelor mari. Eantionarea stratificat. n acest caz se divizeaz populaia n subpopulaii numite straturi, dispunnd fiecare de caracteristici distincte. Se extrage un eantion din interiorul fiecrui strat. Ansamblul acestor eantioane care pot fi de mrime diferit constituie eantionul de studiu. Aceast metod are ca prioritate definirea, n prealabil, a subpopulaiilor sau straturilor. Alegerea la hazard a unitilor se face apoi n interiorul fiecrui strat (definit prin ncruciarea variabilelor). Aceast metod este privilegiat cnd se realizeaz asupra bazei de caracteristici specifice luate drept criteriu de stratificare. Criteriile de stratificare a unitilor sunt funcie a specificului studiului. Exemplu, ntr-o anchet asupra comportamentelor de cumprare a bunurilor de consum zilnic se stabilesc drept criterii: nivelul de venituri al menajului, sexul, mrimea localitii. ntr-o anchet asupra opiniei elevilor acestea pot fi considerate nivelul colar i reuita colar.

I.3. METODE DE EANTIONARE EMPIRICE

SAU METODE NEALEATORII

Aceste metode de eantionare se bazeaz pe construirea unui eantion ale crui caracteristici sunt cele mai apropiate de caracteristicile eseniale ale populaiei, pornind de la informaiile care se posed despre o populaie. Eantionarea prin quote. Este cel mai familiar tip de eantionare i const n alegerea indivizilor care compun eantionul n aa fel nct caracteristicile eseniale ale populaiei s se regseasc n
101

AUREL STAN

aceleai proporii, sau dup un anumit procent (quota), n eantion. Prin acest tip de eantionare se construiete un model redus al populaiei. Mrimea diferitelor subgrupe constitutive ale eantionului este proporional subgrupelor echivalente din populaia printe. Pentru acest tip de eantionare se mai utilizeaz denumirea eantionare proporional. Dac n populaia printe exist 48% brbai i 52% femei, ntr-o anchet purtat pe 1000 de persoane se vor chestiona 480 de brbai i 520 de femei. Pentru a realiza acest fel de eantionare se stabilesc n prealabil cote care se comunic persoanelor nsrcinate cu nregistrarea informaiilor. Indivizii sunt, n general, mai greu de gsit dac ei aparin la o categorie cu frecven redus n populaia printe. Dup stabilirea quotelor se examineaz sau chestioneaz indivizii la concurena proporiilor, innd seama de criteriile fixate. Cele mai importante criterii pentru aduli sunt: a) vrsta, b) sexul, c) profesia, d) nivelul de venituri, e) zona locuit. La copii se consider vrsta i echivalentul su (clasa colar), tipul de coal frecventat, profesiunea tatlui etc. Se pot coleciona date pn se completeaz procentul grilei. n cazul sondajele de opinie, n care metoda de eantionare prin quote este foarte utilizat, variabilele cel mai frecvent utilizate sunt sexul, vrsta, mrimea comunitii locuite, localizarea geografic, profesiunea efului de menaj, profesiunea persoanei chestionate ca i nivelul de studii. Fiabilitatea eantionului este funcie de justeea descrierii populaiei i de pertinena variabilelor alese pentru a determina quotele n legtur cu finalitatea studiului. n domeniile de studiu noi i n timpul bulversrilor sociale sau politice este adesea dificil de a determina a priori variabilele pertinente. EXEMPLU. S presupunem ca trebuie s construim un eantion prin quote avnd volumul de 1200 de persoane i trebuie s inem seama n colectarea datelor de sex, vrst, nivel de studii i specificul localitii de provenien. Sexul l vom nota cu S, cu variantele S1 (masculin) i S2 (feminin). Vrsta o vom nota cu V, avnd varianteleV1 (pn la 25 ani), V2 (26-40 ani), V3 (41 ani de ani i peste). Nivelul de studii l vom nota cu G, cu variantele G1 (studii generale), G2 (studii medii) i G3 (studii superioare). Specificul localitii de provenien l vom nota cu P, avnd variantele P1 (urban) i P2 ( rural). n continuare vom prezenta 2 tabele cu cte 36 de csue fiecare (2332=36). n tabelul din stnga fiecare csu va prezenta procentul din populaia naional (valorile sunt fictive) corespunztor unei anumite combinaii a variantelor sau modalitii variabilelor amintite. n csuele celui de-al doilea tabel vor fi trecute cifre reprezentnd numrul proporional de indivizi ai eantionului.
Situaia existent n populaie (exprimat procentual) P1 P2 G1 G2 G3 G1 G2 3,4 2,8 1,7 2,8 2,0 3,2 3,4 1,8 1,7 1,8 4,8 1,9 2,7 3,8 4,2 2,6 2,5 2,3 3,7 2,8 3,5 3,0 3,1 4,1 3,0 4,3 3,1 1,4 4,0 3,4 Situaia n eantion (exprimat n valori absolute) P1 P2 G1 G2 G3 G1 G2 41 31 20 34 24 38 41 22 20 22 58 23 32 46 50 31 30 28 44 34 42 36 37 49 36 52 37 17 48 41

S1 S2

V1 V2 V3 V1 V2 V3

G3 1,9 1,5 1,9 2,7 1,9 1,5

S1 S2

V1 V2 V3 V1 V2 V3

G3 23 18 23 32 22 18

Cum se obin valorile numerice pentru eantion. n tabelul din dreapta, cuprinznd valorile numerice ale eantionului corespunztoare procentelor existente n populaie, celula S1V1P1G1
102

STATISTIC (II)

(coninnd numrul persoanelor din eantion care sunt de sex masculin, au vrsta pn la 25 de ani, provin din mediul urban i au studii generale) conine cifra 41. Celula corespunztoare din tabelul cuprinznd situaia procentual din populaie conine valoarea 3,4 (exprimare procentual). Valoarea 41 s-a obinut prin nmulirea valorii volumului eantionului (1200) cu 0,034 (proporia corespunztoare din populaie obinut prin transformarea valorii procentuale). Deci 12000,034=40,8, aproximativ 41 (menionm c toate valorile au fost ntregite, deformarea produs fiind considerat neesenial). 41 de subieci reprezint 3,4% din volumul eantionului. Se procedeaz similar pentru toate celulele tabelului. Procentele cu care noi am exemplificat sunt fictive, dar cele reale pot fi uor de gsit n anuarele statistice. Eantionare prin uniti tip. Acest fel de eantionare se obine prin divizarea populaiei printe n categorii cu ajutorul variabilelor care sunt considerate eseniale pentru o anumit cercetare. Obiectivul este de a construi un eantion ale crui caracteristici fac din el un eantion susceptibil de a furniza informaii pertinente. Exemplul cel mai potrivit ar fi acela al unor eantioane cuprinznd infractorii tineri, indicat atunci cnd un cercettor i propune s studieze delicvena juvenil. Realizarea unor astfel de studii presupun depirea unor dificulti de natur organizatoric i metodologic.

I.4. ANCHETELE DIACRONICE n unele situaii de cercetare (n care exist interes tiinific pentru un proces evolutiv) este necesar de a se examina sau chestiona la date succesive acelai eantion de subieci. n acest caz se constituie ceea ce se numete un panel. Aceast metod a fost descris de Paul Lazarsfeld n anul 1938. Ea este utilizat, mai ales, pentru studiul evoluiei comportamentelor electorale. Institutele de sondaje au create paneluri permanente pe subpopulaii specifice: medici, avocai, auditori de radio i televiziune, grupri religioase i politice etc. Panelurile sunt utilizate i n situaii n care un cercettor este interesat de a controla experiena sau competena persoanelor. Aceast tehnic prezint interes n reperarea indivizilor care i sucumb opiniile i atitudinile i a celor care nu i le schimb, avnd drept finalitate aprecierea nivelului acestei stabiliti sau evoluii. Ea prezint unele inconveniente, deoarece persoanele care accept de a face parte dintr-un panel au caracteristici particulare (disponibilitate, sociabilitate) i este dificil de a discerne n privina variabilelor care influeneaz, conduitele, opiniile sau atitudinile. Atitudinile se pot schimba prin faptul de a fi membru al unui panel (de exemplu tendina de a produce rspunsuri conformiste, de a rmne coerent n timp). De asemenea, exist un risc de obsolescen a panelului, datorat evoluiei persoanelor (mbtrnire, schimbarea profesiei, oprirea colaborrii, schimbarea locuinei).

I.5.MRIMEA EANTIONULUI Determinarea mrimii eantionului ce urmeaz a fi constituit este o problem foarte important. Numrul persoanelor examinate sau chestionate trebuie s satisfac: exigena de a fi destul de precis n estimarea populaiei printe i pe aceea de a fi apt de a da informaii fiabile, innd cont de caracteristicile care intereseaz. De exemplu, n cazul sondajului de opinii asupra inteniilor de
103

AUREL STAN

vot ntre dou alegeri este important ca persoanele s fie chestionate ntr-un interval temporal foarte scurt, deoarece se cunoate faptul c preferinele electorale sunt foarte fluctuante i c anticiparea rezultatului votului constituie interesul major al operaiei. Numrul de persoane chestionate trebuie s fie optim limitat, din cauza costurilor sondajului i a numrului de anchetatori specializai la care este posibil de a face apel ntr-un timp scurt. Pe de alt parte volumul eantioanelor trebuie s fie suficient de mare, deoarece estimarea trebuie s fie suficient de precis, cu att mai mult cu ct candidaii sunt numeroi.

I.6. DEFORMRILE SISTEMATICE ALE REZULTATELOR n cazul n care unitile de eantionare sunt fiine umane exist n mod necesar surse de deformare sistematic a rezultatelor care intervin n apreciere. Un termen din ce n ce mai utilizat n literatura de specialitate strin pentru denumirea acestor deformri ce au un caracter sistematic este cel de biais. n fond, nimeni nu este obligat s furnizeze informaii. Deformrile informaiilor oferite de eantionare exist indiferent de metodele folosite. Direciile din care poate veni deformare sunt: n cazul unei eantionri probabiliste, o parte din indivizii care fac parte din eantionul prevzut nu rspund la chestionar; n cazul unei eantionri prin quote putem s avem o suprareprezentare a anumitor categorii de persoane (este mai posibil de a ntlni mai multe femei dect brbai, rurali trind n ora dect rurali izolai. chestionarea persoanelor prin telefon (acelea care nu au telefon nu sunt ntrebate) sau n locuri frecventate n mod obinuit de o anumit categorie de persoane. Controlul acestor deformri, sau, mai bine spus, limitarea lor, se realizeaz prin impunerea de reguli privind chestionarea: a nu chestiona amici i cunotine, a varia locurile i orele de chestionare, a nu chestiona mai multe persoane care aparin la aceluiai grup (membrii aceleai familii) dac aceasta nu este prevzut n mod expres. Institutele de sondaje exercit un control permanent asupra celor ce se ocup cu chestionare persoanelor, deoarece cunosc faptul c nivelul calitii unei anchete depinde de respectarea regulilor de eantionare, reguli care au fost concepute n funcie de finalitatea studiului. n ciuda acestor controale, innd cont de diversitatea surselor de deformare, se estimeaz c metoda quotelor d, n general, rezultate mai puin satisfctoare dect alte metode. Atunci cnd este posibil de aprecia importana deformrilor se procedeaz la aplicarea unor procedee de corecie a datelor obinute. Aceast corecie nu este posibil dect dac exist o bun cunoatere a populaiei cuprinse n studiu i a modelelor adecvate care permit redresarea lor. Operaia de redresare a eantioanelor presupune o serie de riscuri. n sondaje se introduc adesea ntrebri care vizeaz sinceritatea rspunsurilor. De exemplu, cnd se ntreab despre intenia de vot, se ntreab i de votul precedent. Dac exist nepotriviri mari se opereaz o redresare i o ponderare.

104

STATISTIC (II)

II. PROBABILITATE I DISTRIBUIA PROBABILITILOR


II.1 CONSIDERAII PRELIMINARE Acest domeniu aparine statisticii infereniale, adic acelui domeniu care se folosete de datele oferite de statistica descriptiv n scopul de a face prognoze. A nelege statistica inferenial nseamn a nelege metodele de a evalua probabilitatea teoretic de apariie a unor fenomene cu caracter aleator. Inferena statistic este fondat pe evaluarea unei probabiliti teoretice de apariie a unui fenomen observat, probabilitate n funcie de a crei valoare statisticianul stabilete decizia pe care o ia ntr-o anumit problem. n fundamentarea deciziilor opereaz n multe situaii teoria probabilitilor, domeniu tiinific cercetat n principal de matematicieni specializai care-i asigur o abstractizare de nalt nivel. Pentru dimensiunea pe care i-o propune cursul nostru, menionm c apropierea de acest domeniu al teoriei probabilitilor este una empiric, adic bazat pe exemple concrete ce au o anumit valoare ilustrativ. Evaluarea probabilitii se bazeaz pe principiul urnei. Cele mai clare ilustrri ale probabilitii rezultate din tragerea la sori sunt aruncarea unei monede n sus i extragerea succesiv a 10 bile dintr-o urn care conine 50 de bile albe i 50 de bile negre. Dac aruncm o moneda n sus n serii de cte 10 aruncri i realizm serii de ordinul miilor, probabilitatea de a rezulta anumite proporii ale capului sau pajurei se distribuie conform exigenelor unei distribuii normale Gauss, care poate fi transpus grafic n aa-numita curb normal Gauss. Numrul de posibiliti este foarte mare, n situaia n care se fac lansri n serie mare. Dac s-ar face doar 2 lansri ale unei monede, am avea 4 posibiliti teoretice diferite de succesiune a capului sau a pajurei: Cap Cap Pajur Pajur Cap Pajur Cap Pajur

La un numr de dou posibiliti la fiecare aruncare a unei monede (n serii de cte 10 aruncri) avem 210 posibiliti concrete de apariie. Exemplu: pentru proporia de ori 9 cap i 1 pajura avem printre variante:
Nr.crt. 1 2 3 4 5 6 7 8 9 10 1 C C C C C C C C C C 2 C C C C C C C C C P 3 C C C C C C C C P C 4 C C C C C C C P C C P P P P P P P P P P

n care cu C se noteaz apariia capului i cu P apariia pajurei. Numrul diferitelor proporii de apariie poate fi estimat cu ajutorul formulei:

105

AUREL STAN

NPI =

NT ! NI !*( NT NI )!

n care: NPI - numrul de proporii identice; NT - numrul de trageri; NI - numrul de evenimente identice

PAP =

NPI NC

n care: PAP - probabilitatea de apariie a unei proporii NPI - numrul de proporii identice; NC - numrul de combinai. Cu ajutorul unor astfel de formule se pot obine toate probabilitile de apariie a proporiilor posibile, oricare ar fi numrul de lansri succesive care s-ar practica. Probabilitatea de a obine 2 pajuri succesive n cursul a 10 lansri succesive (din 1024 de serii de lansri) este: 10! 10 x9 x8 x7 x6 x5 x 4 x3x 2 x1 NPI (2) = = = 45 2! x(10 2)! (2 x1)! x(8 x7 x6 x5 x 4 x3x 2 x1)

PAP =

45 = 0,0439 , deci aproximativ 4,4%. 1024


Nr.crt. 1 2 3 4 5 6 7 8 9 10 11 Total Evenimentul cutat 0 1 2 3 4 5 6 7 8 9 10 Numrul de apariii 1 10 45 120 210 252 210 120 45 10 1 1024 Probabilitatea 0,10% 0,98% 4,59% 11,72% 20,51% 24,61% 20,51% 11,72% 4,59% 0,90% 0,10% 100,00%

Se poate astfel obine probabilitatea pentru fiecare din proporii

Cu un astfel de tabel se poate imediat evalua probabilitatea de apariie a unei trageri coninnd o proporie dat. Observm c probabilitile extreme (de 10 ori pajura i de 10 ori capul) se ntlnesc foarte rar, i o repartiie egal (de 5 ori pajura i de 5 ori capul) are o mare frecven. Dac efectum o histogram a frecvenelor absolute de apariie a diferitelor proporii vizualizm c anumite proporii sunt mult mai frecvente dect altele. Pentru ca aceste frecvene de apariie s poat lua forma curbei normale Gauss trebuie s avem un mare numr de aruncri. Deci, cu ct numrul de aruncri este mai mare cu att putem s prognozm mai bine numrul de apariii a unei frecvene.

106

STATISTIC (II)

300 250 200 150 100 50 0 0 1 10 2 3 4 5 45 120 210

252 210 120 45 10 6 7 8 9 10 0 11

Cazul cnd ntr-o urn se afla 100 de bile dintre care 30 albe i 70 negre. Formula este urmtoarea: NT ! PAP = xP!NE xP 2 NT NE NE! x( NT NE )! n care - PAP- probabilitatea de apariie a unei proporii: NT- numrul de trageri; NE - numrul de evenimente identice, P1 - probabilitatea primului element; P2 - probabilitatea celui de-al doilea element1. tiind c P1 poate caracteriza proporia bilelor albe i P2 proporia bilelor negre i c NT caracterizeaz mrimea eantionului se poate calcula probabilitatea exact de a obine nu import ce proporie de bile albe i bile negre ntr-un eantion de mrime definit. EXEMPLU. Care este probabilitatea de a obine 3 bile albe provenind din 8 trageri? P1=0,3 P2 = 0,7 (exprimate n scala de la 0 la 1). Se remarc c 1- P1 = P2. NT=8. NE=3. Probabilitatea este urmtoarea: 8! x0,33 x0,7 83 = 0,2541 3! x(8 3)! Probabilitatea este de 0,2541 adic 25,41% anse de a gsi 3 bile albe n eantionul nostru. Probabilitatea de a gsi 7 bile albe va fi de: 8! x 0,37 x 0,7 8 7 = 0,001225 7! x (8 7) deci, exist 0,12% anse de a obine un eantion coninnd 7 bile albe. Principiul urnei funcioneaz asupra msurtorilor de intervale continue i discontinue.

Formulele au fost preluate din lucrarea lui Nicolas Gueguen Manuel de statistique pour psychologues, Dunod, Paris, 1997, pag.72-73

107

AUREL STAN

Oferim n continuare un exemplu de conformitate la distribuia normal Gauss-Laplace a rezultatelor extragerii de eantioane dintr-o populaie. Este un exemplu simplu, bazat pe o populaie restrns2. La o populaie definit de 8 subieci se efectueaz o sarcin de nvare a unei listei de 20 de cuvinte concrete. Se obin urmtoarele scoruri: Subiect Scorul de nvare 1 6 2 8 3 7 4 10 5 9 6 11 7 12 8 5

Se poate considera c cei 8 subieci aparin populaiei printe. S presupunem c noi vom extrage la ntmplare din aceast populaie cte 2 subieci din aceast populaie i efectum media scorurilor lor. Mediile pe care le obin trebuie obligatoriu s corespund la una dintre mediile coninute n tabloul urmtor. n total au putut fi constituite un numr de 28 de eantioane.
5 5 6 7 8 9 10 11 12 5,5 6,0 6,5 7,0 7,5 8,0 8,5 6 6,5 7,0 7,5 8,0 8,5 9,0 7 8 9 10 11 12

7,5 8,0 8,5 9,0 9,5

8,5 9,0 9,5 10,0

9,5 10,0 10,5

10.5 11,0

11,5

Se prezint tabelul cu efectivele fiecrei medii distinctive obinute:


Valoare 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 10,0 10,5 11,0 11,5 Efectiv 1 1 2 2 3 3 4 3 3 2 2 1 1

Vom transpune grafic aceast distribuie, prin intermediul unei histograme. 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 4 3 2 1 1 2 3 3 3 2 2 1 1

9 10 11 12 13

vezi Nicolas Gueguen, op.cit., pag. 74

108

STATISTIC (II)

Aspectul distribuiei este foarte apropiat de cel teoretic elaborat de Gauss-Laplace. Distribuia apare perfect simetric. Se poate verifica aceast simetrie calculnd media, mediana i modulul acestei distribuii a mediilor. Pentru toi aceti indicatori de tendin central se va obine valoarea 8,5. Distribuia normal se caracterizeaz printr-o medie corespunznd punctului cel mai nalt al curbei i printr-o varian caracteriznd modul general n care se disperseaz valorile distribuiei n jurul acestei medii. Din raiuni practice valoarea acestor parametri a fost fixat odat pentru totdeauna prin legea normat centrat redus. Am descris-o anterior, n capitolul destinat indicatorilor statistici, odat cu tratarea valorilor normate z. Este o variant practic a distribuiei normale Gauss-Laplace. Media distribuiei centrate reduse este egal cu 0 i abaterea standard este egal cu 1. Aceast curb este normat prin valoarea celor doi parametri. Curba care caracterizeaz aceast lege este continu. Cunoscnd proprietile distribuiei acestei curbe putem afla probabilitatea teoretic de apariie a unui eveniment, adic a uneia din variantele posibile a unei distribuii. Mai bine spus, ntr-o distribuie centrat redus putem s apreciem sau s estimm probabilitatea de apariie a intervalului mergnd de la media distribuiei pn la valoarea corespunznd fenomenului studiat.

II.2. PRINCIPIUL ABATERII CENTRATE REDUSE Formula abaterii centrate reduse este urmtoarea z =

XX , n care X este variabila brut s

a distribuiei, X media distribuiei eantionului i s abaterea standard a distribuiei eantionului. Aceast transformare nu poate s se realizeze dect dac distribuia studiat prezint o form normal. Este necesar s facem o distincie n privina notrii indicatorilor populaiei i ai eantioanelor. Pentru a nota media unei populaii vom utiliza litera greceasc . Pentru notarea abaterii standard a unei populaii vom utiliza litera greceasc . Pentru a nota volumul unei populaii vom folosi litera n. Notarea mediei eantionului se va face prin X . Prin s vom nota abaterea standard a unui eantion i prin N volumul eantionului. Aceste convenii de notare sunt respectate parial, motiv pentru care trebuie s fim ateni, atunci cnd analizm o lucrare tiinific de statistic, la conveniile cu care se opereaz. Studiul principiilor de extragere a eantioanelor n interiorul unei urne indic c mediile acestora i proporiile acestora tind s prezinte caracteristicile populaiei din care au fost extrase. Se poate prevedea media i proporiile pe care le va avea un eantion oarecare, dac acesta este extras dintr-o populaie ai crei parametri sunt cunoscui i invers (, i n). Obiectivul const n a prevedea valorile anumitor parametri pornind de la indicatorii identificai ntr-un eantion, i invers, a prevedea valorile unor indicatori ai unui eantion pornind de la parametrii unei populaii. Specificm c noiunea de parametru o folosim numai pentru populaie. Se va trece de la funcia de descriere la funcia de inferen. Regula care prezideaz utilizarea tabelelor centrate reduse (prezentnd o form normal) trebuie s fie scrupulos respectat. Tabelele distribuiei respective se gsesc n anexele cursului nostru. n statistica inferenial un concept important este pragul de ncredere. Intervalele de fluctuaie ale mediilor i proporiilor sunt noiuni eseniale ale rezumatelor distribuiilor de msur. Aceste intervale sunt construite pentru a apropia cu cea mai mare certitudine posibil media sau proporia pe care o ia un eantion extras dintr-o populaie pentru care este cunoscut media, abaterea standard i volumul.
109

AUREL STAN

A controla gradul de certitudine adoptat comport un anumit risc de eroare de a nu vedea media sau proporia de eantion n intervalul astfel calculat. Pragul de ncredere este riscul de eroare de a nu lua n calcul aceste dou evenimente posibile. Astfel, exist n cazul aruncrii n sus a unei monede 99,8% din 100 de a avea un eantion coninnd ntre 1 i 9 pajurii. Intervalul 1-9 se poate reduce dar pragul de ncredere se reduce. Astfel: ntre 2 i 8 se gsesc 98,25% din cazuri; ntre 3 i 7 se gsesc 89,07% din cazuri. Aceste procentaje de interval se stabilesc prin adiionarea procentajelor fiecrei variante expuse anterior n tabel. Astfel pentru a rezulta 97,74% cazuri adunm procentajele de la variantele 2,3,4,5,6,7,8, (4,59% +11,72% + 20,51% + 24,61% + 20,51% + 11,72% + 4,59%). Pentru a rezulta 89,07% cazuri adunm procentajele de la variantele 3,4,5,6,7, (11,72% + 20,51% + 24,61% + 20,51% + 11,72%). A stabili pragul de ncredere nseamn a ne pune urmtoarea ntrebare: Care va fi valoarea mediei populaiei din care a fost extras un eantionul, n aa fel nct intervalul pe care l calculez s nu ia n consideraie probabilitatea extrem?. Probabilitile extreme sunt uor localizabile i sunt situate n suprafaa care rmne n suprafaa curbei dincolo de a anumit valoare a abaterii de la medie. Ne servim de valoarea z ca de un coeficient de control a amplitudinii intervalului cutat. Aceast valoare va fixa riscul de a gsi media sau proporia eantionului dincolo de limita acestor abateri. Cu ct valoarea z este mai mare, cu att riscul de a gsi o valoare exterioar apreciabil va fi mai slab. Pragul de ncredere este adaptarea celui mai bun compromis posibil. S vedem ce numr de valori ale unei distribuii centrate reduse poate rmne dincolo de valoarea z egal cu 0,74. Cutm n tabelul anex valoarea z indicat:
Z 0,0 0,1 0,2 0.3 0,4 0,5 0,6 0,7 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,4593

Dup cum indic tabelul 45,93% din numrul valorilor variabilei (am fcut transformarea procentual prin nmulire cu 100) se gsesc n afara intervalului 0,7z i +0,7z, sau mai bine spus n intervalul X 0,7z. Jumtate din valorile cuprinse n acest procent (45,93) valori aparinnd unei distribuii care se conformeaz exigenelor distribuiei centrate reduse (adic 22,965%), sunt mai mici dect 0,7z i jumtate mai mari dect +0,7z. II.3. VALOAREA PRAGULUI DE NCREDERE Noiunea cea mai dependent de responsabilitatea celui care efectueaz msurtori este nivelul de ncredere pe care un cercettor dorete s-l acorde estimrii fluctuaiei eantionrii. Marea majoritate a autorilor de specialitate par a fi de acord s plaseze nivelul de ncredere acceptabil la
110

STATISTIC (II)

95%. Aceasta nseamn c valoarea pe care o ia un indicator al eantionului are 95 anse din 100 de a aparine la intervalul calculat (el nu are 5% anse s aparin acestui interval). 95% este un prag minim care are anse s creasc la 99% sau chiar 99,99%. Cnd dorim, cu orice pre, s ne pzim de o eroare, exist riscul de a cdea n alta. Dac pragul trebuie s fie mai ridicat, aceasta depinde de o solid reflexie teoretic pe conjunctura unei inferene statistice. Pentru efectuarea calculelor va trebui s aducem n atenie o nou noiune, i anume noiunea de eroare standard a mediei. n vederea stabilirii intervalului de fluctuaie a unei medii a populaiei sau a eantionului. Trebuie s adugm la mediile respective o marj de eroare (ME). Marja de eroare este compus dintr-o variabil (z pentru un anumit prag de ncredere) i o constant (eroarea standard). Cnd estimm intervalul de fluctuaie a mediei unui eantion de va folosi abaterea standard a populaie n determinarea erorii standard ( ) N i cnd estimm intervalul de fluctuaie a mediei unei populaii se va folosi abaterea standard a s eantionului n determinarea erorii standard ( ). N s Astfel IFP = X ME sau IFP = X z * N n care: X = media eantionului ME = marja de eroare z = variabila normat cu acelai nume N = volumul eantionului IFP = intervalul de fluctuaie a mediei populaiei. Pentru calculul intervalului de fluctuaie a mediei unui eantion n condiiile n care cunoatem media i abaterea standard a populaie, avem la dispoziie urmtoarea formul: IFE = ME sau IFE = z * n care: - = abaterea standard a populaiei; - N = efectivul eantionului; - = populaiei; - N = volumul eantionului; - z = variabila normat cu acelai nume; - ME = marja de eroare. Intervalul de fluctuaie a mediei la diverse praguri de ncredere Exista o simetrie a valorii marjelor de fluctuaie - limita superioar i limita inferioar. EXEMPLU: Populaie compus din 12 indivizi crora li s-a aplicat proba de dexteritate manual O'Connor (exemplu fictiv, n practica profesional foarte rar se poate ntlni o populaie de 12 indivizi).
Subiect Valoare 1 16 2 6 3 9 4 12 5 7 6 13 7 8 8 10 9 17 10 15 11 14 12 11 111

AUREL STAN

Vom calcula media i abaterea standard a acestei distribuii a valorilor populaiei: Aplicm formula pentru calcularea mediei Nr.crt. X x x2 1 16 4.50 20,25 X = 138 = 11,5 . Simbolul utilizat 2 6 - 5,50 30,25 aritmetice: = n 12 3 9 - 2,50 6,25 pentru desemnarea mediei este adaptat pentru 4 12 0,50 0,25 5 7 - 4,50 20,25 populaie. n continuare, aplicm formula pentru 6 13 1,50 2,25 calcularea abaterii standard. n primul rnd vom calcula 7 8 - 3,50 12,25 variana, dup formula pentru date negrupate, apoi 8 10 - 1,50 2,25
9 10 11 12 17 15 14 11 138 5,50 3,50 2,50 - 0,50 30,25 12,25 6,25 0,25 143

143 = 11,91 . Pentru 12 n calcularea abaterii standard extragem rdcin ptrat

abaterea standard: 2 =

din varian: = 11,91 = 3,45 .

S presupunem c prelevm la ntmplare un eantion din doi subieci n aceast populaie i s ncercm de a prezice cu un prag de ncredere de 95% (deci un risc de eroare de 5%) intervalul de fluctuaie a mediei acestui eantion. Tabelul legii normale centrate reduse ne furnizeaz pentru un risc de 5% o valoare z egal cu 1,96. Pentru a afla aceast valoare z = 1,96 cutm n celulele tabelului legii normale reduse valoarea 0,05. Valoarea z corespunztoare va fi 1,96. Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0, 0,1 . . . .. .. .. . 1,90 0,0500 Deci, dincolo de intervalul valoric 1,96z + 1,96z nu mai rmne dect 5% din suprafaa curbei. Deci, intervalul de fluctuaie a mediei unui eantion extras la ntmplare din populaie se poate afla 3,4 = 11,5 4.10 . Deci, cu un risc de eroare de 5% putem s aplicnd formula: IFE = 11,5 1,96 x 2 estimm c media eantionului poate oscila ntre 7.40 (11,5 - 4,10) i 15.60 (11,5 + 4,10) Dac privim tabloul datelor culese prin examinare observm c marea majoritate a mediilor eantioanelor se ncadreaz ntre aceste limite fixate de medie i abaterile erorii standard (pentru a verifica acest lucru putem s facem media a cte dou valori din populaie pe care s-a exemplificat).

II.4. CONTROLUL PARAMETRILOR DE FLUCTUAIE Marja de fluctuaie depinde de 3 parametri care nu exercit acelai grad de influen asupra amplitudinii intervalului. Pragul de ncredere. Creterea amplitudinii intervalului de ncredere are efect direct asupra concluziilor care se pot trage. Se poate ajunge la dou concluzii diferite (opuse n aparen) dup nivelul de ncredere ales. Este foarte important de a determina bine nivelul de ncredere care se acord estimaiilor noastre, dac nu dorim s ajungem la concluzii eronate.
112

STATISTIC (II)

Variana este dificil controlabil pentru c ea rezult din msurtorile efectuate n populaie. Precizia este cu att mai important (intervalul va fi mai ngust n jurul mediei) cu ct dispersia va fi mai mic, dar nu se poate ntlni situaia n care variana s nu acioneze asupra valorii. Micorarea valorii varianei ntr-o populaie nu este posibil dect dac se identific n populaie indivizii care produc cea mai mare dispersie (i de constatat dac ei nu sunt bolnavi n momentul efecturii unei probe psihologice, dac au neles ceea ce li se cere, dac au mai fcut ceea ce li se cere pe cnd alii nu au fcut). Pe scurt, trebuie s se verifice echivalena factorilor de variaie pentru fiecare subiect. Mrimea eantionului. A priori, nimic nu ne mpiedic s folosim atia indivizi ci dorim pentru cercetare. n schimb, se pune i problema costului general care corespunde mririi numrului de indivizi. Mrirea eantionului nu este proporional valorii sale, ci rdcinii ptrate a acestei valori. Dac dorim o precizie de zece ori mai mare este nevoie de sute de ori mai muli indivizi. Ctigul obinut n termeni de precizie nu este liniar. Populaia printe de mare dimensiune (de ordinul milioanelor) se poate examina sau chestiona n proporie de 50%, 20% , 10%.5% sau 1 %. Este foarte probabil ca energia mobilizat s nu fie proporional ctigului realizat. Institutele de sondaje recomand cel mai bun compromis ntre gradul de precizie i costul financiar al sondajului. Dac avem
stabilite valorile celorlalte variabile ale marjei de fluctuaie (MF = z*

) putem s stabilim mrimea

efectivului eantionului pentru un prag de ncrederea dat). EXEMPLU Din aplicarea unui test de inteligen la o populaie rezult o medie egal cu 240 i o abatere standard egal cu 22, n condiiile n care distribuia este normal. Se dorete s se determine, la un risc de 2%, care va fi numrul de subieci necesari ai unui eantion testat pentru a obine o marja de fluctuaie de 5,70. Deci, MF = 5,70. Pentru un prag de ncredere de 98% sau pentru un risc de eroare de 2% valoarea lui z este egal cu 2,32.
5,70 = 2,32 * 484 484 22 5,70 22 22 22 2 = = 78,81 ;? = ;6,141 = ; ;2,478 = ;2,478 2 = 6,141 ? ? ? 2,32 ? ?

Putem trage concluzia c un eantion care are 79 de indivizi corespunde riscului ales. Determinarea altor parametri de fluctuaie. Este inutil de a aciona asupra mrimii celorlali doi parametri de fluctuaie. Cineva nu poate schimba rezonabil valoarea dispersiei observate n populaie. Aceasta nseamn s relum msurtorile asupra populaiei. A lua un nivel de risc inferior lui 5% se dovedete se dovedete a fi o procedur inadecvat, deoarece exist riscul de a elimina inutil anumite eantioane care pot fi conservate.

II.5. INTERVALELE DE FLUCTUAIE A MEDIILOR PROVENIND DINTR-UN

EANTION

Pn acum s-au estimat intervalele de fluctuaie a mediilor eantioanelor plecnd de la caracteristicile cunoscute ale populaiei. n cazul fluctuaiei mediei eantionului aveam cunotin de media i variana populaiei printe. n practica cercetrilor psihopedagogice se ntlnesc foarte rar astfel de cazuri. n majoritatea cazurilor nu cunoatem parametrii caracteriznd populaia printe din care s-a extras eantionul studiat. Mai frecvent se ntlnete situaia n care se dispune de un eantion despre care exist aprecierea c este cel mai reprezentativ posibil din populaie (deoarece s-au utilizat
113

AUREL STAN

toate mijloacele pentru ca el s fie aa), i nu se dispune de parametrii populaiei permind un asemenea control. Prezint interes, de asemenea, de a ti n ce msur aceste medii pot s reprezinte populaia sau populaiile printe din care au ieit (a se vedea modelizarea principiului urnei.) De aceast dat obiectivul este de a gsi ceea ce conine urna pornind de la informaiile coninute n eantion. Aceast extrapolare nu se poate face dect lund informaii de la eantionul studiat.

II.6. INFERENA ASUPRA MEDIILOR POPULAIEI Curba valorilor mediilor eantioanelor extrase dintr-o populaie este una normal, cnd se extrage un numr suficient de indivizi dintr-o populaie n care distribuia este normal (doar cnd mrimea eantionului este suficient de important). n caz contrar curba de repartiie a datelor eantionului tinde sa ia o alur complet diferit. n cazul n care eantionul este de mic mrime, deci cnd efectivul su este puin important, curba de distribuie nu mai urmeaz legea centrat redus, ci o lege a lui Student. Mrimea de demarcaie ntre eantioanele mici i eantioanele mari este fixat de muli autori la cifra 30. Cnd mrimea este superioar cifrei 30 forma legii lui Student tinde a se confunda cu legea normala de distribuie Gauss-Laplace. Legea lui Student ca i legea centrat redus permite de a determina probabilitatea de apariie a abaterilor teoretice de la medie. Aceste abateri sunt desemnate prin litera t (ca z n legea normal centrat redus). Ca i distribuia normal, distribuia lui t este simetric. Ea se caracterizeaz printr-o medie egal cu 0, dar abaterea sa standard depinde de un numr de grade de libertate (notate n anexa referitoare la legea t a lui Student prin f). Numrul gradelor de libertate depinde de mrimea eantionului. Influena pe care o exercit mrimea eantionului este proporional cu rdcina ptrat a valorii sale. Se ajunge la un moment n care mrimea are puin influen asupra variaiei mrimii studiat. A avea 10 indivizi mai mult sau mai puin nu schimb aproape cu nimic estimaia cnd se lucreaz cu mari eantioane cuprinznd mai multe sute de indivizi. Nu acelai lucru se ntmpl cnd se lucreaz cu eantioane de mic mrime. Cnd mrimea eantionului va fi inferioar sau egal cu 30 vorbim de mici eantioane i inferenele pe care noi le producem se vor fonda pe legea t a lui Student. Cnd mrimea eantionului va fi superioar la 30 vorbim de mari eantioane i inferenele se fondeaz pe legea normala centrat redus. Dac utilizm tabele ale lui t pentru eantioane a cror mrime este superioar lui 30, aceasta nu constituie o eroare. La acest nivel valoarea lui t este apropiat de aceea a lui z nct acest fapt nu afecteaz dect zecimalele erorii standard a fluctuaiei. EXEMPLU FICTIV. Capacitatea de memorare de scurt termen. Se prezint unui numr de 326 de elevi de liceu o lista cu 20 cuvinte pe display-ul unui monitor (un cuvnt la fiecare 2 secunde). Ulterior se verific numrul de cuvinte pe care subiecii le pot reproduce. Media numrului de cuvinte reamintite este de 8,40, n timp ce abaterea standard este egal cu 2.58. Obiectivul cercetrii este de a estima cu un risc de eroare de 5% (sau cu un prag de ncredere de 95%) media populaiei din care sunt extrai elevii care compun eantionul. Este vorba de un eantion mare, deoarece efectivul eantionului depete cifra 30. s n cazul acesta IFP = X z * N

114

STATISTIC (II)

Deosebirea ntre formulele utilizate pn acum const n faptul c abaterea standard a populaiei a devenit abaterea standard a eantionului. Valoarea tabelar a lui z = 0,05 va fi 1,96. Pentru aplicaie: 2,58 2,58 = 8,40 1,96 * = 8,40 0,27 IFP = 8,40 1,96 * 18,05 326 Limita inferioar a intervalului de fluctuaie a mediei populaiei va fi 8,13 (8,40-0,27), iar limita superioar 8,67 (8,40 + 0,27). Cu riscul de eroare de 5% se estimeaz ca media populaiei printe va fi cuprins n intervalul marcat de valorile 8,13 i 8,67. Intervalul de fluctuaie pentru mici eantioane. Menionm c pentru calcularea intervalului de fluctuaie a mediei populaiei pornind de la valorile cunoscute ale indicatorilor eantionului nu exist diferen n privina formulei. Este important ca datele s prezinte o curba de form normal. EXEMPLU. Eantion de 17 copii care prezint tulburri de comportament ntre 6 si 8 ani3. Se relev cu ajutorul unei grile, comportamentele agresive provocate de copiii prezentnd tulburri de comportament n diferite perioade ale jocului colectiv cu copii care nu prezint astfel de tulburri. Din cele 60 de comportamente caracteristice ale agresivitii n timpul jocului s-a obinut o medie de 28,53 i o abatere standard de 8.10. Obiectivul cercetrii este de a realiza un studiu comparativ cu o cercetare identic n care toi copiii manifest respectivele tulburri de comportament. Se dorete a se determina intervalul de fluctuaie a medie la un risc de 1%. n acest caz numrul de grade de libertate va fi de 17-1=16. Se gsete valoarea 2.92. n condiiile legii centrate reduse s-ar fi gsit valoarea de 2,58. Prezentm schematic modul de detectare a valorii t din tabela legii lui t a lui Student, pentru un risc de eroare de 1%.
p f 1 2 16 0,20 0,10 Valori ale pragului de risc p 0,05 0,02 0,01 0,001 0,0001 0,00001

2,92

. Din punerea n aplicare a formulei rezult: N 8,10 8,10 IFP = 28,53 2,92 * = 28,53 2,92 * = 28,53 2,92 *1,96 = 28,53 5,74 4,12 17 La un risc de 1% sau la un prag de ncredere de 99% media populaiei se va situa ntre 22.79 (28,53-5,74) i 34,27(28,53 + 5,74). Populaii finite. n cazul n care se poate evalua cu o precizie corect mrimea populaiei n interiorul creia se preleveaz un eantion, se convine, n fapt, s se considere finit aceast populaie. EXEMPLU: numrul de locuitori ai unei ri. n acest caz se cunoate aproximativ numrul de indivizi care au calitatea cerut pentru a aparine populaiei definite. Gradul de precizie va fi funcie de importana general a populaiei. Astfel, a omite cteva zeci de mii de muncitori din nu este prea grav dac populaia respectiv numr 50 de milioane ntr-o ar. Situaia se modific dac studiul se efectueaz asupra cercettorilor tiinifici dintr-o ar.
Exemplu preluat din Nicolas Gueguen, op.cit.

Formula este urmtoarea: IFP = X t *

115

AUREL STAN

Populaii infinit. Populaia infinit este o populaie la care nu se poate determina numrul sau populaia al crei numr crete fr ncetare. Astfel, pentru utilitatea cercettorilor psihologi nu se tie numrul persoanelor care sufer de o anumit fobie, a persoanelor care iubesc animalele de cas. n unele cazuri, lucrurile au o evoluie foarte rapid nainte ca cineva s poat determina mrimea populaiei. Astfel, n informatic populaia aa-zis a "interneilor" variaz foarte rapid. n acest caz putem s cunoatem indivizi din aceast populaie, dar numrul lor exact nu-l putem afla.

116

STATISTIC (II)

III.TEORIA TESTELOR N STATISTIC


III.1. CONSIDERAII PRELIMINARE n statistic testul este o procedur de calcul pentru verificarea unor ipoteze emise anterior. Deci, testul statistic este util, mai ales, n condiiile n care dorim s afirmm sau s infirmm o ipotez. Pentru a afirma sau infirma validitatea ipotezelor n statistic se dispune de un numr mare de teste statistice. Astfel, exist, teste care compar mediile ntre ele, teste care compar proporiile ntre ele care compar varianele, teste care studiaz legturile ntre variabile. Cea mai curent clasificare este ntre teste statistice de difereniere (teste care compar mediile ntre ele, teste care compar proporiile ntre ele) i teste statistice de asociere (care studiaz legturile ntre variabile). nainte de punerea n aplicare a unui test statistic trebuiesc formulate dou ipoteze, n general opuse, care vor fi alternativ testate pentru a ajuta cercettorul sau practicianul n ceea ce el i propune s realizeze. Ipoteza de nulitate Aceast ipotez statistic mai este denumit ipoteza de nul i este, n general, notat cu H0. Ipoteza de nul presupune c diferenele constatate ntre doi indicatori supui analizei sunt nesemnificative, legate de factori aleatori rezultnd din variaia eantionajului i nu din unul sau mai muli factori sistematici, explicnd ceea ce un cercettor a observat. A formula ipoteza de nul nseamn a afirma ca nu exist nimic diferit, c toate msurile sunt egale, c medii diferite sunt de fapt identice, c proporii neechivalente sunt identice n semnificaie. nseamn a spune c diferenele observate depind de hazard i nu de un alt factor. Ipoteza alternativ. Este ipoteza pe care o formuleaz cercettorul care a prelevat unul sau mai multe eantioane dintr-o populaie, care a manipulat sau studiat mai multe variabile i care gndete c ceea ce el a observat nu este legat de fluctuaii fireti de eantionare, ci de unul sau de mai muli factori determinani. Aceast ipotez, notat n general cu H1, arat c hazardul nu poate s explice rezultatul care s-a obinut. Dup ce o anumit ipotez a fost formulat, poate fi practicat testul care va putea susine o astfel de ipotez mai mult dect alta. Ipoteza nul este cea care este totdeauna testat. n urma acestui demers sunt posibile dou alternative: ipoteza nul este conservat i, n acest caz, nu se poate adopta punctul de vedere al ipotezei alternative; ipoteza nul este respins i, n acest caz, se poate reine ipoteza alternativ. n realizarea testelor statistice se pot ntlni dou tipuri de erori: erori de tip I i erori de spea II. n tabelul care urmeaz prezentm schematic condiiile de apariie a acestor erori. Decizia H0 acceptat Ho respins Ho adevrat Decizie corect Eroare de tip I Ho fals Eroare de tip II Decizie corect

Deci, exist riscuri att prin acceptarea H0, ct i prin respingerea H0. Probabilitatea de a respinge ipoteza de nul, n timp ce aceasta este adevrat se numete, eroare de prima spe sau
117

AUREL STAN

eroare de tip I. Aceast eroare se numete pragul de ncredere sau de semnificaie a unui test. Valoarea sa fixeaz riscul pe care cineva i-l ia un cercettor spunnd c ceea ce se observa este legat de un factor sistematic mai curnd dect de fluctuaiile normale ale eantionrii. Acest tip de risc se fixeaz la 5% sau 1% (se poate reduce dac condiii imperioase justific acest lucru. Probabilitatea de a accepta ipoteza nul, n timp ce aceasta este fals este numit eroare de a doua spe sau eroare de tip II. Este riscul pe care cineva l ia de a spune c ceea ce s-a observat este legat de fluctuaii normale ale eantionrii, pe cnd n realitate aceste observaii sunt explicate printr-un alt factor sau prin ali factori. n mod paradoxal, erorile de tip I si tip II sunt strns legate. Diminund eroarea de tip 1 crete, n acelai timp, eroarea de tip II, i mrind eroarea de tip 1 se diminueaz eroarea de tip II. Deoarece este dificil; de a fixa un compromis ntre cele 2 riscuri de eroare, pragul fixat pentru fiecare din aceste riscuri va fi n funcie de miza inferenelor, voina sau lipsa voinei de a detecta factorul activnd variaia (factorul sistematic) eantionului pe care cineva l utilizeaz, de caracterului novator sau lipsit de aceast caracteristic al rezultatelor. Se va putea reduce riscul de a doua spe fr a modifica riscul primei spee, optimiznd metoda de eantionare, prelevnd indivizi suplimentari, utiliznd anumite tipuri de teste sau optnd pentru un test unilateral mai curnd dect bilateral. Testul unilateral poate obine doar rezultate pozitive, pe cnd cel bilateral poate obine rezultate pozitive i negative.

III.2. TESTE PARAMETRICE I NEPARAMETRICE Folosirea unui anumit test depinde de tipul de scal de msur utilizat pentru a culege informaia statistic. Uneori se poate folosi un test independent de scal pentru c distribuia nu ofer caracteristici de form i de dispersie necesare pentru folosirea acestui test. Se pot distinge dou familii de teste statistice: teste parametrice, n care concluziile se sprijin pe legea probabilitii care certific c distribuia sau distribuiile observate respect anumite caracteristici; teste nonparametrice care nu necesit respectarea acestor caracteristici. Testele parametrice prezint urmtoarele exigene: datele distribuiei trebuie s se repartizeze n maniera "normal", adic, n ali termeni, curba trebuie s aib o form apropiat aceleia a legii normale; datele de care se dispune s provin din scala de msur de interval (cel puin); varianele acestora trebuie s fie omogene, adic nu trebuie s existe dezechilibre importante ale dispersiilor, n cazul n care se cere compararea mediilor a dou eantioane. Aceste trei condiii trebuie s fie verificate naintea oricrei folosiri a unui test parametric. Dac condiiile sunt ndeplinite cercettorul sau practicianul are la dispoziie un evantai de teste puternic, pentru c ele permit de a diminua riscul de a doua spe. Dac una din condiii nu este ndeplinit (i a fortiori toate trei) se risc de a respinge pe nedrept ipoteza de nulitate, adic de a observa diferene i relaii acolo unde ele nu exist. Testele nonparametrice pot s se elibereze de aceast condiie de normalitate sau de echivalen a dispersiilor. Ele sunt independente de un anumit tip de distribuie sau, cum se mai spune, au o distribuie liber. Un alt mare avantaj al acestor teste este acela ca ele nu cer s se dispun de eantioane de mare dimensiune. n schimb, prezint inconvenientul de a fi mai puin puternice ca
118

STATISTIC (II)

testele parametrice, adic informaia pe care o ofer este mai puin consistent. Consecina acestei slbiciuni poate s conduc la creterea riscului de a doua spe, la concluzia c nu exist nimic difereniat, pe cnd n realitate exist unele diferene.

III.3. COMPARAIA MEDIILOR Principalele test. Realizarea tipurilor de teste pentru compararea mediilor pleac de la premisa c eantioanele care se obin dintr-o populaie se situeaz mult mai frecvent n intervalul de fluctuaie al populaiei studiate. Acest principiu poate fi neles la diferena dintre dou medii provenind din eantioane diferite. Se consider c fluctuaiile de eantionare pot s conduc la diferene, dar c frecvenele acestor diferene se repartizeaz de manier neomogen. Astfel probabilitatea de a obine o diferen nul (mediile s fie identice) este cazul cel mai frecvent, n timp ce probabilitatea de a obine o diferen nenul este teoretic mai puin frecvent, cu att mai mult cu ct amplitudinea acestor diferene este mai mare. EXEMPLU: Se aplic unei populaii de 8 subieci o prob de dexteritate manual la care scorul maxim este 18. Scorurile obinute sunt urmtoarele:
Subiect Scor 1 9 2 11 3 14 4 10 5 12 6 13 7 8 8 16 9 15

Se preleveaz la ntmplare doi subieci (S1 i S2) n aceast populaie i se face diferena scorurilor lor (S1 S2). Aceasta trebuie s corespund uneia din diferenele din cele dou tabele. Subiectul 2 8 9 10 11 12 13 14 15 16 8 9 10 11 12 13 14 15 16 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Subiectul 1 8 9 10 11 12 13 14 15 16 -1 .2 -3 .4 -5 -6 -7 -8 -1 -2 -3 -4 -5 -6 -7

1 2 3 4 5 6

1 2 3 4 5

1 2 1 3 2 1 4 3 2 1

-1 -2 -3 -4 -5 -6

Subiectul 1

Subiectul 2

-1 -2 -3 -4 -5

-1 -2 -1 -3 -2 -1 -4 -3 -2 -1

Prezentm, n continuare, un tabel cu efectivele diferenelor posibile n valoare absolut. Observm c cea mai mic diferen este egal cu 1 (n valoare absolut) i cea mai mare diferen este egal cu 8. Amplitudine diferenei Frecvene absolute(efective) Frecvene relative ( n %) 1 16 22 2 14 19 3 12 17 4 10 14 5 8 11 6 6 8 7 4 6 8 2 3 Total 72 100

119

AUREL STAN

Cu ct amplitudinea diferenelor este mai important cu att probabilitatea unui subiect de a fi obinut o astfel de diferen este mai slab. Se pune urmtoarea ntrebare la testul de comparare a mediilor: Care este probabilitatea pe care o vom avea de a obine o astfel de diferen prin hazardul eantionrii?. Testele de comparare a mediilor vor s rspund cu precizie la aceast ntrebare, evalund probabilitatea de a obine n manier aleatorie toate diferenele observate. Dac aceasta probabilitate este superioar unui prag, fixat prin convenie la 5%, atunci se estimeaz ca diferenele sunt imputabile hazardului eantionajului. Se va conserva atunci ipoteza nul. Dac aceast probabilitate va fi egal sau inferioar acestui prag, atunci se va respinge ipoteza de nul i se va propune ipoteza alternativ. Atunci se va concluziona c diferena este statistic semnificativ i c diferena este imputabil efectului variabilei sau variabilelor pe care cineva a putut s le manipuleze. Exist totdeauna, n schimb, un risc ca diferenele s fie imputabile hazardului eantionrii. Un test de comparaie a mediilor nu trebuie s se efectueze dect plecnd de la distribuii de date provenind din scale de msur de interval i de raport. Testele de comparare a mediilor sunt teste parametrice i, deci, la efectuarea lor, cercettorul trebuie s verifice conformitatea caracteristicilor distribuiei cu ateptrile statisticianului. Distribuiile studiate trebuie s fie normale i variantele lor trebuie s fie echivalente. Dac lucrurile stau aa, atunci se dispune de instrumente statistice care devin "parteneri" foarte fiabili n procesele de decizie care se pun n oper. n majoritatea cazurilor, aceasta se verific grafic, comparnd valorile parametrilor.

III.4. COMPARAREA UNEI MEDII LA O NORM Norma poate s mbrace diverse accepiuni, funcie de fenomenul studiat sau de cmpul de studiu, chiar de disciplina tiinific. Statisticienii impun aici o valoare, care reprezint o valoare ateptat a mediei, avnd foarte puin importan dac este o valoare ntreag sau fracionar, dac este pozitiv sau negativ. Este imperativ ca valoarea s se exprime sub form numeric. Psihologul trebuie s se acomodeze la aceast constrngere, exprimnd fenomenul psihologic sub forma unei valori numerice. Media nu poate s rmn la starea de definiie conceptual. n psihologie, norma poate s fie un efect ateptat (memorizarea medie a 7 elemente de informaie) sau cunoaterea prealabil a unui fenomen psihologic pentru care se dispune de o norm provenind de la o populaie (media QI-ul, media naional a rezultatelor unui test colar). Ea poate, de asemenea, s se caracterizeze printr-o valoare ateptat de ctre un cercettor sau un practician, care estimeaz c o poat justifica teoretic. De asemenea, norma poate s fie o valoare nul ntr-o sarcin oarecare de polarizare. n toate cazurile, exploatarea sa va fi aceeai. Testul statistic va avea drept obiectiv de a verifica dac diferena dintre media unui eantion (media observat) i valoarea numeric acordat normei poate fi atribuit la un factor aleator (factor legat de o eroare de eantionare) sau de un factor sistematic (variabila independent, manipulat sau determinat). Ipoteza unui factor sistematic (numita H1 ) este adoptat dup ce s-a respins ipoteza unui factor aleator (numit H0). Metoda de calcul. Obiectivul testului este de a rspunde la ntrebarea urmtoare: Care este probabilitatea ca diferena observat ntre media unui eantion i media normei s poat fi atribuit fluctuaiilor normale de eantionare? Exist mai multe metode de a rspunde, dar a fost aleas aceea care permite de a evalua cu exactitate probabilitatea de a obine prin hazard de eantionaj o astfel de
120

STATISTIC (II)

diferen. Formula pentru diferen dintre o medie de eantion i o norm este asemntoare cu formulele gsite anterior.
z= X (norma ) s ( ) N

n care: z = variabila normat redus

X = media eantionului = media populaiei s = abaterea standard a eantionului N = efectivul eantionului = abaterea standard a populaiei. n parantez au fost trecute simboluri alternative. Formula este un raport ntre diferena a dou medii cu eroarea standard asociat acestei diferene. Norma este numit n acest caz media populaiei, pentru c funcia principal a testului este de a spune dac se poate considera sau nu eantionul ca fiind prelevat din populaia printe din care este extras. Fluctuaia eantionrii face posibil apariia unei infiniti de medii de eantion. Rmne de tiut care poate fi probabilitatea de a obine n aceast populaie, un eantion de aceeai medie ca aceea care s-a observat practic. Examinnd formula se poate observa c indicele obinut nu este nimic altceva dect o abatere pe care cineva o va putea situa n spaiu unei legi de distribuie, aa cum s-a fcut cu valoarea unui subiect. S-a substituit, deci, valorii unui subiect valoarea unei diferene. O astfel de evaluare presupune luarea n considerare simultan a mai multor elemente: amplitudinea abaterii ntre medii: cu ct amplitudinea se mrete, cu att mai puin are ea anse de a se ntlni prin hazardul eantionrii; variana asociat acestei abateri: cu ct aceasta este mai slab cu att abaterea redus este mai mare. Formula ia n calcul dou cazuri: primul este acela n care variana populaiei (variana asociat normei) este cunoscut, n acest caz se ia n calcul variana populaiei. Al doilea caz, n general mai frecvent, este acela n care variana populaiei este necunoscut i, n aceast situaie, aceasta este estimat prin variana eantionului (estimaie fr contorsionri); mrimea eantionului: cu ct mai mult diferenele se observ la marile eantioane, cu att mai mult factorii susceptibili de a exprima diferena pot s se exprime. Influena mrimii eantionului este proporional rdcinii sale ptrate. Abaterea dintre dou medii este deci ponderat de valoarea numitorului care, odat mai mult, depinde de dou variabile: dispersia (sau variana) i mrimea eantionului. Cu ct variabilitatea este mai redus cu att mai mult indicele final (abaterea redus) are anse de a fi mare i deci ipoteza de nulitate are mai multe anse de fi respins. n cazul n care variana populaiei este cunoscut formula sufer o uoar modificare, sugerat de noi n formula precedent. Prin variana populaiei se nelege variana asociat mediei populaiei (aceea care corespunde normei). Abaterea redus se obine fcnd raportul urmtor:

z=

121

AUREL STAN

Semnificaia simbolurilor utilizate n formul este cunoscut. Cazurile n care cercettorul posed o informaie asupra varianei populaiei (populaie din care eantionul comparat a fost extras) sunt puin frecvente n cercetarea psihopedagogic. n majoritatea situaiilor de cercetare, variana populaiei nu este cunoscut cu certitudine, i se consider ca atare. Este cazul n care cercettorul dispune de msuri anterioare fcute cu un eantion de foarte mare mrime, extras cu cel mai mare respect faa de regulile eantionrii. Este, de asemenea, cazul n care msura a fost repetat n multiple circumstane (cu multiple eantioane), situaie n care ea ofer un indice de variabilitate particular constant. Variana ca valoare a normei poate fi determinata fr ca s existe, n mod necesar, o msur prealabil a acesteia. Ea poate s se justifice printr-un model teoretic, independent de toate msurtorile efectuate. Aplicaie. NUMRUL MAGIC. Cercetrile destinate evalurii memoriei de scurt termen arat c aptitudinea de memorizare imediat pentru diferite informaii este de 7 2. n scopul de a verifica dac aceast limit o posed i liceenii, doi cercettori au prezentat o serie de 18 cuvinte comune la 193 elevi. Cuvintele apar pe display-ul, un cuvnt la dou secunde. Imediat dup proiecia listei, subiecii trebuie s-i aminteasc, ct mai repede posibil, cuvintele prezentate pe display. Media amintirii liceenilor este de 7,13. Cercettorii se ntreb dac, adoptnd riscul de 5%, scorul mediu al rezultatului asupra liceenilor este diferit de acela n general observat n lucrrile anterioare. n acest caz valoarea 7 este considerat o norm, iar 2 abaterea standard. Formula de calcul este urmtoarea: 0,13 0,13 7,13 7,00 z= = = = 0,909 2 2 0,143 13,89 193 z teoretic, dat de legea normal centrat redus, este de 1.96 la riscul de 5% (fixarea acestei valori a fost fcut anterior). Valoarea z calculat de noi este mult inferioar valorii tabelare. La riscul de 5% nu se aduce proba unei diferene ntre cele dou probe comparate. Ipoteza de nulitate trebuie s fie conservat. Eantionul liceenilor poate fi considerat ca aparinnd populaiei din care a fost extras. Diferena de reamintire de 0.13 poate fi atribuit fluctuaiilor normale de eantionare. Se poate, deci, considera c aceast diferen nu are nimic excepional.

III.5. CAZUL N CARE VARIANA POPULAIEI ESTE NECUNOSCUT n cercetarea psihopedagogic este rar situaia n care se dispune de elemente de informaie cantitativ precis asupra populaiei, plecnd de la care este extras eantionul studiat. n situaia n care variana populaiei nu este cunoscut se ia n consideraie variana eantionului pentru estimarea erorii standard. Va fi o estimaie fr deformare. Indiferent dac este vorba de mici sau mari eantioane, formula de comparaie a unei medii la o norm este totdeauna aceeai.
X (norma) . s N Alegerea acestora depinde esenial de mrimea eantionului. Dac mrimea eantionului este inferioar sau egal cu 30 indicele, ales este t-ul a lui Student. Tabela consultat va fi tabela t a lui

t sau z =

122

STATISTIC (II)

Student. Dac aceast mrime este superioar lui 30, atunci indicele ales va fi z. Tabele de referin va fi, deci, legea normal centrat redus.

III.6. COMPARAREA A DOU MEDII OBSERVATE Situaia n care se dispune de o norm numeric sau de o medie a populaiei nu este cea mai frecvent n psihologie i n alte disciplinele tiinifice i experimentale. n majoritatea cazurilor se compar ntre ele distribuii ale datelor provenind din dou eantioane. Faptul c nu se dispune de norme sau de medii ale populaiei (n psihologie i alte discipline) este legat de dou particulariti: amplitudinea rezultatelor din domeniul psihologiei; specificitatea metodologic a studiului acestor rezultate. Cnd se concepe un plan de studiu original, cu instrumente de msur i ipoteze originale, cercettorul nu este n msur de a avea la dispoziia sa o medie a populaiei sau chiar o anumit idee a valorii pe care aceasta trebuie s o ia. Originalitatea unui cmp de cercetare, originalitatea unei variabile independente manipulate sau originalitatea unei ipoteze teoretice propuse provin n majoritatea timpului din faptul c nimic nu a fost studiat, fcut sau propus anterior. Un cercettor nu-i pierde timpul relund cercetri la care concluziile se cunosc foarte bine. n situaia n care nici o informaie nu este disponibil cercettorul se vede obligat de a recurge la compararea a dou eantioane. Chiar situaiile experimentale cele mai simple, care compar un grup de control cu un grup supus la aceleai condiii experimentale ca i grupul de control, dar afectat printr-o variabil suplimentar, trebuie adesea s fac apel la dou grupe de subieci, apoi de a le compara pentru a "aprecia" efectul variabilei suplimentare. Obiectivul principal este de preciza dac dou eantioane observate pot fi considerate ca fiind extrase din aceeai populaie. Testele de comparare a dou medii ne dau probabilitatea de a obine a astfel de abatere ntre medii, prelevnd din aceeai populaie dou eantioane de subieci. Dac aceast probabilitate este rar, n general inferioar lui 5% , se consider c eantioanele nu provin din aceeai populaie.

III.7. COMPARAREA A DOU MEDII PROVENIND DIN EANTIOANE INDEPENDENTE Eantioanele independente sunt eantioanele n care indivizii care le compun (indivizi luai n sens larg pentru c poate s fie vorba de persoane, de grupuri, instituii) sunt totdeauna diferii sau n care alegerea unui individ ntr-un eantion nu influeneaz alegerea altui individ n alt eantion. Deci, indivizi care nu pot fi afectai dect n unul sau altul din eantioanele comparate. Cazul n care variana populaiei este cunoscut. Situaie puin frecvent n psihologie, ntlnit, totui n cazul replicrii experienelor sau n cazul n care se dispune de informaii numerice provenind din precedentele studii. De asemenea, se poate estima c variana fiecruia din eantioane trebuie s aib o asemenea valoare (provenind din studii anterioare). De asemenea, se poate estima c variana este constant (aceeai pentru cele dou eantioane). Desigur, se presupune c aceasta se justific teoretic i doar responsabilitatea aceluia care face aceast estimaie poate fi angajat. Formula este urmtoarea:

123

AUREL STAN

z=

X1 X 2

21

N1 N2 Exist puine diferene n comparaie cu metoda de determinare a abaterii reduse folosite anterior. Cazul n care variana populaiei este necunoscut. n cazul n care variana populaiei nu este cunoscut sau, cel puin, una din ele nu este cunoscut, se ia n consideraie variana eantioanelor pentru estimarea erorii standard. n acest caz trebuie s se in seama de mrimea eantionului. Metoda de determinare a abaterii reduse variaz dup mrimea fiecrui eantion i tabela de probabiliti care se aplic pentru a aprecia probabilitatea abaterii.

22

III.7.1. Cazul eantioanelor mari Condiia este ca mrimea eantioanelor s fie mai mare de 30 i distribuiile acestora s se conformeze legii normale. n acest caz se poate utiliza legea normal centrat redus pentru a testa probabilitatea de apariie a abaterii reduse obinute. Indicatorul de diferene va fi, deci, binecunoscutul z. z=

X1 X 2 s1 s22 + N2 N2
2

Exist puine diferene ntre aceast formul i cea utilizat anterior. Variana eantionului ia locul varianei populaiei. III.7.2. Cazul eantioanelor mici n cazul n care mrimea eantioanelor este egal sau mai mic dect 30 i cnd variana populaiei este necunoscut se estimeaz c repartiia eantioanelor diferenelor mediilor nu mai urmeaz o lege normal, ci o lege t a lui Student. Concluziile se vor baza pe legea t a lui Student, funcie de numrul gradelor de libertate care se aplic. Formula de determinare a abaterii reduse va fi n acest caz:
s1 * ( N 1 1) + s 2 * ( N 2 1) 1 1 + * N1 + N 2 2 N1 N 2 Gradul de libertate este egal cu N1+N2-2. S presupunem c avem dou eantioane mici independente cu urmtorii indicatori cunoscui :
2 2

t=

X1 X 2

X 1 =22, s21=3,2, N1 = 24 i X 2 =19,s22=2,6, N2=19. Vom aplica formula pentru efectuarea testului t.
T=

22 19 3,2 * (22 1) + 2,6 (19 1) 1 1 + * 22 + 19 2 22 19


2 2

3 = 11,24 * 21 + 6,76 * 18 * 0,041 * 0,0523 39


=

3 236,04 + 128,44 * 0,093 39

3 364,08 * 0,304 39

3 9,94 * 0,304

3 3 = = 3,26 3,05 * 0,304 0,92

124

STATISTIC (II)

Valoarea lui t egal cu 3,26 o vom compara cu valoarea tabelar a lui t pentru un prag de risc de 0,05 pentru 39 de grade de libertate. n tabel nu vom gsi valoarea 39, ci o valoare apropiat, valoarea 40 a gradului de libertate. Observm c valoarea tabelar gsit de noi (2,02) este mai mic dect cea calculat n testul t. Observm, de asemenea, c valorile tabelare mai mari corespund unor praguri de risc mai mici. Concluzia: vom respinge ipoteza de nul, deci, diferenele dintre mediile celor dou eantioane nu sunt ntmpltoare, ci se datoreaz interveniei unor factori sistematici. Formularea concluziei este urmtoarea: Dac vom respinge n mod constant ipoteza de nul n mai puin de 5% din cazuri o respingem pe nedrept, deci, n peste 95% din cazuri respingem pe drept ipoteza de nul.
p f 1 2 3 40 0,20 0,10 0,05 0,02 0,01 0,001 0,0001 0,00001

2,02

2,43

2,71

3,55

4,32

5,05

III.8. COMPARAIA A DOU MEDII PROVENIND DIN DOU EANTIOANE


MPERECHIATE SAU CORELATE

n cazul acestui gen de eantioane indivizii care le compun sunt aceeai n diferite etape ale prelevrii msurrilor sau posed similitudini care se pot considera, dup regruparea prin cupluri, ca echivalente (vrst, aptitudini cognitive, funcii ocupate). Msurile distribuiilor mperechiate sunt adesea calificate ca "msuri repetate". Din acest motiv calculul diferenelor mediilor i a variaiei se realizeaz "n interiorul" indivizilor i nu ntre indivizi. Operaiile se fac, deci, prin cupluri. Dup caz cuplurile se compun din aceeai indivizi cu dou msurtori, din indivizi "asemntori", avnd fiecare o msur distinct. Se presupune c indivizii sunt extrai n respectul tehnicii de eantionare i c distribuiile diferenelor n interiorul fiecrui cuplu se face ntr-un mod normal. Cazul micilor eantioane. Legea lui Student. Deoarece analiza se face n interiorul cuplurilor, pentru a obine indicele (aici t) corespunznd diferenei dintre cupluri, este suficient de a aplica formula urmtoare:
t= D sD N

n care:

D - media diferenelor cuplurilor de date (suma diferenelor ntre fiecare cuplu de date mprit la numrul de cupluri de date);
D 2 - abaterea standard a diferenelor. N Nu exist nimic fundamental diferit cu cea ce s-a vzut n cazul comparrii mediilor rezultate din eantioane independente. Se face totdeauna raportul ntre abaterea mediilor i eroarea standard asociat acestei abaterii. n cazul eantioanelor perechi abaterea ntre dou distribuii nu se aplic la media distribuiilor, ci pentru fiecare cuplu de date. Aici calculul abaterii ntre medii i mai ales acela al
125

sD =

AUREL STAN

abaterii standard se face de la diferenele coninute n fiecare cuplu de date. Pentru determinarea abaterii standard, numrtorul raportului nu este altul dect suma ptratelor abaterilor tuturor diferenelor observate n fiecare din cupluri prin raport la media acestor diferene. S presupunem c la acelai eantion mic de 14 de subieci am aplicat un test de atenie concentrat, nainte i dup efectuarea unei activiti obositoare care a durat mai multe ore. Rezultatele obinute naintea efecturii unei sarcini foarte obositoare le vom nota cu X i pe cele obinute dup efectuarea unei sarcini foarte obositoare le vom nota cu Y. Ceea ce prezint importan este faptul c ele provin de la aceeai subieci. Vom avea 4 etape de calcul: 1. Calcularea mediei diferenelor: Nr.crt. X Y D D2 1 72 70 5 25 D = 54 = 3,857 D= 2 64 60 4 16 14 N 3 81 80 1 1 2. Calculul varianei diferenelor: 4 87 83 4 16 5 65 62 3 9 D 2 D 2 = 234 3,857 2 = 16.71 14,87 . s2 = 6 69 63 6 36 N 14 7 70 65 5 25 s2 = 1,84 s=1,36. 8 89 86 3 9 3. Calculul erorii standard a mediei diferenelor: 9 76 71 5 25 s 1,36 1,36 10 64 61 3 9 sD = = = = 0,37. N 1 13 3,6 11 55 52 3 9 12 68 63 5 25 D 3,857 = 4. Calculul valorii t: t = =10,42. 13 65 60 5 25 sD 0,37 14 74 72 2 4 Dup ce am aflat valoarea lui t, vom compara valoarea 54 234 lui t tabelar cu cea calculat de noi la un anumit prag de risc. n cazul nostru concret pragul de risc adoptat este de 0,05 sau, exprimat procentual, 5%. Gradele de libertate se calculeaz dup formula: f = N-1, deci f = 141= 13. Valoarea tabelar comparat este valoarea aflat la intersecia liniei egal cu 13 i a coloanei 0,05. p 1 2 3 13 0,20 0,10 0,05 0,02 0,01 0,001 0,0001 0,00001

2,16

2,65

3,01

4,22

5,51

6,96

Observm cu uurin c valoarea tabelar (2,16) este mult mai mic dect valoarea calculat de noi (10,42). Drept urmare, respingem ipoteza de nul i adoptm ipoteza alternativ care susine c diferena dintre medii este semnificativ. n concluzie considerm diferenele ca fiind expresia interveniei unui factor sistematic.

Cazul marilor eantioane. Numr superior lui 30 .z =

D sD nr.cupl.

126

STATISTIC (II)

III.9. TEST CU O IEIRE, TEST CU DOU IEIRI Cunoatem faptul c ipoteza nul susine faptul c mediile eantioanelor sunt identice. Ipoteza alternativ susine faptul c mediile sunt diferite. n fapt, se pot propune 3 ipoteze alternative: mediile sunt diferite (ipoteza 1); media 1 este superioar mediei 2 (ipoteza 2); media 2 este superioara mediei 1 (ipoteza 3). Principiul primului caz este acela pe care noi l-am studiat n exemplele noastre. n statistic el poarta numele de test bilateral sau test cu dou ieiri. n cazul ipotezelor 2 i 3 se poate testa direct sensul unei diferene. Cnd exist ipoteza cu un sens se spune ca este vorba de un test unilateral sau test cu o singur ieire. Probabilitatea asociat acestui tip de test se gsete modificat prin raport la aceea care nsoete un test bilateral. Testul bilateral a fost cel studiat pn n prezent. EXERCIII 1. Dai exemple de populaii statistice cu care se opereaz n domeniul psihopedagogic, altele dect cele date n curs. 2. Examinarea unei populaii de subieci cu un anumit test a oferit urmtorii parametri: =78, =12. Calculai intervalul de fluctuaie a mediei unui eantion ce numr 45 de subieci, pentru pragurile de risc de 0,01; 0,05; 0,10. 3. Indicatorii unui eantion n urma prelucrrii datelor unei examinri, sunt urmtorii: X =49, s=8,4, N=39. Stabilii intervalul de fluctuaie a mediei populaiei din care s-a prelevat eantionul la pragurile de ncredere de 0,90; 0,95; 0,99. 4. Indivizii aceluiai eantion de subieci au obinut urmtoarele rezultate la o prob de atenie nainte i dup o solicitare psihic intens (X - rezultate nainte de solicitare, Y - rezultate dup solicitare). Stabilii dac diferena dintre mediile celor dou serii de rezultate este semnificativ sau nu este semnificativ. Folosii pragul de 0,05 ca prag de risc. Precizai dac infirmai sau confirmai ipoteza de nul. Cu ce fel de eantioane lucrm n acest caz ?
Nr.crt. 1 2 3 4 5 6 7 8 9 10 11 X 88 73 69 82 95 77 63 67 85 73 86 Y 83 72 68 82 93 72 62 65 79 70 84

127

AUREL STAN

IV. RELAIILE DE ASOCIERE DINTRE VARIABILE

Noiunea de relaie este foarte comun i i gsete ntrebuinare ori de cte ori este vorba de stabilit o legtur ntre dou serii de fapte, seria A i seria B. Chiar n cazul n care ntre cele dou serii de date exist o legtur accentuat nu poate fi vorba de a realiza o previziune cert n privina valorilor unei variabile plecnd de la valorile celeilalte. Dar pot exist mari anse ca dup A s apar B. Legtura dintre variabile nu se face simit doar printr-o succesiune temporal, ci i printr-o apariie simultan a lui A i B. Descrierea relaiilor este foarte important n psihologie, deoarece permite de a pune ordine n observaiile care pot fi fcute ntr-o mare diversitate a domeniilor de interes tiinific. Exemplu, n domeniul clinic este deosebit de important relaia dintre boal i simptom. n domeniul psihologiei colare poate fi fcut legtura ntre rezultatele la dou probe verbale. De asemenea, proveniena dintr-un anumit mediu familiar (ce prezint un specific n ceea ce privete nivelul cultural i metode educative) poate fi asociat cu anumite caracteristici individuale ale copilului. De asemenea, se poate constata c, n medie, coeficientul de inteligen al copiilor provenind din mediile favorizate poate fi mai mare dect al celor care provin din medii defavorizate. Constatarea este valabil doar referitor la medie, deoarece pot fi indicate cazuri n care copiii din mediile defavorizate au un coeficient de inteligen mai mare dect cei din mediile favorizate. Relaiile dintre variabile sugereaz ipoteze asupra surselor de variaie, deci, se pot constitui n suport pentru verificarea unor ipoteze cauzale. Exemplu, A poate fi una dintre cauzele lui B, i invers, B poate fi una dintre cauzele lui A. Statistica are un rol indispensabil, atunci cnd exist necesitatea de a stabili cnd variabilele A i B sunt ambele prezente, ambele absente, sau, cnd este prezent doar una dintre ele. n absena unei astfel de stabiliri se risc de a nu se raiona dect asupra cazurilor excepionale care vor reine mult mai pronunat atenia. Exemplu, cazurile de eec colar cazuri de reuit excepional. Un alt aspect este cel al coincidenei apariiei n comun a dou variabile. Exemplu, arlatanul care pretinde a descoperi sexul copilului dup ziua de natere a mamei i care n 50% din cazuri poate avea dreptate. Statistica ajut psihologul s nu se comporte ca un arlatan. Cu ajutorul statisticii se poate stabili ct de mult observaiile sale reale se ndeprteaz de observaiile ateptate i se poate verifica dac relaia ntre dou variabile este slab sau neglijabil. Cuvinte similare pentru relaie sunt nonindependen, asociaie, legtur stohastic, corelaie. Nu exist reguli stricte care s reglementeze folosirea acestui termen. n majoritatea situaiilor practice de prelucrare nu suntem n prezena unei singure variabile, ci a mai multora care variaz mpreun. Abordarea relaiei dintre dou sau mai multe variabile se face difereniat, n funcie de specificul acestora i de specificul demersului experimental. Pornind de la cele mai simple scale existente, scalele nominale, ne confruntm cu variabile calitative, adic variabile exprimate sub forma unor atribute. Aceste atribute pot avea anumite frecvene n studiul pe grupuri, care accepta un anumit tratament matematic, adaptat puterii informaionale a acestui tip de scale. n
128

STATISTIC (II)

studiul relaiilor dintre variabilele care satisfac exigenele scalelor ordinale i de interval ne vom ocupa de corelaiile simple, deoarece tratarea corelaiilor multiple depete cadrul acestei lucrri. De fiecare dat cnd se studiaz relaiile dintre variabile se urmrete punerea n eviden unor legturi cu stabilitate variabil, funcie de valoarea unor indici sau coeficieni. Atunci cnd stabilim o coresponden dintre dou variabile observm modul n care transformarea sau modificarea unei variabile dintr-o serie are legtur cu schimbarea survenit n cealalt serie.

IV.1. RELAIA NTRE DOU VARIABILE NOMINALE n privina variabilelor care satisfac exigenele scalelor nominale se utilizeaz foarte frecvent n cercetarea psihopedagogic testul 2 (se citete hi ptrat). Acest test statistic poate fi utilizat i n cazul variabilelor de interval, dar, din momentul folosirii, intervalele valorice i pierd caracterul ordonat cresctor, devenind simple clase de partiie. Testul 2 este un test introdus de Karl Pearson n anul 1904, deci are o utilizare relativ ndelungat, dac inem seama de perioada temporal n care s-a acordat psihologiei statutul de tiin. Variabila nominal este o variabil calitativ care poate prezenta cel puin dou modaliti sau categorii distincte. De exemplu, variabila sex este o variabil calitativ care prezint dou modaliti, masculin i feminin. Variabila anotimp are patru modaliti: primvara, vara, iarna, toamna obinute printr-o oarecare metoda de investigaie. Exist doua feluri distincte de a folosi testul 2 , care corespund unui anumit specific a modului de prezentare a datelor, i anume 2 de ajustare i 2 t de independen. n cazul testului 2 de ajustare suntem n prezena efectivelor observate ale unei singure variabile. Aceste efective sunt comparate fie cu alte efective observate, fie cu efectivele teoretice care se pot calcula n urma emiterii unei ipoteze, de obicei ipoteza de nul. n acest prim caz un cercettor poate s verifice dac un grup de persoane (selecionate pentru o cercetare sau un studiu) posed aceleai caracteristici generale cunoscute n rndul populaiei (cu date cunoscute n privina claselor de vrsta, categoriilor de sex sau provenienei sociale etc.). Se folosete de asemenea cnd dorim s cunoatem dac o distribuie de efective observate se conformeaz unei legi n care toate modalitile variabilei au teoretic aceeai probabilitate de apariie (echipartiia probabil a modalitilor). Formula general de calcul pentru testul 2 este urmtoarea:

2 =

( fo ft )2
ft

n care cu fo s-au notat efectivele observate, cu ft efectivele teoretice sau alte efective observate. Abaterea dintre efectivele observate sau reale i cele teoretice (fo-ft) este ridicat la ptrat pentru a evita situaia de anulare a sumei algebrice. Deci 2 nu poate avea dect o valoare pozitiv, fapt care-l plaseaz n rndul testelor cu o singur ieire (care presupune o singur alternativ de comparare). Avem dou ipoteze la ndemn:

129

AUREL STAN

Ipoteza nul, notat cu H0. n cazul testului 2 de ajustare aceast ipotez presupune c ntre cele

doua repartiii de date (repartiia empiric i repartiia teoretic sau ntre dou repartiii empirice) nu exist nici o deosebire (acestea sunt identice sau nesemnificativ deprtate). Ipoteza alternativ H1. Susine existena unei diferene semnificative ntre cele dou repartiii. Exprimarea rezultatului se face n form probabilistic. n cazul n care se adopt ipoteza nul, cea alternativ se respinge (i invers). Valoarea numeric obinut n urma efecturii testului 2 se compar cu valorile unui tabel specific, care conine valori teoretice, funcie de gradele de libertate. Aa cum am spus anterior, se accept un risc de eroare. Deci, ntr-un anumit numr de cazuri putem s ne nelm. n general, riscul de eroare acceptat este de 0,05, sau, exprimat procentual 5%, dar, n unele cazuri speciale, exigenele pot fi mai mari sau mai mici. n cazul n care valoarea numeric obinut n urma aplicrii testului 2 este mai mic dect cea aflat la intersecia gradului de libertate corespunztor (vom preciza modul de calcul a acestor grade) i pragul convenit de acceptare a ipotezei de nul (0,05) (valoare prag), atunci vom accepta ipoteza de nul i, n consecin, vom accepta faptul c ntre cele dou distribuii de valori nu exist o diferen semnificativ. Dac valoarea calculat este mai mare dect valoarea prag, atunci respingem ipoteza de nul. Formularea este urmtoarea: Dac respingem n mod constant ipoteza de nul, n mai puin de 5% din cazuri o respingem pe nedrept. Tabelul cu valorile teoretice ale repartiiei 2 se afl printre anexele lucrrii noastre. Cel mai ilustrativ exemplu pentru distribuiile de efective teoretice uniforme este cel cu faetele unui zar sau ale unei monede. EXEMPLU PENTRU 2 DE REPARTIIE. Dup aruncarea unei monede n sus i cderea acesteia pe o suprafa plan pot rezulta dou modaliti: cap sau coroan. Dac aruncm n sus moneda de un numr de 60 de ori putem obine urmtoarea repartiie empiric: Cap Coroan 28 32 Din punct de vedere teoretic fiecare din faete are anse egale de a fi obinut. Ca atare, distribuia teoretic va arta n felul urmtor: Cap Coroan 30 30 n cazul aruncrii efective a zarului de 900 de ori, putem avea urmtoarea repartiie empiric a faetelor: Faeta 1 Faeta 2 Faeta 3 Faeta 4 Faeta 5 Faeta 6 121 162 135 174 182 124 Distribuia teoretic se obine dup emiterea ipotezei c fiecare faet are anse egale de a aprea. Aceasta se prezint n felul urmtor: Faeta 1 150 Faeta 2 150 Faeta 3 150 Faeta 4 150 Faeta 5 150 Faeta 6 150

Att n primul ct i n al doilea exemplu observm diferene ntre distribuiile empirice (cele rezultate din aciuni practice de aruncare a unei monede sau a unui zar) i cele teoretice (rezultate n

130

STATISTIC (II)

urma emiterii unei ipoteze privind modul de distribuire a faetelor). n cazul primei repartiii aplicarea formulei 2 ne d urmtorul rezultat:

= 0,13 + 0,13 = 0,26 . 30 30 Semnificaia rezultatului de 0,26 o vom afla prin consultarea tabelei lui Fisher pentru valori 2 ,
2

(28 30)2 + (32 30)2 =

tabel calculat conform unor legiti de distribuie4. Numrul gradelor de libertate se calculeaz prin intermediul formulei: f =m-1=2-1=1 n aceast formul f reprezint este numrul gradelor de libertate i m numrul de modaliti ale variabilei. f 1 P = 0,99 0,00016 0,98 0,00063 0,95 0,0039 0,90 0,0158 0,10 2,706 0,05 3,841 0,02 5,412 0,01 6,635

La intersecia liniei 1 (care semnific un grad de libertate) i a coloanei 0,05 (prag de risc 0,05) gsim valoarea 3,84. Valoarea 2 rezultat din calculul nostru este 0,26, valoare mult mai mic dect 3,84. n concluzie, acceptm ipoteza de nul (ntre repartiia empiric i cea teoretic nu este o deosebire semnificativ). Oferim, n continuare un exemplu fictiv din domeniul psihopatologic. S presupunem c un cercettor i propune s analizeze relaia dintre anotimpuri i puseele depresive survenite n rndul unor pacieni psihiatrici. Pentru a pune n eviden respectiva relaie, cercettorul a analizat situaia internrilor celor cu simptome depresive la un spital de psihiatrie n funcie de anotimp. Registrele de internare relev urmtoarea situaie n funcie de anotimp: Primvara Vara Toamna Iarna 190 170 270 220 Ipotezele enunate n studiul respectiv sunt: H0 ipoteza nul susine c nu exist nici o legtur dintre anotimp i numrul de internri a pacienilor depresivi. Deci, crizele depresive intervin n proporii egale n fiecare anotimp; H1 Ipoteza alternativ susine c exist o legtur ntre anotimp i puseele depresive. Ca atare, n anumite anotimpuri acestea survin mai frecvent dect n altele. Dac am da curs primei ipoteze, pe care trebuie s o confirmm sau s o infirmm, ar trebui s avem urmtoarea situaie n registrele de internare (aceast distribuie este teoretic, deoarece rezult n urma aplicrii unei ipoteze). Primvara Vara Toamna Iarna 212,5 212,5 212,5 212,5 Efectivul teoretic de 212,5 din fiecare celul rezult din mprirea numrului total de internri sau a efectivului total (850) la 4 (numrul de anotimpuri existente ntr-un an). Un asemenea efectiv nu poate fi observat, deoarece este absurd s spunem c la un spital s-au internat 212,5 oameni.

Tabela lui Fisher este preluat din lucrarea lui G. Milton Smith Ghid simplificat de statistic, Editura Didactic i Pedagogic, Bucureti,1973, pag.168

131

AUREL STAN

Aplicm, n continuare, formula 2 :

212,5 212,5 212,5 212,5 ft = 4,66 + 13,00 + 15,5 + 0,25 = 32,25 Avnd n vedere faptul c avem 4 modaliti ale variabilei calitative anotimp vom avea 3 grade de libertate (f=m-1). Pentru comparaia valorii calculate cutm valoarea tabelar 2 , aflat la
intersecia linei 3 (deoarece avem 3 grade de libertate) i a coloanei 0,05 (pragul de risc). f P = 0,99 0,98 0,95 0,90 0,10 0,05 0,02 0,01 1 .. 2 3 0,297 0,429 0,711 1,0647.779 7,779 9,488 11,889 18,277 Observm c valoarea tabelar este de 9,488, deci o valoare mai mic dect cea calculat de noi. Observm, de asemenea, c valoarea calculat este superioar valorilor tabelare de la coloanele 0,02 i chiar 0,01. Concluzia statistic se exprim n felul urmtor: Dac respingem n mod constant ipoteza de nul n mai puin de 5% din cazuri o respingem pe nedrept i chiar n mai puin de 1%. Valoarea P, n cazul nostru, este mai mic de 0,05; 0,02 i 0,01 Grania dintre admiterea i respingerea ipotezei de nul este fixat prin convenie la 0,05. Pentru valori P mai mici de 0,05 se respinge ipoteza de nul, pentru valori P mai mari dect 0,05 se accept ipoteza de nul. Exprimat altfel, putem spune c dac valoarea calculat de noi pentru (32,25) este mai mare dect valoarea tabelar gsit la pragul de siguran 0,05 (9,488) putem respinge ipoteza de nul. n caz contrar am fi acceptat ipoteza de nul. Respingerea ipotezei de nul duce automat la acceptarea ipotezei alternative. Ca atare putem s afirmm c ntre anotimp i frecvena de apariie a puseelor depresive exist o legtur, adic n unele anotimpuri acestea sunt mai frecvente dect n altele. Aplicarea testului
2

=
2

( fo ft )2 = (190 212,5)2 + (170 212,5)2 + (270 212,5)2 + (220 212,5)2

de ajustare permite o concluzie global i nu o analiz amnunit a

frecvenelor modalitilor variabilei. n cazul n care numrul de categorii se mrete considerabil acest test statistic i dovedete limitele (printr-o apreciere prea global). Se impune, n acest caz, de a realiza o serie de grupri ale modalitilor variabilei sau de a le analiza dou cte dou. Distribuiile teoretice independente. Distribuiile pentru care fiecare modalitate a variabilei posed o probabilitate teoretic independent de alte modaliti se numete distribuie de frecvene teoretice independente. Cele mai frecvente cazuri de aplicare n cercetarea psihopedagogic a testului 2 sunt cele n care o probabilitate de apariie este mai important dect alta. EXEMPLU. S presupunem c un cercettor este interesat de influena fenomenului destrmrii familiale asupra eecului adaptare a copilului la mediul colar. El se confrunt cu urmtoarea situaie aparinnd colilor unui ora. Proveniena copiilor Familii dezorganizate Alte situaii 174 5825

Total 5999

132

STATISTIC (II)

n derularea efortului tiinific cercettorul trebuie n primul rnd s tie dac proporia sau procentul copiilor provenind din familii dezorganizate este aceeai cu aceea de la nivel naional. Dac la nivel naional statisticile indic faptul c 0,05 sau 5% din copii provin din familii dezorganizate (procent imaginat) se procedeaz la calcularea efectivelor teoretice. Pentru alte situaii vom avea 0,95. Pentru exprimarea procentual nmulim expresia procentual cu 100. Se pornete de la ipoteza c proporia sau procentajul copiilor care provin din familii dezorganizate din colile respectivului ora trebuie s fie aceeai ca la nivel naional. Efectiv teoretic pentru copiii provenind din familii dezorganizate: 59990,05=299,95. Deci, dac s-ar respecta proporia situaiei de la nivel naional efectivul teoretic al copiilor provenind din familii dezorganizate ar trebui s fie 299,25 (se va ine cont de faptul c este un efectiv teoretic, deoarece n practic este absurd s afirmm c exist 299,25 copii n aceast situaie). Pentru alte situaii efectum urmtorul calcul: 59990,95=5699,05. Am mai putea s procedm astfel: 5999-299,95=5699,05. Efectivul teoretic pentru alte situaii va fi 5699,05. Aplicm formula pentru 2 :

(174 299,95)2 + (5825 5699,05)2


299,95 5699,05

= 52,30 + 2,78 = 55,08 .

Gradele de libertate n acest caz este egal cu 1 (2-1). La pragul de 0,05 gsim valoarea tabelar egal cu 3,841, iar la pragul de risc de 0,01 gsim valoarea tabelar de 6,635. Valoarea calculat pentru 2 este mai mare dect cele dou valori tabelare. Practic putem spune c respingem ipoteza de nul i adoptm ipoteza alternativ. Concluzia este aceea c efectivele de copii care provin din familii dezorganizate sunt diferite semnificativ de cele care se gsesc la nivel naionale. n multe situaii variabila poate avea mai mult de dou modaliti. S presupunem c un manager dorete s cunoasc dac situaia studiilor muncitorilor angajai la firma pe care o conduce este conform proporiilor existente pe plan naional. S presupunem c situaia studiilor muncitorilor din ntreprindere s-ar prezenta astfel: Nr.crt. 1 2 3 4 5 6 Modaliti ale variabilei studii Fr nici o diplom Diplom de coal general coal general +calificare de 6 luni. coal general + coal prof. de 2 ani Diplom de liceu + scoal prof. de 2 ani Studii superioare + coal prof. de 2 ani Total Efectiv 10 17 164 129 70 10 400 Proporie naional 0,04 (4%) 0,09 (9%) 0,40 (40%) 0,29 (29%) 0,12 (12%) 0,06 (6%) 1,00 (100%)

Pentru a afla efectivele teoretice n vederea comparrii celor doua serii de date nmulim efectivul real din ntreprindere cu proporia existent la nivel naional. Obinem urmtorul tabel: Nr.crt. 1 2 3 4 5 6 Modaliti ale variabilei studii Fr nici o diplom Diplom de coal general coal general +calificare de 6 luni. coal general + coal prof. de 2 ani Diplom de liceu + scoal prof. de 2 ani Studii superioare + coal prof. de 2 ani Total Efectiv observat 10 17 164 116 70 10 400 Efectiv teoretic 16 (4000,04) 36 (4000,09) 160 (4000,40) 129 (4000,29) 48 (4000,12) 24 (4000,06) 400
133

AUREL STAN

n parantez, la rubrica Efectiv teoretic este trecut procedura de obinere a acestora. Din calculul ptrat rezult:
2

= 36 160 116 48 24 = 3,6 + 10 + 0,1 + 1,45 + 10 +8,16 =33,31. Pentru pragul de semnificaie 0,05 i pentru 5 grade de libertate (f = 61) gsim o valoare tabelar egal cu 18,19. Deoarece valoarea de 31,31 obinut prin calcul nostru este mai mare dect valoarea tabelar vom respinge ipoteza de nul i vom conchide c distana dintre cele dou serii de valori este una semnificativ. Distribuia empiric nu se ajusteaz cu cea teoretic. 16
Testul 2 de independen 2 de independen stabilete, n cazul confirmrii ipotezei nule, independena ntre dou variabile studiate. n cazul contrar, ipoteza alternativ afirm existena unei legturi ntre modalitile celor dou variabile. Practic se testeaz faptul dac variaiile repartiiilor provin de la un factor sistematic sau nu. Tabelul ncruciat al celor dou variabile poart numele de tabel de contingen. S lum cazul unor variabile cu statut diferit. S presupunem c dorim s verificm ipoteza influenei sexului asupra preferinelor colare ale adolescenilor. Un numr de 192 de adolesceni (90 de biei i 102 fete) sunt chestionai n privina preferinei pentru un anumit gen de discipline. Rezultatele sunt expuse n tabelul urmtor: Biei Fete Total Discipline umaniste 42 58 100 Discipline exacte 48 44 92 Total 90 102 192 De aceast dat avem n studiu dou variabile, cu cte dou modaliti fiecare. Variabila sex are modalitile biei i fete i variabila preferina pentru un anumit gen de discipline are modalitile discipline umaniste i discipline exacte. Cu un risc de 0,05 se dorete de a se ti dac exist o legtur ntre sexul adolescenilor i preferina pentru anumite categorii de discipline. n acest caz avem 6 distribuii: 2 distribuii marginale i 4 distribuii pariale. Distribuiile marginale sau totale sunt: distribuia marginal a sexului adolescenilor: 90 de biei i 102 fete; distribuia marginal a preferinelor pentru discipline: 100 de preferine pentru discipline umaniste i 92 de preferine pentru discipline exacte. Distribuiile pariale sunt: distribuia parial bieilor n funcie de preferine: 42 de preferine pentru discipline umaniste i 48 de preferine pentru discipline exacte; distribuia parial a fetelor n funcie de preferine: 58 de preferine pentru discipline umaniste i 44 preferine pentru discipline exacte; distribuia parial a preferinei pentru disciplinele umaniste n funcie de sex (42 biei i 58 de fete); distribuia parial a preferinei pentru disciplinele tehnice n funcie de sex (48 de biei si 44 de fete).
134

(10 16)2 + (17 36)2 + (164 160)2 + (129 116)2 + (70 48)2 + (10 24)2

STATISTIC (II)

Dac bieii i fetele ar avea preferine egale pentru disciplinele umaniste i tehnice am avea urmtoarea repartiie teoretic, n cazul emiterii ipotezei de nul: Discipline umaniste Discipline exacte Total Biei 46,87 43,13 90,00 Fete 53,13 48,87 102 Total 100 92 192

Dac comparm efectivele marginale de la tabelul efectivelor observate i a celor teoretice observm c acestea sunt identice. Modul de raionament n cadrul emiterii ipotezei de nul este urmtorul: n total avem 192 subieci dintre care 90 de biei i 102 fete. Exprimndu-ne sub form 90 procentual putem spune c din totalul subiecilor chestionai bieii reprezint 46,87% ( 100 ) i 192 fetele 53,13% (putem face acelai fel de calcul sau putem s efectum scderea 100% - 46,87%). nseamn c dac preferinele bieilor nu difer de cele ale fetelor, disciplinele respective vor fi preferate n funcie de aceste procente. Efectivele teoretice se pot obine la linia Discipline umaniste prin nmulirea valorii marginale egal cu 100 cu 0,4687, respectiv cu 0,5313. Efectivele teoretice de la linia Discipline exacte se pot obine prin nmulirea valorii marginale egal cu 92 cu 0,4687, respectiv cu 0,5313. Dup ce am calculat efectivele teoretice putem aplica formula pentru 2 :

(42 46,87 )2 + (58 53,13)2 + (48 43,12)2 + (44 48,88)2


46,87 53,13 43,12 48,88

= 0,50 + 0,44 + 0,55 + 0,48 =1,97

Formula pentru gradele de libertate n pentru testul 2 de independen este: f = (c-1)*(l-1), n care prin c desemnm numrul de coloane ale tabelelor (n numr de dou) i prin l numrul de linii (de asemenea, n numr de dou). Din aplicarea formulei privind gradele de libertate rezult: f = (2 1)*(2 1) = 1 Valoarea de 1,97 o comparm cu valoarea tabelar gsit la intersecia liniei cuprinznd un grad de libertate i coloanei pentru pragul de semnificaie egal cu 0,05. Valoarea de la aceast intersecie este egal cu 3,84 deci o valoare mai mare dect cea calculat de noi pentru 2 , egal cu 1,97. n acest caz acceptm ipoteza de nul, deci, diferenele de preferine n privina disciplinelor colare nu sunt semnificative. Efectivele teoretice se pot calcula i n alt mod. Relum exemplele date de noi anterior.
Distribuie observat Biei Discipline umaniste 42 Discipline exacte 48 Total 90 Distribuie teoretic Biei Discipline umaniste 46,87 Discipline exacte 43,13 Total 90

Fete 58 44 102

Total 100 92 192

Fete 53,13 48,87 102

Total 100 92 192

Efectivul corespunztor unei celule din tabelul teoretic de contingene se calculeaz mult mai uor prin mprirea produsului dintre efectivele marginale ale unei celule la efectivul total al unei celule (n cazul nostru 192). O celul are dou efective marginale: unul n linie i altul n coloan. Pentru 100 90 celula din stnga sus (valoare observat=42) facem urmtorul calcul: = 46,87 192

135

AUREL STAN

Distribuie teoretic Biei Fete Discipline umaniste 46,87 Discipline exacte Total 90

Total 100 192

Pentru celula din dreapta sus (valoare observata 58) calculm astfel: 100 x102 = 53,13 ; pentru celula din stnga jos (valoare observat 48) facem urmtorul calcul: 192 90 x92 = 43,12; pentru celula din dreapta jos (valoare observat 44) facem urmtorul calcul: 192 92 x102 = 48,88 . S-a oferit ca exemplu cel mai simplu model care poate exista n testul 2 de 192 independen. Se pot construi tablouri de genul: 2x3 (o variabil cu 2 modaliti i o alta cu 3 modaliti); 3x4 (o variabil cu 3 modaliti i o alta cu 4 modaliti). Cnd numrul de modaliti crete apar dificulti rezultate din globalizare. Existena unei legturi nu nseamn c aceast legtur se regsete n fiecare pereche. IV.2. RELAIA DINTRE DOU VARIABILE ORDINALE n privina irurilor de valori ordonate ale unei variabile ordinale sunt folosite n principal dou procedee de relaionare statistic prin intermediul coeficienilor. Exist un coeficient de concordan creat de Kendall i un coeficientul de corelaie introdus la nceputul secolului XX de Spearman. 2T Coeficientul lui Kendall se obine prin aplicarea urmtoarei formule: K= . El se bazeaz pe n(n 1) sistemul diferenei rangurilor n cazul a dou clasificri. Este evident faptul c acest coeficient intervine atunci cnd se opereaz cu clasificri fcute de doi evaluatori n procesul de observare a unor aspecte comportamentale sau de alt natur. EXEMPLU. S presupunem c doi evaluatori (specialiti care ntocmesc locul n cadrul unor clasificri) sunt n situaia de a evalua un numr de 10 comportamente indezirabile social (exemplu de astfel de comportamente: comportament A aezarea n faa unei cozi la un anumit magazin; comportament B manifestare zgomotoas la o adunare pioas etc.). Se cere celor doi evaluatori s ordoneze comportamentele notate cu A,B,C,D,E,F,G,H,I,J, n privina intensitii dezapreciative resimite pentru astfel de comportamente. Numrul 1 l va primi comportamentul considerat cel mai negativ. 2T 2(13 + 32) 2 x19 38 = = = = 0,42 K= n(n 1) 10(10 1) 90 90 n formul K desemneaz coeficientul Kendall, T suma algebric de la rubricile notate ci i +, n numrul cazurilor care se cer apreciate, n cazul nostru numrul comportamentelor.

136

STATISTIC (II) Comportamentul A H B G J I C D A E F Evaluator X B 1 2 3 4 5 6 7 8 9 10 Total Evaluator Y C 4 2 1 7 3 8 10 6 5 9 D 3 1 0 3 0 2 3 1 0 0 -13 + E 6 7 7 3 5 2 0 1 1 0 +32

Prima coloan cuprinde codificrile comportamentelor indezirabile social, n funcie de ordonarea primului evaluator. Aceast ordonare, n ordinea natural a numerelor, este trecut n coloana B. n coloana C sunt trecute rangurile atribuite de ctre cel de-al doilea evaluator comportamentelor notate cu A,B,C,D,E,F,G,H,I,J. Coloanele D i E cuprind cifre notate cu , respectiv +. S vedem n ce condiii se acord punctaj pentru rubrica i n ce condiii se acord punctaj pentru +. Vom da explicaii pentru coloana C n care valorile nu sunt trecute n ordine natural. Comportamentul notat cu H ocupa n clasamentul ntocmit de evaluatorul X locul 1 i n cel ntocmit de evaluatorul Y locul 4. Cu cifre mai mici pe coloana C se gsesc notate comportamentele G,B si I (notate cu 1,2,3), pentru care se primete punctajul -3, cte un punct negativ pentru fiecare numerotare inferioar valorii 4. Notri superioare valorii 4 au comportamentele J,C,D,A,E,F, deci punctajul +6 provine din acordarea a cte unui punct pentru fiecare numerotare mai mare dect 4. Comportamentul B are rangul 2, deci are o valoare mai mic dect el, motiv pentru care a fost notat cu 1 i 7 valori mai mari dect el, motiv pentru care i se acord punctajul +7. Pentru a nu exista nelmuriri n privina acordrii punctajului + 7 (deoarece diferena ntre 10 i 2 este egal cu 8), menionm c valorile alocate nu se mai consider n calcule. Astfel, valoarea 4 a fost alocat odat. Pentru calculul valorilor + ale comportamentului G, care a primit rangul 1 (se mai folosete expresia rangat cu 1) nu se mai consider comportamentele H i B, rangate cu 4, respectiv 2. Dup ce epuizm toate variantele posibile cu astfel de stabiliri, efectum suma algebric a valorilor + i n cazul nostru, T= 13+32 = +19. Aplicarea formulei ne d rezultatul: 2 x19 38 K= = = 0,42 . Coeficientul K a lui Kendall poate lua valori ntre 1 (cnd seriile de valori 10(10 1) 90 sunt complet inversate, deci cel mai bun ntr-un clasament este cel mai slab n cellalt clasament) i +1 (cnd exist concordan deplin ntre cele dou clasamente). Cu aceast formul intrm practic n domeniul corelaiilor. O corelaie exprim gradul relaiei ntre dou sau mai multe variabile. n experimentele psihologice, mai ales, aceste proceduri statistice sunt destul de des ntlnite. Tot la fel de des se ntlnete i o serie de confuzii i neclariti n privina valorii lor. Pe parcursul lucrrii de fa vom prezenta informaii detaliate despre valoarea i limitele corelaiilor, dar acum ne vom opri asupra corelaiei n cazul a dou serii de valori aparinnd la dou variabile ordinale. Formula a fost elaborat de cunoscutul teoretician Charles Spearman: 6*d2 = 1 n(n 2 1)

137

AUREL STAN

n care d reprezint diferena dintre rangurile rezultatelor la cele dou variabile diferite i n reprezint numrul total de cazuri. Formula se poate aplica i pentru dou variabile de interval la care a intervenit o operaie de rangare. Oferim un exemplu n privina modului de calcul a coeficientului de corelaie Spearman. S presupunem c avem la dispoziie rezultatele unui numr de 15 subieci la o proba de atenie (ADPraga) i la o prob de dexteritate manuala (O'Connor). Prin X vom nota rezultatele la proba de atenie i prin Y rezultatele la proba de dexteritate manual.
Nr.crt. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X 47 52 75 81 66 39 47 55 61 70 66 49 59 63 69 Y 6 9 17 10 11 7 6 11 17 13 12 14 10 12 15 RX 13.5 11 2 1 5,5 16 13,5 10 6 3 5,5 12 9 7 4 RY 14,5 12 1,5 10,5 8,5 13 14,5 8,5 1,5 5 6,5 4 10,5 6,5 3 d -1 -1 0,50 - 9,50 -3 2 -1 1,50 6,50 -2 -1 8 - 1,5 0,50 1 d2 1 1 0,25 90,25 9 4 1 2,25 42,25 4 1 64 2,25 0,25 1 223,50

Coloana notat cu X conine valorile variabilei X, coloana notat cu Y valorile variabilei Y. Coloanele notate cu RX i RY conin rangurile acordate celor 15 valori ale variabilelor X i Y. Cum se acord aceste ranguri? Vom exemplifica pe valorile variabilei X. n coloana RX rangul 1 l va avea cea mai mare valoare a variabilei. Dac privim n coloana notat cu X observm c aceast valoarea este 81. Rangul 2 este acordat valorii 75, a doua valoare n ordine descresctoare. Se continu n acest fel pn cnd se ajunge la rangul 15. n cazul cnd avem 2 valori identice se trece n dreptul fiecreia media rangurilor cresctoare pe care le-am fi atribuit dac valorile nu ar fi fost egale. De exemplu, cele dou valorile 66 ar fi avut rangurile 5 i 6. Fiecare valoare 66 a variabilei X primete rangul 5,5. Dac am fi avut 3 valori identice media r fi fost efectuat din trei ranguri. Rangul urmtor care se aloc dup 5,5 este 7 i nu 6 (deoarece se consider c rangul 6 a fost acordat odat). Coloana notat cu d conine diferena algebric dintre valorile coloanelor RX i RY (d = RX RY). Coloana d2 conine ptratele valorilor din coloana d. Suma valorilor din coloana d2 este egal cu 223,50. Dup calcularea acestei sume putem calcula coeficientul de corelaie a lui Spearman. Din aplicarea formulei rezult:

= 1-

6 * 223,50 1341 =1 = 1 0,399 = 0,601 . 2 15(15 1) 3360

Acest gen de corelaii se folosete mai ales atunci cnd numrul de subieci este mic (sub 50 de perechi de valori). Coeficientul de corelaie Spearman poate lua valori ntre 1 i +1, trecnd prin valoarea 0,00. Semnificaiile vor fi explicate la tratarea coeficientului de corelaie Bravais-Pearson.

138

STATISTIC (II)

IV.3. RELAIA NTRE DOU VARIABILE DE INTERVAL Acest gen de corelaii se ntlnesc frecvent n cercetarea psihopedagogic, atunci cnd dorim s tim dac rezultatele a dou teste variaz mpreun ntr-un anumit gradient sau cnd dorim s tim acelai lucru n privina a dou serii de date, dintre care una reprezint rezultatele unui test, iar alta rezultatele unui criteriu (care reprezint rezultatele colare sau rezultatele randamentului cuantificat ntr-o profesie pentru care s-au folosit teste psihologice n procesul de selecie profesional). n cazul unei corelaii de valoare nalt putem prevedea performanele profesionale ale subiecilor sprijinindu-ne pe rezultatele de la teste. S lum, de exemplu, rezultatele folosite de noi la calculul coeficientului de corelaie bazat de diferena de rang, presupunnd, de aceast dat, c ele ar satisface exigenele unei scale de interval:
Nr.crt. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X 47 52 75 81 66 39 47 55 61 70 66 49 59 63 69 899 Y 6 9 17 10 11 7 6 11 17 13 12 14 10 12 15 170 x - 12,93 - 7,93 15,07 21,07 6,07 - 20,93 - 12,93 - 4,93 1,07 10.07 6,07 - 10,93 - 0,93 3,07 9,07 y 5,93 2,39 5,67 1,33 0,33 4,33 5,33 0,33 5,67 1,67 0,67 2,67 1,33 0,67 3,67 x2 167,18 62,88 227,10 443,94 36,84 438,06 167,18 24,30 1,14 101,40 36,84 119,46 0,86 9,42 82,26 1918,93 y2 24,81 5,43 32,15 1,77 0,11 18,75 24,41 0,11 32,15 2,79 0,45 7,13 1,77 0,45 13,47 173,39 xy 68,92 18,48 85,45 - 28,02 - 2,00 90,63 68,92 1,63 6,07 16,82 4,07 - 29,18 1,24 2,06 33,29 338,33

Formula de calcul pentru coeficientul de corelaie Bravais-Pearson este urmtoarea: xy rxy = x2 * y2 n care cu rxy se noteaz coeficientul de corelaie prin momentul produselor, cu x i y se noteaz variabilele de deviaie. O alt form n care se poate exprima aceast formul este: rxy =

xy
n * sx * s y

La aceast formul cu n se noteaz numrul total de pereche de rezultate luate n consideraie, cu sx i sy se noteaz abaterile standard ale distribuiilor valorilor variabilei X, respectiv Y. Pentru a putea realiza un tabel n vederea calculrii coeficientului de corelaie prin momentul produselor sau coeficientul BravaisPearson trebuie, n primul rnd s calculm mediile celor dou distribuii de valori. X = 899 = 59,93 i Y = Y = 170 = 11,33 . Rubricile x i y, coninnd aa Astfel, X = 15 N N 15 numitele valori de deviaie, sunt realizate prin scderea din variabilele originale X i Y a valorii mediilor
139

AUREL STAN

distribuiilor respective. Rubricile x2 i y2 sunt realizate prin ridicarea la ptrat a valorilor de deviaie x i y, iar rubrica xy prin nmulirea valorilor de deviaie ale celor dou variabile. Ultima linie a tabelului conine valorile sumelor necesare pentru calcularea coeficientului de corelaie Bravais-Pearson. Coeficientul de corelaie Bravais Pearson este notat, de obicei, cu r, dar n multe cazuri gsim notaia rxy, pentru a preciza denumirea variabilelor aflate n corelaie. 338,3 338,3 338,3 rxy = = = = 0,587 1918,93 * 173,39 332723,27 576,21 Observm c valoarea corelaiei este foarte apropiat de cea calculat prin procedeul Spearman. Menionm c procedeul BravaisPearson prezint mai mult ncredere n privina preciziei. Pentru date negrupate exist nc o formul uzual care folosete valorile brute ale variabilelor N XY X Y . i are urmtoarea form: rxy= 2 2 2 2 N X ( X ) * N Y ( Y )

][

Aplicarea acestei formule presupune un necesar de calcule mai mare. Corelaiile ntre valorile a dou variabile pot lua valori ntre 1,00 si +1,00 trecnd, firesc, prin 0. Valorile corelaiile egale +1 i 1 indic corelaii perfecte i sunt foarte rar ntlnite n cadrul distribuiilor empirice. Valoarea unui coeficient de corelaie egal cu 0 indic o lips a legturii de asociere ntre valorile celor dou variabile. 1,00 indic o consonana perfect ntre dou serii de valori provenind de la aceiai subieci. Tendinei de cretere valoric dintr-o serie i corespunde o cretere strict proporional n cealalt serie Valoarea coeficientului de corelaie egal cu 1 indic, de asemenea, o consonan perfect, dar care se manifest n sens invers; cu ct valorile unei serii cresc, cu att valorile celeilalte serii scad n aceeai proporie. Corelaia nul, adic egal cu 0, nu ne spune nimic despre tendinele existente ntre cele dou serii de valori (pur si simplu pentru c nu este nimic de spus). Valorile imediat superioare sau inferioare valorii 0 a coeficientului de corelaie contureaz o tendin vag ntre cele dou serii de date. n cazul unor studii care-i propun doar conturarea slab a unor tendine de asociere a valorilor irurilor de date, astfel de corelaii pot avea o anumit importan. Dar, n majoritatea situaiilor funcioneaz exigene de semnificaie a indicelui de corelaie. Semnificaia poate fi calculat prin intermediul tabelelor t ale lui Student (t= ) sau prin intermediul tabelelor 1 r2 legii r a lui Bravais Pearson. n ambele tabele se caut semnificaia n limita gradelor de liberate (f=n-2). Vom calcula valoarea t pentru ultima valoarea obinut a coeficientului de corelaie. t=

r n2

r* n2 1 r2

0,587 * 15 2 1 0,587 2

0,587 * 13 0,587 * 3,6 2,11 = = = 2,61 0,809 1 0,344 0,656

Vom stabili semnificaia acestei valori a lui t prin apelarea la tabela lui Student, adoptnd pragul de risc de 0,05 i 13 grade de libertate.
p f 1 2 .. 13 0,20 0,10 0,05 0,02 0,01 0,001 0,001 0,0001

2,16

2,65

3,01

4,22

5,51

6,96

140

STATISTIC (II)

Valoarea calculat de noi este mai mare dect valoarea tabelar aflat la intersecia liniei care desemneaz 13 grade de liberate i coloanei care indic pragul de risc egal cu 0,05. Aceast constatare ne indic faptul c ne aflm n faa unei corelaii semnificative i deci p<0,05. Dac valoarea calculat ar fi fost mai mic de 2,16 atunci am fi avut p>0,05 i corelaia ar fi fost considerat nesemnificativ. Ce nseamn faptul declarrii unei corelaii drept semnificative. nseamn c n legtura acestor dou variabile intervine un factor sistematic, nseamn c legtura lor nu este ntmpltoare. Firete ne asumm un risc de 5%, adic putem grei n aprecierea noastr n 5 cazuri din 100. Exist n rndul anumitor cercettori tendina de entuziasmare n faa unor coeficieni de corelaie de bun nivel. Desigur, studiile de stabilire a indicelui (sau coeficientului) de corelaie au raiuni clare i un folos de netgduit. Dar, nu trebuie s uitm faptul c un coeficient de corelaie nu reprezint altceva dect proporia varianei comune existente la cele dou serii de date. De asemenea, merit de amintit faptul c indicii de corelaie nu pot fi apreciai direct n privina proporionalitii. Dup aparene, o corelaie de 0.40 este de dou ori mai mic dect o corelaie de 0.80. Pentru a ne putea face o impresie adecvat va trebui s comparm ptratele valorilor respectivilor coeficieni, care sunt 0.16 si 0.64. Aceste ptrate traduc o disproporie de 1 la 4, i nu de 1 la 2, cum aprea iniial. n cazul stabilirii unui coeficient de corelaie nu putem s stabilim clar relaii de cauzalitate ntre variabila X i variabila Y. Dac seriile de date X i Y au un coeficient de corelaie nalt nu putem preciza dac X este cauza lui Y, dac Y este cauza lui X, sau dac att X ct i Y sunt influenate de o a treia variabil, Z. IV.4. ECUAIILE DE REGRESIE Domeniul regresiei este unul vast n domeniul statisticii. Noi vom trata elementar acest concept. Este util s facem o precizare, i anume c acest termen de regresie nu are un sens negativ de retrograd, napoiat, ci desemneaz doar o serie de tehnici de prognoz n domeniul statisticii. Cunoscnd valoarea unui coeficient de corelaie ntre seriile de valori ale variabilelor X i Y se poate realiza o prognoz asupra valorii unei variabile pornind de valoarea corespunztoare cunoscut a celeilalte variabile (necunoscut). Aceast prognoz se poate realiza cu ajutorul ecuaiei de regresie a lui X n Y i a ecuaiei de regresie a lui Y n X. Linia de regresie sau linia maximei ajustri a norului de puncte din diagrama unei corelaii este o linie care trebuie s ndeplineasc o condiie esenial, i anume ca suma ptratelor distanei dintre linie i punctele norului s fie un minim. Ecuaiile de regresie ale respectivelor drepte sunt urmtoarele:

141

AUREL STAN

1. ECUAIA DREPTEI DE REGRESIE A LUI X CTRE Y: ~ = bx * y x ~ x n aceast ecuaie (exprimat n variabile de deviaie) ~ = X X i y = Y Y . Dac inem seama de aceste ultime egaliti putem s scriem ecuaia dreptei de regresie a lui X ctre Y n felul urmtor: ~ ~ X = bx * (Y Y ) + X , n care X este estimarea variabilei X i bx este coeficientul de regresie a lui X n raport cu Y. Acest coeficient are urmtoarea formul: bx = rxy*
sx , n care sx este abaterea standard sy

a valorilor seriei X i sy este abaterea standard a seriei de valori Y. i rxy este coeficientul de corelaie r ntre valorile variabilei X i valorile variabilei Y. Notaiile X, X , Y sunt cunoscute din explicaiile noastre anterioare. 2. ECUAIA DREPTEI DE REGRESIE A LUI Y N RAPORT CU X: ~ = by * x y ~ ~ n care ~ = Y Y , y = Y Y . Fcnd nlocuirile necesare obinem: Y = b (X X ) + Y y
y

Coeficientul de regresie a lui Y n raport cu X este: by = rxy *

sy sx

Vom exemplifica bazndu-ne pe datele ultimului tabel realizat pentru calcularea coeficientului de corelaie prin momentul produselor. Pentru calcularea coeficienilor de regresie avem nevoie de valorile abaterilor standard ale distribuiilor. Formula abaterii standard a seriei de date x este: sx = Folosind valorile de la tabelul amintit vom avea: sx =

x
N

1918,93 = 127,92 = 11,31 . Pentru datele 15

173,39 = 11,59 = 3,39 . N 15 Deoarece cunoatem valoarea coeficientului de corelaie prin momentul produselor (0,587), putem trece la calcularea coeficienilor de regresie. s 11,31 0,587 * 3,33 = 1,95 = bx = rxy * x = 0,587 * sy 3,39

seriei Y valoarea abaterii standard se calculeaz astfel: s y =

by = rxy *

sy sx

= 0,587 *

3,39 = 0,587 * 0,29 = 0,175 11,31

S presupunem c dorim s estimm valoarea pe care un subiect ar obine-o un subiect la variabila Y n momentul n care tim c valoarea variabilei X este egal cu 64. Facem precizarea c ne referim la datele trecute n tabelul pentru calcularea coeficientului de corelaie prin momentul produselor). Calculele de efectuat sunt urmtoarele: ~ Y = by ( X X ) + Y = 0,175(64 59,93) + 11,33 = 0,175 * 4,07 + 11,33 = 0,712 + 11,33 = 12,14 . Deci, atunci cnd un subiect ar obine la variabila X rezultatul de 64 se estimeaz pentru Y un rezultat de aproximativ 12. S presupunem c dorim s estimm valoarea pe care un subiect ar obine-o un subiect la variabila X n momentul n care tim c valoarea variabilei Y este egal cu 8. Calculele de efectuat sunt urmtoarele: ~ X = bx (Y Y ) + X = 1,95(8 11,33) + 59,93 = 1,95 * ( 3,33) + 59.93 = 6,49 + 59,93 = 53,43 . Deci, ne vom atepta ca la variabila X subiectul s obin aproximativ 54.
142

STATISTIC (II)

O situaie particular n calcularea coeficientului de corelaie avem atunci cnd ne aflm n prezenta a dou iruri de date, din care unul este compus din variabile continue sau discrete polihotomice, iar altul din variabile binare (valori 0 i 1). O astfel de situaie o ntlnim atunci cnd dorim s calculm coeficientul de corelaie ntre rezultatele globale obinute de subieci la un test i rezultatele acelorai subieci la un item exprimat dihotomic. n tabelul care urmeaz redm un exemplu de acest specific. Tabelul cuprinde rubrici necesare calculrii indicatorilor existeni n formul:
Nr.crt. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X (rezultat global la test) 15 19 17 13 21 20 12 10 11 17 13 16 12 15 19 230 x - 0,33 - 3,67 - 1,67 - 2,33 5,67 4,67 - 3,33 - 5,33 - 4,33 1,67 - 2,33 0,67 - 3,33 - 0,33 3,67 x2 0,11 13,47 2,79 5,43 31,15 21,81 11,09 21,41 18,75 2,79 5,43 0,45 11,09 0,11 13,47 167,30 Y (rezultat item) 1 0 1 0 1 0 1 0 0 1 1 1 0 1 1 9

Coeficientul de corelaie realizat ntre aceste dou serii de date se numete coeficient de corelaie biserial punctat. Facem o meniune n privina celei de-a doua serii de date, adic cea exprimat sub forma de 0 si 1. n cazul n care ne aflm n prezena unui item aparinnd unui test de randament valoarea 1 reprezint rezolvarea corect a unei sarcini i valoarea 0 nerezolvarea acestei sarcini. n cazul chestionarelor de personalitate valoarea 1 reprezint rspunsul care pune n eviden trstura specificat n manualul chestionarului sau n titlul chestionarului, iar nota 0 lipsa acestei trsturi. Aceeai ntrebare poate fi punctat diferit n funcie de scopul testului sau mai bine zis de destinaia sa psihodiagnostic. EXEMPLU la ntrebarea: i este fric s traversezi o pia imens? se poate acorda nota 1 la rspunsul "da" n cazul n care chestionarul i propune s diagnosticheze anxietatea i nota 0 n cazul n care chestionarul i propune s stabileasc echilibrul emotiv i stabilitatea comportamental. Formula coeficientului de corelaiei biserial punctat este urmtoarea: X p Xq rpbis = * pq sx n care X p este media aritmetic a variabilei continue a subiecilor care au primit la item valoarea 1, iar
X q este media aritmetic a variabilei continue a subiecilor care au obinut la item nota 0; sx este

abaterea standard a ntregii serii de date continue; p este proporia acelor subieci care au rezolvat corect itemul sau care au rspuns n sensul evidenierii trsturii specificate n titlul testului; q = 1 - p, deci proporia acelor subieci care nu au rezolvat corect itemul sau care nu au rspuns n sensul specificat n titlul chestionarului de personalitate.

143

AUREL STAN

15 + 17 + 21 + 12 + 17 + 13 + 16 + 15 + 19 = 16.1 9 19 + 13 + 20 + 10 + 11 + 12 Xq = = 14.1 6 230 p = 9/15 = 0.6; q = 1p = 10.60 = 0.40; X = = 15.33 ; 15


Xp =
167,30 = 11,15 = 3,33 . N 15 Dup ce avem toate datele la dispoziie putem trece la calcularea coeficientului de corelaie biserial punctat. X p Xq 16,1 14,1 rpbis = * 0,60 * 0,40 = 0,60 * 0,49 = 0,29 . * p*q = sx 3,33

sx =

Valoarea de 0,29 a unei corelaii i indic o slab asociere ntre valorile itemului i rezultatele de ansamblu ale testului. n analiza de itemi suntem pui n situaia de a efectua corelaii ntre itemii unui test pentru a indica gradul de omogenitate a acestora. Desigur, dac corelaia dintre doi itemi este egal cu 1,00 ne putem pune ntrebarea dac i putem menine pe ambii n cadrul unui test psihologic. Raiunile relaionrii itemilor sunt mult mai extinse i formeaz domeniul de interes a teoriei testului psihologic sau, pentru o mai mare claritate, a unei pri a teoriei testului, i anume a analizei de itemi. Formula pentru calcularea coeficientului sau a coeficientului celor 4 cmpuri (pentru itemii i i j cu exprimarea pij pi p j dihotomic a rezultatelor) este urmtoarea: = . pi qi * p j qj O alt variant este: pij pi * p j = . pi p 2 i * p j p 2 j Formula se refer la doi itemi: itemul i i itemul j. n aceast formul pij reprezint proporia rspunsurilor punctate cu 1 comune itemilor i si j, pi proporia itemilor punctai cu 1 la itemul i i pj proporia itemilor punctai cu 1 la itemul j. qi = 1- pi i qj = 1 pj. S presupunem c la un test de inteligen aplicat pe 15 subieci avem urmtoarea repartiie a rspunsurilor la itemii i i j, itemi cu punctare dihotomic (vezi tabelul alturat). Avem toate datele la dispoziie pentru aplicarea formulei de calcul a coeficientului .
Nr.crt. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 P Q Item i 1 1 1 0 0 1 1 1 0 0 1 0 1 0 1 9 pI = 0,60 qI = 0,40 Item j 0 1 0 1 0 1 0 0 1 1 0 0 1 1 1 8 pj = 0,53 qI = 0,47 Concordan +

+ + 4 pij = 0,266

pij pi * p j pi * qi * p j * q j

0,052 0,266 0,6 * 0,53 0,052 = = = 0,21 0,239 0,60 * 0,40 * 0,47 * 0,53 0,48 * 0,499

Corelaia obinut este o corelaie mic, cu valoare negativ. Semnific o uoar inversiune a tendinelor de cretere valorile a celor doi itemi.
144

STATISTIC (II)

EXERCIII 1. S presupunem c la absolvire elevii Fete Biei Total unui liceu au fost ntrebai asupra nvmnt artistic 45 27 72 preferinei pentru anumite tipuri de nvmnt medical 50 53 103 nvmnt universitar pe care ar dori s le urmeze. nvmnt politehnic 21 63 84 Rspunsurile au fost nregistrate separat pentru fete nvmnt umanist 45 29 74 i biei. Rezultatele sunt trecute n urmtorul tabel: nvmnt agronomic 15 25 40 Se cer urmtoarele rspunsuri: Total 176 197 373 Precizai variabilele; Precizai modalitile variabilelor; Precizai distribuiile pariale i distribuiile marginalele; Stabilii efectivele teoretice; Precizai dac aceste variabilele sunt dependente sau independente prin folosirea procedeului 2. 2. Se dau urmtoarele serii de valori constituite din rezultatele la dou teste psihologice. S se stabileasc coeficienii de corelaie prin procedeele elaborate de BravaisPearson i Charles Spearman. Precizai semnificaia acestui coeficient de corelaie!
Nr.crt. 1 2 3 4 5 6 7 8 9 10 11 X 14 17 27 35 22 28 30 19 26 19 33 Y 56 60 72 69 73 80 78 65 76 72 81

Andrei ,T., Stancu, S., Statistic - Teorie i aplicaii, Editura All, Bucureti, 1995 Clocotici, V., Stan, A., Statistic aplicat n psihologie, Editura Polirom, Iai, 2000 Gueguen, N., Manuel de statistique pour psychologues, Dunod, Paris, 1997 Milton-Smith, G., Ghid simplificat de statistic pentru psihologie i pedagogie, Editura didactic i pedagogic, Bucureti, 1971 Nowak, A., Metode cantitative n psihologie i sociologie, Oscar Print, Bucureti, 1998 Porojan, D., Statistica i teoria sondajului, Casa de editur ansa SRL, Bucureti 1993 Reuchlin, M., Precis de statistique, Presses Universitaires de France, Paris, 1975 Rotariu,T., Metode statistice aplicate n tiinele sociale, Polirom, Iai, 1999 arc, M., Tratat de statistic aplicat, Editura didactic i pedagogic, R.A. Bucureti, 1998 Vasilescu, I.P., Statistic informatizat pentru tiine despre om, Editura Militar, Bucureti, 1991

BIBLIOGRAFIE

145

AUREL STAN

TABELUL LUI FISHER DE VALORI 2 f 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 F P = 0,99 0,00016 0,0201 0,115 0,297 0,554 0,872 1,239 1,646 2,088 2,558 3,053 3,571 4,107 4,660 5,229 5,812 6,408 7,015 7,633 8,260 8,897 9,542 10,196 10,856 11,524 12,198 12,879 13,565 14,256 14,953 P=0,99 0,98 0,00063 0,0404 0,185 0,429 0,752 0,134 0,564 2,032 2,532 3,059 3,609 4,178 4,765 5,368 5,985 6,614 7,255 7,906 8,567 9,237 9,915 10.600 11,293 11,992 12,697 13,409 14,125 14,847 15,574 16,306 0,98 0,95 0,0039 0,103 0,352 0,711 1,145 1,635 2,167 2,733 3,325 3,940 4,575 5,226 5,892 6,571 7,261 7,962 8,672 9,390 10,117 10,851 11,591 12,338 13,091 13,848 14,611 15,379 16,151 16,928 17,708 18,493 0,95 0,90 0,0158 0211 0,584 1,064 1,610 2,204 2,833 3,490 4,168 4,865 5,578 6,304 7,042 7,790 8,547 9,312 10,085 10,875 11,651 12,448 13,240 14,041 14,848 15,659 16,473 17,292 18,114 18,839 19,768 20,599 0,90 0,10 2,706 4,605 6,251 7,779 9,236 10,645 12,017 13,362 14,684 15,987 17,275 18,549 19,812 21,064 22,307 23,542 24,769 25,989 27,204 28,412 29,615 30,813 32,007 33,196 34,382 35,563 36,741 37,916 39,087 40,256 0,10 0,05 3,841 5,991 7,815 9,488 11,070 12,592 14,067 15,507 16,919 18,307 19,675 21,026 22,362 23,685 24,996 26,296 27,587 28,869 30,144 31,410 32,671 33,924 35,172 36,415 37,652 38,885 40,113 41,337 42,557 43,773 0,05 0,02 5,412 7,824 9,837 11,668 13,388 16,622 16,622 18,168 19,679 21,161 22,618 24,054 25,472 26,873 28,259 29,633 30,985 32,346 33,687 35,020 36,343 37,659 38,968 40,270 41,566 42,856 44,140 45,419 46,693 46,962 0,02 0,01 6,635 9,210 11,345 13,277 15,086 16,812 18,475 20,090 21,666 23,209 24,725 26,217 27,688 29,141 30,578 32,000 33,409 34,805 36,191 37,566 38,932 40,289 41,638 42,980 44,314 45,642 46,263 48,278 49,588 50,892 0,01

146

STATISTIC (II)

TABELUL t A LUI STUDENT p f 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 0,20 3,08 1,89 1,64 1,54 1,48 1,44 1,42 1,40 1,39 1,37 1,37 1,36 1,35 1,35 1,34 1,34 1,34 1,33 1,33 1,33 1,33 1,32 1,32 1,32 1,32 1,32 1,32 1,31 1,31 1,31 1,31 1,31 1,31 1,31 1,31 1,31 1,31 1,31 1,31 1,31 0,10 6,31 2,92 2,36 2,13 2.02 1,95 1,90 1,86 1,84 1,81 1,80 1,78 1,77 1,76 1,76 1,75 1,74 1,74 1,73 1,73 1,72 1,72 1,72 1,71 1,71 1,71 1,71 1,70 1,70 1,70 1,70 1,70 1,69 1,69 1,69 1,69 1,69 1,69 1,69 1,69 0,05 12,71 4,30 3,18 2,78 2,57 2,45 2,37 2,31 2,26 2,23 2,20 2,18 2,16 2,15 2,13 2,12 2,11 2,10 2,10 2,09 2,08 2,08 2,07 2,07 2,06 2,06 2,05 2,05 2,05 2,04 2,04 2,04 2,04 2,03 2,03 2,03 2,03 2,03 2,02 2,02 0,02 31,82 6,97 4,54 3,75 3,37 3,14 3,00 2,90 2,82 2,77 2,72 2,68 2,65 2,63 2,60 2,58 2,57 2,55 2,54 2,53 2,52 2,51 2,50 2,49 2,49 2,48 2,47 2,47 2,46 2,46 2,45 2,45 2,45 2,44 2,44 2,44 2,43 2,43 2,43 2,43 0,01 63,66 9,93 5,84 4,61 4,03 3,71 3,50 3,36 3,25 3,17 3,11 3,06 3,01 2,98 2,95 2,92 2,90 2,88 2,85 2,83 2,82 2,81 2,80 2,80 2,70 2,78 2,77 2,77 2,76 2,75 2,75 2,74 2,74 2,73 2,73 2,72 2,72 2,71 2,71 2,71 0,001 636,63 31,60 12,93 8,61 6,87 5,96 5,41 5,04 4,78 4,59 4,44 4,32 4,22 4,14 4,07 4,02 3,97 3,92 3,89 3,85 3,82 3,79 3,77 3,75 3,73 3,71 3,69 3,68 3,66 3,65 3,64 3,62 3,61 3,60 3,59 3,58 3,58 3,57 3,56 3,55 0,0001 63663,8 100,00 28,00 15,55 11,18 9,08 7,89 7,12 6,59 6,21 5,92 5,51 5,36 5,24 5,13 5,04 4,97 4,90 4,84 4,78 4,74 4,74 4,69 4,66 4,62 4,59 4,56 4,53 4,51 4,48 4,46 4,44 4,42 4,41 4,39 4,37 4,36 4,35 4,33 4,32 0,00001 62725,7 316,39 60,42 27,78 17,90 13,56 11,22 9,78 8,83 8,15 7,65 7,26 6,96 6,71 6,50 6,33 6,19 6,06 5,95 5,86 5,77 5,70 5,63 5,57 5,51 5,46 5,42 5,37 5,34 5,30 5,27 5,24 5,21 5,18 5,16 5,13 5,11 5,09 5,07 5,06

147

AUREL STAN

TABELA LEGII NORMALE REDUSE (PROBABILITI BILATERALE)


Z 0,0 0,1 0.2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2.0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 0,00 1,00000 0,92034 0,84148 0,76418 0,68916 0,61708 0,54851 0,48393 0,42371 0,36812 0,31731 0,27133 0,23014 0,19360 0,16151 0,13361 0,10960 0,08913 0,07186 0,05743 0,00450 0,03573 0,02781 0,02145 0,01640 0,01242 0,00932 0,00693 0,00511 0,00373 0,00270 0,00194 0,00137 0,00097 0,00067 0,00047 0,00032 0,00022 0,00014 0,00010 0,0006 0,01 0,99202 0,91241 0,83367 0,75656 0,68181 0,61005 0,54186 0,7770 0,4]794 0,36282 0,31250 0,26700 0,22628 0,19020 0,15854 0,13104 0,10740 0,08727 0,07030 0,05613 0,04443 0,03486 0,02711 0,02089 0,01595 0,01207 0,00905 0,00673 0,00495 0,00361 0,00261 0,00187 0,00133 0,00093 0,00065 0,00045 0,00031 0,00021 0,00014 0,00009 0,0006 0,02 0,98404 0,90448 0,82587 0,74897 0,67449 0,60306 0,53526 0,47152 0,41222 0,35757 0,30773 0,26271 0,22247 0,18684 0,15561 0,12851 0,10523 0,08543 0,06876 0,05486 0,04338 0,03401 0,2034 0,02034 0,01552 0,01174 0,00879 0,00653 0,00480 0,00350 0,00253 0,00181 0,00128 0,00090 0,00063 0,00043 0,00029 0,00020 0,00013 0,00009 0,0006 0,03 0,97607 0,89657 0,81809 0,74140 0,66720 0,59611 0,52869 0,46539 0,40654 0,35237 0,30301 0,25848 0,21870 0,18352 0,15272 0,12602 0,10310 0,0363 0,06725 0,05361 0,04236 0,03317 0,02575 0,01981 0,01510 0,01141 0,00854 0,00653 0,00465 0,00339 0,00245 0,00175 0,00124 0,00087 0,00060 0,00042 0,00028 0,00019 0,00013 0,00008 0,00006 0,04 0,96809 0,88866 0,81033 0,73386 0,65994 0,59920 0,52217 0,45930 0,40091 0,34722 0,29834 0,25429 0,21498 0,18025 0,14987 0,12356 0,10101 0,08186 0,06577 0,05238 0,04135 0,03235 0,02509 0,01928 0,01469 0,01109 0,00829 0,00614 0,00451 0,00328 0,00237 0.00169 0,00120 0,00084 0,00058 0,00040 0,00027 0,00018 0,00012 0,00008 0,00005 0,05 0,96012 0,88076 0,80259 0,72634 0,65271 0,58232 0,51569 0,45325 0,39532 0,34211 0,29372 0,25014 0,21130 0,17702 0,14706 0,12114 0,09894 0,08012 0,06431 0,05118 0,4036 0,03156 0,02445 0,01877 0,01429 0,01077 0,00805 0,00596 0,00437 0,0318 0,00269 0,00163 0,00115 0,00081 0,00056 0,00039 0,00026 0,00018 0,00012 0,00008 0,00005 0,06 0,95216 0,87288 0,79486 0,71885 0,64552 0,57548 0,50925 0,44725 0,38979 0,33706 0,29914 0,24605 0,20767 0,17383 0,14429 0,18876 0,09691 0,07841 0,06289 0,05000 0,03940 0,03077 0,02382 0,01827 0,01389 0,01047 0,00781 0,00578 0,00424 0,00308 0,0221 0,00158 0,00111 0,00078 0,00054 0,00037 0,00025 0,00017 0,00011 0,0007 0,00005 0,07 0,94419 0,86501 0,78716 0,71138 0,63836 0,56868 0,50286 0,44130 0,38430 0,33205 0,28462 0,24200 0,20408 0,17069 0,14156 0,11642 0,09492 0,07673 0,06148 0,04884 0,03845 0,03001 0,02321 0,01779 0,01351 0,01017 0,00759 0,00561 0,00410 0,00298 0,00214 0,00152 0,00108 0,00075 0,00052 0,00036 0,00024 0,00016 0,00011 0,00007 0,00005 0,08 0,93624 0,85715 0,77948 0,70395 0,63123 0,59191 0,49650 0,43539 0,37886 0,32709 0.28014 0,23800 0,20055 0,16759 0,13887 0,11411 0,09296 0,07508 0,06011 0,04770 0,03753 0,02926 0,02261 0,01731 0,01314 0,00988 0,00736 0,00544 0,00398 0,00288 0,00207 0,00147 0,00108 0,00072 0,00050 0,00034 0,00023 0,00016 0,00010 0,00007 0,00005 0,09 0,92829 0,84931 0,71182 0,69654 0,62413 0,55519 0,49019 0,42953 0,37347 0,32217 0,27571 0,23405 0,19705 0,16453 0,13662 0,11183 0,09103 0,07345 0,05876 0,4659 0,03662 0,02852 0,02202 0,01685 0,01277 0,00960 0,00716 0,00527 0,00385 0,00279 0,00200 0,00142 0,00100 0,00070 0,00048 0,00033 0,00022 0,00015 0,00010 0.00007 0,00004

148