Acest material este destinat persoanelor care nu i propun s devin statisticieni. Eu nsumi nu am fost format n facultate pentru a deveni statistician, fiind absolvent al facultii de psihologie. Cursurile de statistic la care am participat mi-au permis s analizez, s neleg i s explic datele obinute n cercetri i experimente. Cnd studenii la psihologie afl c trebuie s studieze statistica, cei mai muli dintre ei sunt speriai. Acetia consider c statistica este foarte grea i, pe deasupra, este plictisitoare. Prin intermediul captitolelor urmtoare vom ncerca s v artm c statistica nu este att de dificil i, mai ales, c nu este deloc plictisitoare. Statistica este o tiin care descrie fenonemele cu ajutorul numerelor, folosind calculul probabilitilor. Statistica are rolul de a ne oferi informaii relevante despre despre un volum de date foarte bogat i diversificat. Informaiile obinute cu ajutorul statisticii pot descrie un anumit volum de date (statistic descriptiv) sau pot descrie relaiile dintre mai multe variabile sau evenimente (statistica inferenial). Statistica este tiina care se ocup cu recoltarea, descrierea i analiza datelor n vederea extragerii unor concluzii (inferene) pe baza acestora (Popa, 2008). Statistica face parte din viaa noastr ntr-o msura mai mare dect ne putem imagina, ea oferind suport pentru fizic, sociologie, psihologie, economie, biologie, etc. Pentru a putea nelege un fenomen ncercm s l cuantificm, s observm n ce situaii apare sau l comparm cu alte evenimente. Toate aceste operaii au la baz numere. Pe teritoriul Romniei lucrarea lui Dimitrie Cantemir Descriptio Moldavie (1716) poate fi considerat prima lucrare statistic. Lucrarea are un caracter enciclopedic i conine descrieri de natur geografic, politic, administrativ, organizatoric, social, lingvistic i etnografic ale Moldovei. Aceast lucrare conine toate cunotinele acumulate n domeniu pn la acea dat. Fr a ne da seama folosim statistica n cele mai multe dintre momentele pe care le trim zi de zi. De exemplu, dac am vzut un film care ne-a plcut foarte mult, atunci cnd apare partea a doua a se bazeaz pe un algoritm probabilistic atunci cnd decide s mearg la cinematograf pentru a vedea continuarea primei pri. Amintirile primului film, reputaia actorilor i impresia lsat de alte filme n care au mai aprut actorii ne vor face s presupunem c acest nou film va fi bun i ne v plcea. De asemenea, cnd conducem folosim cunotine de statistic. n funcie de experienele anterioare, de or sau ziua din sptmn ne stabilim traseul pe care vom merge astfel nct s ajungem la destinaie n timp util i fr incidente. n acest fel ne dm seama c exemplele ar putea continua la nesfrit. Toate fiinele vii funcioneaz ca nite mecanisme statistice fine i sofisticate, chiar dac actele lor nu decurg n mod normal din prelucrri statistice (Popa, 2008, p. 15). Statistica este tiina care ne permite s nvm cu ajutorul datelor pe care le obinem prin msurare i controlul erorilor. Prin urmare, statistica ne permite formularea unor concluzii pe baza detelor recoltate. A msura presupune atribuirea de valori numerice n raport cu un criteriu de referin. Statistica este de dou tipuri: descriptiv i inferenial. Statistica descriptiv reprezint organizarea, prezentarea i descrierea datelor. Cu toii suntem familiarizai cu cel puin un termen care poate descrie un set de date media aritmetic. nc din coala general este bine cunoscut modalitatea prin care se obine media un grup de numere. n esen, statistica descriptiv ne ofer o expresie (un numr) care descrie setul de date (Spatz, 1992). Statistica inferenial se refer la extinderea rezultatelor obinute la nivel de eantion la nivelul populaiei din care acesta a fost extras. Rezultatele majoritii experimentelor se bazeaz pe statistica inferenial.
2. Concepte fundamentale
Statistica utilizat n psihologie folosete o serie de noiuni i concepte care sunt utilizate i n alte discipline: metodologia cercetrii, psihologie experimental, psihodiagnostic, etc.
2.1 Populaie i eantion
Este foarte bine cunoscut faptul c exist milioane de conductori auto pe teritoriul rii noastre i dorim s aflm ct mai multe informaii despre aceste persoane (ce vrste au, ce tipuri de maini conduc, ct de noi sunt mainile pe care le conduc, etc). Este evident faptul c nu putem s investigm toi posesorii de permis de conducere pentru a afla aceste informaii. Din acest motiv, vom selecta un numr accesibil de conductori auto (s presupunem 1500). Pornind de la acest eantion de conductori auto vom generaliza informaiile obinute la nivelul ntregii populaii de oferi. Astfel, toi conductorii auto de pe teritoriul Romniei reprezint populaia de referin, iar lotul selectat pentru a recolta datele reprezint eantionul cercetrii. Populaia reprezint totalitatea cazurilor care constituie obiectivul de interes al unei cercetrii. Prin cazuri ne referim la subieci sau persoane. Totui, prin caz ne putem referi i la cupluri, maini, departamentele unei organizaii, etc. Populaia se refer la domeniul de interes pe care cercettorul i propune s l exploreze. De exemplu, ntr-un studiu privind efectul antrenamentelor fizice asupra performanei sportive, putem discuta despre mai multe populaii: cea a tenismenilor, cea a atleilor, a fotbalitilor, etc. Caracteristica numeric sau nominal caracteristic populaiei se numete parametru.
Avnd la baz analiza volumului, Popa (2008) propune dou tipuri de populaii: Infinite numrul cazurilor componente nu este cunoscut. De exemplu, populaia cardiacilor, a consumatorilor de cafea, etc. Finite numrul cazurilor componente poate fi cunoscut. De exemplu, populaia angajailor unei organizaii, a sportivilor unui club, etc.
Eantionul reprezint totalitatea cazurilor selectate pentru a fi studiate. Astfel, pornind de la datele obinute la nivelul eantionului se vor face aprecieri n legtur cu ntreaga populaie. Tocmai aceasta este esena statisticii infereniale ipoteza este verificat la nivelul unui eantion care ndeplinete anumite condiii, rezultatele obinute urmnd a fi extinse la nivelul populaiei din care acesta a fost extras. Caliatea unui eantion prin care rezultatele pot fi extinse la nivelul populaiei se numete reprezentativitate. Oricte eantioane am extrage dintr-o populaie nici unul nu poate reprezenta o estimare perfect a populaiei, ele fiind doar o estimare a acesteia. Prin urmare, aceste estimri conin o cantitate mai mic sau mai mare de eroare. Cu ct eroarea este mai mic, cu att eantionul reprezit o estimare mai bun a populaiei din care a fost extras. Caracteristica numeric sau nominal caracteristic eantionului se numete indicator.
2.2 Noiunea de variabil
Prin variabil ne referim la proprietatea constructului analizat de a lua valori diferite. De exemplu, vrsta, greutatea, genul i statutul marital sunt variabile. Exist dou clasificri tradiionale ale variabilelor. O clasificare se face din punct de vedere experimental i n acest context distingem ntre variabile independente i variabile dependente. Conform altei clasificri distingem ntre variabile discrete i variabile continue.
2.2.1 Variabile independente i dependente
Aceast clasificare dintre variabile se face n funcie de variabila controlat de cercettor i cea ce acesta dorete s msoare. Variabila care se afl sub controlul cercetrorului se numete variabil independent. Variabila msurat de cercettor, cea care depinde de variabila independent poart denumirea de variabil dependent. Variabla independent este cea care genereaz efecte asupra variabilei dependente. De exemplu, ntr-o cercetare dorim s studiem influena consumului de alcool asupra timpului de reacie. n acest caz, timpul de reacie variaz n funcie de consumul de alcool. Astfel, consumul de alcool este variabila independent, iar timpul de reacie, cel care suport efectul, este variabila dependent. ntr-un alt studiu, cercettorul dorete s verifice ipoteza conform creia brbaii consum mai mult alcool dect femeile. n acest exemplu, variabila dependent este consumul de alcool, iar variabila dependent este genul (masculin vs feminin). De aceast dat consumul de alcool este cel care suport un efect din partea genului. n acest exemplu observm c consumul de alcool, care n primul exemplu era variabil independent, n acest caz ndeplinete rol de variabil dependent. Variabila dependent este obiectul msurrii cu scopul extragerii unor concluzii, iar variabila independent este cea care genereaz o influen i prin intermediul studiului vom evidenia efectele ei asupra variabilei dependente. Exemplele amintite mai sus ne permit s nelegem c o variabil nu are rol unic de independent sau dependent. Caracteristica de a fi de un tip sau altul depinde de rolul pe care l atribuie cercetrorul n studiul pe care dorete s l desfoare. Este esenial s identificm corect tipul variabilelelor pentru a putea folosi n fundamentarea inferenelor procedurile statistice corespunztoare.
2.2.2 Variabile discrete i variabile continue
O variabil este continu atunci cnd poate lua orice valoare numeric. Altfel spus, o variabil ntre ale crei valori numerice nu exist ntreruperi poart denumirea de variabil continu. Acest tip de variabil primete teoretic un numr infinit de valori. Greutatea, nlimea sau timpul de reacie sunt exemple de variabile continue. Prin variabil discret ne referim la o variabil care poate primi un numr finit de valori, aceastea fiind numere ntregi. Numrul copiilor dintr-o familie, numrul rspunsurilor corecte la un test, numrul de repetri n vederea memorrii unui material sunt exemple de variabile discrete.
2.2.3 Variabile latente i variabile observabile
Experiena uman presupune lucrul cu variabile care pot fi obserate direct (timp de reacie, nlime), dar i cu o serie de constructe latente (depresie, anxietate, sociabilitate, etc). n cazul celor din urm trebuie s gsim indicatori care ne vor permite estimarea constructului latent. Astfel, n cazul sociabilitii vom adresa ntrebri precum Preluai cuvntul cnd intrai ntr-un grup n care nu se vorbete?, V face plcere s cunoatei persoane noi?, V plac reuniunile?. Fiecare ntrebare reprezint o variabil observat ncrcat cu sociabilitate. Dac pentru fiecare rspuns care indic o atitudine ncrcat cu sociabilitate oferim un punct, sociabilitatea se estimeaz ca sum a punctelor obinute. Astfel,ntrebrile dintr-un chestionar care i propune s msoare sociabilitatea devin indicatori ai acesteia. Majoritatea constructelor utilizate n psihologie sunt variabile latente.
2.3 Msurarea
S ne imaginm c suntem n situaia n care intervievm un set de alpiniti despre simptomele de hipoxie aprute n timpul escaladrii Vrfului Everest. Astfel, un alpinist din Romnia va exprima n metri altitudinea la care a resimit primele efecte ale hipoxiei, pe cnd un alpinist din Statele Unite va preciza altitudinea n picioare. S ne imaginm c suntem n situaia n care trebuie s selectm copii pentru a forma o echip de baschet. n acest sens suntem interesai s msurm anumite caracteristici, una din cele mai importante fiind nlinea candidailor. Aceasta poate fi exprimat n metri (1,95, 1,88) sau n centimetri (195, 188). Din aceste exemple nelegem faptul c orice msurtoare presupune un aspect convenional stabilit de cel care msoar. A msura nseamn a atribui numere sau simboluri unui aspect al realitii n funcie de anumite aspecte cantitative sau calitative care le caracterizeaz. Modul n care sunt atribuite anumite numere sau simboluri pentru a msura ceva se numete scal de msurare.
2.3.1 Scale de msurare
n funcie de informaia oferit de valorile obinute prin procesul de msurare distingem patru niveluri: nominal, ordinal, de interval i de raport. Aceast ordine este ierarhic. Fiecare nivel are anumite proprieti, astfel nct fiecare nivel include criteriile tuturor celor inferioare lui (Popa, 2008).
Scala nominal permite etichetarea valorilor i plasarea lor n anumite categorii, dar fr a realiza comparaii. n aceast situaie o valoare nu este mai mare sau mai mic dect alta. Un exemplu de variabil msurat pe scal nominal este starea civil (necstorit, cstorit, divorat). n acest exemplu valoarea variabilei este una simbolic, ea putnd deveni numeric prin atribuirea unui cod: 0 = necstorit; 1 = cstorit; 2 = divorat. Alte exemple de variabile msurate pe scal nominal sunt: anotimpurile (primvar, var, toamn, iarn), naionalitatea (romn, turc, maghiar), tipul de personalitate (introvert, extravert). Variabilele msurate pe scal nominal pot fi de dou tipuri: De identificare o valoare are rolul de a codifica identitatea, referindu-se la o anumit persoan (codul numeric personal, numrul matricol). Categoriale exprim formele pe care le ia o variabil (tipul temperamental: coleric, sangvin, melancolic, flegmatic; tipul de liceu absolvit: real, umanist, tehnic). Acest tip de scal nu permite operaii matematice (adunri, scderi, calcularea mediei) i nu precizeaz dac o valoarea este mai mare sau mai mic dect alta. Totui, sunt permise operaii descriptive (numrare, procente).
Scala ordinal este utilizat n situaia n care dorim s stabilim o ierarhie, dar fr a preciza cu ct o valoare este mai mare sau mai mic dect alta. Candidatul cu cel mai mare punctaj la concursul de admitere primete valoarea 1, iar cel cu al doilea scor primete codul 2. n aceast situaie putem preciza c cel de primul loc a fost mai bun dect cel de 2, dar fr a specifica intensitatea diferenei dintre ei. Cel de pe primul loc nu este de trei ori mai bun dect al treilea clasat. Exemple de variabile msurate pe scal de tip ordinal: ierarhia ntr-un concurs de amitere, nivelul de colarizare, categoria de vrst. Codurile valorilor ordinale sunt arbitrare, dar ele trebuie s indice ordinea. Acest tip de scal nu permite operaii matematice.
Scala de interal are caracter cantitativ, este exprimat numeric, are intervale egale i ne exprim ordinea valorilor. De aceast dat putem stabili intensitatea diferenei dintre valorile variabilei msurate. O caracteristic a acestei scale este absena lui 0 absolut. Exemple: temperatura (cnd termometrul nregistreaz 7 grade putem spune c sunt cu 3 grade mai mult dect atunci cnd sunt nregistrate 2 grade), depresia (un pacient care obine un scor de 10 puncte are cu 4 mai multe dect cel care prezint 6 indicatori). Prin absena lui 0 absolut nelegem faptul c nregistrarea unui scor 0 atunci cnd facem o msurtoare nu nseamn lipsa constructului respectiv. De exemplu, 0 grade Celsius nu nseamn lipsa temperaturii. Acest tip de scal suport toate tipurile de operaii matematice.
Scala de raport deine cel mai nalt grad de msurare. Pe lng egalitatea intervalelor, specific scalei de interval, cuprinde i valoarea 0 absolut. Exemple: timpul, distana, nlimea, greutatea. n psihologie sunt foarte puine variabile msurate pe scala de raport, deoarece foarte rar se opereaz cu constructe care pot lua valoarea 0 absolut. Asemenea scalei de interval, scala de raport suport toate tipurile de operaii matematice. Din acest motiv, n practic, valorile msurate pe scal de interval sau de raport sunt considerate similare, fiind prelucrate cu acelai tip de proceduri statistice. Prin urmare, n aceast situaie, precizm c variabila este msurat pe scal de interval/raport.
2.3.2 Erori de msurare
Orice msurare cuprinde o cantitate mai mic sau mai mare de eroare. Din acest motiv, constructul msurat este format din manifestarea real a respectivului construct (scor real) i o cantitate de eroare
X = T + E
Atunci cnd aplicm un test de inteligen, scorul obinut (120) exprim performana la test a unui subiect. O analiz amnunit a unui astfel de scor nu ne permite s trecem peste faptul c acest scor este afectat de o cantitate de imprecizie. Imprecizia poate proveni din calitatea instructajului, a construciei testului (erori grafice), precum i ca urmare a unor influene din partea mediului de testare (zgomot, temperatur, luminozitate, etc). Este datoria cercetrorului de a se asigura c mrimea erorii este ct mai mic, astfel nct s atribuie o explicaie corect rezultatelor obinute. Erorile sunt de dou tipuri: aleatorii i sistematice. Eroarea aleatorie este produs de diferite surse care pot afecta valorile msurate att n sens cresctor, ct i n sens descresctor. De exemplu, la un concurs de tir, unii participani poi fi afectai de oboseal, iar performana tinde s scad, n timp ce ali candidai sunt odihnii i obin un plus de performan. Dac starea de oboseal se mptie omogen asupra participanilor, atunci plusul i deficitul de performan s-ar neutraliza i ar reduce nivelul erorii. Trebuie s inem cont de faptul c eroarea aleatorie nu are o surs unic. n exemplul de mai sus, performana poate fi influenat de motivaie, de numrul antrenamentelor, distana parcurs pn la locul competiiei, etc. Eroarea aleatorie mai este cunoscut i sub numele de eroare de stare.
Eroarea sistematic, spre deosebire de cea aleatorie care putea afecta valorile n orice sens, afecteaz scorurile ntr-un singur sens (mai mic sau mai mare) fa de scorul adevrat. De exemplu, dac la un test de cunotine, una din variantele de rspuns este subliniat, se presupune c acest fapt ar influena toate scorurile nregistrate de subieci. Eroarea sistematic conduce fie spre creterea scorurilor, fie spre scderea lor, n funcie de orientarea ei. Eroarea sistematic se mai numete bias.