Sunteți pe pagina 1din 109

UNIVERSITATEA BABE-BOLYAI CLUJ-NAPOCA

CENTRUL DE FORMARE CONTINU, NVMNT LA DISTAN I CU

FRECVEN REDUS

Specializarea : Asisten Social

Conf.dr. CORNELIA MUREAN

PROIECTAREA I ANALIZA BAZELOR


DE DATE SOCIALE

ANUL III
C.F.C.I.D

Cluj-Napoca

2017
CUPRINS

Programa analitic ........................................................................................... 4


Partea I. Pachetul statistic SPSS .................................................................. 8
Capitolul 1. Introducere ........................................................................................ 8
1.1. Baze de date sociale i SPSS ..................................................................................... 8
1.2. Procesul de analiz statistic a datelor n SPSS ....................................................... 10
Capitolul 2. Introducere n SPSS sub Windows ................................................ 12
2.1. Pornirea SPSS .......................................................................................................... 12
2.2. Sistemul de meniuri ................................................................................................. 13
2.3. Linia de pictograme ................................................................................................. 14
2.4. Casetele de dialog .................................................................................................... 14
2.5. Asistena on-line................................................................................................... 15
Capitolul 3. Proiectarea unei baze de date sociale ............................................ 16
3.1. Utilizarea Editorului de date SPSS .......................................................................... 16
3.2. Un exemplu.............................................................................................................. 16
3.3. Proiectarea schemei de codificare ............................................................................ 17
3.4. Definirea variabilelor ............................................................................................... 17
3.5. Atribuirea numelui variabilei ................................................................................... 17
3.6. Schimbarea tipului variabilei ................................................................................... 18
3.7. Adugarea etichetelor descriptive pentru variabile i valori .................................... 19
3.8. Atribuirea valorilor omise ........................................................................................ 21
3.9. Valori omise sistem i valori omise utilizator .......................................................... 22
3.10. Schimbarea formatului coloanei ............................................................................ 23
3.11. Definirea variabilelor adiionale ............................................................................ 23
3.12. Introducerea datelor .............................................................................................. 24
3.13. Editarea datelor ...................................................................................................... 24
3.14. Examinarea informaiilor n Editorul de date ........................................................ 24
3.15. Utilizarea etichetelor variabilelor n proceduri ...................................................... 25
3.16. Salvarea fiierului de date ...................................................................................... 25
3.17. Diferena dintre Save As i Save ........................................................................... 26
3.18. Ieirea din SPSS ..................................................................................................... 26
Capitolul 4. Cutarea erorilor i analize statistice exploratorii ....................... 28
4.1. Procedura Frequencies ............................................................................................. 28
4.2. Procedura Crosstabs................................................................................................. 29
4.3. Procedura Descriptives ............................................................................................ 31
4.4. Procedura Means ..................................................................................................... 31
4.5. Procedura Explore ................................................................................................... 32
4.6. Depistarea erorilor ................................................................................................... 34
Partea a II a. Analiza statistic inferenial .............................................. 37
Capitolul 5. Cutarea confirmrii ipotezelor .................................................... 37
5.1. Testarea ipotezelor .................................................................................................. 37
5.2. Explicatii alternative ............................................................................................... 38
5.3. Respingerea explicaiei ansei prin testele statistice ............................................ 39
5.4. Dovezi suficiente i semnificaie .......................................................................... 42
5.5. Relaii statistic semnificative i rezultate substaniale ......................................... 44
5.6. Rezumat ................................................................................................................... 44
5.7. ntrebri pentru studiu ............................................................................................ 45
Capitolul 6. Selectarea unui test statistic ......................................................... 46
6.1. Importana selectrii unui test statistic potrivit ................................................... 46
6.2. Consecinele folosirii unui test statistic necorespunztor ................................... 46
6.3. Consideraii care influeneaz alegerea unui test ................................................ 47
6.4. Teste parametrice i neparametrice ....................................................................... 49
6.5. Cptarea deprinderilor de folosire a testelor statistice ...................................... 50
6.6. Rezumat ................................................................................................................... 50

2
6.7. ntrebri pentru studiu ............................................................................................ 50
Capitolul 7. Asocierea .......................................................................................... 52
7.1. Ce caut s determine asocierea .......................................................................... 53
7.2. Logica tabelelor de asociere .................................................................................... 53
7.3. Cnd s nu utilizm asocierea .............................................................................. 60
7.4. Asocierea cu trei sau mai multe variabile .......................................................... 62
7.1. Exemplu din micro-practic................................................................................... 63
7.6. Exemplu din macro-practic .................................................................................. 66
7.7. Rezumat ................................................................................................................... 68
7.8. ntrebri pentru studiu ............................................................................................ 68
Capitolul 8. Corelaia........................................................................................... 70
8.1. Conceptul de corelaie ........................................................................................... 70
8.2. Logica corelaiei ..................................................................................................... 73
8.3. Corelaia cu trei sau mai multe variabile ........................................................... 79
8.4. Exemplu din micro-practic................................................................................... 79
8.5. Exemplu din macro-practic .................................................................................... 82
8.6. Rezumat ................................................................................................................... 84
8.7. ntrebri pentru studiu ............................................................................................ 84
Capitolul 9. Compararea mediilor...................................................................... 86
9.1. Popularitatea statisticii t ......................................................................................... 86
9.2. Logica statisticii t ..................................................................................................... 87
9.3. Calcularea i interpretarea valorilor lui t............................................................. 88
9.4. Prezentarea statisticii t ............................................................................................. 91
8.5. Cnd nu se folosete testul t .................................................................................... 92
8.6. Exemplu din micro-practic.................................................................................... 93
9.7. Exemplu din macro-practic ................................................................................... 95
9.8. Rezumat ................................................................................................................... 98
9.9. Intrebri pentru studiu ............................................................................................ 98
Capitolul 10. Alte teste statistice .................................................................... 100
10.1. Alternative pentru testele de asociere ................................................................. 100
10.2. Alte teste pentru msurtori de nivel ordinal ....................................................... 102
10.3. Rezumat ............................................................................................................... 107
10.4. ntrebri pentru studiu .......................................................................................... 107
BIBLIOGRAFIE ................................................................................................ 109

3
Programa analitic
Date de contact ale titularului de curs Date de identificare curs i contact tutori
Nume: Lect. dr. Paul Teodor Hrgu Proiectarea si Analiza Bazelor de Date
Tutore: drd. Sergiu Raiu Sociale
Birou: Bdul 21 Decembrie 1989, nr. 128- Codul cursului ALR 2603
130

Telefon: 40.264-42.46.74 Anul III, sem. II


Fax: 40.264-42.46.74 Tipul cursului: obligatoriu
E-mail: tpharagus@socasis.ubbcluj.com
Consultaii: Luni, orele 10 12

Condiionri i cunotine prerechizite:


Nu sunt impuse condiionri pentru participarea la acest curs. Este un curs
fundamental pentru specializarea n domeniul asistenei, ce urmrete familiarizarea
studenilor cu domeniul i particularitile asistenei sociale ca profesie.

Descrierea cursului:
Intentia cursului este de a ajuta studentii de la asistenta sociala, in special studentii in anii
terminali sa isi dezvolte abilitati de a folosi proceduri statistice, si sa inteleaga rezultatele
acestor proceduri. Alte aspecte pe care cursul incearca sa le acopere sunt: invatarea lucrului
cu calculatorul pentru introducerea datelor, analiza datelor, si aprofundarea unor abilitati de
programare folosind softul SPSS. Acest curs constituie o introducere in analiza si
interpretarea datelor, asa cum este folosita in practica asistentei sociale iar printre avantajele
pe care studentii le vor dobandi se numara si cele legate de abilitatea lor de a conduce
cercetari stiintifice, dar si de a evalua critic alte cercetari sau chiar practica asistenei sociale.

La sfritul acestui curs studentul trebuie s:


1. i dezvolte abilitatea de a gndi critic, mai ales cnd vine vorba despre producerea, analiza
i interpretarea datelor relevante pentru practica asistenei sociale.
2. analizeze i s interpreteze datele folosind calculatorul i softurile statistice dedicate
(SPSS)
3. sa acumuleze abilitati legate de folosirea datelor existente dar si de producerea altora noi,
folositoare practicii asistentei sociale, adaptate la nevoile specifice ale clientilor, contextelor
etc.
4. identifice si sa formuleze probleme de cercetare, sa inteleaga diferitele abordari teoretice
asupra cercetarii, sa inteleaga diferitele abordari asupra designului cercetarii, sa poata utiliza
diferite metode statistice pentru analiza datelor.
5. construiasca un program de cercetare care sa fie capabil sa evalueze practica asistentei
sociale.

Temele abordate n cadrul cursului:


Familiarizarea cu tematica cursului. Ce este cercetarea stiintifica? De ce trebuie sa
facem cercetare stiintifica? La ce foloseste? Rolul si functiile cercetarii in asistenta
sociala. Identificarea unei probleme: ce studiem? Intrebarea de cercetare.
Conceptualizare si masurare. Esantioane si tipuri de esantioane. Designul
cercetarii. Unitati de analiza. Design experimental, cvasi-experimental si non-
experimental. Perspective diferite asupra cercetarii. Literatura de specialitate.
Softuri pentru analiza bazelor de date: prezentare generala SPSS, STATA etc.

4
Mediul de lucru in SPSS. Familiarizarea cu sistemul de meniuri si optiuni.
Exercitii practice. Folosirea SPSS pentru generarea unei baze de date. Cum
construim o baza de date? Reguli generale si specifice. Explorarea datelor.
Etichete. Etichetele variabilelor. Valori omise. Sabloane. Cataloage de coduri.
Cautarea erorilor in baza de date. Exercitii practice. Crearea de noi variabile:
masuri compuse. Variabile tip index. Reducerea variantelor de raspuns.
Variabile de tip dummy. Optiunile Recode, Compute. Exercitii practice.
Verificare intermediara: prezentare schitei proiectului de cercetare. Analiza
datelor. Analiza univariata. Prezentarea grafica a datelor. Analiza bivariata.
Prezentarea rezultatelor. Interpretarea rezulatetelor. Dileme si posibile solutii.
Analiza multivariata. Cauze multiple. Prezentarea rezultatelor: raportul de
cercetare. Elemente constitutive. Exemple practice.

Sarcinile cursantului:
1. Evaluarea continua a activitii studentului n cadrul cursului:
- comentarii pe baza unor lecturi
- interventii/comentarii pe tema cursului 20%
2. interventii/comentarii la prezentarile colegilor Verificare parial (schi a
proiectului de cercetare) n sptmna a 6-a 30%
3. Proiect de cercetare (predat in ultimele saptamani de scoala) 50%

Prezentarea coninuturilor tematice


1. Introducerea. Familiarizarea cu tematica cursului. Ce este cercetarea stiintifica?
De ce trebuie sa facem cercetare stiintifica? La ce foloseste? Rolul si functiile
cercetarii in asistenta sociala.
2. Identificarea unei probleme: ce studiem? Intrebarea de cercetare. Conceptualizare
si masurare. Esantioane si tipuri de esantioane.
3. Designul cercetarii. Unitati de analiza. Design experimental, cvasi-experimental si
non-experimental. Perspective diferite asupra cercetarii. Literatura de specialitate.
4. Softuri pentru analiza bazelor de date: prezentare generala SPSS, STATA etc.
Mediul de lucru in SPSS. Familiarizarea cu sistemul de meniuri si optiuni.
Exercitii practice.
5. Folosirea SPSS pentru generarea unei baze de date. Cum construim o baza de
date? Reguli generale si specifice. Explorarea datelor.
6. Etichete. Etichetele variabilelor. Valori omise. Sabloane. Cataloage de coduri.
Cautarea erorilor in baza de date. Exercitii practice.
7. Crearea de noi variabile: masuri compuse. Variabile tip index. Reducerea
variantelor de raspuns. Variabile de tip dummy. Optiunile Recode, Compute.
Exercitii practice.
8. Verificare intermediara: prezentare schitei proiectului de cercetare.
9. Analiza datelor. Analiza univariata. Prezentarea grafica a datelor.
10. Analiza bivariata. Prezentarea rezultatelor. Interpretarea rezulatetelor. Dileme si
posibile solutii.
11. Analiza multivariata. Cauze multiple.
12. Prezentarea rezultatelor: raportul de cercetare. Elemente constitutive. Exemple
practice.
13. Prezentarea proiectului de cercetare.
14. Prezentarea proiectului de cercetare. Incheierea cursului.
Bibliografie obligatorie:
1. Babbie Earl R., Halley Fred, Zaino Jeanne (2000). Adventures in social research.
Thousand Oaks, Calif : Pine Forge Press.
2. Babbie, Earl R. (2010). Practica cercetarii sociale. Iasi: Polirom.

5
3. Blaxter, L., Hughes, C., Tight, M. (2001). How to research. 2nd Ed., Open Univ.
Press.
4. Field, Andy (2007). Discovering statistics using SPSS. 2nd Ed, Thousand Oaks,
Ca: Sage.
5. Morris, Teresa (2006). Social work research methods: four alternative paradigms.
Thousand Oaks, Ca: Sage.
6. Tutty, L.M., Rothery, M., Grinell, R.M Jr. (2005). Cercetarea calitativ n
asistena social. Faze, etape i sarcini. Iai: Polirom.
7. Rotariu T., Badescu G., Culic I., Mezei E., Muresan C. (1999). Metode statistice
aplicate in stiintele sociale. Iasi: Polirom.
8. Rotariu, T., Ilu, P. (1997). Ancheta sociologic i sondajul de opinie, Iai:
Polirom.
Bibliografie opional
1. Chelcea, Septimiu (2005). Cum sa redactam o lucrare de licenta, o teza de
doctorat, un articol stiintific in domeniul stiintelor socio-umane. Bucuresti:
Comunicare.ro.
2. Culic, I. (2004). Metode avansate in cercetarea sociala. Analiza multivariata de
interdependenta, Iasi: Polirom.
3. Eco, U. (2000). Cum se face o teza de licenta. Constanta: Pontica
4. Freedman, D., Pisani, R., Purves, R. (1997). Statistics. 3rd Ed, WW Norton.
5. Howitt Dennis, Cramer Duncan, Popescu Andrei (2006). Introducere n SPSS
pentru psihologie. Iai : Polirom.
6. Jaba Elisabeta, Grama Ana (2004). Analiza statistica cu SPSS sub Windows.
Iasi: Polirom.
7. King G., Keohane, R., Verba, S (2000). Fundamentele cercetarii sociale. Iasi:
Polirom.
8. King, R.F. (2005). Strategia cercetrii. Treisprezece cursuri despre elementele
tinelor sociale. Iai: Polirom.
9. Krueger, R.A, Casey, M.A. (2005). Metoda focus grup. Ghid practic pentru
cercetarea aplicat. Iai: Polirom.
10. Lungu, Ovidiu (2001). Ghid introductiv pentru SPSS 10.0. Iasi : Erota.
11. Mucchielli, Ales (2002). Dictionar al metodelor calitative in stiintele socio-
umane. Iasi: Polirom
12. Pah Iulian (2004). Introducere n SPSS. Cluj-Napoca : Eikon.
13. Popa, Marian (2008). Statistic pentru psihologie. Iai: Polirom.
14. Singly, F., Blanchet, A., Gotman, A., Kaufmann, J-C. (1998). Ancheta i
metodele ei: chestionarul, interviul de producere a datelor, interviul
comprehensiv, Iai: Polirom
15. Strauss, A., Corbin, J. (1998). Basics of qualitative research: techniques and
procedures for developing grounded theory. Thousand Oaks, Ca: Sage
16. Williams, L., Dunsmuir A. (1999). How to do social research. London: Harper
Collins Publ.

Materiale i instrumente necesare cursului:


Pentru parcurgerea n bune condiii a pregtirii necesare promovrii cursului
studentul ar avea nevoie de urmtoarele resurse:
calculator conectat la internet (pentru a accesa baze de date resurse electronice
suplimentare dar i pentru a participa la secvenele de formare interactiv on-line)
acces la resursele bibliografice (prin legitimaie la biblioteca Central a
Universitii Babe-Bolyai)

6
acces la imprimant, pentru realizarea temelor, acces la echipamente de
fotocopiere

Elemente de deontologie academic:


Plagiatul sau frauda se pedepsete n conformitate cu reglementrile n vigoare
(poate implica exmatricularea studentului). Plagiatul este prezentarea unor ideilor,
argumente, forme de exprimare, date, figuri, tabele etc. scrise sau elaborate de ctre o
alta persoan ca aparinnd propriei persoane, fr o corect menionare a sursei (prin
citare, referire sau not bibliografic). Prin urmare, este vorba de plagiat n situaia n
care cuvintele unei alte persoane sunt reproduse fr menionarea sursei, ct i atunci
cnd ideile sau argumentele altei persoane sunt parafrazate astfel nct cititorul ar
putea crede c ele aparin autorului textului. Pentru standardele de redactare a
bibliografiilor putei consulta: Standardele APA pentru redactarea bibliografiilor
(salvat n data de 29 august 2005, de pe adresa
http://psihologie.esential.ro/APA%20bibl.html.)

Solicitarea de ajutor prin e-mail: Este necesar s includei numele


dumneavoastr complet n subiectul fiecrui e-mail pe care mi-l trimitei, precum i
numele cursului/disciplinei pentru care formulai intrebri/dorii clarificri. Studenii
sunt rugai s foloseac platforma ID a universitii.

Studeni cu nevoi speciale:


Titularul cursului i exprim disponibilitatea, n limita constrngerilor tehnice
i de timp, de a adapta coninutul i metodele de transmitere a informaiilor, precum i
a modalitilor de evaluare (ex.: examen oral pentru studenii cu probleme de vedere)
n funcie de tipul dizabilitii cursantului.

Strategii de studiu recomandate:


Avnd n vedere caracteristicile nvmntului la distan, se recomand
studenilor o planificare riguroas a secvenelor de studiu individual, coroborat cu
secvene de dialog prin internet cu tutorele i titularul disciplinei. Parcurgerea fiecarui
modul, rezolvarea la timp a temelor faciliteaz nelegerea coninutului tematic i
promovarea, n bune condiii, a disciplinei.

7
Partea I.

Pachetul statistic SPSS

Capitolul 1. Introducere

1.1. Baze de date sociale i SPSS

n istoria dezvoltrii sistemelor de gestiune a bazelor de date ultimele tipuri


aprute, dar i cele care au devenit cele mai populare, gestioneaz aa-numitele baze
de date relaionale. Acestea se prezint ntotdeauna sub form de tabele, n care
liniile reprezint cazurile, iar coloanele reprezint variabilele statistice. La intersecia
rndului cu coloana se va gsi valoarea unei variabile pentru un caz particular. Bazele
de date relaionale seamn mult cu tabelele ce s-ar putea construi ntr-o foaie de
calcul, desigur respectnd anumite structuri de date apriori definite.

Pachetul statistic Statistical Package for Social Sciences (SPSS), n varianta


lui sub Windows, este dotat cu un Editor pentru date care permite construirea unui
fiier de date specific domeniului tiinelor sociale.

Aici volumul datelor nu este att de impresionant ca n cazul domeniului


economic, legturile ntre diverse fiiere de date nu sunt chiar att de complexe,
problemele de securitate legate de accesul partajat ntre mai muli utilizatori n timp
real nu se pun cu atta acuitate, dar celelalte probleme legate de facilitile oferite n
mod tradiional de un sistem de gestiune a bazelor de date sunt rezolvate cu succes i
de SPSS.

n plus, SPSS este dotat cu o serie de programe statistice extrem de puternice,


special construite pentru analiza statistic a datelor din domeniul social.

Iat de ce considerm c pentru profesiunea de asistent social, unde se culeg,


prelucreaz i interpreteaz date sociale, este avantajoas nsuirea pachetului SPSS,
chiar dac pentru nceput suntem interesai doar de partea de management al datelor.
Odat definite structurile necesare, apoi completate fiierele cu informaiile adecvate,
vom putea beneficia att de partea de management al datelor oferite de Editorul de
date ct i de partea de analiz statistic att de necesar n orice cercetareintreprins
n domeniul social.

8
Figura 1.1. Procesul de cercetare

Teorie
&
Practic

Ipoteze

Conceptualizare
Operaionalizare

Selectarea subiecilor

Design Design
observaional experimental
Analiza documentelor Grupuri experimentale,
Interviuri grupuri de control
Anchete pe baz de Observaii / administrare
chestionare teste sau chestionare

Colectare date

Analiz date (SPSS)

Interpretare rezultate

9
1.2. Procesul de analiz statistic a datelor n SPSS

n principal, SPSS a fost conceput pentru ajuta utilizatorul n ducerea la capt


a unei cercetri. Desigur, n procesul cercetrii analiza statistic intervine mult mai
trziu. nainte de a ne aeza n faa unui calculator i a folosi Editorul de date
(modulul Data Editor) al SPSS pentru a introduce datele, se presupune c am parcurs
deja pai importani n procesul unei cercetri. Principalele faze ale unei cercetri sunt
schiate n Figura 1.1.

Computerul i pachetul de programe SPSS intervine doar n partea de analiz a


datelor. n faa calculatorului activitatea se desfoar practic n patru pai care, de
obicei, se reiau de mai multe ori (vezi figura 1.2).

Aducerea Pas 1
datelor n
memoria
intern

Pas 2
Selectarea unei
proceduri

Pas 3
Selectarea
variabilelor

Transformri fiier de date Pas 4


Interpretarea
rezultatelor

Figura 1.2. Procesul de analiz a datelor

Pasul care ne intereseaz n prima faz este cel de introducere a datelor ntr-un
fiier de date sau, dup caz, de aducere al datelor n memoria intern.

10
1. Aducerea datelor n memoria intern

Datele de gestionat (sau, dup caz, de analizat) pot fi date salvate


anterior ntr-un fiier de date SPSS.

Se pot citi date din fiiere proprii altor produse software. Cele mai
cunoscute sunt bazele de date dBASE, FoxPro sau Access; fiierele
tip foaie de calcul produse cu tabelatorul Excel; sau fiiere simple
de tip text ASCII, produse cu orice editoare de texte. Desigur,
pentru a importa astfel de date, trebuie respectate nite reguli
clare i trebuie furnizate informaii suplimentare de conversie, n
cadrul procedurilor iniiate de SPSS.

Se pot introduce direct datele n formatul propriu fiierelor de date


SPSS cu ajutorul modulului Data Editor.

2. Selectarea unei proceduri

Sistemul de meniuri al SPSS ofer o gam de comenzi care permit selectarea


i declanarea a patru categorii de proceduri:

Proceduri de gestionare a datelor

Proceduri de obinere a listelor i rapoartelor

Proceduri de construire a tabelelor statistice, de calcul a unor


indicatori statistici, de cutare a unor modele explicative

Proceduri pentru crearea unor grafice

3. Selectarea variabilelor

Cele mai multe din procedurile SPSS cer precizarea variabilelor. Acestea sunt
listate n casetele de dialog ale procedurilor, iar utilizatorul va trebui s indice
variabilele care intr n analiz.

4. Interpretarea rezultatelor

Dup ce toate elementele de informaii necesare execuiei unei proceduri au


fost precizate de ctre utilizator, procedura se va declana i va produce
rezultatele. Ele trebuie privite cu atenie i interpretate.

O edin de lucru cu SPSS const n mai multe reluri a celor patru faze: n
mai multe operaiuni de management al datelor, sau mai multe proceduri de analiz a
datelor. De multe ori ceea ce hotrm s facem n continuare depinde de rezultatele
unei operaiuni anterioare. Utilizatorul (sau dup caz, cercettorul) folosete SPSS ca
un asistent docil, dar foarte puternic i capabil, ale crui performane depind de
abilitatea cercettorului de a lua deciziile cele mai potrivite.

11
Capitolul 2. Introducere n SPSS sub Windows

SPSS sub Windows funcioneaz sub controlul unui mediu grafic GUI
(Graphical User Interface), utiliznd un sistem de meniuri descriptive i casete de
dialog care uureaz mult interfaa om-calculator. Cele mai multe operaiuni sunt
declanate i duse la capt prin punctare i clic cu mouse-ul, chiar dac lucrul cu
tastatura este oricnd o a doua alternativ.

2.1. Pornirea SPSS


Ca orice produs sub Windows, SPSS se pornete prin dublu-clic pe pictograma
sa aflat fie pe ecranul dispay-ului, fie n lista de Programe al meniului Start.

Figura 2.1. Ferestrele Data Editor i Output Navigator

Ceea ce vom vedea prima dat va fi modulul Data Editor (vezi figura 2.1). n
afara acestui modul, SPSS mai are nc dou: modulul Output Navigator modul care
se ocup de afiarea rezultatelor prelucrrilor, precum i de modificarea aspectului lor
- i modulul Chart Editor modul care faciliteaz manipularea i gestionarea
graficelor obinute prin SPSS.
Fiecare fereastr are o linie de titlu. Sub ea se gsete meniul principal al
aplicaiei. Fereastra Editorului de date conine datele de analizat sub forma unui tabel
asemntor unei foi de calcul, iar orice rezultat produs de o procedur SPSS se va

12
introduce n fereastra Output al Navigatorului de rezultate. Iniial se va deschide doar
fereastra Editorului de date. Fereastra Navigatorului de rezultate se deschide ndat ce
vreo procedur produce rezultate. In afara acestor dou ferestre mai pot apare, la
nevoie, alte dou ferestre: fereastra Editorului de grafice sau fereastra Sintax (pentru
pstrarea comenzilor SPSS n vederea repetrii lor ntr-o alt edin de lucru).

2.2. Sistemul de meniuri


SPSS v7.5 poate lucra ntr-o varietate de moduri, dar majoritatea procedurilor
pot fi accesate fcnd selecii din meniuri. Meniul principal al Editorului de date, cea
mai utilizat component a pachetului, conine nou meniuri:

File. Se utilizeaz pentru a crea fiiere noi SPSS, pentru a deschide fiiere
existente, pentru a citi fiiere de tip spreadsheet sau baz de date create cu alte
programe software. Meniul File se mai utilizeaz pentru crearea i deschiderea
altor fiiere SPSS, adic fiiere de grafice, de rezultate sau de sintax.

Edit. Se utilizeaz pentru a modifica sau copia texte din ferestrele de rezultate
sau de sintax.

View. Se utilizeaz pentru a modifica aspectul ecranului n funcie de opiunile


utilizatorului.

Data. Se utilizeaz pentru a face schimbri globale la fiierul de date, cum ar


fi agregarea datelor din mai multe fiiere, mprirea cazurilor n subseturi.
Aceste schimbri sunt doar temporare i nu afecteaz fiierul permanent cu
excepia cazului cnd se cere explicit acest lucru (prin salvare).

Transform. Se utilizeaz pentru a face schimbri variabilelor selectate din


fiierul de date i pentru a calcula variabile noi pe baza valorilor existente n
alte variabile. Nici aceste schimbri nu afecteaz fiierul permanent dect dac
schimbrile se salveaz n mod explicit.

Statistics. Procedurile statistice se selecteaz din acest meniu. Cele mai


comune proceduri statistice sunt: tabelele de frecvene, tabelele de asociere,
calculul indicatorilor statistici descriptivi, analiza varianei, corelaia sau
regresia liniar.

Graphs. Meniul Graphs se folosete pentru a crea diagrame de bare, diagrame


circulare, histograme, diagrame de mprtiere i alte grafice n culori i de
mare rezoluie. Chiar i unele proceduri statistice pot genera grafice. Orice
grafic poate fi mbuntit cu ajutorul Editorului de grafice (Chart Editor).

Utilities. Se folosete pentru a afia informaii despre variabilele din structura


fiierului de date, pentru a defini i utiliza seturi restrnse de variabile, sau
pentru a deschide un index al comenzilor SPSS.

Window. Se utilizeaz pentru a aranja, a selecta i a controla atributele


diverselor ferestre SPSS.

13
Help. Acesta deschide ferestre de asisten on-line cu manuale electronice,
demonstraii, sfaturi contextuale i programe de nvare asistat de calculator
de tip tutorial.

2.3. Linia de pictograme


Cele mai comune comenzi SPSS, folosite n mod uzual, pot fi accesate prin
intermediul unor pictograme situate imediat sub linia de meniuri, n linia de
pictograme (Tool Bar). Aceast linie este prezent la oricare din ferestrele modulelor
SPSS, dar poate conine pictograme diferite, adaptate situaiei (vezi figura 2.1).
Unele din pictograme s-ar putea ntmpla s nu fie eligibile n anumite situaii
chiar dac apar pe ecran. O scurt explicaie a ceea ce reprezint ele poate fi obinut
foarte simplu prin plasarea indicatorului mouse-ului pe ele.

2.4. Casetele de dialog

Cele mai multe proceduri SPSS afieaz casete de dialog prin intermediul
crora adun toate informaiile necesare ducerii la bun sfrit a operaiunilor cerute de
utilizator.

Pentru c aceste casete ofer informaii utile n alegerile pe care utilizatorul le


are de fcut i pentru c aceste casete sunt foarte asemntoare ntre ele, s aruncm o
privire, de exemplu, pe cea folosit la deschiderea unui fiier: figura 2.2

Aceast caset conine o zon etichetat Look in unde va apare directorul


curent (BazeDate, n exemplu). Dac fiierul cutat nu este n directorul curent, acesta
poate fi schimbat cu ajutorul pictogramelor din aceast zon.

Fiierele sunt listate n zona cea mai ntins a casetei de dialog. De exemplu,
n figura 2.2 putem vedea patru fiiere. Oricare dintre ele poate fi deschis. Alegerea
se face prin pointare i clic pe butonul stng al mouse-ului.

Numele fiierului selectat va apare in zona File name. Aceast informaie


poate fi i tastat dac se dorete folosirea tastaturii i nu a mouse-ului.

Nu toate fiierele din directorul curent sunt listate n caset. Ele sunt filtrate cu
ajutorul extensiilor consacrate pentru diverse tipuri de fiiere. Observm c n
exemplu, toate cele trei fiiere au extensia .sav. Zona Files of type ofer ns
posibilitatea selectrii altor tipuri inclusiv a tuturor tipurilor, deci posibilitatea
neutilizrii filtrelor.

n partea dreapta jos a casetei se gsesc butoanele, adic acele zone care
declaneaz aciuni. Clic pe butonul Open produce deschiderea fiierului selectat. Clic
pe butonul Paste produce doar un text cu comanda de deschidere a fiierului selectat,
comand ce se va scrie ntr-un fiier de tip sintax, n vederea folosirii lui ulterioare.
Butonul Cancel anuleaz operaiunea n curs, fr s declaneze procedura pentru care
se fceau pregtirile. Dup acionarea butoanelor casetele de dialog dispar de pe
ecran.

Figura 2.2. Caseta de dialog Open File

14
n majoritatea casetelor de dialog apare i butonul Reset. Selectarea lui va
anula toate specificrile fcute n caseta de dialog afiat, fr ca acesta s fie tears
de pe ecran. Utilizatorul va putea face deci alte selecii.

Unele casete de dialog pot conine butoane radio i / sau csue pentru
bifare (check box). Ele nu declaneaz aciuni imediate dar permit optarea pentru
anumite variante ale procedurilor. Butoanele radio se deosebesc de csuele pentru
bifare prin faptul c numai unul dintr-o zon poate fi ales i una din alegeri este
obligatorie. n cazul csuelor pentru bifare, acestea pot fi bifate sau nu, indiferent
cte sunt ntr-o caset de dialog. Butoanele radio au o aparen circular iar opiunea
ales se marcheaz cu un punct (). Csuele pentru bifare au aparen ptratic i
opiunile alese vor fi marcate cu [] .

2.5. Asistena on-line

Figura 2.3. Fereastra Tutorialului SPSS

Meniul Help ofer multiple posibiliti de a obine ajutor interactiv. Procedura


Topics permite accesul n manualul electronic pe baza unor opiuni tematice,
procedura Tutorial este indicat pentru un prin contact cu SPSS (vezi figura 2.3), iar
procedura Statistics coach este un meditator pentru procedurile statistice. Unele din
proceduri conin demonstraii interactive, cele mai multe conin ilustraii i toate
conin explicaii textuale n limba englez.

15
Capitolul 3. Proiectarea unei baze de date sociale

3.1. Utilizarea Editorului de date SPSS

Editorul de date (Data Editor) este un modul SPSS care afieaz o fereastr tip
spreadsheet (foaie de calcul) utilizat la crearea i editarea fiierelor de date SPSS. El
se folosete att la introducerea datelor direct de pe un chestionar ct i la vizualizarea
informaiilor deja introduse, cum ar fi fie medicale, baze de date cu angajaii sau
clienii unor agenii, rezultate obinute n urma unor testri i multe altele. Fereastra
Editorului de date se deschide automat la nceputul unei edine de lucru SPSS, vezi
figura 2.1.
Dac nu se deschide un alt fiier de date, Editorul de date rmne gol. nainte
de a introduce date trebuie s avem n vedere cteva lucruri:
Liniile reprezint cazuri

Fiecare linie reprezint un caz, o observaie sau un individ statistic. n fiierul


de date folosit de noi ca exemplu, vezi fundalul figurii 2.3, fiecare linie reprezint un
respondent.
Coloanele reprezint variabile
Fiecare coloan reprezint o variabil, o caracteristic sau o nsuire a
individului statistic. n exemplul nostru chestionarul a avut 133 itemi de completat.
De aceea Editorul de date va avea 133 de variabile.
Celulele conin valori
O celul conine o singur valoare a unei variabile pentru un caz. De exemplu,
prima celul din exemplul nostru conine numrul de identificare al primului
respondent. Celulele conin numai valori numerice, iruri de caractere i date
calendaristice. Spre deosebire de foile de calcul, celulele din Editorul de date nu
conin formule.

3.2. Un exemplu
Datele utilizate n acest curs aparin bazei de date Martie97.sav. Ea conine
1.298 cazuri, reprezentnd un eantion naional al populaiei Romniei, iar variabilele
coninute se refer la ntrebri de opinie legate de situaia social, economic, politic
a Romniei, reprezentnd Barometrul de opinie editat de Fundaia pentru o Societate
Deschis. Fiierul de date conine i cteva caracteristici de identificare a subiecilor
i gospodriilor din care fac parte (gen, vrst, naionalitate, domiciliu, nivel de
educaie etc.). Ancheta de teren a avut loc n martie 1997.
Variabilele din Barometru acoper toate scalele nivelelor de msur i permit
exemplificarea celor mai variai indicatori i proceduri statistice.

16
3.3. Proiectarea schemei de codificare
Rspunsurile la cteva ntrebri sunt numere: de exemplu, vrsta, numrul de
membrii n gospodrie, distana n kilometrii fa de cel mai apropiat ora, etc. Alte
cteva ntrebri cer alegerea unor opiuni din mai multe posibile (de exemplu ultima
coal absolvit, ocupaia etc.) i fac necesar ntocmirea unei scheme de codificare.
O schem de codificare este un mod de a asocia anumite valori unor
rspunsuri din chestionar. Codurile sunt ceea ce se introduce efectiv n fiierul de
date.

n general schemele de codificare sunt arbitrare. De exemplu pentru ntrebarea


Suntei de sex masculin sau feminin? codurile ar putea fi (1) pentru masculin i (2)
pentru feminin. O alt posibilitate ar putea fi m pentru masculin i f pentru
feminin. Ori de cte ori este posibil se recomand folosirea codurilor numerice i nu a
caracterelor alfanumerice (de exemplu literele). Ar fi fr sens a cere obinerea mediei
unui grup de litere. (SPSS poate converti codurile alfabetice n coduri numerice prin
utilizarea procedurii Automatic Recode din meniul Transform).

3.4. Definirea variabilelor


Exist 133 de itemi n chestionarul nostru. Aceasta nseamn 133 de variabile
pentru Editorul de date. Cu alte cuvinte 133 coloane. Primul item este codul de
identificare (sau cod) i const n pn la 4 caractere numerice. Al doilea item este
genul respondentului (sau gen) i const ntr-un cod alfabetic m sau f. Al treilea
item este vrsta respondentului (sau varsta) care const n dou cifre. Al patrulea item
este nivelul colii absolvite (sau ulscoala) care, dat fiind c exist doar 5 posibiliti
de rspuns, const ntr-un caracter numeric. Al cincilea item este localitatea de
domiciliu (sau localit).
n caseta de dialog Define Variable din meniul Data putem gestiona 5
categorii de informaii: numele variabilei, tipul variabilei, etichetele, valorile omise i
formatul coloanei. Aceste informaii sunt tot attea aspecte ale structurii bazei de date
i se definesc pentru fiecare variabil n parte.

3.5. Atribuirea numelui variabilei


nainte de a introduce informaiile din chestionar n celulele Editorului de date,
trebuie furnizate nume unice de maximum 8 caractere pentru fiecare coloan din
fiier. Acesta va permite o referire uor de memorat pentru fiecare coloan, sau
variabil, legat de un item de chestionar. Prima coloan din Editorul de date este
legat de un item ce nu este inclus n chestionar, dar care va fi util n identificarea
respondenilor codul numeric al respondentului. Pentru a atribui un nume variabilei:
- facei clic pe orice celul din prima coloan
- facei clic pe meniul Data din meniul principal
- facei clic pe Define Variable din meniul Data
Va apare o caset de dialog ca n figura 3.1.

Figura 3.1. Caseta de dialog Define Variable

17
SPSS arat definiiile curente pentru variabil; n acest caz numele implicit al
variabilei este VAR00001. Pn ce acesta este selectat se poate nlocui cu un nume
nou, mai uor de recunoscut, ca reprezentnd numrul de identificare al
respondentului.
Tastai cod n csua Variable Name.
Exist cteva reguli ce trebuie respectate atunci cnd se atribuie nume
variabilelor. O parte din ele sunt:
Numele trebuie s nceap cu o liter
Lungimea unui nume nu trebuie s depeasc 8 caractere
Utilizarea spaiilor i a caracterelor speciale (! ? *) este interzis
Fiecare nume de variabil trebuie s fie unic
Apoi se poate face clic pe butonul OK pentru a se schimba efectiv numele
variabilei n Editorul de date. Urmeaz acum alte schimbri ale caracteristicilor
implicite ale variabilei.

3.6. Schimbarea tipului variabilei


Caseta de dialog folosit pentru schimbarea numelui variabilei (Define
Variable) poate fi utilizat i pentru specificarea tipului variabilei. Tipul variabilei se
refer la forma n care apar valorile n coloan (de exemplu cnd o informaie este de
tip text sau una din formatele numerice) dar i la dimensiunea memoriei alocat
pentru stocarea informaiei. n figura 3.2 putem vedea c tipul variabilei cod este
Numeric8.2.

Figura 3.2 Caseta de dialog Define Variable Type

18
Acesta este formatul implicit, definit n SPSS, i semnific faptul c
informaiile sunt afiate numeric cu maximum 8 poziii care includ un punct i dou
cifre pentru partea zecimal. De exemplu 1 se va afia ca 1.00. Aceasta mai
nseamn i c formatul de afiare a rezultatelor obinute n urma procedurilor SPSS
se vor afia tot cu 8 poziii i 2 cifre pentru zecimale.
Pentru a schimba formatul de afiare al variabilei se face clic pe csua de
dialog Type.
Apoi se poate schimba lungimea variabilei cod la 4 poziii, fr cifre zecimale,
ca n figura 3.2.
Dup schimbri se va aciona butonul Continue, iar schimbarea poate fi acum
sesizat n caseta Define Variable (vezi figura 3.3).

Figura 3.3. Definiii modificate pentru variabila cod

3.7. Adugarea etichetelor descriptive pentru variabile i valori


Adugarea etichetelor descriptive este foarte util, chiar dac se poate lucra i
fr ele. Etichetele adugate variabilelor i valorilor lor mbuntesc mult listingurile
cu rezultate i uureaz analiza.
Etichetele pentru variabile sunt extensii ale numelor variabilelor i permit
ataarea unor informaii mai descriptive dect permit cele maximum 8 caractere
impuse pentru un nume de variabil. Limita maxim pentru o etichet de variabil
este de 120 caractere, dar trebuie s inem totui cont c multe proceduri afieaz mai

19
puin de 120 caractere i deci este bine s folosim o etichet de o lungime ct mai
scurt.
Etichetele de valori se ataeaz valorilor specifice ale variabilelor. Acestea
sunt avantajoase mai ales atunci cnd codurile valorilor nu au legturi intrinseci cu
categoriile reprezentate de acestea. De exemplu, trebuie s codificm ultima coal
absolvit de respondent utiliznd coduri de la 1 la 5, dar fr utilizarea etichetelor
pentru valori va fi dificil s inem minte ce grup am codificat cu un anume numr.
Etichetele de valori trebuie s fie de maxim 60 caractere, dar i aici este recomandabil
s utilizm denumiri mai scurte pentru c multe proceduri nu pot afia aceste etichete
n extenso.
Tabelul 3.1 rezum informaiile descriptive pentru o parte a variabilelor din
baza de date Martie97. Un astfel de tabel se numete catalog de coduri.
Tabel 3.1. Catalog de coduri pentru cteva variabile ale Barometrului

Variabila Eticheta pentru variabil Etichete pentru valori Tip variabil

cod Serie chestionar nu Numeric 4.0


gen Genul m = masculin String 1
f = feminin
x = non-raspuns
varsta Varsta Nu Numeric 2.0
ulscoala Ultima coal absolvit 1 = maxim c. general Numeric 1.0
2 = c. profesional
3 = liceu
4 = c. postliceal
5 = nvmnt superior
localit Localitatea de reedin nu String 15

Adugarea etichetelor pentru variabile i valorile lor se face tot prin


intermediul casetei de dialog Define Variable (figura 3.3), anume prin acionarea
butonului Labels. Se va deschide o nou caset de dialog, ca cea din figura 3.4. Dup
specificarea valorii i a etichetei corespunztoare se utilizeaz butonul Add pentru a
aduga atribuirea n lista de atribuiri. Se repet adugarea atribuirilor pn se
epuizeaz lista de valori, iar la urm se acioneaz butonul Continue.

Figura 3.4. Caseta de dialog Define Labels pentru variabila ulscoala

20
Observaie. Etichetarea se face de obicei la nceput, nainte de introducerea
datelor n fiier, dar aceast operaiune poate fi cerut oricnd n cadrul unei edine
de lucru, fie pentru corectarea unor greeli, fie pentru o etichet mai gritoare. Pentru
a face astfel de schimbri se va selecta atribuirea n cauz prin clic, se vor face
modificrile n zonele Value sau Value Label , iar apoi se va aciona butonul Change.

3.8. Atribuirea valorilor omise


Una din consecinele cele mai nedorite ale colectrii datelor prin intermediul
chestionarelor este lipsa unor informaii sau incorectitudinea altora. Aceste situaii pot
apare din diverse motive printre care ar fi: incapacitatea subiectului de a rspunde la o
ntrebare, furnizarea unor rspunsuri inadecvate, omisiuni fcute de cei care codific
datele etc.

Figura 3.5. Declararea valorii omise prin caseta de dialog Define Missing Values

O alt situaie in care lipsesc valori este cea n care chiar chestionarul permite
rspunsuri ca nu tiu sau refuz s rspund sau nici unul din rspunsurile de mai
sus. i pentru astfel de informaii trebuie prevzute coduri care s serveasc
introducerii n fiierul de date. Cu toate acestea vom dori s excludem aceti subieci
din anumite analize sau anumite tabele. De exemplu, se ntmpl deseori ca o anumit
proporie a respondenilor s rspund cu nu tiu la o ntrebare privind o opinie
politic. Dei aceast proporie este interesant prin ea nsi, putem cere un tabel care
s arate informaii numai despre cei care i-au exprimat o opinie.
Indiferent din ce raiune, avem nevoie s nregistrm apariia uneia din aceste
situaii prin atribuirea unei valori omise. O alternativ ar fi s lsm liber celula
Editorului de date, dar acesta va genera o alt problem potenial: aceea de a nu mai

21
fi capabili s distingem ntre situaiile ca cele descrise mai sus i erorile fcute cu
ocazia introducerii datelor.
n exemplul nostru puteam s fi fost pui n situaia ca un respondent s nu-i
fi declarat genul. Vom atribui eticheta non-raspuns valorii x a variabilei gen
pentru aceti respondeni i vom face clic pe butonul Missing Values a casetei de
dialog Define Variable.
Caseta de dialog Define Missing Values prevede o mulime de situaii
alternative pentru definirea valorilor omise. Implicit SPSS trateaz toate valorile ca
fiind valide. Putem declara pn la trei valori distincte, discrete, ca fiind valori omise,
sau putem specifica un interval (range n lb.englez) de valori ca fiind omise, sau un
interval i o valoare discret. n exemplul nostru avem o valoare omis x, dar pentru
c este o variabil de tip ir (string n lb.engl.), este bine s atribuim i valoarea blank
(spaiu) ca valori omise. Aceasta este necesar pentru c spaiul (blankul) este un
caracter legitim pentru variabilele de tip ir, spre deosebire de variabilele numerice,
iar atribuirea lui ca valoare omis va preveni situaiile n care cazurile invalide vor fi
incluse n tabelele de analiz.
Observaie. Valorile omise, ca i etichetele variabilelor i ale valorilor sunt
senzitive la majuscule, aa c o valoare X nu va fi recunoscut ca valoare omis i
nici nu va purta eticheta non-raspuns.

3.9. Valori omise sistem i valori omise utilizator


Valorile omise pot fi de dou tipuri diferite: sistem, care apar de fapt atunci
cnd exist omisiuni n setul de date, i utilizator, care sunt declarate ca atare n
Editorul de date. Nici una din ele nu sunt utilizate n analizele statistice.
Valori omise sistem
Cnd o celul dintr-o variabil numeric este lsat necompletat, SPSS
plaseaz automat un punct zecimal n aceea celul. Acest punct este referit
ntotdeauna ca valoare omis sistem. Cazurile cu valori omise sistem sunt excluse din
majoritatea procedurilor de analiz statistic i de transformare a datelor.
Valori omise utilizator
Deseori este util a se face distincia ntre motivele pentru care valorile sunt
omise. De exemplu, pentru variabila mservici din Barometrul opiniei publice din
Martie97 s-a atribuit valoarea omis 0 , cu eticheta NS / NR / NC (abrevieri de la
nu tiu, non-raspuns si nu comentez). Aceste situaii sunt bine determinate i nu
coincid cu acelea n care informaia privind mulumirea fa de serviciu nu a fost n
mod eronat introdus n baza de date.
n figura 3.6, care este listingul cu rezultate din fereastra Navigatorului de
rezultate, putem vedea c sunt semnalate 643 cazuri de non-rspuns , dar i 3 cazuri
cu valori omise sistem, care au aprut cu siguran prin neatenia celui care a introdus
datele n calculator.

22
Figura 3.6. Tabel de frecvene care arat tratarea valorilor omise sistem i utilizator

3.10. Schimbarea formatului coloanei


nainte de a termina definirea variabilei gen mai avem de explorat un ultim
buton al casetei de dialog Define Variable, i anume Column Format. Aceast opiune
controleaz afiarea coloanei n Editorul de date. Fixnd tipul variabilelor (deci i
lungimea lor) limea coloanelor din Editorul de date se schimb n mod automat, iar,
de cele mai multe ori, numele variabilelor nu mai pot fi distinse din cauz c ele sunt
de obicei mai lungi dect lungimea declarat a variabilei. Pentru a rectifica aceast
situaie, putem face urmtoarele:
Clic pe Column Format
Schimbm 1 n 7
Clic pe Continue

De regul, cel mai bine este s declarm limea coloanei cu un caracter mai
lung dect numele variabilei, sau cu un caracter mai lung dect valoarea cea mai
lung. Dac avem variabile de tip ir lung (Long String), s-ar putea s nu dorim s
vedem tot textul afiat, aa c vom alege o lime a coloanei mai mic.
Putem s schimbm, pe aceast cale, inclusiv alinierea textului n coloan.

3.11. Definirea variabilelor adiionale


nainte de a introduce datele va trebui s definim i celelalte variabile. Pentru a
defini celelalte 3 variabile din exemplul nostru (varsta, ulscoala i localit) vom utiliza
fie aceeai procedur utilizat pn acum (adic clic pe Data, Define Variable) fie
vom putea alege o variant mai rapid, anume dublu-clic pe capul coloanei.

23
Se va deschide caseta de dialog Define Variable, unde vom completa mai n
nti numele variabilei, apoi tipul, lungimea, etichetele pentru variabil i pentru
valori, formatul coloanei, valorile omise.
n cazul variabilei localit, care este de tip ir lung, vom vedea c butonul
Missing Values pentru valoarea omis nu este un buton eligibil. Exist o regul n
SPSS i anume c variabilele de tip ir lung (adic peste 8 caractere lungime) nu pot
avea valori omise. n multe alte situaii n care contextul este de aa natur c anumite
opiuni nu au sens, SPSS face ineligibile anumite butoane i zone din casetele de
dialog, spre avantajul utilizatorului care astfel este mpiedicat s fac declaraii fr
sens.

3.12. Introducerea datelor

Odat ce variabilele au fost definite n concordan cu catalogul de coduri


(tabelul 3.1), datele vor putea fi introduse fr nici o problem. Cursorul se fixeaz pe
celula int i se introduc date direct din chestionar. Pentru deplasarea la cmpul
urmtor se poate folosi tasta Tab. Pentru un alt caz, procedeul se repet.
Dac ntr-o celul nu se introduce nimic, iar aceasta aparine unei variabile
numerice, va apare un punct zecimal i se va atribui o valoare omis sistem.

3.13. Editarea datelor


SPSS nu previne utilizatorul cnd acesta introduce date eronate. Singura
validare pe care totui o face este s nu permit introducerea caracterelor alfabetice n
cmpurile numerice. Dac observai o informaie greit introdus punei cursorul pe
celula n care apare acea informaie i retastai informaia n mod corect. Dac dorii
s facei o corectur celula trebuie deschis iar corectura se face n linia de editare
(echivalent liniei pentru formule dintr-un tabelator). Deschiderea celulei active se
face fie prin dublu-clic , fie prin apsarea tastei F2.

3.14. Examinarea informaiilor n Editorul de date


Cea ce s-a introdus pn acum n fiierul de date sunt codurile valorilor din
chestionar. Etichetele, dei definite, nu sunt de fapt afiate. Pentru a vedea etichete n
loc de coduri se poate cere comanda Value Labels din meniul Utilities.

Chiar i n aceast situaie, trebuie s reinem c pentru introducerea datelor


noi folosim ntotdeauna codurile i nu etichetele. Avem ns o alternativ: s alegem o
etichet de valoare dintr-o list afiat pe ecran dup ce facem clic pe celula n care
vrem s introducem informaia cu butonul din dreapta al mouse-ului. Urmrii de
exemplu lista afiat pentru o celul din coloana ulscoala, n figura 3.7.

Figura 3.7. Etichete de valori n Editorul de date

24
3.15. Utilizarea etichetelor variabilelor n proceduri
Etichetele pentru valori sunt utile nu numai n vizualizarea mai explicitat a
semnificaiei codurilor valorilor n Editorul de date ci i n rezultatele procedurilor. n
figura 3.6 ai putut vedea cum etichetele pentru valorile variabilei mservici -
mulumirea fa de locul de munc al respondenilor au aprut n locul codurilor n
tabelul de frecvene produs de SPSS.

3.16. Salvarea fiierului de date


Dac prsii SPSS n acest punct al edinei de lucru, toate datele i
informaiile adiionale atribuite variabilelor, valorilor variabilelor i valorilor omise,
se pierd. Toate aceste informaii put lua ns o form permanent dac salvai fiierul
de date dup ce ai definit variabilele i informaiile adiionale de descriere a lor.
Pentru a salva un fiier de date, fereastra Editorului de date trebuie s fie
fereastra activ. Salvarea pentru prima oar se face cu comanda Save As din meniul
File, pentru c acesta permite specificarea numelui fiierului n caseta de dialog care
se deschide (vezi figura 3.8). extensia implicit pentru un fiier de date SPSS este
.sav. Ca s fim siguri c salvm un fiier de date i nu unul din celelalte tipuri permise
de SPSS trebuie s ne asigurm c zona Save as Type are ca i coninut SPSS (*.sav).

Figura 3.8. Caseta de dialog Save Data As

Dac dorim s salvm fiierul ntr-un alt director dect cel curent, care apare
n zona Save in, o putem face schimbnd directorul prin intermediul butoanelor din
partea de sus a casetei de dialog.

25
3.17. Diferena dintre Save As i Save
Comanda Save As a meniului File se utilizeaz cnd se dorete schimbarea
numelui fiierului afiat n linia de titlu al Editorului de date sau cnd se dorete
schimbarea formatului fiierului, de exemplu pentru a crea o versiune care s poat fi
citit n Microsoft Excel. Deasemenea dac se dorete schimbarea directorului n care
se salveaz, altul dect cel definit implicit de SPSS se folosete tot Save As.
Save se folosete pentru a salva o versiune mbuntit a fiierului curent,
adic cu ocazia actualizrilor bazei de date.

3.18. Ieirea din SPSS


Pentru a termina o edin de lucru i a prsi SPSS se va alege comanda Exit
SPSS din meniul File.

Figura 3.9. Cerere de salvare a fiierului cu rezultate Output1

SPSS ine evidena ferestrelor deschise n timpul edinei. Dac ceva din ceea
ce s-a produs nu a fost salvat, SPSS ntreab explicit dac se dorete salvarea. De
exemplu, dac am declanat procedura Frequencies pentru a obine o tabel de
frecvene, acesta s-a afiat n fereastra Output1al Navigatorului de rezultate. De aceea
SPSS ne va ntreba dac dorim s salvm fiierul cu rezultate, vezi figura 3.9.
Extensia implicit pentru fiierele cu rezultate este .spo.

26
27
Capitolul 4. Cutarea erorilor i analize statistice
exploratorii

Vom explora n cele ce urmeaz cteva din cele mai comune ci de a descrie
datele dintr-o baz de date prin intermediul procedurilor de statistic elementar
Frequencies i Descriptives. De foarte multe ori vom vedea c aceste dou proceduri
sunt suficiente pentru a rspunde la multe din ntrebrile cercetrii. Procedurile
Crosstabs i Means sunt utile n investigarea unor posibile relaii ntre dou variabile.
Aceste patru proceduri, la care se adaug i procedura Explore, nu sunt numai tehnici
puternice descriptive, dar constituie tot attea mijloace de investigaie necesare
naintea ntreprinderii unor analize statistice mai sofisticate.

4.1. Procedura Frequencies

Figura 4.1. Procedura Frequencies

Procedura Frequencies, furnizeaz tabele statistice i reprezentri grafice.


Implicit, ea va genera o distribuie de frecvene sub form de tabel, n care pentru
fiecare valoare distinct a variabilei selectate, se va afia numrul de apariii,
procentul pe care acesta-l reprezint din ntregul eantion i procentul cumulativ. Ca
opiuni, pot fi selectate grafice ca diagrama de bare, histograma (care vor fi alese n
funcie de tipul variabilei), valorile pentru anumite percentile sau indicatori statistici
descriptivi.

28
n tabela de frecvene sau n diagramele de bare, valorile distincte pot fi
ordonate n ordine cresctoare sau descresctoare. Generarea / afiarea tabelei de
frecvene poate fi eliminat dac variabila are prea multe valori distincte. Unitile de
msur folosite n diagrame i grafice pot fi sub form de frecvene numerice
(implicit) sau procente.
Indicatori statistici ce pot fi cerui: media, mediana, modul, suma, abaterea
standard, variana, amplitudinea, minimum i maximum, eroarea standard a mediei,
oblicitatea (skewness) i ascuimea (kurtosis) (cu erorile lor standard), cuartile i
percentile definite de utilizator, frecvene, procente, procente cumulate.
Pentru declanarea procedurii se va alege din meniu: Statistics, Summarize,
Frequencies

Figura 4.2. Procedura Crosstabs

4.2. Procedura Crosstabs


n cazul n care dorim s studiem o relaie de asociere ntre variabile
categoriale, va fi util o tabel care conine frecvenele combinaiilor valorilor
(categoriilor) celor dou variabile. Acestea sunt tot tabele de frecvene, dar se
genereaz nu doar pentru o variabil, ci pentru combinaia a dou variabile. Vom
numi o astfel de tabel, tabel de frecvene ntre dou variabile, tabel de asociere
sau tabel de contingen. Ea se obine din meniu, alegnd:
Statistics, Summarize, Crosstabs
Pentru exemplificare, vom utiliza fiierul Martie97.sav, care conine
variabilele gen i mservici (satisfacia in munca).

29
Putem studia relaia ntre mservici i venit, sau ntre orice alte variabile ntre
care bnuim c ar putea exista o legtur.

m i

C
e
a
tpl
u o
ot
t
t
t u
u
uu
t
2
1
0
6
9 Gm
0
0
8
5
3 f
2
1
8
1
2 T

Figura 4.3. Tabel de asociere ntre gen i satisfacia n munc (frecvene absolute)

Coninutul celulelor aa cum apare sub form de frecvene absolute (figura


4.3) nu exprim relaia dintre cele dou variabile. Pentru a putea compara diversele
grupuri ntre ele, trebuie s folosim o msur independent de numrul cazurilor
cuprinse n grupul respectiv; fiecare grup avnd un numr diferit de cazuri (359
persoane de sex masculin i 293 persoane de sex feminin). O exprimare n procente a
frecvenelor din fiecare celul permite comparaiile dorite (figura 4.4).

m it

d e
o
s
e p
taluo
r
r
T
ul
ll
l
to
t
ttu
u
uu
t
52
1
06
9Gm
C
%
%
%
%
%
% G
r e
90
0
85
3 f
C e
%
%
%
%
%
% G
r e
52
1
81
2TC
%
%
%
%
%
% G
r e

Figura 4.4. Tabel de asociere ntre gen i satisfacia n munc (frecvene procentuale)

Procentajul pe coloane ne arat distribuia variabilei de pe linii pentru fiecare


categorie a variabilei de pe coloane (ce procent din totalul cazurilor de pe o coloan
este distribuit pe fiecare linie). Tabelul din figura 4.4 nu afieaz astfel de procente.
Procentajul pe linii ne arat distribuia variabilei de pe coloane pentru fiecare
categorie a variabilei de pe linii (ce procent din totalul de cazuri de pe o linie este
distribuit n fiecare coloan). n tabelul din figura 4.4 putem vedea, de exemplu, c
8,9% din persoanele de sex masculin (variabila gen este variabila de pe linii) se
declar deloc mulumii de serviciul pe care l au (variabila de pe coloane), 17% nu
sunt prea mulumii, 52,9% sunt mulumii i 21,2% sunt foarte mulumii.
Observaie: Cum putem spune dac ntr-un astfel de tabel procentele
din celule reprezint procentajul pe linii sau pe coloane? Dac n coloana
numit Total procentul nscris n fiecare celul este 100%, avem de-a face cu

30
procente pe linii. Dac pe linia numit Total procentul nscris n fiecare celul
este 100%, avem de-a face cu procente pe coloane.

4.3. Procedura Descriptives


Aceast procedur calculeaz i afieaz indicatori statistici univariai (o
variabil la un moment dat) pentru diferite variabile i poate calcula valorile
standardizate (scoruri Z) pentru fiecare caz. Implicit, pentru fiecare variabil ce se
selecteaz se vor calcula media, abaterea standard, minimum, maximum (vezi
csuele bifate din caseta de dialog Descriptives Options din figura 4.5.). Opional mai
pot fi cerute variana, amplitudinea, eroarea standard a mediei, oblicitatea i
ascuimea.
Observaie: Mediana, modul, cuartilele i percentilele nu pot fi calculate aici,
ele se determin cu procedura Frequencies.

Figura 4.5. Procedura Descriptives

Declanarea procedurii se face din linia de meniu cu:


Statistics, Summarize, Descriptives

4.4. Procedura Means


ntr-un grup de subieci putem distinge subgrupuri de cazuri n funcie de
diverse criterii, subgrupuri ntre care este util s facem comparaii n scopul stabilirii
unor diferene ce merit exploatate mai ndeaproape.

31
Putem studia de exemplu media notelor la matematic obinute ntr-o clas,
separat pentru fete i biei. Sau putem studia diferenele privind media de vrst
pentru femei i brbai ntr-un eantion reprezentativ al populaiei Romniei (vezi
figura 4.6).
Subgrupurile pot fi formate atunci cnd cazurile pot fi divizate pe baza uneia
sau mai multor variabile de grupare.
Variabila sub studiu este deci de tip interval iar variabila de grupare este
categorial.

Declanarea procedurii se face prin intermediul liniei de meniu:


Statistics, Compare Means, Means

Figura 4.6. Procedura Means

Rezultatul este o tabel care afieaz pentru variabila n cauz media, abaterea
standard i efectivul fiecrei categorii de grupare.
n cazul n care se dorete definirea grupurilor n funcie de mai multe
variabile de grupare, variabilele categoriale vor fi puse n straturi (Layers) diferite.

4.5. Procedura Explore

Figura 4.7. Caseta de dialog al procedurii Explore

32
Poate fi folosit pentru a studia distribuia unei variabile:
Calculeaz indicatori statistici descriptivi pentru toate cazurile sau pentru
subgrupuri de cazuri.
Identific valorile extreme. Acestea se datoreaz uneori introducerii greite a
datelor n calculator. Dac sunt reale, atunci ele pot influena puternic deciziile
pentru analiza statistic ulterioar, de aceea este util s fie depistate.
Calculeaz percentilele distribuiei variabilei, att pentru toate cazurile ct i
pentru subgrupuri de cazuri;
Genereaz o varietate de reprezentri grafice a datelor (stem and leaf, boxplot,
histograme) care ne arat vizual cum se distribuie valorile datelor.
Pentru declanare vom alege din linia de meniu:
Statistics, Summarize, Explore
n Dependent List se trece variabila pe care dorim s-o explorm (variabil tip
interval). Variabila factor este o variabil de grupare, care se alege n cazul n care
dorim s calculm statistici pentru subgrupuri de cazuri ale variabilei numerice
studiate.

100

1105
1097
834 968
90
766
80 953
1007
943 1117

60

40

20
vrsta

0
N= 72 121 338 121

deloc multumit destul de multumit


nu prea multumit foarte multumit

Multumit de - serviciu
Fig.4.8. Grafic boxplot pentru legtura dintre satisfacia n munc i vrst
(Martie97)

n figura 4.8 putem vedea o diagram boxplot produs de procedura Explore


avnd ca i variabil factor mservici (satisfacia n munc) iar ca variabil dependent
vrsta. Caseta de dialog al procedurii Explore a fost completat ca n figura 4.7.

33
4.6. Depistarea erorilor
Este important s fim siguri c datele noastre sunt corecte. Avem aadar
interesul s cutm ct mai multe tipuri de erori posibile. Cteva din cele mai des
utilizate metode sunt tratate n cele ce urmeaz.
Erorile pot apare din mai multe motive i n mai multe faze ale unei cercetri.
Cu ct exist mai multe faze cu att posibilitatea apariiei unui nou tip de erori crete.
Erorile pot apare nc din faza de aplicare a chestionarului: respondentul sau
operatorul de interviu bifeaz o alt csu dect cea corect. n etapa de codificare a
chestionarului, n cazurile cnd codificarea nu apare direct pe formularul chestionar,
se pot introduce erori suplimentare. O alt surs de erori este etapa de introducere a
datelor n baza de date.
Cele mai des utilizate proceduri de localizare a erorilor sunt Case Summaries,
Frequencies i Descriptives. Dar i procedurile Crosstabs i Explore pot fi utile.
Comanda Frequencies poate fi utilizat pentru a localiza valori inadecvate
pentru variabile cu un numr mic de categorii distincte (caz tipic pentru variabilele de
tip nominal i ordinal).
n exemplul din figura 4.9 se poate vedea un tabel de frecvene pentru
variabila temere1 (temerile romnilor) unde apare un cod (9) care nu face parte din
valorile prevzute.

mau l
qr
rr
uc
cce
8
6
7
7V
1
9
7
7
52
8
6
7
23
4
3
4
54
3
3
4
95
1
2
2
16
2
5
5
57
8
4
4
98
1
1
1
09
4
6
0T
5
4M
0
5
4T
9
0T

Figura 4.9. Tabel de frecvene pentru temere1

Problema const n faptul c n afara celor 8 valori admisibile (codificate de la


1 la 8) mai apar i valorile 0 i 9. Valoarea 0 este atribuit valorilor omise, deci este
acceptabil. n schimb valoarea 9 trebuie s fie o eroare de un fel sau altul. Soluia
ideal ar fi s se caute valorile i s se nlocuiasc valoarea eronat cu versiunea
corect. n multe cazuri acest lucru nu este posibil i atunci se poate atribui codului 9
rolul valorii omise (vezi seciunea 9 din modulul 3). Aceast valoare omis poate fi
una de tip utilizator sau una de tip sistem (vezi modulul 6). n acest mod valoarea
incorect va fi exclus din majoritatea analizelor statistice care utilizeaz variabila
temere1.

34
e

t d
e
Ni
mma
8
8
2
0
5 V
9
0
4
4
8 N
8 V

Figura 4.10. Indicatori statistici descriptivi pentru variabilele vrsta i nringosp

Comanda Descriptives este util pentru depistarea erorilor similare, dar


pentru variabile continue, msurate pe scale de nivel interval sau rapoarte. Aceast
procedur furnizeaz valorile minime i cele maxime ntlnite n baza de date i astfel
putem vedea dac apar valori neplauzibile. De exemplu, dac tim c eantionul era
compus din indivizi majori (cum este cazul la Barometrul opiniei publice), o vrst
minim de 10 ani nu putea s apar dect dintr-o eroare. Un nivel de educaie de 0 ani
este la fel de improbabil (dei nu imposibil).
n cazul exemplului din figura 4.10 vrstele minim (18) i maxim (92)
ntlnite n eantion sunt plauzibile, dar pentru variabila nringosp (numr de indivizi
n gospodrie) valoarea zero (0) nu are sens.
Comanda Case Summaries este un instrument extrem de util prin faptul c
permite listarea valorilor mai multor variabile pentru fiecare caz. Aceasta permite o
abordare a cutrii erorilor mai sofisticat, pentru gsirea cazurilor n care fiecare
variabil are valori perfect justificate, dar pentru care combinaia de valori pentru
dou sau mai multe variabile este ridicol. Aa de exemplu, pentru cineva n vrst de
10 ani ar fi ridicol s apar c ar conduce maina 50.000 km pe an. Comanda Case
Summaries permite detectarea erorilor de acest tip. Utilizarea acestei metode este
mare consumatoare de timp, aa c se prefer de multe ori listarea numai a anumitor
pri din baza de date.
Pentru declanarea procedurii se utilizeaz meniul principal:
Statistics, Summarize, Case Summaries
n figura 4.11 se poate vedea un exemplu de listare a variabilelor autoturi,
mcuraten i mtranspo pentru 15 cazuri.

35
a
u m

l t u
v
n ei a
t
etou c
-r
1232
2234
3231
4221
5132
6111
7222
8123
9242
12130
12321
12322
12213
12324
11235
1
55 T
5N o
a
L .
i

Figura 4.11. Lista a 4 variabile pentru un set de 15 cazuri

Ce putem face dac gsim erori


Unele erori pot fi tratate mai uor dect altele. n exemplul de la procedura
Frequencies, dac am fi gsit o vrst de 99 ani, probabil c problema se putea
rezolva prin declararea codului 99 ca valoare omis. Acest tip de eroare este uor de
corectat.
Erorile aprute n etapa de codificare sau n cea de introducere a datelor pot fi
corectate prin reexaminarea chestionarelor originale, dac ele mai exist. Pentru
aceste cazuri este important includerea unui numr de serie att pe formularul de
chestionar ct i n fiierul de date, astfel ca valorile s poat fi controlate. Dac nu
avem un astfel de numr (sau cod) de identificare, localizarea formularelor pentru
cazurile cu valori eronate este deosebit de dificil.
Dac nu putem descoperi nicicum adevrata valoare care ar fi trebuit s fie n
fiier, cea mai bun metod este cea de introduce n locul ei valoarea omis sistem
(punctul zecimal) tuturor valorilor suspecte.

36
Partea a II a.

Analiza statistic inferenial1

Capitolul 5. Cutarea confirmrii ipotezelor

Statistica elementar studiat n anul I s-a ocupat de organizarea, tabelarea i


rezumarea datelor colectate despre caracteristicile unei populaii statistice. Procedurile
de rezumare sunt destinate s prezinte datele ntr-o form care s fie ct mai sugestiv
pentru cititorii interesai de cunoaterea realitii prin intermediul variabilelor
statistice. Dei, pentru un observator atent, prezentrile grafice i indicatorii statistici
descriptivi pot sugera legturi ntre variabule, totui ele nu pot confirma i nici
verifica astfel de legturi. Ele nu ne permit s generalizm nici un fel de constatri
dincolo de eantioanele pe care le-am studiat. Pentru astfel de generalizri, avem
nevoie s dezvoltm ipoteze i s le testm n concordan cu principii tiinifice.

5.1. Testarea ipotezelor


Formularea ipotezelor n cercetarea i practica de asisten social este extrem
de important. Fie c sunt validate sau nu, ipotezele ne permit s abordm n mod
siinific practica de asisten social.
Ipotezele sunt formulate deobicei dup trecerea n revist a literaturii de
specialitate sau prin procesul sintetizrii cunotiinelor cantitative i calitative pentru o
tem particular: din experiena profesional ctigat n practic; din cursuri scrise
de profesioniti i din multe alte surse specifice domeniului, incluznd legislaia,
documente nepublicate i persoanele cunosctoare. Dup o examinare a literaturii,
putem expune doar rspunsuri pariale sau putem finisa rspunsuri la ntrebri
generale. La nceput se dorete exprimarea impresiilor sau a concluziilor noastre sub
forma ipotezelor. Dup aceea ipotezele vor trebui testate.
Multe definiii au fost date ipotezelor, dar toate au la baz acelai concept - o
ipotez este o tentativ de rspuns la o ntrebre de cercetat, derivat din
trecerea n revist a literaturii de specialitate. Este n acelai timp o exprimare a
unei relaii dintr-o variabil sau ntre variabile. O ipotez, fie c este sau nu
susinut de analiza datelor, ea trebuie s fie o extensie logic a cunotiinelor
existente anterior. Oricare alt metod folosit pentru formularea ipotezelor nu este
altceva dect smulgerea unei legturi i genereaz posibilitatea de pune la ndoial
credibilitatea studiului de cercetare.
Dupa colectarea, organizarea i rezumarea informaiilor, utiliznd statistici
asemntoare celor prezentate n Partea I a acestei cri; putem ncepe s nelegem
dac ipotezele noastre sunt sau nu susinute de datele colectate. S presupunem, de

1
Aceast parte a manualului se bazeaz pe capitolele 7-12 din Weinbach R.W., Grinnell R.M. Jr., 1987
- Statistics for Social Workers, Longman Inc., New York / London

37
exemplu, c am lansat ipoteza: clienii alcoolici care primesc tratamentul n grup se
pot abine de la butur mult mai bine, dup trei luni de tratament, dect clienii
alcoolici care au primit tratamentul individual. Frecvenele i procentajele par s ne
furnizeze suportul pentru aceat ipotez; mai ales c numrul clienilor a fost mic i
ne-a fost uor s obsevm tendina de succes pentru o metod de tratament (aici
tratamentul n grup) n opoziie cu altele (tratamentul individual). Probabil, 70% din
clienii alcoolici care au primit tratamentul n grup se pot abine acum de la butur n
comparaie cu 65% din cei care au primit tratamentul individual. Exist n aparen
o legtur ntre variabila dependent (butor / nebutor) i variabila independent
(tratamentul de grup / tratamentul individual). Cu toate acestea, doar un naiv ar
concluziona, doar pe baza celor prezentate anterior, c tratamentul n grup este cea
mai bun metod de lucru cu alcolicii. Pentru a testa ipotezele noastre n mod
tiinific, trebuie s examinm i alte explicaii posibile.

5.2. Explicatii alternative


Aa cum am afirmat, ipotezele noastre trebuie s fie sprijinite de date
colectate. Dar e nc prematur s concluzionm c exist o relaie adevrat ntre cele
dou variabile. O relaie poate fi verificat doar dup epuizarea tuturor explicaiilor
alternative care ar putea justifica legtura. n cazul nostru cele trei explicaii
alternative majore sunt: (1) deformarea, (2) alte variabile i (3) ansa. Primele dou
sunt n principal legate de metodologia cercetrii, iar cea de-a treia este direct legat
de testarea statistic. O bun cunoatere a metodelor de cercetare folosite n asistena
social ne va ajuta s minimalizm efectele primelor dou explicaii alternative - iar
aceast carte ne va ajuta cu eliminarea efectelor celei de a treia explicaie alternativ.
Deformarea
Prima explicaie alternativ este deformarea realitii. Influenele
conjuncturale sunt o surs sistematic de distorsiune, care afecteaz calitatea datelor
colectate. Ele pot conduce la rezultatele eronate i apoi la tragerea unor concluzii
eronate. Deformri conjucturale pot apare cnd datele se colecteaz ntr-un moment
neprielnic sau cnd studiul este influenat de evenimente exterioare, de vreo tendin
contient sau incontient a persoanelor care colecteaz datele i care nu au o
percepie corect asupra lor. Dac dintr-un motiv oarecare, sau combinaie de motive,
datele au fost deformate, variabilele noastre dependente i independente pot aprea ca
fiind legate, cnd de fapt ele nu sunt. Posibilitatea ca deformarea s poat explica o
legtur aparent ntre dou variabile este minimizat deobicei prin folosirea cu mare
grij a tehnicilor de msurare.
Alte variabile
A doua explicaie alternativ este influena altor variabile. Factorii care
influeneaz variabila independent pot deasemenea explica diferenele din cadrul
variabilei dependente (a bea / a nu bea, n exemplul nostru). n exemplul nostru,
acetia ar putea fi intensitile diferite ale suportului familiar pentru metoda de
tratament i nivele de calificare diferite ale asistenilor sociali care practic cele
doumetode. Un plan experimental bun, construit pe baze aleatoare, poate garanta un
anumit nivel de control pentru celelalte variabile, dar planurile experimentale bune
sunt rare n cercetarea n asisten social. Alegerea unei tehnici metodologice
corespunztoare ne poate garanta c alte variabile nu sunt explicaii reale ale unei
aparente legturi ntre dou variabile. Cile prin care planurile de cercetare pot ajuta
n controlul altor variabile sunt prezentate n general n textele privind metodologia
cercetrii.

38
ansa
Cea de-a treia explicaie alternativ este ansa, care poate fi referit i prin
termeni ca probabilitate, eroare de eantionare, ntmplare norocoas - sau pur i
simplu noroc. ansa stipuleaz ca probabilitatea s se ntmple un eveniment se poate
situa oriunde ntre valorile 0 (niciodat) i 1 (absolut sigur). Ea se bazeaz pe
presupunerea c n timp ce prin repetarea n timp ndelungat a unor observaii se poate
vedea ca exist o anumit regularitate (pattern), n particular, sau pe termen scurt,
observaiile tind s difere ntr-un fel de pattern-ul pe termen lung. De exemplu, cnd
desemnm n mod aleator, un eantion dintr-o populaie, putem s nu selectm un
eantion care s aibe o compoziie identic cu cea a populaiei din care provine.
Teoria probabilitii ne trimite direct la conceptul de eroare de eantionare, prezentat
n textele metodologice.
Probabilitatea spune c o moned lansat n aer, are 0,5 anse (sau 50%) s
cad cu o anumita fa n sus. Cu alte cuvinte, probabilitile ca s fie cap sau pajur
sunt egale. n realitate dac aruncm o moned de zece ori am putea gsi un rezultat
diferit de 5 cu 5. Nu vom fi surprini dac obinem 4 cu 6, sau 8 fee din zece
aruncri. n acest caz vom nvinovi ansa (eroarea normal de eantionare), i vom
presupune c dac vom repeta testul de suficient de multe ori, procentul de aparinie
al feei va fi aproximativ de 50%.
Cnd analizm datele noastre, trebuie s determinm dac nu cumva
rezultatele noastre sunt aberaii plauzibile de la patternul normal al evenimentelor
aprute din cauza erorilor de eantionare. Trebuie s fim ct mai siguri c o legtur
aparent dintre variabile nu este un simplu noroc ce poate aprea din cnd n cnd.
Avem nevoaie s determinm dac ansa poate fi explicaia real pentru o legtur
aparent. O ipotez poate fi susinut doar cnd ansa, la fel ca i deformarea i ca
influena altor variabile, pot fi convingtor eliminate ca explicaii alternative. ansa
este de obicei ultima explicaie pe care consumatorii sceptici de rapoarte de cercetare
l propun ca i cauz real a legturii aparente dintre dou variabile. Spre deosebire
de cazul deformrii sau al altor variabile, planurile solide de cercetare nu sunt
suficiente pentru a elimina ansa ca explicatie alternativ pentru o aparent legtur
ntre dou variabile. Doar testele statistice o pot face.

5.3. Respingerea explicaiei ansei prin testele statistice


Toate testele statistice ncearc s discrediteze ansa ca explicaie a unei
aparente legturi ntre variabile. Cu toate acestea, ele o fac pe ci diferite. Din fericire
sunt mai multe asemnri dect diferene, ntre testele statistice. Acest capitol
examineaz cile prin care toate testele statistice se apropie de acest obiectiv.
n ncercarea de a ctiga suport pentru ipoteze, nu putem elimina total ansa
ca explicaie pentru o legtur aparent. nainte de susine o legtur, trebuie s ne
asigurm ntr-o msur rezonabil c cea ce am observat nu este o ntmplare
norocoas care poate fi uor explicat prin eroarea normal de eantionare derivat
din ntmplare. Nu dorim s raportm o legtur care pare s fie adevrat, dac ea nu
este de fapt aa. n acelai timp, nu trebuie s fim niciodat att de rigizi sau
neraionali, nct s nu cerem suport statistic pentru un rezultat al cercetrii care este
foarte improbabil s se datoreze ansei. Dac cercettorii devin obsedai de eliminarea
total a ansei ca explicaie alternativ, puine, sau chiar niciunul din rezultatele gsite
ar vedea lumina zilei.

39
Testele statistice determin probabilitatea ca relaiile aparente dintre
variabile s se datoreze ntmplrii. Dac probabilitatea efectului ntmplrii este
mic, i dac deformrile i celelalte variabile au fost eliminate ca i explicaii
posibile pentru o legtur aparent, rmne o singur explicaie raional: exist o
legtur credibil. Dac efectul ansei este mare, noi nu mai putem pretinde suport
pentru o ipotez care prezice o legtur, chiar dac celelalte dou explicaii alternative
au fost eliminate. Pe scurt trebuie eliminate toate cele trei explicaii alternative nainte
ca o ipotez s poat fi considerat ca avnd suport.
Tipuri de legturi declarate n ipoteze
O ipotez care declar o legtur ntre variabile, dar care nu indic care valori
ale unei variabile se vor grupa cu care valori ale altei variabile, este denumit ipotez
nedirecional (non-directional sau two-tailed) O ipotez care declar o legtur ntre
dou variabile i specific modul (direcia) n care se crede c sunt legate, este
denumit ipotez direcional (sau one-tailed).
Exemplul folosit mai devreme n acest capitol este o ipotez direcional. Ea
precizeaz clar c rata nalt a abstinenei la alcool va fi gsit printre clienii alcolici
care au primit tratamentul n grup fa de clienii alcolici care au primit tratamentul
individual. O ipotez nedirecional pentru exemplul nostru, ar stabili c metoda de
tratament folosit este legat de abstinen; dar nu ar putea prezice care metod de
tratament poate fi asociat cu rata ridicat sau sczut de abstinen.
Exist, firete, o a treia descriere posibil a legturii ntre dou variabile -
predicia c ele nu vor fi gsite legate (nu exist nici o relaie ntre ele). Aceast este
numit ipotez nul. Ipoteza nul este considerat de obicei ipoteza cercetrii - adic,
ipoteza care trebuie dovedit. Dei ipotezele cercetrii tind n mod frecvent s fie
direcionale, cteodat sunt folosite i ipotezele nedirecionale, dac cunotinele
asupra subiectului sunt limitate. Cutarea suportului pentru a prezice c dou variabile
sunt nelegate este rar, dar nu fr utilizare n practica i cercetarea din asistena
social. Cercettorii care au cutat s contrazic ipoteza c o ras ar fi superioar
alteia din punct de vedere intelectual, au cutat suport statistic pentru ipoteza nul
(rasa i inteligena nu sunt legate). Similar practica curent poate sugera c
tratamentul individual este mai eficient dect tratamentul n grup pentru tratarea
disfuncionalitii sexuale a clienilor. Din observaile noastre i din literatura de
specialitate am putea totui concluziona c nu se pot face diferenieri ntre metodele
de tratament folosite n asistena social. n acest caz am putea alege ipoteza nul ca
ipotez pentru o astfel de cercetare: succesul n tratarea disfunciei sexuale nu este
legat de metoda de tratament.
Ipoteza nul i indicatorii statistici
Cele trei forme ale ipotezei (direcional, nedirecional i nul) sunt toate
importante pentru noi n construcia ipotezei unei cercetri.Toate trei, dar n special
ipoteza nul, sunt extrem de importante n nelegerea modului n care indicatorii
statistici sunt folosii n testarea ipotezelor.
Trebuie amintit c ipoteza nul este consistent n raport cu ansa. Ea susine
c dou variabile sunt nelegate chiar dac ele par a fi legate ntr-un set de date. Ea
continu s susin c doar fluctuaia normal a ansei, sub forma erorilor de
eantionare, este cea mai potrivit explicaie pentru aparenta legtur dintre dou
variabile. Chiar i atunci cnd ipoteza nul nu este folosit ca ipotez a cercetrii, i
ipotezele sunt fie direcionale fie nedirecionale, conceptul ipotezei nule joac un rol
important n testare. Pentru a confirma c dou variabile sunt legate, trebuie s
verificm mai nti c ele s nu sunt nelegate. Altfel spus trebuie s demonstrm c
ansa (ca expresie a ipotezei nule) nu este explicaie fericit a legturii aparente.

40
Cnd o ipotez este direcional sau nondirecional, exist un fel de fantom
a ipotezei nule. Ipoteza nul statueaz c o legtur aparent este de fapt un rezultat al
ansei. nseamn c am extras un eantion netipic de date i c legtura aparent pe
care am observat-o n eantion nu caracterizeaz n realitate populaia din care am
extras eantionul. Pentru a respinge ipoteza nul, avem nevoie s demonstrm c
ansa este o explicaie nefericit pentru legtura aparent observat i c o legtura
adevrat este o concluzie mult mai plauzibil. Testele statistice ne permit s
determinn cnd putem ntri o ipotez direcional sau non direcional cu ajutorul
unui suport statistic.
Erori de tipul I i de tipul II
Dou tipuri de erori pot fi fcute n interpretarea rezultatelor unei cercetri:
tipul I i tipul II. O eroare de tipul I este atunci cnd se respinge ipoteza nul i se
concluzioneaz c exist o legtur ntre dou variabile, cnd de fapt nu exist nici o
legtur. O eroare de tipul II este atunci cnd ncercarea de a respinge ipoteza nul i
de a identifica o legtur adevrat ntre dou variabile eueaz, cnd de fapt exist
una. Cele dou tipuri sunt comparate n Tabelul 5.1.
Tabel 5.1. Erori de tip I i II
n realitate Decizia noastr
Respingem ipoteza nul Acceptm ipoteza nul
Ipoteza nul este fals Corect Eroare de tip I
ex: criminalul este nevinovat
Ipoteza nul este adevrat Eroare de tip II Corect
ex: nevinovatul este criminal

Sunt civa factori legai de deciziile privind planul de cercetare care pot mri
sau micora probabilitatea producerii erorilor de tipul I sau II. Acetia includ
selectarea unui eantion deformat, utiliznd instrumente de colectare a datelor care
sunt nevalabile i/sau nesigure, i care vor sfri prin imposibilitatea de a controla
efectul altor variabile.
Tipul I i II de erori pot deasemenea rezulta din folosirea testelor statistice
nepotrivite. Dac folosim un test statistic ce necesit condiii puternice care nu sunt
ndeplinite, sau dac utilizm un test care necesit doar cteva condiii i n realitate
sunt ndeplinite condiii pentru un test mai puternic, pot aprea erori de tipul I sau II.
n primul caz datele au fost tratate ca i cnd ar poseda caliti care de fapt le lipsesc,
n ultimul caz, oportunitatea pentru o analiz mai exact nu a fost folosit. Dac nu e
folosit testul statistic potrivit, poate aprea o legtur statistic numai datorit
nsuirilor eronate pe care le-am atribuit datelor i modului n care au fost colectate.
Sau s-ar putea ca o legtur adevrat s rmn ascuns.
Niciodat nu putem elimina n totalitate posibilitatea de comitere a erorilor n
luarea deciziilor, deci nici n decizia de a respinge sau nu ipoteza nul. De fapt dac
suntem prea prudeni s nu comitem erori de tipul I (s respingem n mod greit
ipoteza nul), crete posibilitatea comiterii tipului II de eroare (greeala de a nu
respinge ipoteza nul). Analog, grija exagerat de a nu comite erori de tipul II duce la
creterea probabilitii de a comite eroride tipul I. Cercettorii trebuie s decid pn
la urm care eroare, de tipul I sau de tipul II, este mai acceptabil pentru ei. Aceasta
este o decizie de natur etic ce presupune cunotiine din practica asistenei sociale i

41
despre consecinele uneia sau alteia din erori. Din fericire aa cum vom prezenta mai
departe, exist convenii statistice care s ne ghideze n luarea deciziilor.
ntr-un studiu de cercetare importana acestor erori este, desigur, potenial
grav. De exemplu, profesionitii n asisten social nerecunoscnd c folosirea
greit a testului statistic sau a unei erori metodologice a dus la un rezultat eronat din
tipul I, pot concluziona n mod eronat c exist o legtur ntre o metod particular
de tratament i rata mai mare de succes n tratament. Ei pot ajusta accesul la tratament
pe baza acestui fapt. Sau ei pot reaciona la alte rezultate ale cercetrii n care (din
anumite motive) a fost comis eroare de tipul II, i care discrediteaz o metod de
tratament n realitate foarte buna, dar care a aprut c nu face parte dintre tratamentele
eficiente. Tipul I i tipul II de erori pot fi la fel de distructive cnd aplicm rezultatele
cercetrii la situaiile practice de asisten social. Amndou ne pot conduce la
concluzii greite, pot face ru clieniilor notri, sau duc la risipirea resurselor limitate
ale ageniei.
Chiar dac studiile de cercetare sunt bine planificate i dac noi nelegem i
aplicm criteriile de selecie a testului statistic potrivit, exist ntotdeauna cteva
posibiliti, nu conteaz ct de acceptabil de mici, pentru comiterea unei erori n
tragerea concluzilor intr-o cercetare. ntotdeauna rmne posibilitatea de-a ni se
ntmpla ca unul din miliardele de eantioane posibile, s ne conduc la concluzii
eronate despre legturile dintre variabile n populaia din care provine eantionul. Sau
am fcut cteva erori metodologice obscure care au introdus deformarea sau alte
variabile n planul nostru de cercetare. Aceast vag posibilitate nu trebuie, totoi, s
s ne timoreze n a ne asuma riscuri rezonabile n interpretarea rezultatelor cercetrii
i n aplicarea lor practic. n felul acesta putem face progrese i putem deveni
practicieni cu o baz de cunotine tiinifice.

5.4. Dovezi suficiente i semnificaie


Dac ne ntoarcem la exemplul nostru cu cele dou tipuri de tratamente i la
posibila legtur cu abstinena clienilor alcoolici, putem observa c diferena de
procente dintre rata absinenei pentru grupul care a primit tratamentul n grup (70%)
i rata abstinenei pentru aceia care au primit tratamentul individual (65%), este de
fapt destul de mic. Chiar dac am fi avut 50 de clieni pentru fiecare tratament, muli
dintre noi nu pot spune dac aceste 5 procente (70% - 65% = 5%) diferen pot fi
suficiente pentru a respinge ipoteza nul (ipoteza nul n acest exemplu poate fi aceea
c metoda de tratament i efectele nu au legtur una cu alta). O diferen de 40
procente ntre dou metode de tratament, ne-ar da mai multe sperane n a obine
suport statistic pentru o asemenea ipotez.
Din nefericire, n realitate datele arareori vorbesc att de tranant pentru a
putea susine sau respinge ipoteza nul. Ele de obicei sunt astfel nct avem nevoie de
testele statistice care s ne ajute (nu s ne conduc) n a decide dac avem sau nu
suport statistic pentru eliminarea ipotezei nule. Pn la ce punct ne putem simi
linitii cnd vrem s respingem ipoteza nul i s susinem c avem suport statistic
pentru ipoteza direcional? Dac urmare a unor evenimente fortuitoare, a fost posibil
s repetm un studiu de cercetare (numit replicare n terminologia cercetrii) de 100
sau chiar de 200 de ori i n fiecare studiu individual clienii tratai n grup au avut o
rat de abstinen alcoolic mai nalt, noi trebuie s fim convini c ipoteza nul
poate fi cu siguran respins. Din nefericire, n cercetarea de asisten social nu prea
avem posibilitatea de a repeta studiile de mai multe ori. Astfel c avem nevoie s
obinem nite dovezi palpabile ale improbabilitii ipotezei nule, cu ajutorul unui

42
singur studiu. De la ce punct putem fi suficient de siguri c o legtur aparent nu
poate fi respins n mod rezonabil, datorit aportului ansei? Aici trebuie s apelm la
simul comun i la convenii.
Dealungul anilor, cele mai multe cercetri au situat la nivelul de 95%
certitudine, punctul care este suficient de nalt pentru a putea avea ncredere n
eliminarea ipotezei nule. Altfel spus cercettorii se vor simi siguri n a concluziona c
dou variabile sunt legate (sau n relaie) dac analiza statistica sugereaz c exist
mai puin de 5% procente anse de a face o greeal, prin respingerea ipotezei nule.
Acest nivel de risc n comiterea unei erori de tipul I este acceptabil n majoritatea
studiilor de cercetare. Convenia statistic declar c exist suport pentru o ipotez
direcional sau nondirecional, dac probabilitatea de a face o eroare de tipul I este
mai mic dect 5% - se mai utilizeaz i terminologia echivalent: nivel de
semnificaie 0,05 , sau coeficient de risc 0,05, sau nivel de ncredere 0,95. O decizie
care respinge ipoteza nul nu poate elimina definitiv ansa ca explicaie posibil a
unei legturi aparente. Trebuie s acceptm c ansa, sub forma erorii de eantioanare,
poate fi cauza pentru care dou variabile par a fi legate, cnd ele nu sunt de fapt.
Nu exist nimic sacru n ceea ce privete nivelul de semnificaie 0,05, dar el
este cel mai des folosit pentru respingerea ipotezei nule. Decizia folosirii i a altor
nivele dect cel de 0,05 se justific n funcie de consecinele care ar rezulta prin
luarea unei decizii greite. O cerere de dovezi mai tari, pentru aceptarea unei legturi
ntre variabile, cum ar fi cele de nivel 0,025 sau 0,01, poate fi dorit cnd este necesar
s existe chiar mai puine posibilitai de a grei respingnd ipoteza nul i de a
concluziona c exist o legatur ntre dou variabile, atunci cnd ntmplarea este o
explicaie real pentru legtura aparent dintre ele. Aceast abordare asigur o
probabilitate de a grei chiar mai mic dect cea datorat erorii de eantionare. Dac
utilizarea rezultatelor cercetrii poate fi o problem de via i de moarte, aa cum e n
cazul unui nou medicament, este nevoie de un nivel mai nalt i mai precis pentru
eliminarea ipotezei nule, de exemplu putem folosi nivelul 0,001. Nivelul de
semnificaie 0,001 nseamn c probabilitatea de a respinge ipoteza nul n mod
eronat este de 1 la 1000.
n studiile de cercetare n care importana unei erori n respingerea ipotezei
nule nu este fatal sau traumatic, putem considera c nivelul de semnificaie 0,10
(10% probabilitate de a grei) este acceptabil. La nivel de semnificaie 0,10 exist de
dou ori mai multe posibiliti de a comite o eroare de tipul I (sub forma erorii de
eantionare) dect exist la nivelul 0,05. Cteodat se accept un nivel de semnificaie
mai slab dect 0,10 pentru confirmarea unei legturi ntre dou variabile, acolo unde
planul de cercetare include replicarea (repetarea cercetrii). Dac un nivel de 0,10
poate fi considerat ca insuficient pentru a dovedi o legtur, un caz tipic sau o serie de
cazuri tipice sunt suficiente pentru a ajunge la concluzia c ipoteza nul poate fi
respins.
Dei o anumit flexibilitate este permis n selectarea pragurilor la care ansa
este n mod acceptabil eliminat ca explicaie pentru o legtur aparent, alegerea
unui nivel de ncredere nu trebuie vzut ca i cauzal. Selectarea unui nivel de
ncredere trebuie deasemenea s fie fcut nainte ca informaiile s fie colectate. Nu
ar fii etic s schimbm nivelul de ncredere dup aceea, deoarece deciziile ar fi
interpretate ca un efort manipulator pentru a ntoarce rezultatele n favoarea sprijinirii
concluziilor cercetrii.

43
5.5. Relaii statistic semnificative i rezultate substaniale
Cuvntul semnificativ este larg utilizat si totodat foarte vag n profesia
noastr. l folosim deseori pentru a accentua importana a ceva, ca de exemplu
contribuia semnificativ a unui asistent social la autorizarea plii notelor de plat
sau pe rol de evoluii semnificative n dezvoltarea respectului de sine la clieni. Cu
alte cuvinte l folosim zilnic, ca o valoare, de aceea este bine s aezm alturi de
nelesul lui semnificativ utilizat n mod obinuit, i ceea ce el nseamn n statistic.
Semnificaia statistic este o demonstraie, prin procedeul testrii statistice, care
elimin ipoteza nul ntr-un mod sigur, i art c exist o legtur real ntre
variabile. O legtur ntre dou variabile care este declarat a fi statistic semnificativ
este atunci cnd suntem n mare msur siguri (95%, n cele mai multe cazuri) c ea
nu poate fi explicat ca o idiosincrazie a ansei sau a erorii de eantionare. n statistic
exist doar un singur neles relevant al cuvntului semnificativ sau semnificaie;
trebuie s fim ateni n folosirea termenilor numai n acest sens.
O legatur statistic semnificativ ntre variabile poate sau nu sugera un rezultat
ntradevr important al cercetrii. Trebuie s fim ateni la evaluarea fiecrei legaturi
cu suport statistic, n contextul ntrebrii, Ei i ce ?! n practica de asisten social,
nu orice legtur statistic semnificativ este un rezultat ce necesit o implementare
real. In realitate pot exista legaturi statistic semnificative care sunt judecate ca fiind
nesemnificative n sens absolut.
Un exemplu ne poate ajuta s ilustrm aceast distincie. Un administrator de
asisten social care a condus un studiu de cercetare pentru a determina care tip de
abordare (A sau B) produce rezultate mai bune la clienii care apeleaz la serviciile de
consiliere familial. Administratorul demonstreaz c mrimea medie de 53 printre
cuplurile care au primit Tratamentul A este suficient de diferit fa de marimea 57
printre cuplurile ce au primit Tratamentul B. Administratorul se simte sigur n ceeace
privete eliminarea ipotezei nule i concluzioneaz c exist o legtur statistic
semnificativ ntre tipul de tratament i aranjamentul marital. Dar dup o privire mai
atent, administratorul concluzioneaz c rezultatele nu sunt relevante, pentru c o
diferen de numai patru puncte (57-53) este prea mic. Aceast diferen nu este n
mod sigur ndeajuns de mare pentru a justifica trimiterea ctorva membrii ai
personalului la un program scump de nvare i deprindere a Tratamentului B.
Bazndu-se pe lipsa cunoaterii a ceea ce poate fi interpretat ca un rezultat substanial
(o diferen banal de patru puncte) administratorul decide s nu implementeze
rezultatele.
Existena unei legturi statistic semnificative ntre variabile poate fi determinat
prin testare statistic pe baza legilor probabilitii. Dup aceea trebuie determinat dac
un rezultat este suficient de substanial sau nu. Aceast decizie cere o bun nelegere
a mai multor aspecte diferite din practica asistenei sociale.

5.6. Rezumat
Acest capitol a prezentat modul n care ansa i legile probabilitii sunt
implicate n testarea ipotezelor cercetrii. Testarea statistic este folosit pentru a
elimina factorul ans ca o explicaie a legturilor aparente; planurile de cercetare sunt
folosite pentru a elimina celelalte posibile explicaii, ca deformarea i alte variabile.
ntotdeauna trebuie s avem n vedere principiile eticii, conveniile i sensul comun n
stabilirea dac ansa a fost adecvat eliminat ca o explicaie competitiv pentru o
aparent legtur ntre variabile. Decizia dac suportul statistic pentru o legtur poate

44
fi invocat sau nu, trebuie ntotdeauna fcut n legtur cu potenialul de decizii n
folosul sau n defavoarea clienilor asistai social. n final trebuie s decidem dac o
legtur gsit a fi statistic semnificativ ntre variabile este substanial sau lipsit de
importan.

5.7. ntrebri pentru studiu


1. nainte de a pretinde c exist o legtur real ntre variabile, care sunt cele trei
explicaii cuncurente care trebuie eliminate ?
2. Care dintre explicaiile concurente necesit aportul statisticii ca s fie respinse ?
3. Care explicaii concurente trebuie s fie controlate la nceputul planului de
cercetare?
4. Care sunt ceilali patru termeni pentru ans care sunt folosii n testarea
ipotezelor?
5. Care este diferena dintre o eroare de tipul I i una de tipul II ?
6. Care este forma nul a unei afirmaii pentru o legtur ntre vrst si preferina
politic?
7. Care este legtura dintre ipoteza nul i ans n testarea ipotezei ?
8. Poate o legtur statistic semnificativ ntre variabile, s nsemne c nu exist
posibilitatea ca variabilele s fie nelegate? Explicai.
9. Cnd putem folosi un alt nivel de semnificaie dect convenionalul 0,05 pentru a
concluziona c exist suport statistic pentru o ipotez ?
10. Care nivel de semnificaie 0,01 sau 0,10 sugereaz o probabilitate mai mare de
existen a unei legturi reale ntre variabile ?

45
Capitolul 6. Selectarea unui test statistic

Capitolul precedent a descris modul n care sunt folosite testele statistice


pentru a produce argumente n susinerea ipotezelor privind relaiile dintre sau printre
variabile; testele statistice particip n determinarea situaiei n care ansa este o
explicaie nepotrivit pentru o legtur aparent. Acest capitol continu discuia
asupra testelor statistice i prezint condiiile n care un anume test statistic este
potrivit pentru analiza datelor unei anumite situaii date.

6.1. Importana selectrii unui test statistic potrivit


Prea multe decizii legate de o cercetare pot altera credibilitatea unui studiu de
cercetare. Selecionarea unor instrumente deformante de colectare a datelor, folosirea
unor metode de eantionare inadecvate, sau compilarea unor reviste de specialitate
inadecvate ne pot produce ndoieli n ceeace privete rezultatele oricrui studiu de
cercetare. n plus, credibilitatea unui studiu de cercetare n asistena social depinde
foarte mult de utilizarea unor analize statistice corespunztoare. Folosirea unui test
statistic nepotrivit ne poate conduce la concluzii i recomandri eronate, care pot
compromite i cel mai bun plan de cercetare.
De ce oare suntem cteodat pui n situaia de a alege un test statistic
necorespunztor cnd exist altele care sunt corespunztoare pentru aproape orice
situaie posibil? Un motiv major este regula obinuinei. Aceast pricipiu afirm c
muli dintre noi tind s vad soluia pentru o problem ca fiind ceea ce este mai bine -
i ceea ce este mai confortabil i mai familiar. De exemplu, un specialist n rezolvarea
cazurilor poate tinde s rspund problemei unui client prin recomandarea unui
tratament individual, un specialist n munca de grup poate vedea acelai client ca
avnd nevoie de un tratament n grup. Iar un avocat poate nclina spre a vedea
serviciul legal ca fiind soluia pentru multe probleme.
Civa asisteni sociali au o anumit formare n utilizarea testrii statistice.
Cunotiinele lor le permit s fie familiari cu unul sau dou teste statistice. Aflai n
situaia de a alege n obinuitele limitri de timp un test statistic, ei vor aplica regula
obinuinei, alegnd unul din vechii prieteni cu care sunt familiarizai, mai degrab
dect s exploreze posibilitatea utilizrii unui test statistic mai potrivit care ar necesita
studiu suplimentar.
Ei mai pot avea impresia c toate testele statistice au att de multe n comun
nct diferenele rezultate n folosirea lor vor fi mici indiferent care dintre ele ar fi
folosit. Aceast fals interpretare poate duce la selectarea testului folosit cel mai
frecvent n locul unuia care este mai puin familial. Acest mod de gndire scuz n
mod fals timpul pe care nu-l consumm pentru a cuta un test statistic potrivit pentru
situaia dat. El duce la proasta aplicare i la discreditarea a ceea ce altfel ar fi fost
extrem de necesar n domeniul cercetrii.

6.2. Consecinele folosirii unui test statistic necorespunztor


Orice test statistic cere anumite condiii pentru folosirea sa corespunztoare.
Aa cum vom vedea, anumite teste au cerine mai multe dect altele - adic ele au mai
multe restricii de utilizare. Ca regul general, testele care necesit condiii mai

46
exacte trebuie folosite mai degrab dect cele care cer condiii mai puine, dar numai
dac condiiile necesare sunt ndeplinite. Ele ne conduc mai greu la erori de tipul I sau
de tipul II n formularea concluziilor cercetrilor noastre.
Conceptul puterii unui indicator statistic
Nu toate testele statistice sunt egale; unele sunt inevitabil mai bune dect
altele. Testele cele mai bune sunt mai puternice fa de testele mai puin puternice. Un
test mai puternic ne permite s tragem concluzii bine specificate din datele deinute;
concluziile mai vagi, mai generale, rezult din folosirea testelor mai puin puternice.
Puterea este un concept bazat pe calcule matematice i msoar probabilitatea
comiterii unei erori prin respingerea ipotezei nule, dac testul este utilizat corect.
Un test mai puternic, folosit corespunztor, va avea o mai mic probabilitate de a ne
conduce la o eroare de tipul II, adic el este mai potrivit pentru a detecta o legtur
adevrat ntre variabile. Un test mai puin puternic, datorit propriei naturi, este mai
probabil s ne conduc la o eroare de tipul II, chiar dac toate criteriile pentru
folosirea lui sunt ndeplinite.
Aa cum am sugerat, testele mai puternice sunt n general acelea care necesit
condiii mai ferme pentru folosirea lor. Ele sunt mai complexe prin aceea c folosesc,
n general, toate valorile pentru toate cazurile (direct sau indirect), n loc de a folosi
doar valorile ctova cazuri (de exemplu, extremele sau valorile tipice). tim c
abaterea standard este preferabil amplitudinii ca indicator al mpratierii (i mai
potrivit) i c media este un indicator mai precis al tendinei centrale (i mai potrivit)
dect sunt mediana sau modul. De ce? Pentru c amndou, media i abaterea
standard, implic calcule care folosesc toate valorile; pe cnd celelalte statistici
descriptive, mai puin precise, nu le folosesc. Acelai principiu se aplic n
nelegerea nivelului mare sau mic al puterii testului statistic folosit n testarea
ipotezei. n general, testele mai puternice au probabilitatea de a folosi mai multe
valori din setul de date. Deasemenea ele profit mai mult de avantajele msurtorilor
de o precizie mai mare.
n general, trebuie s folosim cel mai puternic test care poate fi justificat
pentru orice situaie dat. Datele sunt irosite dac e folosit un test mai puin puternic
cnd sunt ntlnite criterii pentru un test statistic mai puternic. Un test statistic prea
puternic pentru condiiile care exist, ne poate conduce la tragerea unor concluzii
false din analiza datelor. Putem evita selectarea unui test statistic prea puternic sau al
unui test mai puin puternic dect ar fi posibil, doar dac nelegem factorii criteriilor
de alegere a diferitelor teste.

6.3. Consideraii care influeneaz alegerea unui test


Metodele de cercetare utilizate i datele rezultate afecteaz direct alegerea
testului statistic. Este deosebit de important, chiar critic, s cunoatem contextul
cercetrii noastre, strategia specific de cercetare pe care am utilizat-o i nivelul de
msur al datelor colectate. O corect nelegere a studiului de cercetare i abilitatea
de a specifica ce, cum i de ce, nainte de faza analizei datelor, va facilita foarte mult
selectarea unui test statistic.
Este bine s specificm testele statistice ce urmeaz a fi folosite nainte de a
ncepe colectarea informaiilor. Totui, se ntmpl destul de des s ntlnim probleme
n colectarea datelor, probleme care pot schimba modul n care aceste informaii sunt
colectate i cile prin care ele pot fi msurate i analizate. Cnd apar astfel de situaii
se consider etic, i n anumite cazuri absolut esenial, selectarea unor teste diferite de

47
cele anticipate. Trei consideraii influeneaz alegerea unui test statistic: (1) metodele
de eantionare folosite, (2) natura distribuiei populaiei cercetate i (3) nivelul de
msurare al variabilelor.
Metodele de eantionare folosite
Opiunile metodologice fcute n procesul de cercetare vor ncepe procesul de
eliminare a anumitor teste statistice ca fiind nepotrivite pentru testarea ipotezelor.
Alegerea unei metode de eantionare scurteaz lista testelor potrivite pe care le-am
putea folosi. n selectarea testului corect, trebuie s fim capabili s dm rspunsuri la
patru ntrebri legate de metoda de eantionare:
1. Observaiile fcute au fost alese aleator? Selecia unui caz a putut crete sau
descrete probabilitatea c oricare alt caz al populaiei s fi fost deasemenea
selectat?
2. Metoda de eantionare a selectat un singur eantion sau mai multe? Ct de multe?
3. Dac au fost mai multe eantioane, au fost ele independente unele fa de altele,
sau au fost ele legate ntr-un fel?
4. Ct de mare este ordinul de mrime al eantionului ?
Dac putem rspunde la aceste patru ntrebri, vom fi capabili s eliminm
corect mai mult de jumtate din testele statistice existente deoarece nepotrivirea lor
pentru metoda de eantionare avut n vedere este evident.
Natura distribuiei populaiei cercetate
O a doua apreciere major n selectarea testului statistic este modul n care
variabilele pe care le-am selectat pentru studiu sunt distribuite n interiorul populaiei.
Cteva din cele mai puternice teste necesit o distribuie normal (sub form de
clopot) a variabilei n populaia din care eantionul noastru a fost scos la ntmplare.
Aa cum am discutat n Partea I a acestei cri, o distribuie oblic pozitiv sau
negativ trebuie s exclud folosirea mediei ca msur a tendinei centrale sau abaterii
standard ca o msur a dispersiei. Absena unei distribuii normale a variabilei n
populaia supus studiului va duce n mod similar la scoaterea din considerare a
multor teste folositoare i puternice.
O distribuie normal perfect simetric este rar. O descriere complet a unei
variabile pentru o anumit populaie poate s nu existe; dac e aa datele avute pot s
aproximeze doar o curb n forma de clopt. n situaiile concrete ale cercetrilor,
adesea facem judeci de valoare care ne ajut n luarea decizilor. De exemplu, facem
judeci de valoare cnd decidem c am vzut suficient de mult literatur de
specialitate, cnd justificm o ipotez direcional, sau cnd alegem un nivel de
ncredere pentru respingerea ipotezei nule. Tot aa, facem o judecat de valoare cnd
determinm dac o distribuie este suficient de normal. n general, cnd o variabil
are valori ce aproximeaz o curb n form de clopot, poligonul de frecvene pentru
populaia din care provine este considerat suficient de normal pentru folsosirea unor
teste statistice relativ puternice.
Nivelul de msurare pentru variabile
Un al treilea factor, considerat major n selectarea testelor statistice, este
nivelul de msurare al variabilelor dependente i independente. Aa cum am prezentat
n Capitolul 1, putem categoriza variabilele de nivel nominal, ordinal, interval i
rapoarte. O construcie bine planificat a instrumentelor de colectare a datelor ne va
pemite obinerea celui mai nalt nivel posibil de msurare pentru orice variabil dat.
Putem pierde din precizia datelor dac folosim un instrument de colectare a

48
informaiilor construit nengrijit, prin care se permite unei variabile care ar fi putut fi
msurat de nivel interval sau raport s fie mai puin precis. Apoi urmeaz s o
tratm doar ca un indicator sec al cantitii (nivelul ordinal). Alegerea unui instrument
care produce categorii doar de nivel ordinal de msurare, n loc de un indice msurat
la nivel interval, va exclude automat folosirea tuturor testelor statistice care necesit
variabile de nivel interval. Intradevr, deciziile pe care le folosim n operaionalizarea
i n construirea chestionarului, afecteaz cercetarea prin micorarea sau extinderea
posibilitilor de alegere a testelor statistice potrivite pentru ipotezele noastre.

6.4. Teste parametrice i neparametrice


Cei trei factori menionai mai sus, metoda de eantionare, natura populaiei
cercetate i nivelul de msurare al variabilelor, determin testul statistic cel mai
potrivit pentru a fi utilizat. Fiecare test are propriile cerine specifice care se leag cu
fiecare dintre aceti trei factori. Totui pentru simplificarea proceselor de selectare a
unui test corespunztor, trebuie punctat c exist dou grupuri de teste mutual
exclusive, care reflect dou mnunchiuri distincte de cerine. Cele doua tipuri de
teste statistice sunt testele parametrice i neparametrice.
Testele parametrice
Testele parametrice sunt mai puternice dect cele neparametrice. Din acest
motiv ele sunt preferabile testelor neparametrice, desigur dac sunt ndeplinite
condiiile pentru folosirea lor. Ele pretind: (1) o distribuie normal a variabilei
(variabilelor) n populaia studiat, (2) extragerea de eantioane independente i (3)
cel puin o variabil studiat s fie de nivel interval sau rapoarte. Deobicei, ele pretind
(4) mrimi mai mari pentru eantioane dect cele neparametrice. Ca o regul, e bine
s avem n vedere c dac media i abaterea standard sunt potrivite ca statistici
descriptive pentru rezumarea datelor, statisticile parametrice pot fi utile pentru
examinarea legaturilor dintre variabile.
Testele neparametrice
Testele neparametrice sunt folosite pentru cercetarea situaiilor n care
condiiile pentru folosirea testelor parametrice nu sunt ndeplinite. Ele sunt mai puin
puternice dect cele parametrice. Spre deosebire de testele parametrice, acestea nu
necesit o distribuie normal. Unele cer eantioane independente, altele nu. Numrul
de eantioane i de cazuri din componena fiecrui eantion sunt factori importani n
selectarea unui test neparametric din sutele care exist. Multe dintre aceste teste
necesit date msurate doar la nivel nominal sau ordinal, dar unele cer o precizie de
msurare mai mare.
Deoarece statisticile neparametrice sunt desemnate, n general, pentru
analizarea datelor de nivel nominal sau ordinal care nu trebuie s fie distribuite
normal, ele sunt adesea ideale pentru cercetarea de asisten social. Aa cum am
artat mai devreme, multe dintre variabilele dependente nu sunt de nivel de msurare
interval sau rapoarte (de exemplu, succesul sau eecul n tratament, respitalizarea sau
nerespitalizarea etc.).
Testele neparametrice sunt mai mult dect o a doua opiune pentru situaiile n
care criteriile cerute de statisticile parametrice nu sunt ndeplinite. Ele au cteva
avantaje distincte fa de testele parametrice i sunt adesea singurele teste potrivite cu
necesitile noastre statistice. De exemplu, un test statistic neparametric este n special
folositor cnd:

49
1. Eantioanele au fost selectate din populaii diferite; folosindu-se cadre de
eantionare diferite.
2. Datele deinute au fost constituite n principal prin aranjarea n ordine a mai
multori rspunsuri alternative sau,
3. Eantioane foarte mici (din ase sau apte cazuri) sunt tot ce exist disponibil
pentru studiu.
Din fericire, lipsa de putere a testelor neparametrice poate fi compensat cel
puin n parte. n multe situaii, dou sau chiar mai multe teste pot fi potrivite; unul
dintre ele poate fi potenial mai puternic dect altul (altele). Totui ele pot avea nevoie
de diferite mrimi minime de eantione. Ca o regul general, testul care necesit cea
mai mare dimensiune de eantion este, probabil, cel mai puternic. Dac anticipm
nevoia de putere n testare, putem mri dimensiunea eantionului (eantioanelor)
noastre, astfel nct s se ndeplinesc criteriile pentru utilizarea celui mai puternic
test statistic. Pentru c eantionul cel mai mare este cel care are efectele cele mai
pozitive n privina puterii testelor, nu este greit s folosim cea mai mare mrime
posibil atunci cnd dispunem de resurse adecvate. In anumite cazuri aceast strategie
poate avea un efect important, fcnd un test neparametric aproximativ la fel de
puternic ca unul parametric.

6.5. Cptarea deprinderilor de folosire a testelor statistice


Deoarece att de multe teste statistice sunt disponibile nu putem s le
cunoatem n ntregime pe toate. De fapt, probabil mai puin de o duzin de teste sunt
utilizate n mod obinuit n cercetarea de asisten social; altele sunt rar ntlnite n
literatura de specialitate, i un al treilea grup include un numr mare de teste care sunt
necunoscute. n plus, noi teste sunt create cu ajutorul calculatorului, n timp ce altele
devin la mod pentru un timp, iar apoi sunt abandonate.
Urmtoarele trei capitole sunt concentrate doar pe trei teste statistice. Ele sunt
teste care sunt acceptate de muli ani i promit s rmn acceptate datorit potrivirii
lor pentru analiza datelor n cercetarea de asisten social. Accentul va fi pus pe
nelegerea modului n care testele statistice i ndeplinesc menirea. Convingerea
noastr este c nelegerea factorilor ce influeneaz alegerea unui test, aa cum au
fost discutate n acest capitol, i principiile generale ale testrii explicate n capitolul
precedent i dezvoltate n capitolele urmtoare vor pregti cititorul s fac alegerea
testului statistic adecvat.

6.6. Rezumat
Acest capitol a accentuat importana selectrii cu grij a testului statistic
folosit n analiza datelor. El a prezentat factorii majori avui n vedere n alegerea
celui mai potrivit test pentru o situaie dat. Din cele discutate, am observat c cea
mai potrivit selecie a unui test statistic este absolut necesar pentru credibilitatea
studiului de cercetare i c acesta va avea o mare influen asupra probabilitii ca
rezultatele cercetarii s fie utile profesionitilor din asisten social.

6.7. ntrebri pentru studiu


1. Cum poate folosirea unui test statistic s discrediteze credibilitatea cercetrii?

50
2. Cum poate un cercettor s foloseasc un test necorespunztor care n final are un
efect negativ n servirea clieniilor?
3. Cum poate cteodat regula obinuinei s conduc la selecia unui test statistic
necorespunztor ?
4. La ce ne referim cnd spunem c un test statistic este mai puternic dect altul?
5. Ce factori legai de metodele de eantionare utilizate ajut la determinarea testului
statistic corespunztor?
6. Care sunt celelalte dou caracteristici ale datelor care contribuie la alegerea
testului statistic potrivit?
7. Cum poate operaionalizarea unei variabile, realizat chiar nainte ca informaiile
s fie colectate, s limiteze sau extind numrul de opiuni de teste statistice care
ar putea fi utilizate?
8. Care sunt cele trei criterii care trebuiesc ndeplinite pentru ca un test parametric s
poat fi utilizat?
9. De ce sunt testele neparametrice folositoare, n particular n multe proiecte de
cercetare n asisten social?
10. Cum putem crete puterea, cnd trebuie s folosim teste neparametrice?

51
Capitolul 7. Asocierea

Nici o analiz statistic nu este mai bine cunoscut i mai frecvent folosit
greit, dect asocierea - referit uzual prin hi-ptrat. Popularitatea lui deriv n
principal din doi factori. n primul rnd, muli dintre cei care au studiat statistica ca
parte a programului de formare profesional pentru asisten social, i-au petrecut
ctva timp studiind acest test statistic. A fost un fel de lan intergeneraional de
nvare pentru formatorii din asistena social (care sunt mai familiarizai cu acest tip
de analiz dect cu altele) i care au tendina s sugereze folosirea acestuia
studenilor, care la rndul lor l recomand altora.
Analiza tabelelor de asociere apare destul de frecvent n literatura de
specialitate aa c ne ateptam s le vedem folosite n articolele din jurnalele cu
orientare statistic. Faptul c cunoaterea tabelelor de asociere este att de rspndit
faciliteaz definitiv comunicarea rezultatelor din munca de asisten social, unde
practicienii citesc jurnale mai puin orientate statistic, care ar putea utiliza i alte
procedee statistice mai puin rspndite. Procedurile statistice nelese de mult lume
sunt avantajoase atunci cnd ncercm s comunicm cunotine din practica asistenei
sociale. Totui, i asocierea, ca i toate celelalte analize statistice, sunt destinate a fi
folosite cu un anumit tip de date i n anumite situaii de cercetare specifice.
Cercettorul sau practicianul de asisten social care nu cunoate condiiile specifice
necesare utilizrii lor, risc s fac o grav eroare care poate avea n final un impact
negativ chiar asupra practicii de asisten social. De asemenea, popularitatea
asocierii poate fi un pericol potenial . Credina n ele i larga lor rspndire printre
cercettori i practicieni, constituie principalele consecinele negative ale folosirii lor
greite.
Un al doilea factor explicativ al popularitii asocierii provine direct din
condiiile necesare utilizrii: ele necesit informaii doar de nivel nominal. Faptul c
doar nivelul nominal este cerut pentru variabile, face ca asocierea s fie bine vzut
de un numr mare de cercettori de asisten social. Asocierea cere ca valorile unei
variabile s reprezinte categorii distincte i s existe doar diferene de clas. Ar trebui
s fie evident de acum ncolo, c dac examinm legaturile dintre variabile de nivel
ordinar i interval, sunt necesare alte teste, n general mai puternice.
Asistenii sociali sunt adesea interesai n a cuta legturi ntre variabile ca
eficiena tratamentului (succes/eec) i alte variabile de nivel nominal cum ar fi tipul
de tratament (de grup/individual). Este destul de dificil de spus cu certitudine dac
succesul clientului (mbuntire/nenbuntire) s-a petrecut, i fr a ncerca s se
determine cantitatea exact de succes. Similar, putem uor afla dac o parte specific
a legislaiei sociale a fost adoptat n diferite state (ale S.U.A.). Dar probabil c nu
vom avea de gnd s msurm cantitatea de implicare a grupurilor de avocai n
adoptarea acestor legi - ci doar dac au fost active sau nu. n practica de asisten
social i n situaiile de cercetare, multe dintre variabile au valori de tipul da-nu
sau alte categorii de valori ce pot fi considerate a fi numai de nivel nominal. Pentru c
procedeul cutrii asocierilor este cel mai potrivit pentru cazurile cnd ambele
variabilele din studiu sunt de nivel nominal, el va fi adesea legitim a fi utilizat n
analiza datelor din proiectele noastre.

52
7.1. Ce caut s determine asocierea
Aa cum am discutat ntr-un capitol anterior, toate testele statistice ncearc s
elimine ansa ca explicaie pentru o legtur aparent ntre dou sau mai multe
variabile. Cu asocierea, spectrul ansei are anumite caracteristici. Dac spre exemplu,
am cauta s gsim o legtur ntre o variabila dependent ca succesul tratamentului
clientului (succes/eec) i o variabil independent asemenea tipului de tratament (de
grup/individual) pentru urmarirea evaluarii unui program de consiliere n privina
alcoolului, ansa ar putea juca rolul scepticului. Ipoteza nul spune c nu exist nici o
legtur ntre cele dou variabile: dac clienii s-au abinut de la alcool pentru o
perioad de timp (succes) sau nu s-au abinut (eec) i dac au primit tratamentul de
grup sau individual. Ocazional poate aprea c acei clieni care s-au abinut au fost n
general cei care au primit tratamentul individual sau vice versa. Totui n concordan
cu ipoteza nul, aceast aparent legtur dintre cele dintre dou variabile poate fi
explicat i de variaiile normale ale caracteristicilor ntlnite n eantionul mic pe
care s-a lucrat (fa de populaia tuturor alcoolicilor). Ar putea fi doar rezultatul erorii
de eantionare. Ipoteza nul trebuie s susin c nu exista o legtur real ntre dou
variabile dintr-o populaie.
Putem pretinde existena unei legturi reale ntre dou variabile doar dac
putem demonstra c legtura observat dintre ele este improbabil s se fi ntmplat
doar pe baza ansei, i deci orice persoan rezonabil va elimina ntmplarea (i
firete factorii deformare i alte variabile) ca explicaie improbabil. Asocierea
ncearc s determine dac exist o legtur adevrat ntre dou variabile, examinnd
n ce msur valorile specifice unei variabile sunt asociate cu valorile specifice ale
celei de a doua variabile, ntr-un grad de probabilitate suficient de mare ca aceasta s
nu fie doar efectul erorii de eantionare. Cnd folosim asocierea nu suntem att de
ambiioi ca s sugerm c o variabil poate fi cauza variaiei celeilalte variabile.
Putem doar afirma, n cel mai bun caz, c exist un anumit tip de legtur (patern).
Asocierile sunt folosite cnd dorim s tiim cnd aceste legturi sunt suficient de
puternice i consistente pentru a elimina ansa (ntmplarea) ca o explicaie a legturii
observate.
Analiza asocierii este una dintre cele mai simple ci pentru a determina dac
exist o legtur adevrat ntre dou variabile. Exemplul care urmeaz ilustreaz
modul cum asocierea este folosit n examinarea eficacitii relative a tratamentului
de grup fa de tratamentul individual cu clienii care au fost tratai pentru alcoolism
la un centru particular de tratament. Pentru a face aceasta, un grup de clieni care au
primit tratamentul n grup sunt comparaii direct cu un grup de clieni care au primit
tratamentul ndividual.

7.2. Logica tabelelor de asociere


Pentru a nelege procedeul asocierii este util s ncepem cu un tabel care este
asemntor Tabelului 7.1 sau Tabelului 7.2 . Tabelele au multe nume: tabele de
asociere, tabele hi-ptrat sau tabele de contingen. n continuare ne vom referi la ele
ca tabele de asociere. n ultima coloan din dreapta Tabelului 7.1 i Tabelului 7.2,
sunt totalurile (frecvenele) pentru fiecare rnd introdus. Totalurile pe coloane sunt
introduse n linia de jos. Aceste totaluri de pe rnduri i coloane sunt denumite
totaluri marginale. Ele indic numrul total de cazuri care au fost observate avnd o
anumit valoare pentru una din variabilele - aceste sunt: tratament n grup, tratament
individual, succes sau eec. Totalul general, numrul total de cazuri (N), este introdus

53
n colul din dreapta-jos. Suma totalurilor de pe ultima coloana i de pe ultimul rnd
sunt egale, i egale cu numrul total de cazuri.

Tabelul 7.1 Tipul de tratament dup succesul clientului


Succes?
Tip de tratament Da Nu Total
Tratament n grup a b a+b
Tratament individual c d c+d
Total a+c b+d N
Aa cum se vede, Tabelul 7.1 conine dou variabile dihotomice (cu dou
categorii), tipul de tratament i succesul clientului. Clienii difer dup tipul de
tratament pe care l-au primit (variabila independent) i pot varia datorit succesului
(variabila dependent). Este, desigur, posibil a avea variabile cu mai mult de dou
categorii. Tabelul de asociere va avea atunci mai multe rnduri i coloane i firesc mai
multe celule. Tabelul 7.1 identific diferitele celule n exemplul nostru cu a, b, c i d.
Categoriile variabilelor din tabelul de asociere pot fi puse n orice ordine
deoarece ele sunt de nivel nominal; neexistnd o ordonare dup rang sau alte diferene
cantitative. Matematic este posibil s folosim analiza tabelelor de asociere cu variabile
de nivel ordinar, interval sau raport. Totui folosind tabelele de asociere cu variabile
de nivel ordinal sau interval, acestea nu vor putea profita de avantajele pe care le ofer
precizia de msurare a acestor variabile. Valorile, n aceste cazuri, sunt tratate fr s
se in cont de diferenele cantitative pe care le reflect, ca i cum ele ar reprezenta
doar diferene calitative.
Tabelele de asociere prezint deobicei frecvenele pentru o variabil
independent i pentru una dependent. n acest capitol, n toate tabelele, variabila
dependent va fi dispus pe coloane, iar variabila independent va fi dispus pe linii.
Aceasta nu reprezint o lege, de aceea unele studii folosesc aezarea invers. De fapt
n orice studiu de cercetare, n momentul calculului indicatorului de asociere este
orb n ceea ce privete care dintre variabile este cea independent sau cea
dependent. Asocierea examineaz numai dac exist legaturi ntre cele dou
variabile. Sunt situaii cnd nici una dintre variabile nu este clar dependent sau
independent. Ele sunt doar dou variabile, a cror legtur dorim s o studiem.
Indicatorul hi-ptrat este deasemenea potrivit pentru acest tip de situaii.
Frecvene observate
Tabelul 7.2 prezint rezultatele actuale, sau observate, rezultate din studiul
nostru ipotetic asupra celor dou metode de tratament. Datele din cele patru celule ale
Tabelului 7.2 reprezint numrul observat de clieni care au realizat fiecare
combinaie de valori corespunztoare pentru cele dou variabile. Putem observa c au
existat n total 100 de clieni (N), dintre care 60 au primit tratamentul n grup (a+b) i
40 au primit tratamentul individual (c+d). Cincizeci i cinci au avut succes n timp ce
45 au avut insucces. n plus, printre cei 60 care au primit tratamentul n grup, 40 de
clieni au avut succes (celula a) i 20 de clieni au avut insucces (celula b). Printre
clienii ce au primit tratamentul individual, 15 au fost considerai ca avnd succes
(celula c) i 25 ca avnd insucces (celula d).

Tabel 7.2 Frecvene observate a tipului de tratament dupa succesul clientului


Succes?
Tip de tratament Da Nu Total

54
Tratament n grup 40 20 60
Tratament individual 15 25 40
Total 55 45 100
n exemplul nostru avem nevoie s comparm clienii care au primit
tratamentul n grup cu aceia care au primit tratamentul individual, n ceea ce privete
rezultatele lor. O astfel de comparaie este relativ greu de observat n Tabelul 7.2
pentru c cele dou tipuri de tratament au numere diferite de clieni (60 i 40). Evident
c cei 40 de clieni care au avut ca rezultat succesul cu tratamentul n grup (celula a),
nu-i putem compara direct cu cei 15 clieni care au avut ca rezultat succesul, dar pe
baza tratamentului individual (celula c) i astfel nu putem concluziona c tratamentul
n grup este cea mai bun metod de tratament doar pentru ca cifra 40 este mai mare
dect 15. n ciuda diferenei dintre numarul de cazuri n cele dou grupuri, este posibil
s facem o ncercare de comparare ntre cele dou tipuri de tratament, prin calcularea
procentelor. De exemplu, putem afla ce procentaj reprezint 40 de clieni din 60 de
clieni i ce procentaj reprezint 15 clieni din 40 de clieni. Tabelul 7.3 este un tabel
de asociere cu procentaje pentru datele observate n Tabelul 7.2. El arat c 66,7
procente ale clienilor care au primit tratamentul n grup au avut ca rezultat succesul,
comparativ cu 37,5 procente ale acelor clieni care au primit tratamentul individual.
Variabilele tipul de tratament primit i succesul clienilor ar putea fi deci legate. Dac
procentajele (celula a i celula c) ar fi identice, cele dou variabile n mod sigur nu ar
fi legate. Acum la acest punct, este nc dificil s tim dac aparenta legtur nu este
doar o fluctuaie a ansei.
Dei cele dou variabile par s fie ntructva legate, totui s-ar putea spune c
ele nu sunt prea mult legate. Argumentul ar consta n faptul c 29,2 procente
diferen (66,7 procente - 37,5 procente = 29,2 procente) nu este foarte mult i s-ar
putea ca faptul de a fi legate este doar un rezultat al erorii de eantionare. Aa s fie?
Multe dintre raionamentele statistice sunt preocupate s ne ajute s decidem ct de
mare diferen este necesar pentru a elimina ansa ca explicaie posibil al unei
legturi aparente ntre variabile.

Tabel 7.3 Procente observate a tipului de tratament dupa succesul clientului


(din tabelul 7.2)
Succes?
Tip de tratament Da Nu Total
Tratament n grup 66.7 33.3 100.0
Tratament individual 37.5 62.5 100.0
Tratament n grup = Celula a: 40 / 60 = 66.7%
Celula b: 20 / 60 = 33.3%
100%
Tratament individual = Celula c: 15 / 40 = 37.5%
= Celula d: 25 / 40 = 62.5%
100%

Frecvenele ateptate
Ct de mare ar trebui s fie diferena ntre procente pentru ca ansa s fie o
explicaie improbabil ? Putem rspunde la aceast ntrebare prin concentrarea asupra
ct de mult difer frecvenele observate fa de acele frecvene pe care noi ne
ateptm s le gsim mai frecvent, dac ipoteza nul ar fi adevrat - acestea sunt
frecvenele ateptate.

55
S ne ntoarcem la Tabelul 7.2 i s ne concentrm doar asupra frecvenelor
marginale. Din totalul de 100 de clieni, 55 sau 55 % au avut ca rezultat succesul.
Dac tipul de tratament nu este legat de succesul clientului, ar trebui s ne ateptm la
aproximativ 55 de procente din totalul clienilor s aibe succes, indiferent de tipul de
tratament aplicat. Dei rezultatele dintr-un eantion particular nu vor iei exact n
acest mod, foarte adesea, ntr-un numr mare de eantioane dintr-o populaie n care
ipoteza nul este adevrat (variabilele n mod sigur sunt nelegate), vom gsi
rezultatul mediu al tuturor eantioanelor; adic proporia medie de aproximativ de
55 %.
Putem construi un tabel al frecvenelor ateptate presupunnd c ipoteza nul
ar fi adevrat; asemntor Tabelului 7.4 . Pentru a calcula frecvena ateptat dintr-o
celul, se ia totalul pe coloan, se nmulete cu totalul de pe linie pentru acea celul i
dup aceea se mparte rezultatul la numrul total de cazuri (N). Adic:

E= (R) (C)
(N)
unde:

E = Frecvena ateptat ntr-o celul particular


R = Totalul pe linia celulei
C = Totalul pe coloan celulei
N = Numrul total al cazurilor

nlocuind valorile vom gsi:

celula a: E = (60) (55) = 33


100
celula b: E = (60) (45) = 27
100
celula c: E = (40) (55) = 22
100
celula d: E = (40) (45) = 18
100
Totalul frecvenelor ateptate = 100

Tabelul 7.4 Frecvene i procentaje ateptate


pentru tipul de tratament dup succesul clienilor
Succes?
Tip de tratament Da Nu Total
Tratament n grup 33 (55%) 27 (45%) 60 (100%)
Tratament individual 22 (55%) 18 (45%) 40 (100%)
Total 55 45 100

56
Tabelul 7.5 Diferena dintre frecvenele observate i cele ateptate
pentru tipul de tratament dup succesul clienilor (din Tabelele 7.2 i 7.4)
Observate -Ateptate = Diferene
Celule (Tabelul 7.2) -(Tabelul 7.4) = (Tabelul 7.5)
Celula a 40 - 33 = +7
Celula b 20 - 27 = -7
Celula c 15 - 22 = -7
Celula d 25 - 18 = +7
Total 100 - 100 = 0
Succes?
Tip de tratament Da Nu Total
Tratament n grup +7 -7 0
Tratament individual -7 +7 0
Total 0 0 0

Diferena dintre frecvenele observate i frecvenele ateptate


Tabelul pentru frecvenele obsevate este acum comparat cu tabelul
frecvenelor ateptate. Aceasta nseamn ca vom examina mai ndeaproape diferenele
dintre frecvenele observate (Tabelul 7.3) i frecvenele ateptate (Tabelul 7.4) pentru
fiecare celul. Tabelul 7.5 prezint diferenele matematice ntre frecvenele observate
i frecvenele ateptate din exemplul nostru.
Indicatorul statistic hi-ptrat
Ar fi nevoie acum de un fel de rezumat al diferenelor prezentate n Tabelul
7.5. Simpla adunare a diferenelor pentru toate celulele nu este bun pentru c va fi
ntotdeauna zero. Un rezumat mai bun este furnizat prin ridicarea la ptrat a
diferenelor din fiecare celul, mprirea acestor ptrate la valoarea ateptat pentru
fiecare celul i adunarea rezultatelor pentru toate celulele. Numrul care rezult este
numit valoarea hi-ptrat, reprezentat de litera din alfabetul grec, hi cu semnul
ridicrii la ptrat. Putem exprima aceasta cu formula:
2
2 = (O - E)
E
unde: 2= Valoarea hi-patrat
O = Frecvena observat
E = Frecvena ateptat
= Suma (tuturor celulelor)
nlocuind literele prin valori gsim:
2= (40-33)2 + (20-27) 2 + (15-22) 2 + (25-18) 2
33 27 22 18
= (+7) 2 + (-7) 2 + (-7) 2 + (+7) 2
33 27 22 18
= (49) / 33 + (49) / 27 + (49) / 22 + (49) / 18
= 1,5 + 1,8 + 2,2 + 2,7
= 8,2 (valoarea lui hi-ptrat)
Dac sunt doar patru celule, aa cum este cazul n exemplul nostru, trebuie s
mai scdem 0,5 din diferena dintre frecvenele observate i cele ateptate pentru
fiecare celul nainte de ridicarea la ptrat (acesta este Factorul de corecie al lui

57
Yates). Dar de dragul simplificrii i pentru a prezenta formula obinuit, exemplul
nostru nu a mai efectuat aceast scdere.
Grade de libertate
nainte s putem utiliza un tabel de asociere pentru calculul lui hi-ptrat,
pentru a determina dac exist o asociere statistic semnificativ ntre cele dou
variabile, avem nevoie s nelegem conceptul de grade de libertate. Probabilitatea
obinerii unei valori hi-ptrat mari este afectat de mrimea tabelului de asociere pe
baza cruia este calculat. Mrimea aici se refer la numrul de coloane i de linii
(adic numrul total de celule) din tabel. Cu ct tabelul este mai mare, cu att este mai
probabil s avem o valoare mai mare al lui hi-ptrat. Aceasta reiese evident din faptul
c valoarea hi-ptrat este suma cifrelor derivate din fiecare dintre celule. Cu ct sunt
mai multe celulele ntr-un tabel cu att vor fi mai multe cifre care adunate vor crete
valoarea lui hi-ptrat.
Fiecare valoare hi-ptrat trebuie s fie evaluat innd cont de dimensiunea
tabelului, exprimat n termeni de grade de libertate. Numrul de grade de libertate
pentru un tabel de asociere este egal cu numarul de linii minus unu, nmulit cu
numrul de coloanelor minus unu. Putem scrie aceast formul astfel:
df = (r-1) (c-1)
unde:
df = grade de libertate
r = numrul de linii
c = numrul de coloane
nlocuind literele cu valorile din exemplul nostru, gsim:
df = (2-1) (2-1)
= (1) (1)
= 1 (grade de libertate)
ntradevr, Tabelul 7.2 are gradul unu de libertate, aa cum au toate tabelele
formate din doua linii i dou coloane.

Determinarea probabilitii
Pentru a determina dac valoarea lui hi-ptrat pentru un tabel de asociere dat
sugereaz sau nu o asociere statistic semnificativ ntre variabile, trebuie s gsim n
primul rnd linia care corespunde gradelor de libertate al tabelului de asociere n
Tabelul 7.6. Cele ase valori n fiecare din liniile Tabelului 7.6 sunt valori hi-ptrat
care au probabilitatea indicat n capul de tabel al coloanelor respective. Vom citi n
dreptul liniei pentru a gsi unde cade valoarea noastr hi-ptrat. Dac numrul exact
nu apare, vom considera numrul din stnga locului unde ar cdea valoarea lui hi-
ptrat. Dup aceea ne vom deplasa la vrful coloanei ivom gsi probabilitatea
asociat lui.

58
Tabelul 7.6 Valori critice pentru hi-ptrat
Nivel de semnificaie pentru un test direcional
.10 .05 .025 .01 .005 .0005
Nivel de semnificaie pentru un test nedirecioal
df .20 .10 .05 .02 .01 .001
1 1.64 2.71 3.84 5.41 6.64 10.83
2 3.22 4.60 5.99 7.82 9.21 13.82
3 4.64 6.25 7.82 9.84 11.34 16.27
4 5.99 7.78 9.49 11.67 13.28 18.46
5 7.29 9.24 11.07 13.39 15.09 20.52

6 8.56 10.64 12.59 15.03 16.81 22.46


7 9.80 12.02 14.07 16.62 18.48 24.32
8 11.03 13.36 15.51 18.17 20.09 26.12
9 12.24 14.68 16.92 19.68 21.67 27.88
10 13.44 15.99 18.31 21.16 23.21 29.59

11 14.63 17.28 19.68 22.62 24.72 31.26


12 15.81 18.55 21.03 24.05 26.22 32.91
13 16.98 19.81 22.36 25.47 27.69 34.53
14 18.15 21.06 23.68 26.87 29.14 36.12
15 19.31 22.31 25.00 28.26 30.58 37.70

16 20.46 23.54 26.30 29.63 32.00 39.29


17 21.62 24.77 27.59 31.00 33.41 40.75
18 22.76 25.99 28.87 32.35 34.80 42.31
19 23.90 27.20 30.14 33.69 36.19 43.82
20 25.04 28.41 31.41 35.02 37.57 45.32

21 26.17 29.62 32.67 36.34 38.93 46.80


22 27.30 30.81 33.92 37.66 40.29 48.27
23 28.43 32.01 35.17 38.97 41.64 49.73
24 29.55 33.20 36.42 40.27 42.98 51.18
25 30.68 34.38 37.65 41.57 44.31 52.62

26 31.80 35.56 38.88 42.86 45.64 54.05


26 31.80 35.56 38.88 42.86 45.64 54.05
27 32.91 36.74 40.11 44.14 46.96 55.48
28 34.03 37.92 41.34 45.42 48.28 56.89
29 35.14 39.09 42.69 46.69 49.59 58.30
30 36.25 40.26 43.77 47.96 50.89 59.70

32 38.47 42.59 46.19 50.49 53.49 62.49


34 40.68 44.90 48.60 53.00 56.06 65.25
36 42.88 47.21 51.00 55.49 58.62 67.99
38 45.08 49.51 53.38 57.97 61.16 70.70
40 47.27 51.81 55.76 60.44 63.69 73.40

44 51.64 56.37 60.48 65.34 68.71 78.75


48 55.99 60.91 65.17 70.20 73.68 84.04
52 60.33 65.42 69.83 75.02 78.62 89.27
56 64.66 69.92 74.47 79.82 83.51 94.46
60 68.97 74.40 79.08 84.58 88.38 99.61
Valoarea hi2 este semnificativ dac ea este mai mare sau egal cu valoarea listat n tabel

59
Dac, de exemplu, fixm nivelul de probabilitate la 0,05, vom ti c dac
respingem ipoteza nul, probabilitatea statistic de a comite o eroare de tipul I este
mai puin dect 5 din 100.
n exemplul nostru, valoarea obinut pentru hi-ptrat este de 8,2, cu un grad
de libertate. Lum valoarea lui hi-ptrat de 8,2 i gsim cele dou valori din prima
linie din Tabelul 7.6 ntre care se gsete aceast valoare. Valoarea noastr hi-ptrat,
8,2 , este localizat ntre valorile 6,64 i 10,83 . Astfel, dac ipoteza noastr a fost
direcional (sau one-tailed n tabel), adic clienii care primesc tratamentul n grup
au o rat statistic semnificativ mai nalt de succes dect clienii care primesc
tratamentul individual, putem spune c dac respingem ipoteza nul, exist o
probabilitate de doar 0,005 de a face o eroare de tipul I (doar 5 dintr-o mie). Pe scurt,
ipoteza noastr direcional poate fi considerat ca avnd suport statistic, deoarece
0,005 este mult mai mic dect convenionalul 0,05. Pe de alt parte, dac ipoteza
noastr ar fi fost nedirecional, putem nc considera c avem suport statistic pentru
ea, pentru c probabilitatea corespunztoare este tot mai mic dect 0,01, care este
mai mic dect convenionalul 0,05 .
S inem minte c trebuie s folosim valoarea din stnga valorii calculate a lui
hi-ptrat pentru a determina corect nivelul probabilitii. De exemplu, avem nevoie s
gsim o valoare chi-ptrat la cel puin 2,71, cu un grad de libertate, pentru ca o
ipotez direcional s fie susinut la un nivel obinuit de semnificaie de 0,05.
Prezentarea rezultatelor unei analize de asociere
Prezentarea rezultatelor noastre obinute n urma unei analize de asociere, este
relativ simpl. n primul rnd, vom prezenta tabelul de asociere cu frecvenele
observate, dup aceea plasm valoarea hi-ptrat (2), gradele de libertate (df), i
probabilitatea (p) asociat valorii noastre 2 ca rezultatul s se datoreze ntmplrii,
la sfritul tabelului. Aceste trei elemente de informaie vor fi scrise astfel:
2 = 8,2, df = 1 ; p < 0,005
Tabelele 7.7; 7.8; 7.11 i 7.12 sunt exemple de prezentare a analizei de
asociere.

7.3. Cnd s nu utilizm asocierea


Analiza hi-ptrat poate s ne fie foarte folositoare. Totui, ea poate fi greit
neleas. Probabilitatea indicat poate s nu fie prea adecvat n cazul n care
frecvenele ateptate din cteva celule ale tabelului de asociere sunt mici. Exist dou
situaii n care procedeul tabelelor de asociere nu poate fi folosit:
1. Cnd ntr-un tabel cu dou linii i dou coloane (patru celule), una sau mai multe
celule au valoarea ateptat mai sczut dect 5.
2. Cnd ntr-un tabel cu mai mult dect dou linii i dou coloane, exist mai mult de
20% din celule care au valori ateptate mai mici dect 5.
3. Cnd ntr-un tabel cu mai mult dect dou linii i dou coloane, exist celule cu
fredcvee nule (0).
O verificare rapid dac sunt probleme cu valorile ateptate prea mici, ntr-un
tabel de asociere poate fi realizat prin localizarea celulei cu valoarea ateptat cea
mai mic. Pentru a face aceasta, se localizeaz linia i coloana cu cele mai mici
totaluri. Celula cu cea mai mic valoare se afl la intersecia liniei i coloanei
localizate. Dup aceea valoarea ateptat a celulei este determinat cu formula (R) (C)

60
/ (N). Dac frecvena ateptat este 5 sau mai mult, este permis folosirea analizei
tabelului de asociere. Dac ea este mai mic dect 5 poate fi necesar s combinm
anumite celulele ntre ele (numit grupare) astfel nct criteriul pentru folosirea lui hi-
ptrat se poat fi ndeplinit; sau se poate folosi un alt test statistic (vezi ultimul
capitol). Desigur un tabel 2 x 2 (dou linii i dou coloane) nu poate fi grupat.
Volumul eantionului
n general, cu ct avem un eantion mai mare, cu att avem mai multe anse s
respingem ipoteza nul. Cu ct este mai mare dimensiunea eantionului cu att este
mai puternic testul. (Acesta este valabil pentru orice test statistic) De fapt, cu un
eantion foarte mare este extrem de probabil ca ipoteza nul s fie respins chiar dac
diferena absolut dintre frecvenele ateptate i cele observate din fiecare celul este
suficient de mic. Cnd oamenii interpreteaz un tabel de asociere, sunt adesea indui
n eroare de valoarea lui hi-ptrat i de nivelul de probabilitate rezultat; mai ales dac
nu urmresc cu atenie volumul eantionului (N). Trebuie ntotdeauna s avem n
minte c o valoare hi-ptrat i nivelul de probabilitate sunt legate direct de
dimensiunea eantionului pe baza cruia sunt calculate.
Cele prezentate anterior pot prea greu de neles, dar un acelai tabel de
asociere poate prezenta o legtur statistic important ntre dou variabile (via
indicatorul statistic hi-ptrat) sau - credei sau nu - el poate descrie o legtur slab,
dar statistic semnificativ. Pe scurt, putem aproape ntotdeauna avea o valoare hi-
ptrat statistic semnificativ - interesnd mai puin magnitudinea legturilor dintre
dou variabile - dac eantionul este suficient de mare. Astfel trebuie ntotdeauna s
privim la ceea ce nseamn legtura - nu doar nivelul de semnificaie statistic (p) al
valorii hi-ptrat. Aceasta este legat de discuia noastr din Capitolul 7 n care am
fcut distincie ntre: (1) legturi statistic semnificative ntre sau dintre variabile i (2)
rezultate substaniale.
Tabelul 7.7 Frecvene i procentaje observate
pentru tipul de tratament dup succesul clienilor (N = 200)
Succes?
Tip de tratament Da Nu Total
Numr Procent Numr Procent Numr
Procent
Tratament n grup 30 60.0% 20 40.0% 50
100%
Tratament individual 80 53.3% 70 46.7% 150
100%
Total 110 90 200
2 = 0,672, df = 1 ; p > 0,20 (fr predicia direciei)
O continuare a exemplului nostru va clarifica cele afirmate. S presupunem ca
ntr-un alt studiu, 200 de clieni au primit tratament n cadrul programului de tratare al
alcoolicilor. Rezultatul studiului poate fi asemenea celui prezentat n Tabelul 7.7. Aa
cum poate fi observat din acest tabel, p este mai mare dect 0,20 doar dac direcia
legturii nu a fost precizat i mai mare dect 0,10 ; dac s-a specificat direcia n
prealabil (vezi Tabelul 7.6). Cu alte cuvinte, noi am putea s nu avem suport statistic
suficient la nivelul 0,05 pentru a fi capabili s respingem ipoteza nul.

Acum s presupunem c avem nu doar 200 de clieni, aa ca n Tabelul 7.7 ci


de zece ori mai muli - 2000, iar proporia celor 2000 clieni n toate celulele este

61
exact acelai ca i n cazul eantionului anterior, prezentat n Tabelul 7.7. Rezultatele
se gsesc n Tabelul 7.8.
O privire atent asupra Tabelelor 7.7 i 7.8 va arta c frecvenele observate n
ambele tabele sunt absolut proporionale una fa de cealalt, dar diferena ntre
valorile fiecrui hi-ptrat i nivelele de probabilitate este foarte mare. Frecvenele
observate n Tabelul 7.7 nu sunt statistic semnificative, n timp ce frecvenele
observate n Tabelul 7.8 sunt statistic semnificative (la nivelul 0,01 pentru o ipotez
nedirecional i la nivelul 0,005 pentru o ipotez direcional). Dac am fi folosit
20000 clieni valoarea hi-ptrat ar fi fost de 67,2; dac am fi folosit 200000 clieni, hi-
ptrat ar fi devenit 672 i aa mai departe. i totui cele dou tabele 7.7 i 7.8 sunt
aproape identice, singurul lucru care le difereniaz este numarul de cazuri pe care le-
am folosit pentru calcularea celor dou mrimi hi-ptrat.

Tabelul 7.8 Frecvene i procentaje observate


pentru tipul de tratament dup succesul clienilor (N = 2000)
Succes?
Tip de tratament Da Nu Total
Numr Procent Numr Procent Numr
Procent
Tratament n grup 300 60.0% 200 40.0% 500
100%
Tratament individual 800 53.3% 700 46.7% 1500
100%
Total 1100 900 2000
2 = 6,72, df = 1 ; p < 0,01 (fr predicia direciei)

7.4. Asocierea cu trei sau mai multe variabile


De obicei ne concentrm atenia mai nti pe legturile dintre dou variabile.
Totui trebuie s avem n vedere c o a treia variabil poate, ntr-un anumit fel,
explica legtura aparent. n exemplul pe care-l vom folosi, ncepem n primul rnd
cu legtura dintre cele dou variabile, tipul de tratament i succesul clientului. Este
posibil ca o a treia variabil; nivelul motivaiei clientului naintea intrrii la tratament,
care nu a fost controlat metodologic i s poate explica aparenta legtur ntre
variabila dependent i cea ndependent. Va trebui s o reverificm pentru a avea o
imagine mai bun asupra legturii adevrate dintre tipul de tratament i succes. A treia
variabil, motivaia clientului, se numete variabil de control.
O modalitate de explorare a efectului celei de-a treia variabile este de a
mprii clienii notri dup categoriile celei de-a treia variabile i de a examina
legtura dintre variabilele principale, controlndu-le astfel prin prisma celei de-a treia
variabil. n exemplu nostru putem mpri eantionul n dou subcategorii: cu
motivaie nalt pentru tratament i cu motivaie sczut pentru tratament. Putem dup
aceeia construi dou tabele separate, pentru a urmri legtura dintre cele dou
variabile: tipul de tratament i succesul clientului. Rezultatul poate aprea ca n
Tabelul 7.9 (motivaie nalt pentru tratament) i Tabelul 7.10 (motivaie sczut
pentru tratament). Legtura dintre tipul de tratament i rezultatul clientului aproape c
a disprut, aa cum putem vedea examinnd diferenele dintre frecvenele observate i
cele ateptate n celulele respective (ele sunt aproape zero). Astfel, controlnd
motivaia clienilor pentru tratament, legtura aparent dintre variabilele dependente i

62
independente aproape c a disprut. Este foarte probabil ca legtura aparent dintre
variabila dependent i cea independent s nu fi fost una real.
Legtura iniial nu dispare ntotdeauna cnd o controlm printr-o a treia
variabil. Firete poate rmne n esen aceiai cu toate valorile celei de-a treia
variabile. n astfel de cazuri vom putea concluziona c cea de a treia variabil nu
joac un rol important n explicarea legturii iniiale. Legtura poate fi mai sczut
chiar dac nu dispare. n acest caz, a treia variabil poate explica doar o parte, nu
totul, dintr-o legtura iniial. Intensitatea legturii poate s creasc cnd o a treia
variabil este verificat. n asemenea situaii, cea de-a treia variabil este probabil
variabila nabuit (se mai numete i variabil latent) aceasta ascunznd gradul real
al asocierii dintre variabila dependent i cea independent.

Tabelul 7.9 Frecvene i procentaje observate pentru tipul de tratament


dup succesul clienilor cu o motivaie nalt (N = 70)
Succes?
Tip de tratament Da Nu Total
Numr Procent Numr Procent Numr Procent
Tratament n grup 21 52.5% 19 47.5% 40 100%
Tratament individual 16 53.3% 14 46.7% 30 100%
Total 37 33 70

Tabelul 7.10 Frecvene i procentaje observate pentru tipul de tratament


dup succesul clienilor cu o motivaie sczut (N = 30)
Succes?
Tip de tratament Da Nu Total
Numr Procent Numr Procent Numr Procent
Tratament n grup 11 55% 9 45% 20 100%
Tratament individual 6 60% 4 40% 10 100%
Total 17 13 30

Astfel putem da peste un alt rezultat cnd introducem o a treia variabil,


Legtura dintre primele variabile poate fi diferit pentru diferitele categorii ale
variabilei de control. Acesta nu este un rezultat simplu, el este adesea unul important.
Nu ntodeuna este posibil s obinem uor rezultate rezumative; mai curnd, legtura
iniial trebuie s fie descris pentru fiecare categorie a variabilei de control. A treia
variabil este prezent ca s detaileze mai departe legtura dintre primele dou
variabile, i se mai numete variabil de control.

7.1. Exemplu din micro-practic


Descrierea situaiei care genereaz un studiu
Joan este un asistent social ce se ocup cu internarea pacienilor n spital. Ea a
observat c un numr mare de pacieni care au fost lsai s triasc cu propriile rude
sunt reinternai n spital. Cunoscnd c asistenii sociali, colegi de a ei, care se ocup
cu planificarea externrilor trimit frecvent pacienii externai la internat, ea s-a
ntrebat de ce a vzut att de puine reinternri printre acei pacieni care au fost
externai la internat. Ea s-a ntrebat dac nu poate fi o legtur ntre pacienii care sunt
reinternai n spital i locul n care au fost ei externai (internat/la rude).

63
Ipoteza ce urmeaz a fi testat
Joan citete literatura de specialitate asupra temei ce o preocup. Bazndu-se
apoi pe consensul general al altor practicieni de asisten social; pe rezultatele
cercetrilor anterioare i pe propriile intuiii i observaii subiective, ea pornete la
realizarea i implementarea unei cercetri de mici proporii care va strnge datele
necesare testrii unei ipoteze direcionale.
Pacienii externai la internat vor avea o rat de reinternare mai sczut fa
de pacienii externai la rude, statistic semnificativ.

O privire asupra metodologiei


Joan a ales o strategie simpl pentru a testa ipoteza sa direcional. Ea a primit
permisiunea supervizorilor si s selecteze un eantion de 10 procente din toate
dosarele pacienilor care au fost externai n ultimele 18 luni, alese la ntmplare.
Utiliznd un instrument de colectare al informaiilor standardizat ntocmit de ea, a
strns date de o mare varietate al variabilelor demografice pentru 148 de pacieni
(10% din 1480 pacieni = 148 pacieni) care au fost externai la internat i 250 de
pacieni (10% din 2500 pacieni = 250 pacieni) care au fost trimii la rude. Eantionul
total a fost de 398 pacieni (148+250=398). Variabila dependent n ipoteza ei a fost
statutul admisiei pacienilor (readmii/nereadmii). Variabila independent a fost
statutul externrilor pacienilor (internat/rude).
Rezultatele
Tabelul 7.11 prezint rezultatele la care a ajuns Joan, folosind procedeul
tabelelor de asociere aa cum sunt prezentate n acest capitol.

Tabelul 7.11 Reinternarea n spital dup starea externrii


Reinternare?
Starea externrii Da Nu Total
La internat 25 123 148
La rude 71 179 250
Total 96 302 398
2 = 7,2 , df = 1, p < 0.005 (utiliznd corecia lui Yates)

Interpretarea rezultatelor i tragerea concluziilor


Ce a aflat Joan din testarea ipotezei direcionale folosind tabelul de asociere?
Din cunotiinele sale generale despre testarea ipotezelor, ea tia c p < 0.005, este un
nivel de probabilitate impresionant. Aceasta a nsemnat pentru ea c diferenele dintre
frecvenele observate i cele ateptate au fost mari. Ea tia deasemenea c dac
respinge ipoteza nul pe baza analizei sale ea va grei de mai puine ori dect 5 dintr-o
mie. Astfel ea a putut respinge ipoteza nul i s concluzioneze c exist o legtur
statistic semnificativ ntre cele dou variabile. Important este c ea a avut suport
statistic pentru ipoteza ei direcional.
Deasemenea Joan tia c n analiza tabelei de asociere trebuie s priveasc nu
numai dac rezultatul este statistic semnificativ, dar i dac legtura ntre cele dou
variabile a fost n direcia ipotezei. Asemenea altor teste statistice despre care vom
discuta, tabelul de asociere nu ia n seam direcia pretins a ipotezei. Deoarece n
analiza tabelului de asociere se ine cont n primul rnd de diferenele dintre
frecvenele ateptate i cele observate pentru toate celulele, el va fi sensibil la relativa

64
mrime sau micime al frecvenelor observate pentru fiecare celul, neinnd cont de
ceea a fost prevzut. Mai trebuie s ne reamintim c o diferen este doar o diferen,
chiar dac sugereaz numere mai mici sau chiar mai mari dect cele prezise. O
diferen mare ntre frecvenele observate i cele ateptate dintr-o celul (n orice
direcie) contribuie mult la creterea valorii lui hi-ptrat, care se va reflecta prin
cretea probabilitii ca ipoteza nul s fie respins. Trebuie s determinm dac
asocierea este n direcia prezis, privind direct celulele n care se gsesc frecvenele
observate relativ mari, sau examinnd procentajele.
Folosind Tabelul 7.11 Joan a fost capabil s determine c aproximativ 17%
(25 din 148) din pacienii externai la internat au fost readmii n spital, comparativ cu
28% (71 din 250) dintre aceia dirijai ctre rude. Aceste dou procentaje, 17 i 28 au
fost consecvente cu direcia ipotezei sale; pacienii eliberai ctre internat au fost mai
puin ntlnii ca reinternai fa de pacienii eliberai ctre rude.
nainte ca Joan s trag orice concluzie despre nsemntate semnificaei
statistice dintre cele dou variabile, ea a tiut c trebuie s recunoasc efectele
metodologiei de cercetare pe care a folosit-o, n interpretarea rezultatelor obinute. Ea
a folosit un instrument de colectare a datelor standardizat i structurat. Totui,
validitatea i sigurana informaiilor din fiele pacienilor poate fi o problem, ca i
ali factori deformatori. Din cauza lipsei unui plan experimental, lista altor variabile
(factori) care ar fi putut afecta reinternarea ar putea fi mare. Acetia ar putea fi:
diagnosticul pacientului, durata primei spitalizri, disponibilitatea serviciului de
ngrijire de dup externare, medicaia folosit de pacient, i muli ali factori pe care
ea nu a are motiv s cread c au fost egal reprezentai n cele dou grupuri de
pacieni (ngrijii acas / n internat).
Deci, ce i spun rezultatele despre ipotez? Scopul procedeului tabelelor de
asociere este de a cpta probe pentru sau mpotriva existenei unei legturi ntre dou
variabile; cunoaterea relaiei cauz-efect nu este posibil de la nceput, datorit
absenei unui plan experimental i datorit limitelor proprii ale analizei de asociere.
Ceea ce Joan a aflat este faptul c pentru diferite motive, pacienii externai din
spitalul ei ctre internate, au avut o probabilitate mai mic s fie reinternai fa de
aceia care au fost eliberai acas.
Joan nu i-a limitat analiza asocierii doar la legtura dintre variabila
independent i cea dependente. Ea a mai adunat date despre diagnosticul pacienilor
i durata primei spitalizri. Ea a putut deci examina legtura dintre aceste alte
variabile i variabila dependent folosind mai multe analize complexe ale tabelelor
de asociere, i alte teste statistice adecvate. Fiele pacienilor pot conine informaii
despre variabile suplimentare care au contribuit la luarea deciziei de externare, cum ar
fi unde au locuit nainte de internare (la rude sau n internat); aceste informaii pot fi
folosite pentru a tempera rezultatele analizei sale i pentru a ls s cad mai mult
lumin pe rezultatele statistice.
Legarea rezultatelor de practic
Date fiind toate limitrile care au temperat interpretarea rezultatului gsit de
Joan, poate prea la prima vedere c rezultatele sale sunt virtual nefolositoare. O
asociere este o legtur prin definiie relativ slab; probabilitatea existenei mai
multor variabile care pot afecta variabila dependent pot discredita utilitatea practicii
de asisten social sau chiar rezultatele cercetrii. Chiar n ciuda unui plan de
cercetare mai puin perfect i a folosirii unei analize de de asociere relativ puin
puternic pot aprea implicaii n practic.

65
Contribuia rezultatelor gsite de Joan, la corpul de cunotine profesionale
este relativ limitat, dar fr ndoial real. Condiiile legate de admitere, scoatere de
sub tratament i readmitere la spitalul lui Joan, pot diferi ntr-o oarecare msur fa
de alte spitale, dar nu n totalitate, probabil vor fi mai multe asemnri dect diferene.
Vom fi abilitai s generalizm rezultatele ei mai departe de acest spital particular.
Unul dintre beneficiile majore ale identificrii unei legturi ntre dou variabile este
acela c poate mbunti abilitatea noastr de a prevedea viitorul. Cteva implicaii
pot fi imediat folosite, bazndu-ne pe rezultatele lui Joan din tabelul 7.11. Ea cepe s
se ntrebe urmtoarele lucruri:
1. Ar trebui oare s ncerc s gsesc plasamente n internate pentru mai muli dintre
clienii mei?
2. Ar trebui s m strduiesc ca un asistent social profesionist s se ocupe de creerea
mai multor faciliti de internat?
3. Ar trebui s consider pacienii care au ales s se ntoarc la rude c risc s fie
reinternai n spital?
4. Ar trebui s m strduiesc s furnizez surse suplimentare de suport pentru
pacienii care se duc s triasc cu rudele pentru a reduce probabilitatea lor de a fi
reinternai?
Aceste aplicaii ale rezultatelor cercetrii sunt nc doar ntrebri. Nici una
dintre ele nu arat c practicienii asisteni sociali de la serviciul de externare ar trebui
pregtii s fac modificri drastice n metodele lor, fr o atent chibzuial, i ceea ce
este mai important, fr dovada unor cercetri suplimentare.
Cele patru ntrebri mai reflect nivelele diferite ale angajamentului de a se
ncrede n rezultatele cercetrii. ntrebarea 4 poate atrage dup sine o activitate care
merge puin mai departe dect ct de util este o practic de asisten social pentru
un planificarea externrii pacienilor. Este totui o urmare bazat pe rezultatele lui
Joan, crearea unui cadru modificat al prioritilor practicii (timp mai mult alocat
pacienilor ncredinai rudelor). Intrebarea 2 va cere un efort mai mare i resurse
practice suplimentare din partea asistentului social i a comunitii; ceea ce probabil
nu s-ar fi ntmplat pn ce Joan nu s-ar fi convins de adevrul rezultatelor sale i de
generalitatea lor dincolo de eantionul folosit.
Multe alte implicaii practice pot fi scoase din datele prezentate n tabelul 7.11.
Unele pot reflecta foarte modest schimbrile experimentate din practica de asisten
social care pot fi destinate mbuntirii serviciilor.
Se recomandat mult atenie cnd se interpreteaz toate rezultatele cercetrii.
Aceasta deoarece schimbrile radicale n furnizarea serviciilor de asisten social pot
afecta negativ traiul clienilor notri. Aplicaiile practice derivate din rezultatele
asocierilor pot fi riscante. Asocierea servete cel mai bine pentru identificarea
legturilor dintre variabile i pentru formularea unor ntrebri critice la care s se
caute rspuns prin analize statistice mai puternice.

7.6. Exemplu din macro-practic


Descrierea situaiei care genereaz un studiu
Jim este un asistent social angajat de un comitet legislativ. El ncearc s
acorde asisten n punerea n aplicare a unui sistem mrit de taxe de vnzare. Noua
tax propus va furniza un venit suplimentar pentru colile publice. Ca parte a muncii

66
sale, el a nceput strngerea unor date personale asupra legislatorilor n scopul de a
nelege ce i determin s voteze pentru / mpotriva taxelor propuse.
Dup ce a examinat cteva date disponibile i zvonuri despre 30 de legislatori,
i se prea c legislatorii care au favorizat aprobarea taxei au de obicei copii care
frecventeaz colile publice; iar acei legislatori care nu au sprijinit legiferarea taxei nu
prea aveau copii n colile publice. Jim s-a ntrebat dac poate gsi suport statistic
pentru o legtur dintre variabila dependent (susinerea/nesusinerea taxei) i
variabila independent (folosirea/nefolosirea colilor publice).
Ipoteza ce urmeaz a fi testat
Dup discuii cu membri comitetului i trecerea n revist a literaturii
disponibile despre modelele dup care legislatorii voteaz diverse taxe, Jim a
concluzionat c poate formula o ipotez direcional.
Legislatorii care au copii nscrii la colile publice vor susine mai mult
creterea impozitului pentru a genera venit suplimentar colilor publice, dect
o vor face legislatorii care nu au copii n aceeai situaie.
O privire asupra metodologiei
Jim a continuat s strng informaii despre legislatori dar a fcut i un efort
special s afle mai multe despre nregistrarea sistematic a datelor despre variabilele
sale dependente i independente. A identificat 160 legislatori care i-au anunat public
suportul pentru sau mpotriva taxei. A obinut date biografice suficiente despre 125
(78%) dintre ei i a putut s trag concluzii asupra situaiilor n care acetia i trimit
proprii copii la colile publice.
Rezultatele
Tabelul 7.12 prezint rezultatele la care a ajuns Jim folosind procedurile de
asociere aa cum au fost prezentate n acest capitol.

Tabelul 7.12 Suportul legislatorilor pentru crterea taxelor n funcie


de cum utilizeaz colile publice
Voteaz pentru taxe mrite?
Utilizeaz colile publice? Da Nu Total
Da 39 36 75
Nu 21 29 50
Total 60 65 125
2 = 1,2 , df = 1, p > 0,10 (utiliznd corecia lui Yates)

Interpretarea rezultatelor i tragerea concluziilor


Jim a fost ntructva nspimntat de rezultatele analizei de asociere. El a fost
totui bucuros c nu s-a ncrezut n bnuiele de dinainte i nu a vorbit comitetului
legislativ despre aceasta. Bazndu-se pe propria analiz, ar fi avut o probabilitate
mare de comitere a unei erori de tipul I dac ar fi respins ipoteza nul i ar fi
revendicat existena unei legturi ntre variabilele dependent i independent.
Cu un grad de libertate i cu o ipotez direcional tia c valoarea lui hi-ptrat
ar fi trebuit s fie cel puin 2,71 (tabelul 7.6) pentru a putea respinge ipoteza nul la
nivelul standard 0,05 de semnificaie statistic. El acum are motive s cread c

67
folosirea sau nefolosirea colilor publice pentru instruirea propriilor copii, nu a fost
asociat cu preferina pentru votarea taxei mrite de impozitare, de ctre legislatori.
Alte variabile ar fi putut reflecta un grad mai puternic de asociere cu variabila
dependent - preferina de vot asupra oricrei taxe de impozitare, percepia acestora
asupra oportunitii unei taxe fa de alte surse de venit, cstoria cu un so care a fost
instruit ntr-o coal public, etc. Dar Jim poate fi acum aproape sigur c, cel puin n
statul su, nu exist nici un motiv s cread c votul legislatorilor pentru sau
mpotriva impozitului, a fost legat ntr-un fel sau altul de faptul c aveau copii n
sistemul colar public.
Legarea rezultatelor de practic
Lipsa suportului statistic pentru ipoteza direcional nu a negat n nici un fel
valoarea studiului de cercetare ntreprins de Jim. Micul su studiu, chiar dac limitat
i focalizat pe un singur obiectiv, a fost foarte folositor. El a evitat tragerea unor
concluzii eronate, bazate pe dovezi inadecvate, care puteau avea ca rezultat o strategie
nepotrivit pentru lobby. Jim s-a ntrebat dac nu ar fi productiv s ncerce s
analizeze statistic alte caracteristici demografice ale legislatorilor ca variabile
independente. Acum ar putea s-i foloseasc timpul mai eficient urmrind alte piste
n nelegerea poziiilor legislatorilor asupra propunerilor de impozit.
Adesea, lipsa suportului statistic pentru o ipotez poate economisi foarte mult
timp. Majoritatea studiilor de cercetare genereaz alte ntrebri de cercetat. n general,
studiile de cercetare creaz mai multe ntrebri de cercetat dect la cte pot rspunde.
Cu toate acestea faptul c putem pune o ntrebare relevant este un bun indicator a
msurii n care rezultatele cercetrilor au contribuit la mbuntirea calitii
serviciilor sociale.

7.7. Rezumat
Acest capitol a fost o discuie pentru nelegerea analizei de asociere. Am
explicat popularitatea acesteia i am subliniat cnd este folosit. La acest moment, ar
trebui s cunoatei cum lucreaz acest test statistic, cum pot fi interpretate rezultatele,
i cum pot fi aplicate n practica de asisten social. Ceea ce stpnii despre hi-ptrat
v va ajuta i pe mai departe. Ceea ce nu nelegei nc n totalitate poate deveni mai
clar pe msur ce vom discuta principii asemntoare n legtur cu un alt test statistic
- coeficientul de corelaie r a lui Pearson.

7.8. ntrebri pentru studiu


1. De ce folosirea frecvent al lui hi-ptrat n cercetarea n asistent social poate fi
un avantaj sau un dezavantaj?
2. De ce este testul hi-ptrat n mod particular bine situat n cercetarea de asisten
socal?
3. Ce nsemntate au numerele din fiecare celul a unui tabel de asociere?
4. Ce se pierde cnd se folosete testul hi-ptrat pentru date care sunt, de exemplu,
de nivel interval i normal distribuite?
5. Poate indicatorul statistic hi-ptrat s ne spun dac o variabil produce variaia n
a doua variabil? Explicai.
6. Ce sunt frecvenele ateptate i cum sunt ele folosite n testul hi-ptrat?

68
7. Cum intervin gradele de libertate n determinarea dac o valoare hi-ptrat
precizat (de exemplu 10,00) este statistic semnificativ?
8. Care este minimul de frecven ateptat necesar pentru folosirea lui hi-ptrat?
9. Care sunt cei doi pai ai procesului de determinare dac avem sau nu suport
statistic pentru o ipotez direcional?
10. Cum poate fi folosit hi-ptrat pentru a examina legtura dintre dou variabile n
timpul ce se controlaz efectului unei a treia variabile?

69
Capitolul 8. Corelaia

Capitolul precedent a prezentat un mod de analiz a legturii dintre dou


variabile de nivel nominal prin folosirea tabelelor de asociere i a indicatorilor
asocierii. Acest capitol explic modul n care putem s analizm legtura dintre dou
variabile de nivel interval sau rapoarte prin procedurile denumite analize de corelaie.

8.1. Conceptul de corelaie


Un exemplu de legtur ntre dou variabile poate fi gsit n distribuia
ipotetic a variabilitii motivaiei clienilor pentru tratament dup nivelul lor de
funcionare. Tabelul 8.1 nsumeaz datele pentru un eantion de zece clieni. Pentru
fiecare valoare a variabilei X de nivel interval (nivelul motivaional al clientului)
exist o coresponden; sau o pereche, valoarea variabilei Y de nivel interval (nivelul
de funcionare al clientului). O legtur ntre aceste dou variabile este evident
deoarece, fr excepie, nivelul nalt al motivaiei pentru tratament este asociat cu
nivelele nalte ale funcionrii i vice versa. Floyd de exemplu, a nregistrat cea mai
sczut valoare la ambele, nivelul de motivaie (1) i nivelul de funcionare (2), Jane a
msurat urmtorul nivel sczut pentru ambele variabile (rezultatele 2 i respectiv 3), i
Lyne a atins nivelele cele mai nalte pentru ambele variabile (rezultatele 10 i
respectiv 11).
Aceast legtur poate fi depistat cu ajutorul diagramei de mprtiere,
asemenea acelei ilustrate n Figura 8.1. Axa orizontal reprezint rezultatelele
individuale ale clienilor, sau valorile, pentru nivelul motivaiei pentru tratamentul
(X), n timp ce axa vertical reprezint rezultatele individuale ale nivelelor de
funcionare (Y). Fiecare punct reprezint un caz i totodat o pereche de valori -
msuri ale celor dou variabile- pentru fiecare client. Dac punctele se conecteaz, ele
vor forma o linie dreapt, indicnd c cele dou variabile sunt perfect corelate.
Asemenea perfeciune este rar ntlnit n practica cercetrii de asisten social. Aici
ea este folosit pentru a ilustra conceptul de corelaie.

Tabelul 8.1 Rezultate nregistrate de 10 clieni la nivelele de motivare i de funcionare


Nivel motivaional Nivel de funcionare
Numele clientului (X) (Y)
Floyd 1 2
Jane 2 3
Robert 3 4
Sue 4 5
Herb 5 6
Bill 6 7
Margareta 7 8
Ann 8 9
Doroty 9 10
Lyne 10 11

Figura 8.1 Legtur perfect pozitiv ntre dou variabile: nivelul


motivaional i nivelul de funcionare social a clienilor (din Tabelul 8.1)

70
11 - Lyne
10 - Dorothy
9- Ann
Nivel 8- Margareta
de 7- Bill
funci- 6- Herb
onare 5- Sue
(Y) 4- Robert
3- Jane
2 - Floyd
1-
| | | | | | | | | | |
1 2 3 4 5 6 7 8 9 10 11
Nivel motivaional (X)

Intensitate i direcie
Figura 8.1 pune n eviden dou dimensiuni importante ale relaiei dintre
variabile: intensitatea i direcia. Cu privire la intensitate, legtura dintre dou
variabile este cea mai puternic atunci cnd rezultatele tuturor clieniilor cad
dealungul unei linii drepte. Linia care trece prin toate punctele (reprezentnd clienii)
diagramei de mprtiere este numit linie de regresie. n aceste foarte rare cazuri, n
care exist o legtur perfect, putem prezice cu precizie (de 100%) c unei valori Y i
corespunde o anume valoare X, i vice versa. n cazurile obinuite unde intensitatea
legturii este mai puin perfect, linia de regresie este mai puin distinct, iar
capacitatea noastr de a prezice valorile unei variabile din valorile alteia este supus
erorii.

Figura 8.2 Legtur perfect negativ ntre dou variabile: nivelul motivaional al
clientului i nivelul de funcionare social a clienilor

11 -
10 -
9-
Nivel 8-
de 7-
funci- 6-
onare 5-
(Y) 4-
3-
2-
1-
| | | | | | | | | | |
1 2 3 4 5 6 7 8 9 10 11
Nivel motivaional (X)
n legtur cu a doua dimensiune a corelaiei, direcia, legtura dintre nivelul
motivaional i nivelul de funcionare social a clieniilor, aa cum este prezentat n
Figura 8.1, poate fi descris ca fiind pozitive. Valorile nalte ale lui X sunt asociate cu
valorile nalte ale lui Y, i vice versa. ntr-o legtur negativ (Figura 8.2), valorile
nalte ale unei variabile sunt asociate cu valorile sczute al celei de-a doua variabile i

71
vice-versa. Asemenea corelaiei perfecte pozitive, corelaia perfect negativ este
foarte rar n cercetarea de asisten social, ele apar n principal n disciplinele fizice.
n cercetarea de asisten social, n anumite legturi nu se va putea distinge
direcia i nici intensitatea - cu alte cuvinte nu exist legturi ntre toate variabile.
Acestea lucru va fi susinut de ipoteza nul. Dar majoritatea legturilor dintre
variabile de nivel interval sau rapoarte reflect un anumit grad de corelaie, mergnd
de la aproape perfect i pn la abia distictibil numit i corelae nonperfect.

Figura 8.3 este o alt diagram de mprtiere ilustrnd o legtur ntre


variabilele nivelul motivaional i funcional, care este nc pozitiv dar nu mai este
perfect ca aceea ilustrat n Figura 8.1. Ea ne arat c doi clieni au realizat 1 pentru
nivelul motivaional, dar unul dintre ei (Sue) a realizat 2 pentru nivelul funcionalitaii
i cellalt (Robert) a realizat 4. Linia de regresie nu este aa distinct ca n figura 8.1,
nu este posibil ca o linie dreapt s treac prin toate punctele. De aceea este imposibil
s prognozm cu o precizie de 100% mrimea nivelului de funcionalitate pentru un
client, doar pe baza rezultatului privind nivelul lui motivaional.

Figura 8.3 Legtur nonperfect pozitiv ntre dou variabile: nivelul motivaional al
clientului i nivelul de funcionare social a clienilor

11 -
10 -
9-
Nivel 8-
de 7-
funci- 6-
onare 5-
(Y) 4 - Robert
3-
2 - Sue
1-
| | | | | | | | | | |
1 2 3 4 5 6 7 8 9 10 11
Nivel motivaional (X)

Similar, figura 8.4 furnizeaz un exemplu de legtur negative care este mai
puin perfect. Figura 8.5 prezint un exemplu n care nu se poate observa nici un fel
de legtur ntre cele dou variabile.

Figura 8.4 Legtur nonperfect negativ ntre dou variabile: nivelul motivaional al
clientului i nivelul de funcionare social a clienilor

11 -
10 -
9-
Nivel 8-
de 7-
funci- 6-

72
onare 5-
(Y) 4-
3-
2-
1-
| | | | | | | | | | |
1 2 3 4 5 6 7 8 9 10 11
Nivel motivaional (X)

Figura 8.5 Nici o legtur ntre dou variabile: nivelul motivaional al clientului i
nivelul de funcionare social a clienilor

11 -
10 -
9-
Nivel 8-
de 7-
funci- 6-
onare 5-
(Y) 4-
3-
2-
1-
| | | | | | | | | | |
1 2 3 4 5 6 7 8 9 10 11
Nivel motivaional (X)

8.2. Logica corelaiei


Figurile 8.1 - 8.5 sunt diagrame de mpratiere standard. Ele sunt modaliti
dificile i consumatoare de timp de prezentare a perechilor de valori pentru un numr
mare de cazuri. O cale mult mai eficient de punere n eviden a unei relaii dintre
variabile de nivel interval sau rapoarte este folosirea unei indicator statistic numit
coeficient de corelaie. Acesta furnizeaz o valoare numeric att al intensitii ct i
al direciei unei legturi. Aa cum este prezentat n Figura 8.6, coeficientul de
corelaie variaz ntr-un continuum de valori, de la o extrem -1,0 (legtura perfect
negativ) la o alt extrem 1.0 (legtura perfect pozitiv), cu 0.00 (fr corelaie) ca
punct de mijloc. Un coeficient de corelaie nu poate fi mai mare dect 1.00 sau mai
mic dect -1.0.

Figura 8.6 Intervalul n care variaz coeficientul de corelaie

| | |
-1.0 0.0 -1.0

73
Cu ct valoarea numeric a coeficientului de corelaie este mai aproape de una
din valorile extreme (-1 sau -1), cu att mai puternic este legtura dintre cele dou
variabile. De exemplu, un coeficient de 0,92 este mai apropiat de o corelaie perfect
dect oricare din coeficienii -0,65 sau 0,60 i de aceea, sugereaz o mai puternic
corelaie dect oricare dintre cele dou. Cu ct coeficientul este mai apropiat de
mijlocul acestui interval cu att legtura dintre cele dou variabile este mai slab. Un
coeficient de corelaie care este apropiat de valoarea 0 sugereaz c nu exist nici o
legtur ntre variabile.
Semnul plus sau minus indic direcia legturii. De exemplu, corelaia dintre
nivelul ndemnrii asistenilor sociali i anii de experiena profesional n asisten
social poate fi de 0,85. Absena semnului minus indic o legtur pozitiv. Corelaia
dintre nivelul de ndemnare i nivelul de apatie a celor care muncesc poate fi de -
0,75, indicnd astfel o puternic legatur negativ. Exist persoane care sunt mai
apatice i neimplicate n munca lor, astfel este normal ca ele s fie mai puin
ndemnatice, i vice versa.
Pot fi utilizate o varietate de analize de corelaie. Una din procedurile cele mai
frecvent utilizate este i cea care va fi prezentat pentru a ilustra coeficientul de
corelaie n acest capitol Este vorba de corelaia Pearson al produsului momentelor
(sau coeficientul de corelaie r), pe care l vom numi n discuiile ce urmeaz, simplu:
r.
nelegerea indicatorului statistic r
Folosind r, ncercm s determinm statistic ceea ce arat o diagram de
mprtiere - adic, pn la ce grad punctele reprezentnd valorile celor dou variabile
pentru fiecare caz vor tinde s formeze o linie dreapt. Dac valoarea lui r este mare
(dac se apropie de 1,00 sau -1,00) punctele vor tinde s se strng aproape de linia
de regresie; iar dac valoarea lui r este mic (n apropierea lui 0,00) o diagram a
punctelor va reflecta distanarea punctelor fa de dreapta de regresie.
Pentru a nelege cum a aprut formula lui r ca un indicator al corelaiei dintre
variabile, este bine s ne reamintim c r este cel mai des interpretat ca o expresie a
abilitii noastre de a prezice o valoare a unei variabile din informaiile pe care le
avem despre o valoare a celeilalte variabile. Nu este implcat nici o relaie de
cauzalitate. Dac o valoare mare r rezult din analiza statistic, rezultatul ne poate
ajuta s prezicem valoarea unei variabile dac tim valoarea alteia, dar r nu ne poate
spune de ce tind variabilele s se influeneze. Argumentul care explic ce variabil
cauzeaz variaia alteia, trebuie s se bazeze pe ali factori.
Trebuie remarcat n formula lui r, c numrtorul este derivat din perechile de
valori (una pentru fiecare variabil) pentru fiecare caz. Suma de la numrtor reflect
gradul n care variaz mpreun cele dou variabile. Exprimat n alt fel, el ne spune n
ce grad anumite valori ale unei variabile tind s fie gsite mpreun cu anumite valori
ale celeilalte variabile.
La numitor, formula introduce cantitatea total de variaie a tuturor datelor;
anume produsul abaterilor standard al celor dou variabile. Valoarea r care rezult din
formula final, este proporia din variaia total ce revine covariaiei de la numrtor.
ntr-o corelaie perfect (r = 1,0 sau r = -1,0) 100 % din variaia total a celor dou
variabile va fi explicat de ctre covariaia de la numrtor. Invers, n acele cazuri rare
n care nu exist corelaie (r = 0,0) ntre variabile, nimic din variaia total nu va fi
explicat de covariaia sumarizat n numrtor. Cunoscnd valorea pentru o variabil
a unui caz n care r = 0,0 ea nu ne va ajuta cu nimic n a prezice valoarea pentru cea
doua variabil pentru acel caz.

74
Valoarea indicatorului statistic r care rezult din formul ne spune mai multe.
Dac ridicm la ptrat valoarea r, noua cifr va fi proporia variaiei dintr-o variabil
care poate fi explicat prin legtura ei cu cealalt variabil. inei minte c termenul
explicaie pe care l folosim aici, nu nseamn cauzalitate. Se refer doar la abilitatea
noastr de a prezice valorile unei variabile dac tim valorile altei variabile. De
exemplu, o valoare de 0,80, relativ la numrul de interviuri de tratament i la
rezultatele obinute la testul stimei de sine, nseamn c 64% (0,80 x 0,80 = 0,64) din
variaia rezultatului obinut la testul stimei de sine poate fi explicat pe baza numrului
de interviuri de tratament. Celelalte 36 de procente ale variaiei valorilor stimei de
sine (1,00 - 0,64) rmn neexplicate, sau cauzele care explic acestea sunt altele.
Capacitatea noastr de a prezice prerea despre sine nsui a clienilor dac tim
numrul de interviuri avute ar trebui s fie bun, dar cu siguran nu poate fi perfect.
Doar un r de +1,0 sau de -1,0 (o corelaie perfect) ne-ar permite s facem preziceri
cu o acuratee de 100% (1,02 = 1,0).
Statistica r este un indicator al intensitii i al direciei oricrui model de
asociere ce exist ntre valorile unei variabile i valorile altei variabile. Aa cum am
subliniat n prezentarea lui hi-ptrat, folosim greit un test cnd ncercm s mergem
mai departe dect este principala sa destinaie (predicia n cazul lui r) i ncercm s
i atribuim mai multe atribuii (implicaii n cauzalitate) dect este el capabil s
realizeze. Exemplul i aplicarea pas cu pas a formulei, ce urmeaz, va sublinia faptul
c r (la fel ca alte teste statistice ) este doar o manevrare matematic a numerelor care
pot furniza doar un rspuns parial pentru ntrebrile cercetrii noastre. Rspunsurile
plenare trebuie s vina din logic, teorie, intuiie, experien practic, sau din alte
domenii, mai puin din procesele mecanice.
Calcularea indicatorului statistic r
Tabelul 8.3 furnizeaz un model pentru pregtirea datelor i calculul lui r,
folosind informaiile prezentate n Tabelul 8.2. Tabelul 8.3 prezint ceea ce Floyd a
obinut ca mrime a motivaiei (X) de 5, ea este nregistrat n coloana a , i ca nivel
de funcionare (Y) de 10, nregistrat n coloana b. n coloana c este nregistrat ptratul
valorilor X (5 x 5 = 25) i n coloana d este nregistrat ptratul valorilor Y (10 x 10 =
100). Coloana e conine produsul valorilor lui Floyd X i Y (5 x 10 = 50). n partea de
jos a fiecrei coloane este suma valorilor tuturor cazurilor. Aceste sume sunt apoi
nlocuite n formula de mai jos.

e _ (a)(b)
N
r = -------------------------------
| c _ a2 | | d _ b2 |
| N || N |

Unde

r = coeficientul de corelaie
a = suma valorilor X
b = suma valorilor Y
c = suma valorilor X2
d = suma valorilor Y2
e = suma produselor X x Y
N = numrul total de cazuri

Substituind literele cu valori , obinem

75
a = 175 d = 11000
b = 300 e = 6750
c = 4875 N = 10
Substituind valorile n formula lui r , obinem

6750 _ (175)(300)
10
r = ------------------------------------------
| 4875 _ 1752 | | 11000 _ 3002 |
| 10 | | 10 |

= (6750 - 5250) / (4875 - 3062,5)(11000 - 9000)


= 1500 / 1812,5 x 2000
= 1500 / 1903,94
= 0,78784
= 0,79 (coeficient de corelaie)

Tabelul 8.2 Rezultatele obinute de clieni la nivelele motivaional i de funcionare


Nivel motivaional Nivel de funcionare
Numele clientului (X) (Y)
Floyd 5 10
Jane 15 20
Robert 25 30
Sue 35 40
Herb 45 50
Bill 0 10
Margareta 7 20
Ann 10 30
Doroty 15 40
Lyne 20 50

Tabelul 8.3 Schem de calcul pentru coeficientul de corelaie r a lui Pearson


(din tabelul 8.2)
Variabila
(a) (b) (c) (d) (e)
Nivel motiva. Nivel de func.
Numele clientului (X) (Y) X2 Y2 XY
Floyd 5 10 25 100 50
Jane 15 20 225 400 300
Robert 25 30 625 900 750
Sue 35 40 1225 1600 1400
Herb 45 50 2025 2500 2250
Bill 0 10 0 100 0
Margareta 7 20 25 400 100
Ann 10 30 100 900 300
Doroty 15 40 225 1600 600
Lyne 20 50 400 2500 1000
Total 175 300 4875 11000 6750

76
Legtura dintre r i ans
Ct de mare trebuie s fie r pentru a putea respinge n siguran ipoteza nul i
s avem suport statistic pentru existena unei legturi reale ntre cele dou variabile?
Ca i la alte legturi bivariate, coeficientul de corelaie este gndit s fie suficient de
puternic ca s ajung la sau s depeasc nivelul predeterminat al semnificaiei
statistice. Nivelul de ncredere de 0,05 justificat i statuat anterior, este folosit i aici
ca punct de referin pentru a determina dac putem respinge ipoteza nul. Tabelul
pentru valorile critice ale lui r (Tabelul 8.4) ilustreaz punctul la care semnificaia
statistic este realizat pentru diferite intensiti ai coeficientului de corelaie,
depinznd de mrimea eantionului. Aa cum arat tabelul, pentru un eantion de 11
indivizi, este nevoie de un coeficient de corelaie de 0,602 cu o ipotez nedirecional,
care a ajunge la o semnificaie statistic de nivelul de 0,05 (0,735 pentru nivelul 0,01)
i care permite astfel respingerea ipotezei nule. Cu o mrime a eantionului de 400 de
cazuri, respingerea ipotezei nule este posibil cu un coeficient de corelaie mult mai
slab (0,098 la nivelul 0,05 i 0,128 la nivelul 0,01). Acesta este un punct important
care trebuie reinut.
Ca i la analiza de asociere, i la analiza corelaiei probabilitatea demonstrrii
semnificaiei statistice cu ajutorul lui r este legat direct de mrimea eantionului.
ntr-un eantion mai mic este mult mai probabil ca ntmplarea (ansa), sub forma
erorii de eantionare, s fie cauza legturii aparente dintre dou variabile, dect ntr-
unul mai mare. Cu un eantion mare, o legtur aparent, chiar una care la prima
vedere apare a fi slab, este de departe mai puin probabil s fie rezultatul ansei. Un
tabel cum este Tabelul 8.4 ncorporeaz acest factor cnd ia n considerare
dimensiunea eantionului n furnizarea nivelului de semnificaie.

Tabelul 8.4 Valorile critice ale coeficientului de corelaie r


Nivel de semnificaie pentru un test direcional
.025 .005 .025 .005
Nivel de semnificaie pentru un test nedirecionat
n .05 .01 n .05 .01
3 .997 .999 38 .320 .413
4 .950 .990 39 .316 .408
5 .878 .959 40 .312 .403
6 .811 .917 41 .308 .398
7 .754 .874 42 .304 .393
8 .707 .834 43 .301 .389
9 .666 .794 44 .297 .384
10 .632 .765 45 .294 .380

11 .602 .735 46 .291 .374


12 .576 .708 47 .288 .372
13 .553 .684 48 .284 .368
14 .532 .661 49 .281 .364
15 .514 .641 50 .279 .361
16 .497 .623 55 .266 .345
17 .482 .606 60 .254 .330
18 .468 .590 65 .244 .317
19 .456 .575 70 .235 .306
20 .444 .561 75 .227 .296

21 .433 .549 80 .220 .286

77
22 .423 .537 85 .213 .278
23 .413 .526 90 .207 .270
24 .404 .515 94 .202 .263
25 .396 .505 100 .195 .256
26 .388 .496 125 .170 .230
27 .381 .487 150 .159 .210
28 .374 .478 175 .148 .194
29 .367 .470 200 .138 .181
30 .361 .463 300 .113 .148

31 .355 .456 400 .098 .128


32 .349 .449 500 .088 .115
33 .344 .442 600 .080 .105
34 .339 .436 700 .074 .097
35 .334 .430 800 .070 .091
36 .329 .424 900 .065 .086
37 .325 .418 1000 .062 .081

Substanialitatea coeficientului de corelaie


Pentru a interpreta intensitatea unui coeficient de corelaie, trebuie s lum n
considerare modul n care se utilizeaz o analiz de corelaie. Chiar dac se obine un
coeficient de corelaie statistic semnificativ, valoarea r n sine nu este n mod necesar
prttor de neles i nu reprezint neaprat un rezultat substanial. De exemplu,
cercetrile care construiesc instrumente de msurare sunt preocupate de validitatea si
fiabilitatea lor. Punctul tradiional de la care se poate accepta un instrument, ca
prezentnd siguran, cere adesea un coeficient de corelaie de peste 0,85, pe cnd
punctul pentru a accepta validitatea instrumentului este frecvent de 0,40 sau chiar mai
sczut. Dintr-o perspectiv diferit, indentificarea faptului c nu exist o asociere (r =
0,00) ntre dou variabile despre care se credea c sunt legate, poate reprezenta cel
mai important rezultat al unui studiu.
n interpretarea unui coeficient de corelaie, mai este important s nu l tratm
ca i cum ar fi echivalent cu date de nivel interval sau rapoarte; sau nu facem judeci
care dau o astfel de impresie. De exemplu, un coeficient de corelaie de 0,80 nu este
de dou ori mai puternic ca unul de 0,40. De fapt 0,80 descrie o asociaie de patru ori
mai puternic (0,802 = 0,64; 0,402 = 0,16; 0,64 / 0,16 = 4) n ceea ce privete cantitatea
de variaie pe care o poate explica din variaia total a celeilalte variabile. Trebuie
inut minte c un coeficient de corelaie att de puternic ca 0,80, arat un model
(pattern) de la care se vor abate foarte puine excepii - adic tuturor valorilor mari ale
primei variabile i vor corespunde virtual valori mari i pentru cea de a doua variabil,
i vice versa. Un coeficient de corelaie mai slab (aa ca 0,40) va avea un procentaj
mai mare de cazuri care se opun direciei de asociere.
Prezentarea corelaiilor
Prezentarea unui coeficient de corelaie ntr-un raport de cercetare este simpl.
Dup calcularea lui r conform schemei date n Tabelul 8.3 i formulei lui de calcul,
vom gsi nivelul de probabilitate asociat cu r -ul obinut; pe baza dimensiuni
eantionului n tabelul 8.4. Acesta ne va permite s determinm dac putem respinge
ipoteza nul sau nu. Cu informaia astfel obinut putem prezenta rezultatele noastre
ntr-o fraz.
De exemplu:

78
ntre variabilele independent i cea dependent pentru 20 de clieni s-a gsit
o corelaie r = -0,57, la nivelul de semnificaie p < 0,01, ceea ce indic
prezena unei corelaii negative statistic semnificative ntre cele dou
variabile.

8.3. Corelaia cu trei sau mai multe variabile


Legturile bivariate necesit frecvent explicaii n continuare. De exemplu,
este improbabil s putem prezice cu siguran ct timp un client va rmne n
tratament doar pe baza unor informaii privind severitatea problemei prezentate de
client, motivaia lui pentru tratament; sau orice alt variabil singular. Perspectiva
sistemelor i alte teorii a cauzelor multiple, susin c exist multe variabile care
contribuie mpreun i determin comportamentul uman. Acurateea prediciei poate
fi mbuntit prin extinderea volumului de date disponibile prin includerea mai
multor (dect dou) variabile n acelai timp ntr-o analiz. Deciziile privind direcia
n care s aibe loc extinderea, sursele suplimentare i tipurile de date necesare
mbuntirii explicaiilor i capacitilor noastre predictive, constituie adesea
urmtorul pas critic n procesul de analiz a datelor. n acest text, nu ne vom ocupa cu
descrierea testelor care examineaz corelaiile ntre trei sau mai multe variabile (unul
binecunoscut este coeficientul de corelaie parial). Pentru dezbaterea noastr, este
suficient s spunem c ar trebui s tim despre existena lor i despre ceea ce pot ele
oferi (sau ce nu pot ele oferi) n plus fa de o analiz bivariat, cu utilizarea lui r.

8.4. Exemplu din micro-practic


Descrierea situaiei care genereaz un studiu
Bill este un asistent social ntr-o agenie de servicii familiale. El conduce
cteva grupuri de tratament, constituite din adolescente. Recent el i-a dat seama de
variabilitatea mare n participarea verbal printre membrii grupului. Virtual toate
fetele ar fi trebuit s ia parte cnd aveau loc discuii; dar cteva dintre ele nu au fcut
niciodat vreun comentariu nesolicitat. El a simit c aceste fete aveau un nivel sczut
al dorinei de a se implica n grup. Dup o perioad de cteva sptmni, Bill a
ntrebat cteva din fetele nevorbree, de ce sunt aa de rare comentariile lor
voluntare. Dintre cele apte fete ntrebate, cinci au dat un rspuns asemntor: fiecare
a fost singurul copil n familie i au fost nvate de ctre prini c nu este datoria lor
s iniieze comunicarea. Apoi Bill le-a ntrebat pe trei dintre cele mai vorbree, care
nclinau s domine n discuiile din grup, ci frai i /sau surori au. Rspunsurile lor
au fost ase, apte i nou.
Pe baza incursiunii sale limitate, Bill a nceput s speculeze o posibil legtura
ntre o variabil dependent, neiniierea unui comentariu n tratamentul de grup i o
variabil independent, numrul frailor din familie.
Ipoteza ce urmeaz a fi testat
Din literatur, Bill a aflat tot ce a putut despre fenomenele ca trsturile
sociale ale copilului singur, modelele de comunicare dintre frai i variaiile n
participarea verbal n grupurile de adolesceni. Majoritatea literaturii de specialitate
prea s-l conduc la concluzia c adolescenii cu mai muli frai sunt mai dispui
pentru comentarii voluntare dect aceia cu mai puini frai. Aceast presupunere se
explica prin experiena n comunicare ctigat prin maturizarea printre frai. Totui
alt parte a literaturii de specialitate prea s sugereze o versiune opus. Ea susinea

79
c copii care au n jur aduli cu care s comunice vor cpta mai mult iscusin
verbal i vor fi mai puin intimidai de prezena adulilor. Astfel Bill a rmas indecis.
Oriunde era vorba de o astfel de tem, n diferitele surse, se sugera c variabila
dependent i cea independent par a fi logic legate. Dar n ce direcie? Bill avea i el
o oarecare experien ctigat (desigur netiinific) din propriile observaii. Pn la
urm s-a decis s- realizeze un studiu de cercetare de dimensiuni mici, care s testeze
urmtoarea ipotez direcional:
Printre adolescentele dintr-un grup de tratament, exist o corelaie pozitiv
ntre numrul comentariilor nesolicitate i numrul frailor din familie.
O privire asupra metodologiei
Este o procedura obinuit ntr-o agenie s se nregistreze video sesiunile de
tratamentet de grup i s se foloseasc apoi de ctre personalul ageniei pentru
supervizare. Astfel Bill nu avea nici o problem n privina accesului la informaiile ce
i-ar putea folosi pentru a-i testa ipoteza. El a primit permisiunea administratorului
ageniei de a folosi benzile video cu cele apte fete din grupul su, pentru a le folosi n
cercetare.
Pentru operaionalizare Bill a definit un caz, ca fiind o adolescent care a
participat la cel puin 75% din edinele grupului su ntr-o perioad de patru luni;
Avnd identificate 35 de fete care ndeplineau acest criteriu, el a revzut toate
videocasetele mpreun cu un coleg care a fost interesat de studiul su. Bill i
prietenul su au dezvoltat o definiie operaional pentru variabila comentariu
nesolicitat. Dup aceea ei au nregistrat numrul comentariilor nesolicitate realizate
de fiecare fat n timpul fiecarei edine. Un comentariu nesolicitat a fost judecat ca
fiind fcut doar dac Bill i colegul su au simit c a fost conform cu definiia.
Bill i colegul su au adunat numrul comentariilor nesolicitate pentru fiecare
dintre fete (cazuri) i apoi l-au mprit la numarul de adine la care tinerele au
participat. Acest numr le-a furnizat media comentariilor nesolicitate pe o edin
pentru fiecare caz (variabila dependent). Din nregistrrile fcute la Agenie ei au
scos datele pentru variabila independent, numrul fraiilor pentru fiecare caz. Bill a
aezat msurtorile pentru fiecare dintre cele dou variabile ntr-un tabel asemntor
tabelului 8.2.
Rezultatele
Bill a folosit r pentru a determina dac poate s aibe suport statistic pentru
ipoteza sa. Folosind formula pentru r, el a aflat c coeficientul de corelaie dintre
numrul comentariilor nesolicitate pe edin i numrul de frai a fost de 0,340.
Gndindu-se la ceea ce nseamn puterea corelaiei, el a fost oarecum dezamgit, dar
reamintindu-i c dimensiunea eantionului su este mare (35 este relativ mare pentru
r), i-a dat seama c nu avea nevoie de o corelaie mare pentru a avea semnificaie
statistic. Cnd s-a uitat n tabelul pentru r, unde dimensiunea eantionului este
controlat (Tabelul 8.4), el a observat c probabilitatea comiterii unei erori de tipul I
n respingerea ipotezei nule cu o corelaie de 0,340 i un eantion de 35 era mai mic
dect 0,025. (De semnalat c 0,340 se gsete la dreapta lui 0,334, dar este mai mic
dect 0,430).
Interpretarea rezultatelor i tragerea concluziilor
Bill a tiut c nivelul de semnificaie 0,05 este n general acceptat ca suport
pentru o legtur dintre dou variabile. El tie deasemenea c n cea ce privete
legtura dintre variabila dependent i cea independent, se afl pe trmul sigur al
statisticii. Totui este necesar un al doilea pas pentru interpretare, nainte de a
revendica suport statistic pentru ipoteza sa. A fost oare corelaia dintre variabile n

80
direcia n care el a formulat ipoteza, adic este o corelaie pozitiv? Bill a inut minte
c o corelaie pozitiv ntre dou variabile (Figurile 8.1 i 8.3) nseamn ca valorile
nalte ale unei variabile tind s se afle printre cazurile care au valori nalte ale
celeilalte variabile i vice versa. Aceasta nseamn c, pentru aceste date, fetele care
au avut valori mari pentru variabila numrul comentariilor nesolictate ar fi trebuit s
aibe valori mari i pentru variabila numrul frailor i vice versa. Datele lui Bill
arat c este aa. El a concluzionat c are suport statistic pentru ipoteza sa, n direcia
presupus.
Bill a fost realist n privina rezultatelor sale. El a tiut c pot fi i alte
explicaii pentru rezultatul sau statistic semnificativ, dect existena unei legturi
adevrate ntre variabile. Cercetarea sa a fost una de dimensiuni mici, el s-a bazat pe
un eantion care i convenea cel mai mult: de la agenia sa i dintre cazurile lui. Multe
efecte deformante i multe alte variabile ar fi posibil s fi afectat rezultatele obinute
de el. Acestea ar putea s fie legai cu factori ca: (1) o anume deformare creat n
interiorul eantionului ca urmare a cazurilor pierdute; (2) o posibil inabilitate a lui
Bill de a fi un bun mediator pentru fetele care nu au fost obinuite s fie n situaii de
grup; (3) o posibil distorsiune a evenimentelor dat de limitele echipamentelor de
nregistrare video folosite. n plus, o corelaie de 0,340 dintre variabile nu este
puternic n sens absolut. Lipsa de ncredere absolut n rezultatele sale i mrimea
acestora, l-au determinat pe Bill s nu publice nc un articol din studiul su pentu a
comunica rezultatele sale i altora.
Legarea rezultatelor de practic
Rezultatele lui Bill, chiar i astfel calificate, cu siguran nu erau fr valoare.
El le-a rezumat i le-a prezentat la o ntlnire sptnnal a personalului. Colegii si i-
au oferit o privire critic asupra metodelor sale de cercetare i au identificat posibilele
deformri i prezene ale altor variabile care, dac ar fi controlate metodologic, ar
mbunti planul cercetarii.
Bill i civa asisteni sociali au decis s fac cteva ajustri metodei lor
practice, bazndu-se pe presupunerea c corelaia pe care el a identificat-o a fost una
real. Ei au estimat c riscul implementrii unor schimbri rezultate din constatrile
cercetrii este mic ca efect asupra clieniilor, i ei au fost de acord s le evalueze peste
ase lunii. Ei s-au hotrt s urmeze urmtorii pai:
1. Vor folosi variabila numrul de frai pentru a crea grupuri mai omogene printre
viitorii noi clieni. Ei i-au dat seama c aeznd pe cei ar trebui s fie cei mai
vorbrei membrii (cu mai muli frai) laolalt ntr-un grup, ei nu vor mai putea
inhiba prin intimidare pe ceilali membrii ai grupului care sunt mai puin
insisteni. Ei au sperat c clienii mai insisteni vor fi mai puin tentai s domine i
s monopolizeze discuia cu persoanele asemntoare lor. n schimb, cteva dintre
acele persoane pe care asistenii sociali le considerau mai puin insistente (cu mai
puini frai) vor deveni mai active i mai insistente n grupuri formate din persoane
mai asemntoare lor.
2. n alte grupuri, noii membrii din familiile cu mai muli copii, vor fi vzui ca
persoane cu risc s domine discuiile. De asemenea noii membrii cu mai puini
frai sau fr de frai, vor fi privii ca avnd riscul de a fi rezervai n ceeace
privete comentariile voluntare. Aceast percepie va afecta modul n care
asistenii sociali si vor juca rolul de ndrumtori ai unor grupuri mai omogene.
3. n toate grupurile, liderii vor facilita discuii n jurul unor domenii ca: atitudinile
fa de prezena sau absena frailor, atitudinile prinilor fa de afirmaiile
copiilor, etc.

81
Ca i n exemplele ce folosesc tabelele de asociere, contribuia la corpul
cunotiinelor n asisten social oferite de studiul lui Bill trebuie s fie considerat
ca fiind limitat. Cantitatea nou de cunotiine aduse a fost mic. Totui, la un alt
nivel, Bill a realizat un obiectiv foarte important, care i-a adus multe beneficii, att
lui, colegilor lui ct i clieniilor. El pus bazele pentru urmtoarele studii de cercetare
care vor folosi planuri de lucru mai sofisticate.
n plus personalul format din asisteni sociali au nceput s se gndeasc la a
face cercetri. Ei au ctigat experien n aplicarea rezultatelor cercetrii. Ei vor
ncerca de acum s utilizeze materialele publicate n revistele de specialitate, n
viitoarele lor cercetri. Probabil, chiar i fr s tie, Bill a adus personalul mai
aproape de legitimizarea cercetrii ca o component important a practicii de asisten
social. Vor fi formate grupuri de tratament mai eficiente sau mai puin eficiente, ca
rezultat direct al cercetrii lui Bill. Dar cndva n viitor, studiul su de mici proporii
poate avea efecte pozitive n oferta de servicii de asisten social pentru clienii
ageniei.

8.5. Exemplu din macro-practic


Descrierea situaiei care genereaz un studiu
Tanya este un administrator ntr-o agenie districtual de bunstare public. De
curnd ea i-a dat seama de rata nalt a erorilor nregistrate la serviciul de asisten
financiar a ageniei sale. Cnd ea a fost angajat n poziia actual, rata erorilor de
determinare a eligibilitii pentru noii solicitani de AFDC (Ajutor Social Financiar)
era printre cele mai mari din stat. Ea a presupus c problema a fost legat, cel puin n
parte, de experiena insuficient a angajailor. Ea a obinut acordul necesar i a luat
rapid hotrrea s mreasc baremurile de acceptare a asistenilor sociali angajai mai
curnd de ase luni. Ea a cerut deasemenea angajailor mai vechi o precizie mai mare
n determinarea eligibilitii. La un an dup ce a luat aceste decizii, rata erorilor s-a
dublat.
Tanya a fost preocupat de noua cifr a ratei erorii. Ea s-a ntrebat, cum de
eforturile ei de a redresa aceast problem pot avea ca rezultat nrutirea ei. Cum de
s-a putut ntmpla ca o mai bun instruire a noilor asisteni sociali, combinat cu
folosirea personalului mai experimentat, s rezulte ntr-o cretere dramatic a erorilor
n determinarea eligibilitii? Discutnd acest paradox cu unii membrii ai
personalului, ea a primit o sugestie asupra a ce probabil c a funcionat greit.
Membrii personalului au fcut o observaie cauzal i anume c dealungul a
civa ani au fost o serie de schimbri majore n criteriile de acceptare n AFDC.
Tanya s-a ntrebat dac experiena practic a lucrtorilor mai vechi, cptat sub
standarde vechi, nu a fost acum cnd ei au fost rugai s-i ndeplineasc cu mult
seriozitate ndatoririle, mai mult o ocazie de a face erori dect un beneficiu. Ea a
presupus c atta timp ct nici un angajat vechi nu a beneficiat de o instruire
suplimentar de cnd s-au schimbat lucrurile, ei au putut face un numr mare de erori
din cauza lipsei de cunotiine asupra noilor standarde. Printre aceti veterani care
au lucrat sub cteva seturi de standarde, pot fi muli care fac confuzii n privina
standardelor actuale i de aceea exist posibilitatea de a face erori.
Tanya i-a propus s nu ia alte decizii care ar putea s nu soluioneze
problema, sau chiar s o nrutasc. Dac ea ar fi recomandat schimbri pentru
viitor ele nu se puteau bizui dect pe o bnuial. S-a hotrt s adune mai nti
informaii sigure pe care s-i sprijine apoi recomandarile.

82
Ipoteza ce urmeaz a fi testat
Dac experiena a fost ntr-adevr pozitiv corelat cu rata erorii printre
lucrtorii vechi, atunci, s-a gndit Tanya, ar trebui s demonstreze aceast legtur
folosind informaiile deja disponibile n sistemul de informaii al conducerii ageniei.
Pentru c ea a fost mai interesat n explicarea diferenelor de rate de eroare dintre
lucrtori ca diferene determinate de diferenele de experien dintre lucrtori, prima
variabil a fost identificat ca fiind cea dependent i ultima variabil ca
independent. Ea a simit c scurta sa trecere n revist a literaturii de specialitate i
discuiile cu colegii i-au permis s formuleze o ipotez direcional:

Printre asistenii sociali care lucreaz la determinarea eligibilitii n AFDC,


exist o puternic i statistic semnificativ corelaie pozitiv ntre anii de
experien de lucru n agenie i rata erorilor.
O privire asupra metodologiei
Asemenea lui Bill din exemplul anterior, Tanya s-a gndit la o cercetare
simpl. Pentru c avea nevoie de un rspuns rapid, ea i-a limitat studiul la
examinarea legturii dintre variabila dependent i variabila independent. Cu ajutorul
calculatorului, ea a calculat r pentru a evalua corelaia dintre variabile pentru toi cei
40 de asisteni sociali care au determinat eligibilitile n mod curent. Pentru
msurarea variabilei dependente ea a folosit numrul erorilor identificate la 100 de
cazuri (ultimele 100).
Rezultate
Coeficientul de corelaie dintre rata de eroare i anii de experien a fost -
0,215. Tanya a verificat n tabelul cu valori critice similar cu Tabelul 8.4 dac ansa
poate fi explicaia pentru aceast legtur. Din tabel a reieit c ar fi nevoie de o
valoare minim pentru r de 0,264 pentru a obine semnificaie statistic la nivelul de
0,05 cu un eantion de 40 de cazuri i o ipotez direcional. Ea nu a gsit deci suport
pentru ipoteza sa la nivelul de 0,05. n plus semnul pe care l poart coeficientul de
corelaie indic tendina n direcie opus aceleia n care ea a prezis c s-ar afla.
Interpretarea rezultatelor i tragerea concluziilor
Tanya a sperat s gseasc suport pentru presupunerea ei c, n cazul
asistenilor sociali mai vechi, cei cu mai mult experien au fcut cele mai multe
erori, iar cei cu mai puin experien au fcut mai puine erori. Ea dorea s foloseasc
acest rezultat pentru a recomanda supervizorilor s nu mai foloseasc pentru
determinarea eligibilitii clienilor o parte din angajaii vechi, sau ca acetia s fie
trimii la aceleai ore de instruire la care sunt trimii i noii angajai. Rezultatele ns
au dezamgit-o. Uoarea corelaie negativ i-a sugerat c asistenii sociali mai vechi
au fcut mai puine greeli dect aceia cu mai puin experien. Rata erorii n district
ar fi fost chiar i mai ridicat dac nu ar fi fost folosii angajaii mai vechi.
Legarea rezultatelor de practic
Tanya tia suficiente lucruri despre cercetare pentru a nelege c lipsa
suportului statistic pentru ipoteza sa nu a nsemnat c nu au aprut cunotine noi.
Studiul su de cercetare a determinat schimbarea focalizrii ateniei mai departe dect
pe experiena de lucru trecut a angajailor mai n vrst, ca factor principal n
creterea recent a ratei erorii. Ea i-a reamintit c n graba ei de a reduce rata erorii,
ea a introdus dou variabile: personalul vechi cruia i-a cerut determinri mai precise
ale eligibilitii i personalul nou care a fost instruit mai mult n vederea ndeplinirii
rolului lor. Probabil problema a devenit i mai grav datorit introducerii instruirii

83
suplimentare. Ea a aflat n final c o cretere a numrului de ore de instruire nu a
reprezentat n mod necesar o garanie c s-au format lucrtori mai bine pregtii
pentru munca lor. n plus, faptul c angajaii cu experien, care au lucrat i sub
regulamente vechi i care nu au fost expui unor instrucii suplimentare, au lucrat mai
bine dect noii lucrtori supui instruirii, a condus la ntrebarea dac instruirea i-a
atins obiectivele. Bazndu-se pe analiza datelor sale, Tanya a decis urmatoarele
msuri:
1. S ntocmeasc i s pun n aplicare un plan de studiu evaluativ pentru instruirea
asistenilor sociali noi.
2. S foloseasc n continuare angajaii cu experien pentru a crete
responsabilitatea n determinarea eligibilitii i s-i ncurajeze s le acorde
asisten noilor angajai n nvarea rolului lor.
3. S raporteze rezultatele cercetrii sale superiorilor ei, informndu-i asupra
modului de abordare a problemei (punctele 1 i 2 de mai sus), pentru a-i face s
cunoasc preocuparea ei pentru rata ridicat de erori i de ncercarea de a o
corecta.
Contribuia Tanyei la cunotiinele profesionale, folosind analiza corelaiei, a
fost foarte folositoare n ciuda faptului c ipoteza ei nu a avut suport statistic. Pentru
c ea a folosit corect indicatorul r, i ntr-o situaie corespunztoare, rezultatele au
avut credibilitate. Ele i-au permis s ia decizii n cunotiin de cauz i au cluzit-o
n selectarea i planificarea altor studii de cercetare necesare.

8.6. Rezumat
Acest capitol a prezentat analizele de corelaie ca un mijloc de determinare i
exprimare a intensitii i a direciei unor asocieri (extindere a covariaiei) dintre dou
variabile de nivel interval sau rapoarte. Am artat deasemenea efectul pe care l are
dimensiunea eantionului asupra semnificaiei statistice i modul n care acest efect
explic matematic de ce un coeficient de corelaie poate fi semnificativ statistic chiar
dac este slab. Corelaia este unul dintre multele domenii n care un cercettor trebuie
s fie permanent preocupat de etic, i s aibe o grij special s nu prezinte greit,
intenionat sau neintenionat, rezultatele cercetrii.
Asemntor tuturor testelor statistice, r (coeficientul de corelaie r a lui
Pearson) nu poate controla deformrile sau efectele altor variabile. Ideal ar fi ca aceti
factori s fie deja controlai prin grija cu care se ntocmete planul de cercetare nainte
de colectarea datelor i analiza acestora.

8.7. ntrebri pentru studiu


1. Care va fi forma unei diagrame de mprtiere care reflect o corelaie negativ
perfect?
2. Ce coeficient de corelaie sugereaz o legtur mai puternic ntre dou variabile,
0,74 sau -0,86?
3. Ce coeficient de corelaie sugereaz c nu exist nici o legtur ntre dou
variabile de nivel interval?
4. Cum influeneaz dimensiunea eantionului, mrimea coeficientului de corelaie
considerat semnificativ statistic?
5. Cum se poate ca o corelaie foarte slab, de 0,10 , s fie o contribuie valoroas la
mbuntirea cunotiinelor practice?

84
6. De ce nu este corect s afirmm c, coeficientul de corelaie de 0,84 sugereaz o
legtur de dou ori mai puternic dect un coeficient de corelaie de 0,42?
7. De ce analizele bivariate, asemenea lui r, nu furnizeaz n mod uzual o explicaie
total asupra legturii dintre dou variabile?
8. Poate o analiz bivariat de corelaie s ne spun care variabil cauzeaz variaia
n a doua variabil? Explicai.
9. Cnd poate un coeficient de corelaie s fie folosit pentru a prezice, cu siguran
de 100%, valorile unei variabile cu ajutorul valorilor cunoscute pentru cealalt
variabil?
10. Care este formatul obinuit pentru prezentarea rezultatelor din analiza de
corelaie?

85
Capitolul 9. Compararea mediilor

Am prezentat pn acum un test popular (hi-ptrat) care este folosit frecvent


pentru analizarea legturii dintre dou variabile de nivel nominal i am discutat apoi despre
un alt test (coeficientul de corelaie r, a lui Pearson) destinat examinrii relaiei dintre dou
variabile de nivel interval sau de rapoarte. In acest capitol, vom examina unul dintre testele
statistice potrivite atunci cnd una din variabile, deobicei cea dependent, este cel puin de
nivel interval iar cealalt variabil, deobicei variabila indepedent, este de nivel nominal.

9.1. Popularitatea statisticii t


Exist cteva feluri diferite de teste proiectate pentru diferite necesiti de
analizare a informaiilor. Vom prezenta doar unul dintre acestea. Testul t este foarte
popular i n special foarte folositor pentru cercetarea n asisten social.
Ce l face pe testul t (numit i testul Student) att de folositor? Una dintre cele
mai mari nevoi pentru asisteni sociali este n acele studii care caut evaluarea
eficacitii diferitelor abordri ale interveniei. Avem nevoie s tim dac o metod de
intervenie este n mod real mai bun dect alta pentru obinerea rezultatelor dorite.
Testul t este ideal pentru a fi folosit n situaii n care avem dou categorii a unei
variabile independente (intervenia A / intervenia B) care este de nivel nominal, pe
cnd variabila dependent (comportamentul, atitudinea, valoarea sau orice altceva) pe
care sperm s o gsim afectat, este cel puin de nivel interval.
Deobicei avem msurtori rezonabil de precise ale variabilei dependente.
Exemplele pot include variabile ca: respectul de sine, aspiraia ctre bunstare,
satisfacia marital, nivelul de funcionare social, sau alte caracteristici ale clientului.
Mulumit muncii cercettorilor care au mbuntit instrumentele pentru aceste
msurri, acum aceste variabile pot fi tratate statistic, ca fiind msurate la nivel
interval. Alte variabile dependente frecvent folosite ca: numrul ntlnirilor ratate,
numrul mpotrivirilor exprimate fa de un program de bunstare social, sau
numrul comportamentelor violente ndreptate ctre soie, sunt de nivel interval sau
de rapoarte datorit naturii lor. Dac putem justifica o variabil ca fiind de nivel
interval sau de rapoarte i cealalt variabil este doar de nivel nominal, t poate fi ales
ca test statistic.
Alt motiv pentru care cercettorii n asisten social adesea folosesc testul t,
este dimensiunea relativ mic a eantionului necesar pentru utilizarea acestui test.
Eantioanele mari sunt rar disponibile n cercetarea n asisten social, n special n
situaii clinice. Testul t este potrivit pentru cercetrile care folosesc un numr mic de
cazuri (de exemplu, un total de doar 20 sau 30 de cazuri). n plus cele dou grupuri nu
trebuie neaprat s conin un numr egal de cazuri. Chiar i n cercetrile planificate
cu mare grij, de exemplu cele asupra eficacitii unui tratament, exist oameni care
renun nainte ca studiul s fie terminat. Aceasta conduce la o situaie n care exist
mai multe cazuri ntr-un grup dect n altul. Discrepana dintre dimensiunea celor
dou grupuri este automat controlat de formula lui t.

86
9.2. Logica statisticii t
Testul t, asemenea altor teste statistice, este folosit pentru a ne ajuta s
determinm dac o legtur aparent dintre dou variabile este o legtur adevrat,
care exist n interiorul populaiei, sau este rodul ansei. Cu t, se face de fapt o
comparare ntre dou medii. Eantionul este divizat n dou grupuri (sub-eantioane)
pe baza valorii fiecrui caz pentru una din cele dou categorii, variabila de nivel
nominal (de exemplu, intervenia A sau intervenia B). Mrimile mediilor variabilei
de nivel interval (sau de rapoarte) pentru cele dou grupuri sunt comparate apoi
folosind formula lui t.
Mediile celor dou subeantioane sunt probabil diferite; t este o analiz a
mrimii acestei diferene. Dac diferena se dovedete ca fiind mic din punct de
vedere matematic, att de mic nct hazardul ar putea fi explicaia probabil pentru
aceast diferen, ipoteza nul nu va putea fi respins. Vom putem atunci concluziona
c, mult mai probabil, diferena dintre mediile celor dou grupuri se datoreaz ansei
i nu reflect o diferen real care ar exista n populaie. Dar dac testul nostru t,
indic faptul c diferena este destul de mare ca ea s nu fie explicat doar prin jocul
ansei, vom fi abilitai s respingem ipoteza nul si s concluzionm c diferena
observat n eantion este ntr-adevr o reflectare a unei diferene reale n interiorul
populaiei. ansa, sub forma erorii de eantionare, va fi eliminat ca explicaie pentru
o legtur observat ntre dou variabile.
Dac eantionul este mic, chiar i o diferen mare ntre dou medii poate fi
atribuit ansei. Dar exist un punct unde diferena dintre doua medii este suficient de
mare, astfel ca ansa s fie puin probabil, o explicaie pentru legtura aparent dintre
dou variabile. Unde poate fi gsit acest punct? Testul t ni-l spune. Acest punct se
determin sub forma unei probabilit statistice, probabilitatea de a face o eroare de
tipul I, adic de a respinge ipoteza nul i de a concluziona c diferena dintre cele
dou medii este legat de prezena valorilor diferite pentru variabila secundar (cea de
nivel nominal).
S lum un exemplu pentru a ilustra utilizarea lui t. Un ghid teoretic de studiu
a fost realizat pentru a ajuta la pregtirea absolvenilor pentru examenul de licen.
Pentru a evalua rezultatele unui asemenea ghid de studiu, putem selecta la ntmplare
15 din 30 de studeni care au planificat s participe la examen i crora le vom furniza
o copie a acestui ghid. Le vom da astfel cteva direcii specifice pentru a-i mpri
timpul de studiu, fiecare putnd folosi ghidul ca ndrumtor.
Cei 15 studeni care au folosit ghidul vor putea fi privii ca un grup
experimental, rmnnd 15 care nu au folosit ghidul i care vor fi privii ca i grup de
control. Dup ce cei 30 de abolveni vor reui s promoveze examenul de licen,
rezultatele lor vor fi comparate. Nu vom compara direct notele tuturor acelora care au
folosit ghidul de studiu cu notele celor care nu l-au folosit. n schimb vom compara
media notelor rezultate pentru cei 15 absolveni din grupul experimental cu media
notelor celorlali 15 absolveni din grupul de control.
Odat cu compararea mrimilor celor dou medii, este necesar s ne punem
cteva ntrebri:
Este oare diferena dintre mediile celor dou grupuri suficient pentru a ne
permite s respingem ipoteza nul, care spune c nu exist nici o legtur ntre
folosirea respectiv nefolosirea ghidului de studiu i rezultatele lor la examen?

87
Ct de ncreztori putem fi, pentru a spune c diferena nu s-a datorat erorii de
eantionare? Altfel spus, este posibil ca diferena dintre mediile celor dou grupuri s
reflecte o asociere real ntre cele dou variabile?
Cu ajutorul testului t putem compara mrimile celor dou medii, folosind o
formul matematic conceput pentru a ne spune dac diferena dintre mrimile
mediilor celor dou grupuri este suficient de mare pentru ca legtura dintre cele dou
variabile s fie puin probabil din cauza ansei. Testul t ne spune dac ipoteza nul
poate fi respins i dac exist suport statistic pentru a susine c ghidul de studiu
poate n mod real mbunti rezultatele la examen. Desigur, chiar dac se
demonstreaz c exist o legtur statistic semnificativ ntre cele dou variabile, va
mai trebui s decidem dac legatura este una substanial. Diferena rezultat din
examinare este suficient de mare ca s justificre preul de achiziie a ghidului de
studiu?

9.3. Calcularea i interpretarea valorilor lui t


Datorit extinderii utilizrii calculatoarelor n faculti, n ageniile de servicii
sociale i chiar n multe familii, aflarea lui t nu mai este o problem n ceea ce
privete calculul matematic. Aceast fapt este o uurare, deoarece formula lui t este
complex i va implica o cantitate considerabil de timp dac se lucreaz cu creionul
i hrtia. Pentru cititorii care gsesc c este mai uor s neleag cum este aplicat
formula lui t urmrind pas cu pas procedura, am inclus Figura 9.1 . Vei observa c
testul t implic mult mai mult dect o simpl comparare de medii. De fapt, el compar
variabilitatea rezultatelor intergrupuri cu variaia rezultatelor din interiorul grupurilor.
Complexitatea analizei lui t (datorit faptului c toate mrimile brute sunt folosite n
calcularea sa) explic de ce este un test att de puternic pentru examinarea unei
legturi aparente dintre dou variabile.
Nivelul de probabilitate al unei valori t este determinat n pasul 7 al Figurii
9.1. n eantionul din exemplu, valoarea lui t este 1,90 (Pasul 5) i gradul de libertate
este 8 (Pasul 6). ntrebarea este: "Care este probabilitatea de a comite o eroare de tipul
I cu o valoare a lui t de 1,90, la 8 grade de libertate date?" Pentru a rspunde la
aceast ntrebare, avem nevoie s consultm tabelul de probabiliti al valorilor t, din
tabelul 9.1. Valoarea lui t pentru eantionul din Figura 9.1 (1,90) este statistic
nesemnificativ (la nivelul 0.05) pentru un test cu o ipoteza nedireciont (two-tailed),
dar este statistic semnificativ la nivel 0.05 pentru un test direcionat (one-tailed). Aa
cum indic Tabelul 9.1, dac valoarea t este cuprins ntre 2.306 i 2.895 (cu 8 grade
de libertate), nivelul probabilitii p va fi semnificativ la nivelul de 0.05 pentru o
ipotez nedirecionat i la nivelul 0.025 pentru o ipoteza direcionat.

Figura 9.1 Algoritmul de calcul al statisticii t pentru dou subgrupuri


PAS 1. Prezentarea datelor brute.
Grup A Grup B
Nume client Rezultat Nume client Rezultat
Peter 5 Gary 0
Janice 15 Carol 5
Alice 25 Martha 10
Robert 35 Jeff 15
Rosalie 45 James 20

PAS 2.Calculul sumelor de la pasul 1.

88
Unde Na = Numarul indivizilor din grupul A
Nb = Numarul indivizilor din grupul B
Xa = Suma rezultatelor brute din grupul A
Xb = Suma rezultatelor brute din grupul B
Sa = Suma ptratelor rezultatelor brute din grupul A
Sb = Suma ptratelor rezultatelor brute din grupul B
N = Numarul total al indivizilor (Na + Nb)

Substituind valorile n formule obinem


Na = 5
Nb = 5
Xa = 5 + 15 + 25 + 35 + 45
= 125
Xb = 0 + 5 + 10 + 15 + 20
= 50
Sa = 52 + 152 +252 + 352 + 452
= 25 + 225 + 625 + 1225 + 2025
= 4125
Sb = 02 + 52 + 102 + 152 + 202
= 0 + 25 + 100 + 225 + 400
= 750
N =5+5
= 10

PAS 3. Calculul mediilor pentru ambele grupe


Stabilirea formulelor.
Grup A Grup B
Ma = Xa / Na Mb = Xb / Nb
Unde: Ma = Media aritmetic a grupului A Mb = Media aritmetic a grupului B

Substituind valorile n formul obinem


Grup A Grup B
Ma = 125 / 5 Mb = 50 /5
= 25 = 10

PAS 4. Calculul mediei ptratelor abaterilor valorilor fa de media grupei (calculul


varianei) pentru ambele grupuri
Stabilirea formulelor.
Grup A Grup B
SSa = Sa - Xa2 / Na SSb = Sb - Xb2 / Nb

Unde: SSa = Suma patratelor abaterilor pentru grupul A


SSb = Suma patratelor abaterilor pentru grupul B

Substituind valorile n formule obinem


Grup A Grup B
SSa = 4125 - 1252 / 5 SSb = 750 - 502 / 5
= 4125 - 15.625 / 5 = 750 - 2500 / 5
= 4125 - 3125 = 750 - 500
= 1000 = 250

89
PAS 5. Calculul valorii t
Stabilirea formulei statisticii t
t = Ma - Mb
SSa + SSb Na + Nb
Na + Nb - 2 Na * Nb

Substituind valorile n formul obinem


t = 25 - 10
1000 + 250 5+5
5+5-2 5*5

= 15
1250 10
8 25

= 15
156,25 * 0,4

= 15 / 62,5
= 15 / 7,9057
= 1, 8974
= 1,90

PAS 6. Calculul gradelor de libertate


Stabilirea formulei gradelor de libertate df
df = N - 2

Substituind valorile n formul obinem


df = 10 - 2
= 8 (grade de libertate)

PAS 7. Determinarea nivelului de probabilitate a valorii t obinute


a. Se utilizeaz valoarea t calculat (la pasul 5) i gradele de libertate (pasul 6)
b. Se utilizeaz Tabelul 9.1, Valorile critice ale lui t
c. Se caut n linia corespunztoare gradelor de libertate df (prima coloan a tabelului)
d. Se compar valoarea t calculat cu valorile tabelate fie pentru testul direcionat
(one-tailed) fie pentru cel nedirecionat (two-tailed).

90
Tabelul 9.1 Valori Critice pentru testul t
Nivele de semnificaie pentru testul direcionat (one-tailed)
0.10 0.05 0.025 0.01 0.005 0.0005
Nivele de semnificaie pentru testul nedirecionat (two-tailed)
df 0.20 0.10 0.05 0.02 0.01 0.001
1 3.078 6.314 12.706 31.821 63.657 636.619
2 1.886 2.920 4.303 6.965 9.925 31.689
3 1.638 2.353 3.182 4.541 5.841 12.941
4 1.533 2.132 2.776 3.747 4.604 8.610
5 1.476 2.015 2.571 3.365 4.032 6.859
6 1.440 1.943 2.447 3.143 3.707 5.959
7 1.415 1.895 2.365 2.998 3.499 5.405
8 1.397 1.860 2.306 2.896 3.355 5.041
9 1.383 1.833 2.262 2.821 3.250 4.781
10 1.372 1.812 2.228 2.764 3.169 4.587
11 1.363 1.796 2.201 2.718 3.106 4.437
12 1.356 1.782 2.179 2.681 3.055 4.318
13 1.350 1.771 2.160 2.650 3.012 4.221
14 1.345 1.761 2.145 2.624 2.977 4.140
15 1.341 1.753 2.131 2.602 2.947 4.073
16 1.337 1.746 2.120 2.583 2.921 4.015
17 1.333 1.740 2.110 2.567 2.898 3.965
18 1.330 1.734 2.101 2.552 2.878 3.922
19 1.328 1.729 2.093 2.539 2.861 3.883
20 1.325 1.725 2.086 2.528 2.845 3.850
21 1.323 1.721 2.080 2.518 2.831 3.819
22 1.321 1.717 2.074 2.508 2.819 3.792
23 1.319 1.714 2.069 2.500 2.807 3.767
24 1.318 1.711 2.064 2.492 2.797 3.745
25 1.316 1.708 2.060 2.485 2.787 3.725
26 1.315 1.706 2.056 2.479 2.779 3.707
27 1.314 1.703 2.052 2.473 2.771 3.690
28 1.313 1.701 2.048 2.467 2.763 3.674
29 1.311 1.699 2.045 2.462 2.756 3.659
30 1.310 1.697 2.042 2.457 2.750 3.646
40 1.303 1.684 2.021 2.423 2.704 3.551
60 1.296 1.671 2.000 2.390 2.660 3.460
1.282 1.645 1.960 2.326 2.576 3.291
Valoarea t obinut din calcule este semnificativ dac ea este mai mare sau egal cu
valoarea listat n tabel

9.4. Prezentarea statisticii t


Deobicei este util a prezenta mrimile brute ale cazurilor n ambele grupuri
(dac eantionul nu este prea mare) astfel ca cititorii s poat face propriile comparri.
Dac nu dorim s raportm rezultatele individuale, vom prezenta cel puin rezultatele
medii pentru fiecare grup. Trebuie reinut ca diferena actual ntre medii ajut
cititorul n a determina dac o legtur semnificativ statistic este n mod real un
rezultat esenial. Astfel vor mai fi prezentate pe lng valoarea lui t, gradul de
libertate (df) i valoarea probabilitii p asociate. Dac se realizeaz mai multe teste t,
este folositor un singur tabel care s conin toate rezultatele obinute. Dac sunt

91
calculate doar puine teste t, rezultatele sunt deobicei prezentate n corpul textului,
mai degrab dect ntr-un tabel.
In majoritatea studiilor statistice, se raporteaz att analizele care nu au permis
respingerea ipotezei nule, ct i cele care au permis-o. In unele cazuri este suficient s
se raporteze c nu s-a gsit c variabilele ar fi legate la un nivel statistic semnificativ.
In situaiile n care ipoteza nul este ipoteza central a cercetrii (adic, ncercm s
dovedim ca fals o legatur care n mod obinuit este crezut ca fiind adevrat),
suportul statistic sau nesprijinirea pentru respingerea ipotezei nule trebuie, firete, s
fie prezentat.

8.5. Cnd nu se folosete testul t


Ca i testul hi-ptrat, popularitatea testului t printre asistenii sociali ne poate
conduce la utilizri greite. n graba noastr de a folosi o statistic care ne este
familiar, putem folosi cteodat testele t n situaii n care ele nu sunt
corespunztoare i n care ar fi putut fi utilizate alte teste mai potrivite. De obicei cnd
testul t este folosit greit avem una din urmtoarele situaii: (1) cnd ignorm forma
distribuiei pentru variabila de nivel interval n populaie i (2) cnd nu suntem ateni
la analizarea corect a informaiilor, ncercnd s prezentm un rezultat ocant.
Forma distribuiei
Faptul c variabila independent este de nivel interval i c cea dependent
este de nivel nominal nu justific folosirea lui t pentru a determina prezena unei
legturi ntre dou variabile. Testul t este un test din categoria celor parametrice, ceea
ce nseamn c este proiectat pentru a fi folosit doar cnd variabila de nivel interval
este considerat ca fiind normal distribuit n populaie. Dac distribuia de frecvene
pentru valorile variabilei n populaie este vizibil asimetric, va trebui folosit un alt
test, asemenea celor prezentate n capitolul urmtor (testul Mc Neamar, testul exact
Ficher, testul Man-Whitney, etc.) Credibilitatea rezultatelor cercetrii este serios
periclitat dac testul t este folosit cu variabile de nivel interval sau rapoarte care nu
se prezint ca o curb normal.
Abordarea ocant
O a doua greal obinuit implic calcularea n serie a testelor t, cu o singur
variabil dependent legat eventual de mai multe variable independente. In cteva
exemple particulare ale acestei erori, cercettorii au calculat testele t folosind sute de
posibile variabile independente (fr prea mare legtur), doar pentru a anuna cu
mndrie c ei au gsit o legtur semnificativ statistic ntre una dintre variabilele
independente i variabila dependent.
Teoria probabilitilor sugereaz c astfel de rezultate reflect probabil erori
de Tipul I i c legtura aparent va fi legat de ans i nimic mai mult. Conform
legilor probabilitii, o variabil dependent va prea c are o asociere semnificativ
statistic cu cteva variabile independente dac sunt testate suficiente legturi. In
situaiile unde exist motive s credem c mai multe variabile independente diferite,
pot fi n legtur cu variabila dependent, ar trebui s folosim alte teste statistice,
special proiectate pentru astfel de situaii.

92
8.6. Exemplu din micro-practic
Descrierea situaiei care genereaz un studiu

Frank este un asistent social ntr-un centru de planificare familial. El a fost


nvat n agenia sa c cea mai bun form pentru consilierea marital este de a vedea
ambii parteneri (soul i soia) mpreun. nainte cu cinci ani a tratat 20 de cupluri n
care consilierea nu s-a putut face dect individual (so sau soie), din cauza
programului pe care l aveau acetia la servici. El a fost surprins observnd c, cu
toate c ei nu au consiliai niciodat mpreun, dup primele interviuri toate cele 20 de
cupluri preau s realizeze un progres excelent n rezolvarea problemelor lor maritale.
De-a lungul a civa ani, Frank a consiliat tot mai multe cupluri pe o baz
individual. Creznd c a obinut rezultatele bune datorit metodei folosite, el a
ncurajat ase dintre colegii si s consilieze cuplurile cu dificultai maritale,
ntlnindu-i separat mai degrab dect mpreun. Ali asisteni sociali au fost
deasemenea surprini de progresele excelente ale clieniilor lor. Frank nu a fost
pregtit s concluzioneze c metoda de consiliere marital individual este preferabil
consilierii cuplului. El a decis s realizeze o mic cercetare pentru a vedea dac poate
gsi suport statistic pentru ipoteza c satisfacia marital este cel mai bine sporit cnd
cuplurile sunt tratate n consiliere individual i nu mpreun.
Ipotezele care vor fi testate
A nceput s caute n literatura de specialitate de asisten social i a gsit
suport pentru afirmaia c consilierea mpreun a cuplurilor este mai adecvat n
obinerea satisfaciei maritale, dect cea individual. Dar cum el s-a aventurat n
literatura de specialitate din alte domenii ca psihologia i consilierea pastoral, Frank
a gsit o cantitate mare de suport pentru prerea c satisfacia marital ar fi mult mai
probabil ca s rezulte din consilierea individual. Explicaia cea mai uzitat era c
clienii tind s discute despre insatisfacie mai uor i mai cinstit atunci cnd cellalt
so nu este prezent. Frank a concluzionat c literatura de specialitate era n
contradicie. Totui el a simit c propriile observaii i cele ale colegilor si au fost
suficiente pentru a nclina balana suficient pentru a justifica o ipotez direcional:
Printre cuplurile ce au primit consiliere marital, acelea care au fost
consiliate individual vor reflecta un nivel mai nalt de satisfacie marital
dect acelea care au fost consiliai mpreun.
O privire asupra metodologiei
Frank a realizat o mic cercetare pentru a-i testa ipoteza. El a primit
permisiunea din partea directorului ageniei pentru a-i fi repartizai la ntmplare
clienii noi care au cerut consiliere marital pe o perioad de trei luni pentru a realiza
consiliere individual sau de cuplu. Pentru a realiza cercetarea, clienii au fost
repartizai la ntmplare n dou grupuri de subieci. Toi cei ase asisteni sociali care
au folosit anterior consilierea individual (i care deci aveau experien) au participat
ca i consilieri la studiul lui Frank. Incepnd cu luna urmtoare fiecare cuplu care erau
de acord a fost repartizat la unul dintre cei ase asisteni sociali pentru a fi vzui
mpreun la o consiliere de 50 de minute pe sptmn; cuplurile care au rmas au
fost repartizate pentru a fi vzute individual timp de 25 de minute fiecare n fiecare
lun. Cei ce nu au fost de acord cu acest aranjament au fost deasemenea tratai, dar nu
au mai fost inclui ca subieci n acest studiu de cercetare.
Metoda de consiliere (individual sau n cuplu) a fost variabila independent.
S-a decis c variabila dependent, satisfacia marital, va trebui msurat dupa zece

93
sptmni consecutive de consultan. A fost aleas o scal pentru a msura gradul
satisfaciei maritale, ea fiind adaptat pentru a produce informaii de nivel interval.
Paisprezece cupluri au fost vzute n sesiuni de consiliere individual i
paisprezece au fost vzui ca i cuplu. Toi clientii au completat scalei satisfaciei
maritale. Frank a comparat mrimea mediei scalei pentru clienii care au fost vzui
individual (grupul experimental) cu mrimea mediei scalei pentru clienii care au fost
vzui ca i cuplu (grupul de control). Variabila "satisfacie marital" msurat pe
scal a fost gsit ca fiind normal distribuit, deci Frank s-a simit n msur s
foloseasc testul t pentru analiza statistic. El a ncercat s determine dac diferena
dintre mrimile mediei (pentru cele dou grupuri) a fost suficient de mare pentru a-i
permite s resping ipoteza nul. El a dorit s fie capabil s concluzioneze c o
legtur real dintre dou variabile a fost probabil explicaia pentru diferenele
observate n eantion.
Rezultatele
Valoarea lui t pentru informaiile lui Frank, a fost de 1.312 . Din tabelul
valorilor critice ale lui t (Tabelul 9.1), el a observat c ar fi avut nevoie de o valoare
minim pentru t de 1.706 pentru a putea respinge ipoteza nul (folosind o statistic
semnificativ de la nivel 0.05, un eantion de 28 indivizi statistici i 26 de grade de
libertate, avnd o ipotez direcional).
Interpretarea rezultatelor i tragerea concluzilor
Frank a notat c dac ar fi respins ipoteza nul pe baza informaiilor lui, el ar
fi desconsiderat mai mult dect 1 din 10 (10 procente) anse n comiterea unei erori de
Tip I. El avea n mod clar o lips de suport statistic pentru ipoteza sa. Dezamgirea lui
iniial a fost chiar i mai mare atunci cnd a privit la mrimile mediilor celor dou
grupuri. Clienii care au participat la consiliere individual au avut media cu ceva mai
mic dect a fost cea pentru cei care au fost consiliai mpreun. Frank a privit
rezultatele sale cu mai mult obiectivitate. Astfel el a realizat c lipsa argumentului
statistic pentru legtura dintre metoda de consiliere i satisfacia marital, poate fi un
rezultat folositor pentru sine nsui. Imposibilitatea de a respinge ipoteza nul poate fi
interpretat ca nsemnnd c exist diferene prea mici determinate de metoda de
consiliere folosit.
Frank deasemenea i-a pus problema cum de a putut grei. Rezultatele
cantitative din studiul su au fost inconsistente n ceea ce privete impresiile
anterioare. El s-a ntrebat dac el sau ali asisteni sociali nu cumva au perceput doar
c consilierea individual fcut de ei duce la rezultate superioare, pentru c ei au fost
surprini c ceilali clieni consiliai n cuplu au putut obine rezultate superioare.
Firete el deasemenea s-a ntrebat dac ipoteza sa poate fi nc corect. S-ar putea ca
adevrata legtur dintre variabila dependent i cea independent s fi fost ascuns
de tehnica msurtorilor sau de influena altor variabile (de exemplu experiena mare
a asistenilor sociali care au efectuat consilierea cuplului). Frank a concluzionat c
sunt necesare studii suplimentare pentru a rezolva dilema.
Legarea rezultatelor de practic
Inainte ca studiile viitoare s se realizeze, Frank s-a ntrebat ce utilizare
practic s dea rezultatelor sale. In timpul urmtoarei ntlniri cu personalul ageniei
el a avut timp s prezinte rezultatele studiului su. El a fost capabil s traseze
implicaiile pe care le poate avea studiul su pentru practica de asisten social n
interiorul ageniei. Aa cum n mod obinuit se ntampl n cercetarea n asisten
social, studiul su a generat mai multe ntrebri dect rspunsuri. Totui aceste
ntrebri au servit la focalizarea ateniei personalului pe domeniile potenial

94
productive ale cercetrii. Bazndu-se pe propriile rezultate, Frank i ali membrii ai
personalului, au nceput s-i pun urmatoarele ntrebri:
1. Datorit faptului ca tipul de consiliere (individual sau n cuplu) poate avea puin
sau nici un efect n sporirea satisfaciei maritale, este necesar ca s se fac eforturi
pentru a ncuraja clienii s participe n cuplu la consiliere, chiar dac ei par a se
mpotrivi sau dac programul lor de la servici reprezint o dificultate pentru
ntlnirile n cuplu?
2. Poate implicarea ambilor parteneri n consiliere s continue cteodat s fie o
condiie esenial pentru consiliere sau trebuie ca politica ageniei s fie
schimbat?
3. Trebuie alocate resurse pentru un program de dezvoltare a personalului cu scopul
de a forma asistenii sociali specialiti n consilieriea individual n tratamentul
problemelor maritale?
4. Este necesar ca personalul s dezvolte un singur model de tratament care s
combine consilierea individual cu cea de cuplu, sau trebuie ca personalul
profesionist s i se permit libertatea de a alege formula de consiliere pe care el o
prefer spre utilizare?
Aceste ntrebri (i multe altele) au reieit din problemele care au afectat
profesionitii asisteni sociali i din problemele care au fost legate de politicile
ageniei. Principala valoare a studiului lui Frank a fost de a pune n cauz practicile
necontestate din interiorul ageniei i a ncurajat pe fiecare membru al personalului
pentru a justifica sau pentru a lsa deoparte practicile bazate pe explicaii nevalidate.
Chiar dac nu au rezultat schimbri, asistenii sociali vor trebui s practice pe o baz
teoretic deja existent, pn cnd rezultatele cercetrilor ulterioare nu vor furniza un
rspuns definitiv la ntrebri.

9.7. Exemplu din macro-practic


Descrierea situaiei care genereaz un studiu
Nan este efa serviciului social al unei mari agenii de sntate. n rolul ei
profesional, ea supervizeaz serviciile de asisten social oferite n 50 de oficii
districtuale de sntate din interiorul statului. I-a fost adus recent la cunotiin c
agenia are probleme serioase cu plecarea personalului de asisten social. O
examinare preliminar a datelor ageniei a relevat c problema era real i c prea a
fi normal distribuit printre cele 50 de birouri de district.
Nan a vorbit cu eful de personal, responsabil cu conducerea interviurilor
pentru angajaii care prseau agenia. La nceput acesta a preferat s nu sugereze
motivele posibile pentru care att de muli asisteni sociali i-au dat demisia. Dar dup
ce Nan l-a asigurat c nu plnuia s-l pun s identifice asistenii sociali care i s-au
plns, el a explicat c motivele date de ctre asisteni pentru a prsi agenia preau a
fi asemntoare. El a afirmat c muli preau a fi fost total frustrai de lipsa de
autonomie n luarea deciziilor. n timp ce ei recunoteau c n unele probleme
profesionale i administrative deciziile finale trebuie s aparin supervizorilor, ei nu
vedeau nici un motiv pentru care multe alte decizii nu puteau fi luate de ctre ei nii.
Dup aceea, Nan s-a gndit la ceea ce i s-a spus. n timp ce prima ei reacie a
fost de enervare pe supervizorii districtului pentru modul autocratic n luarea
deciziilor, ea i-a reamintit c trebuie s-i asume o mare din responsabilitate pentru
stilul propriu de supervizare, care funciona att de bine la nivelul persoanelor din

95
secretariat. A angajat apoi formatori din afara ageniei i a cerut tuturor supervizorilor
districtului s participe la cursurile privind folosirea autoritii n faa personalului. Ea
nsi a participat activ la ntlniri fcnd n mod regulat comentarii asupra eficacitii
abordrilor discutate. Aparent supervizorii rspundeau pozitiv la mesajele lui Nan c
folosirea extensiv a autoritii asupra personalului este un semn al unei bune
supravegheri. Consultndu-i doar asistenii sociali cu care lucrau, fr ca s le se
permit s ia decizii sau s le implementeze, supervizorii s-au complcut n a urma
directivele date de Nan.
Ipoteza ce urmeaz a fi testat
Nan a tiut c avea nevoie de o modalitate obiectiv de a determina dac
nivelul de autonomie al asistenilor sociali n luarea deciziei este legat de plecarea lor
din agenie. Ea nu a dorit s se ncread n impresiile nsrcinatului cu personalul far
a se convinge personal. Ea nu dorea s ncerce s-i ajute pe toi supervizorii ei s
devina mai liberali n luarea deciziilor pn ce nu era absolut sigur c exist o
legtur ntre cele dou variabile. Ea a decis s realizeze o cercetare pentru a testa
ipoteza:
Rata demisiei personalului va fi mai sczut ntr-un mediu de luare a
deciziilor democratic dect ntr-unul autocratic.
O privire asupra metodologiei
Nan tia c literatura de specialitate recent, despre folosirea cercurilor de
calitate, propunea ca i cale de rezolvare a unor probleme administrative luarea
deciziilor n urma unui proces de grup. Concepia este caracteristic metodelor de
conducere ale Teoriei Z, folosit cu foarte mult succes n Japonia de foarte muli
ani. Deoarece Nan cunotea mai de mult teoria cercurilor de calitte, ea a vzut acum
o bun ocazie pentru a o ncerca. Cercurile de calitate i s-au prut a fi o bun
operaionalizare a unei modaliti mai democratice de luare a deciziilor n birourile
districtuale.
Nan a ales la ntmplare 10 districte pentru a-i servi ca i grup experimental.
Dup aceea ea a acordat timp supervizorilor din cele zece districte s frecventeze nite
antrnamente (workshop-uri) de folosire a cercurilor de calitate. Ea a spus
supervizorilor c ateapt de la ei s implementeze cercurile de calitate n cadrul
supervizrii lor i a cerut un raport asupra metodelor de implementare ca s se asigure
c acestea au fost puse n practic. Ei au fost rugai s nu mprteasc propriile
experiene cu ali supervizori.
n acelai timp Nan a selectat la ntmplare alte zece districte care s constituie
grupul de control. Supervizorilor din cele zece districte nu le-a fost dat un
antrenament suplimentar i nici informaii noi; ca de exemplu cum trebuie s se
descurce cu luarea deciziilor n interiorul grupurilor de lucru. Dup un an, Nan a
calculat rata medie a plecrilor din district pentru grupul experimental i pentru grupul
de control. Ea a considerat dou categorii de nivel nominal pentru variabila
independent: mediul de luare a deciziilor (democratic i autocratic). Variabila
dependent, rata demisiei, era de nivel rapoarte. Condiiile preau s fie ndeplinite
pentru folosirea testului t i ar fi putut obine suport statistic pentru ipoteza sa
direcional.
Rezultatele
Valoarea t obinut din datele lui Nan a fost 1,992. Ea a determinat 18 grade
de libertate (10+10-2 = 20-2 = 18). Folosind tabelul valorilor critice ale lui t (vezi
Tabelul 9.1) ea a remarcat c, pentru linia corespunztoare la 18 grade de libertate,
valoarea lui t a czut ntre valorile 1,734 i 2,100 . Ea s-a uitat la capul de tabel n

96
dreptul valorii din stnga (1,734) i a observat c nivelul de semnificaie se situeaz la
0,05 pentru o ipotez direcional i la 0,10 pentru o ipotez nedirecional.
Probabilitatea p (de a grei respingnd ipoteza nul de egalitate a mediilor)
corespunztoare datelor sale a fost deci mai mic dect 0,05.
Interpretarea rezultatelor i tragerea concluziilor
Din cunotiinele ei de statistic, Nan a tiut c a gsit suport statistic pentru
ipoteza sa. Ea a tiut c respingnd ipoteza nul, are mai puin de cinci procente anse
pentru producerea unei erori de Tipul I (doar pe baza probabilitii statistice). Ea a
fost deasemenea ncntat s vad c legtura era n direcia prezis; media ratei celor
plecai din oficiile districtului pentru grupul experimental a fost mai sczut dect
media celor plecai din oficiile districtelor grupului de control.
Pentru ca studiul ei a fost foarte limitat n privina extinderii, Nan a fost
ovitoare n a privi propriile rezultate ca o aprobare fr echivoc a cercurilor de
calitate sau a altor metode mai democratice de "rezolvare de probleme / luare de
decizii, ca metod de reducere a demisiilor personalului de asisten social. Ea a
recunoscut c ar fi fost precipitat din partea ei s procedeze la implementarea
rezultatelor sale lundu-le ca o legtur simpl cauz-efect. Planul simplist al
cercetrii sale nu a eliminat nici influenele posibile, nici alte variabile care ar explica
diferena ntre rata demisiilor n cele dou grupuri de birouri districtuale. Cu siguran
se pot pune ntrebri i asupra metodologiei. De exemplu, ct de pozitiv a influnat
trainingul, adic posibilitatea de a pleca n afara statului, moralul supervizorilor din
cadrul grupului experimental? Probabil ei s-au ntors ntr-o stare sufleteasc mai bun
i mai tentai s ia n considerare prerile subordonailor. Dac a fost aa, aceasta ar fi
fost o mai bun explicaie pentru pentru rata sczut a demisiei, dect implementarea
cu succes a cercurilor de calitate. Sau poate c asistenii sociali i-au privit pe
supervizorii din grupul experimental cu mai mult consideraie pentru c fceau un
efort de ncerca ceva nou? Dac a fost aa, i acesta ar fi putut fi un factor major
pentru reducerea ratei demisiei. Nan a nceput prin a-i pune ntrebri n lumina
rezultatelor cercetrii sale:
1. Cum pot s mi potrivesc stilul de supervizare n raport cu supervizorii districtelor
n aa fel nct s nu le comunic neintenionat c atept extinderea autoritii lor n
supravegherea asistenilor sociali?
2. Cum pot s ajut supervizorii districtelor s identifice deciziile care sunt potrivite a
fi luate printr-un procedeu democratic i cum s-i fac s se simt mai confortabil
n folosirea acestui procedeu.
3. Cum pot s ajut supervizorii districtelor s identifice deciziile care nu sunt
corespunztoare a fi luate prin procedeu democratic (de exemplu, problemele
personale) i s foloseasc autoritatea lor de efi i alte procedee mai puin
democratice far a rni moralul lucrtorilor?
4. Ce metode de procedee democratice, n afara cercurilor de calitate, vor ajuta
asistenii sociali s simt c pot avea mai mult iniiativ n decizii dac ei posed
cunotiinele tehnice necesare?
5. Ar fi oare de recomandat s se trimit toi supervizorii districtelor la edine de
training de cercuri ale calitii?
6. Ce alte cercetri ar putea fi proiectate pentru a furniza suport suplimentar pentru
concluzia mea c decizia democratic este asociat cu o rat sczut a demisiei
personalului?

97
Dup ce s-a gndit la aceste ntrebri i la altele care reieeau din studiu, Nan
mpreun cu colegii ei care erau administratori de asisten social au discutat ideile ei
pentru implementarea rezultatelor pentru alte probleme ale ageniilor. Apoi ea a
hotrt un plan de aciune.
La urmtoarea ntlnire a tuturor supervizorilor Nan a mprtit rezultatele
sale din cercetare. Ea i-a reafirmat poziia n utilizarea autoritii date de poziia de
conductor n anumite situaii dar a vorbit i despre convingerea c asistenii sociali
de la toate nivelele sunt profesioniti care trebuiesc implicai n luarea deciziilor. Ea a
subliniat ca ea crede c folosirea excesiv a supervizrii autocratice poate rni
moralmente, i chiar mai important, nu aduce avantaje n expertizarea problemelor de
rezolvat. Pentru a pune n aplicare aceste gnduri a cerut unui membru al grupului
experimental s utilizeze o parte din ntlnirea de supervizare urmtoare pentru a-i
inva pe toi supervizorii (inclusiv pe ea nsi) principiile de baz ale cercurilor de
calitate. La ntlnire i ceilali nou supervizori care au utilizat aceast metod au fost
provocai s-i povesteasc experienele.
Nan s-a convins c anumite decizii sunt mai bine de luat n comun de ctre
supervizorii districtuali i personalul (staf-urile) lor. La o alt ntlnire ea a subliniat
aceast convingere. Dar ca s fie consecvent, ea a permis fiecruia s decid personal
dac s frecventeze cercurile de calitate pentru a-i mbunti tehnica lurii deciziilor
n district sau dac s-i dezvolte un plan propriu (cu aprobarea ei) n vederea
democratizrii lurii deciziilor.
n final Nan i-a alocat timp pentru a dezvolta o analiz mai cuprinztoare i
mai riguroas a problemei fluctuaiilor de personal. Studiul va examina ali factori (n
plus fa de procesul lurii deciziilor) pe care i le-a sugerat literatura legat de moralul
i fluctuaia personalului. Ea sper ca, n ultim instan, rezultatele studiului de
ntindere mai mare s poat fi generalizate la alte domenii de asisten social i ca
raportul final s poat fi publicat ntr-o revist de specialitate.

9.8. Rezumat
Acest capitol a prezentat cum se utilizeaz un test statistic popular care
compar mediile a dou eantioane, testul t. S-a subliniat n mod particular importana
lui n cercetarea n asisten social. Exemplele practice descrise au ilustrat c chiar
dac testul t este utilizat n principal n cercetri majore el este valabil i n
preliminarii, n eforturi limitate.
Exemplele din micro- i macro-practic, vzute n lumina celor spuse n
capitolele precedente, mai dovedesc nc ceva. Cititorul va remarca c rezultatele
statistice care au fost gsite pe baza unor ipoteze au valori practice la diferitele nivele
ale muncii de asisten social. Chiar dac un studiu bine proiectat i implementat i a
crui teste statistice au fost corect conduse, eueaz n a oferi suport pentru ipotezele
statistice el este totui util n practic. Se insist asupra faptului c cercettorii
contiincioi care utilizeaz bunul sim n interpretarea rezultatelor lor nu pot pierde.
Ei vor mbogi corpul de cunotine disponibile pentru practica asistenei sociale,
chiar dac nu vor obine niciodat suport statistic pentru o ipotez direcionat sau
nedirecionat.

9.9. Intrebri pentru studiu


1. Care este combinaia de nivele de msurare a variabilelor utilizate n testul t?

98
2. De ce dimensiunile cerute de tesul t pentru volumul eantionului i a
subeantioanelor l fac ideal pentru cercetrile n asisten social?
3. Dac ipoteza nul este corect, valoarea medie a variabilei din eantion va fi
similar sau foarte diferit de valoarea medie a variabilei din cellalt eantion?
4. Cnd erorile de eantionare sunt mai probabil s genereze o diferen de 5 ani
ntre vrstele medii a studenilor din dou seciuni ale unui curs: dac acestea au
cte 10 studeni fiecare sau dac au 25?
5. De ce formula lui t sugereaz c testul poate fi utilizat numai cu o distribuie
normal?
6. Ce determin gradele de libertate pentru statistica t, ntr-un set de date concrete?
7. Ce pas suplimentar este necesar n a determina dac o valoare t semnificativ din
punct de vedere statistic ofer suport pentru o ipotez direcionat?
8. Ce strategie ar trebui s utilizeze un cercettor pentru a raporta o analiz statistic
care a utilizat testul t i care nu a putut furniza suport statistic pentru o ipotez?
9. Cum poate un test t care nu a gsit o valoare semnificativ statistic s reflecte un
rezultat care s fie util pentru un practician?
10. Cum au utilizat cercettorii mai multe proceduri diferite t pentru o singur
variabil dependent pentru a produce rezultate derutante?

99
Capitolul 10. Alte teste statistice

Ultimele trei capitole au furnizat o privire detailat asupra a trei teste care sunt
extrem de folositoare pentru cercetarea n asisten social. De fapt, o parte
important a tuturor cercetrilor de asisten social folosesc hi2, r (coeficientul de
corelaie Pearson), i testul t (Student) n analiza statistic. Cteodat, aceste teste sunt
folosite fie c sunt potrivite, fie c nu, scznd astfel credibilitatea studiului de
cercetare. n capitolul de fa vom meniona pe scurt alte cteva teste statistice care
apar destul de frecvent n literatura de specialitate. Ele constituie o list
reprezentativ, nu exhaustiv, a alternativelor la cele trei teste prezentate pn acum.
Informaiile despre aceste teste nu vor fi detailate, dar cititorii vor putea afla tot ceea
ce au nevoie pentru a le putea folosi. Nu vor fi prezentate formule. Numai ntr-o
singur discuie (prima) exist un exemplu despre cum sunt prezentate deobicei
rezultatele i asta pentru a clarifica cele prezentate n text. Obiectivul acestei scurte
prezentri care va urma, este informarea despre cum lucreaz aceste teste i despre
tipurile de situaii de cercetare n care pot fi utilizate. Pentru a lua decizia final
privind oportunitatea folosirii testului i cerinele suplimentare necesare, cititorul va
trebui s consulte alte lucrri pentru documentare.

10.1. Alternative pentru testele de asociere


Hi2, favorit pentru orice asistent social, nu este potrivit pentru toate analizele
statistice care implic variabile de nivel nominal; astfel dimensiunea eantionului sau
independena eantionului pot obliga cercettorul s caute alte teste. Vom examina pe
scurt dou dintre ele.
Testul McNemar
Acest test (cunoscut i ca test pentru semnificaia schimbrii) este utilizat
pentru eantioane legate. El este cel mai utilizat n cercetrile care angajeaz un
plan iniial i unul final, deci dou mrimi diferite ale unei aceleai variabile pentru
aceiai subieci, obinute la dou momente de timp diferite. Este frecvent utilizat
pentru a determina dac un anume tip de intervenie a avut sau nu efect. De exemplu,
prezena unui program educaional a fost sau nu asociat cu vreo schimbare n
comportament sau atitudine?
n practica asistenei sociale, ne punem deseori ntrebarea dac o intervenie a
avut sau nu n final vreun efect. Firete, suntem interesai pentru o schimbare ntr-un
anumit sens. Dar din cauza existenei attor variabile care pot influena
comportamentul clientului, adesea nu mai putem spune cu certitudine cum pot
serviciile de asisten social influena schimbrile dorite. Testul McNemar poate, cel
puin, s produc un indicator care s arate prezena (sau absena) asocierii dintre
tratament i schimbare.
Exemplu
Un asistent social, Carlos, a solicitat permisiunea de a expune la o ntlnire a
unui grup de prini, prerea sa n favoarea angajrii a patru noi asisteni sociali
pentru acel district. El s-a ntrebat dac prinii vor fi influenai de argumentele sale
sau ei le vor asculta numai din politee. Sau poate c nu-l vor asculta deloc; gndindu-
se la ceea ce vor face la sfritul sptmnii, de exemplu. nainte ca s ia din nou
cuvntul n seara urmtoare, la ntlnirea unui alt grup de prini, el avea nevoie s

100
tie dac prima sa expunere a fost asociat cu schimbare dorit de el, n modul de
gndire al prinilor.
Au fost testate prerile prinilor n legtur cu problema angajat, nainte i
imediat dup expunerea lui Carlos. Astfel prinii au servit i ca grup de control.
Carlos a luat cele dou seturi de msurtori i le-a plasat ntr-un tabel 2x2, cu o
singur variabil (ca cel folosit pentru hi2). Dup aceea el a folosit formula potrivit
i a verificat tabelul pentru a vedea dac exist suport statistic pentru eliminarea
ipotezei nule.
Numerele plasate de Carlos n celulele tabelului reprezint numrul cazurilor
(frecvenele absolute) (vezi Tabelul 10.1). Dac, de exemplu, naintea expunerii, d-l
Brown a fost favorabil angajrii asistenilor sociali, iar dup audiere el i-a schimbat
opinia, el va fi reprezentat ca unul din cele 13 cazuri din celula din colul dreapta-jos
(d). Testul McNemar caut schimbarea. Celulele a i d reprezint schimbarea;
celulule b i c reflect nemodificarea poziiei dintre momentul dinaintea i cel de dup
expunerea lui Carlos. Testul nu ine cont, de fapt, de cazurile n care schimbarea nu
s-a produs. Astfel inta analizei vor fi celulele a i d. ansa (ipoteza nul) afirm c
schimbarea poate surveni n anumite cazuri chiar dac expunerea lui Carlos nu ar fi
avut efect, dar totui tot ea spune c ntmplarea poate sta la baza schimbrilor ntr-un
anumit sens pentru jumtate din cazuri i n sens opus pentru cealalt jumtate de
cazuri.

Tabelul 10.1 Presentare tabelar a testului de semnificaie pentru analiza schimbrii


(Testul McNemar)
Dup
nainte Pentru mpotriv Total
mpotriv 5 (a) 4 (b) 9
Pentru 3 (c) 13 (d) 16
Total 8 17 25
2
x = 4.50, df = 1, p < .025

Statistic, testul McNemar caut s determine dac ipoteza nul poate fi


respins prin demonstrarea c schimbrile preponderente s-au produs ntr-o anumit
direcie. Carlos a putut astfel s resping ipoteza nul. Din pcate, direcia indicat a
legturii arat c prezentarea sa este asociat mai mult cu schimbri n sens negativ
(prinii ntorcndu-se mpotriva propunerii). Doar 7 prini nu i-au schimbat prerile
(celulule b i c). Dar din cei 18 care i le-au schimbat (celulele a i d), doar 5 au trecut
de la o atitudine negativ la una pozitiv (a), n timp ce 13 (d) care anterior erau
favorabili ideii, s-au opus ei dup prezentare. Demonstraia semnificaiei statistice a
schimbrii de atitudine indus de prezentarea lui Carlos a fost un gir pentru
schimbarea produs, dar nu n sensul schimbrii dorite de Carlos. A spus el oare ceva
care s fi ntors opinia prinilor mpotriv, din moment ce att de muli par s fie
negativ afectai ?
Aa cum putem observa, testul McNemar este destul de limitat. El cere
ndeplinirea ctorva condiii privind mrimea i tipul eantionului i se potrivete cel
mai bine cnd situaia implic variabile de nivel nominal, culese nainte i dup
experiment. In concluzie, este un test util pentru cercettorii din asistena social.
Testul Exact Fisher
Testul exact Fisher, ca si hi2, se utilizeaz cnd exist dou eantioane
independente. Eantioanele independente trebuie s fie rezultatul unor procedee

101
aleatoare de eantionare pentru identificarea celor dou grupuri (de exemplu cosiliere
individual i de grup).
Principalul avantaj al testului exact Ficher, fa de hi2 este c el poate fi
utilizat i atunci cnd volumul eantionului este prea mic pentru hi2. El este
deasemenea foarte potrivit pentru analiza datelor dintr-un tabel de contingen 2x2 -
adic atunci cnd exist doar dou valori posibile pentru fiecare din cele dou
variabile de studiat (variabile dihotomice), sau atunci cnd trei sau mai multe
categorii a unei variabile pot fi grupate ntr-un tabel 2x2.
Exemplu
Joyce este un supervizor asistent social ntr-o agenie de protecia copilului. n
cursul unei sptmni recente lucrtorii ei au investigat 27 de cazuri n care se invoca
abuz sexual. 20 de cazuri au fost nchise din lips de dovezi. 18 din ele au fost
investigate de asisteni sociali brbai. Ea a devenit preocupat de ideea dac nu
cumva s-au grbit asistenii sociali brbai s nchid cazurile? Exist oare o asociere
ntre genul lucrtorilor sociali i decizia de a nchide cazurile raportate de abuz
sexual?
Joyce a plasat informaiile ntr-un tabel, asemantor Tabelului 10.1. Analiza
datelor a confirmat suspiciunea ei. Joyce a putut s dovedeasc existena unei asocieri
statistic semnificative ntre genul lucrtorilor i situaia cazurilor de nchidere sau nu a
cazurilor. Supervizorii brbai (conform datelor dintr-o lun) au fost aparent mai
nclinai s nchid cazurile dect femeile. Fenomenul ar merita investigaii
suplimentare.
Testul exact Fisher este ideal pentru nevoile unei cercetri ca aceea a lui
Joyce. Pentru c se limiteaz la tabele 2x2, i este cel mai potrivit pentru eantioane
mici, el se aplic adeseori la schiarea unor tentative de concluzii care pot fi mai trziu
verificate utilizndu-se eantioane mai mari i planuri de cercetare mai complexe.

10.2. Alte teste pentru msurtori de nivel ordinal


In ultimele dou capitole s-au discutat dou teste, (coeficientul de corelaie r a
lui Pearson i testul t) care, cnd sunt folosite pentru testarea ipotezelor i pentru alte
analize, cer ndeplinirea unor condiii riguroase. Coeficientul lui Pearson se folosete
pentru a determina gradul de corelaie ntre msurile de nivel interval ale unei
variabile i msurile de nivel interval ale unei alte variabile. Tesul t nu cere dect ca
una din variabile s fie de nivel interval. Dar el este un test parametric: adic variabila
de nivel interval trebuie s fie normal distribuit n populaie. Dac pentru variabila
dependent se pot produce msurtori precise de nivel interval, sau dac exist o scal
rafinat de msur a ei, i (n cazul lui t) exist o distribuie normal, acestea pot fi
testele alese. Dar ce se ntmpl dac variabila dependent nu este normal distribuit
n populaie, sau dac lipsesc msurtorile precise? S-ar putea ca scala de msur
folosit s fie relativ nou i s nu ne simim nc confortabili declarnd c intervalele
dintre valori sunt egale. De multe ori variabilele sunt de natura ntodeauna,
cteodat, niciodat, mbuntire, nici o schimbare, nrutire, sau alte valori
ordonatoare. Din fericire, exist cteva alte teste bune pe care cercettorul asistent
social le poate avea n vedere pentru variabilele de nivel ordinal. Vom meniona patru
din ele i vom da cte un scurt exemplu de cum pot fi ele folosite.

102
Mann-Whitney U
Testul U Mann-Whitney este folositor n special n studiile de cercetare care
folosesc dou eantioane mici. Se utilizeaz frecvent n experimentele mici sau ex
post-facto, n situaiile qvasi-experimentale pentru a determina dac un anume
tratament aplicat unui grup experimental dar nu i unui grup de control pare s fi
condus la diferene n ceea ce privete o variabil dependent a crei valori pot fi
ordonate (de nivel ordinal). Grupurile nu trebuie s fie neaprat de aceleai
dimensiuni. Este un test bun pentru efective foarte mici (sub 8) sau pentru mai mari,
dar trebuie s fim ateni s utilizm tabela de valori critice cea mai adecvat n raport
cu volumul eantionului.
Testul este uor de calculat manual sau cu calculatorul de buzunar, mai ales
dac volumul eantionului este mic. Se bazeaz pe ideea c un indicator bun al
diferenelor dintre cele dou grupuri este numrul cazurilor dintr-un grup care cad sub
rezultatul corespunzator din cellat grup, cnd toate rezultatele sunt aranjate n ordine.
Premisa logic pus n eviden este c o grupare a rezultatelor celor mai nalte ntr-un
grup i a rezultatelor celor mai mici n cellalt grup, probabil sugereaz c, privit n
ansamblu cele dou grupuri sunt diferite n raport cu variabila independent. U este o
modalitate matematic de a determina cnd un astfel de pattern este suficient de
puternic pentru a respinge ipoteza nul.
Exemplu
Scott este un asistent social angajat ntr-o corporaie mai mare. n iulie el a
primit 17 referine despre lucrtorii si ca avnd probleme de atitudine n munca
lor. El a cerut supervizorilor si s numeasc cte un alt lucrtor de acelai nivel pe
care s-i poat descrie ca avnd o atitudine foarte bun i care s se poat altura lor
cnd vor fi consiliai. apte dintre supervizori i-au satisfcut cererea, iar ceilali zece
nu au fost de acord.
Scott s-a ntlnit cu toi 17, cu cei 7 s-a ntlnit mpreun cu cte un
colaborator iar cu ceilali singuri, n cinci sesiuni. Dup al cincilea interviu a rugat
suprvizorii s completeze o scal de atitudine fa de serviciu, dezvoltat recent de
departamentul de personal pentru evaluarea lucrtorilor supervizori. Scala coninea 10
itemi i totaliza maximum 5 puncte. A ordonat apoi rezultatele celor 17 i a utilizat
indicatorul U a lui Mann-Whitney pentru a testa independena grupului. El a fost prea
optimist creznd c rezultatele obinute de grupul experimental, care a folosit
metoda consilierii mpreun cu un colaborator, vor fi superioare celor din grupul de
control, care au consiliat singuri, chiar dac trei din primele 4 rezultate cele mai bune
au fost obinute de cei din grupul experimental.
De fapt, U nu a permis respingerea ipotezei nule. Dou din cele mai mici
rezultate veneau tot din grupul experimental. Chiar dac U ar fi demonstrat o
semnificaie statistic, explicaii alternative la acest rezultat ar fi existat totui (lipsa
repartizrii aleatoare n grupuri, efectul altor variabile, etc.) pentru c planul de
cercetare a lui Scott a fost fr rigoare. Scott a decis s refac planul i s continue
cercetarea folosind eantioane mai mari, i incluznd i un prestest.
Testul U Mann-Whitney este folosit ca o metod preliminar de examinare a
relaiilor dintre variabile fr s se investeasc prea mult efort n planul de cercetare i
implementatrea lui. Deoarece necesit doar date de nivel ordinal, este potrivit pentru
situaiile n care care dezvoltarea unui nou instrument de colectare a datelor, care s
satisfac preteniile cercettorului privind precizia datelor (scale de nivel interval sau
rapoarte), nu poate fi impus. Cerinele testului pentru eantioane de dimensiuni mici
l fac i ele adecvat pentru analiza preliminar a unei legturi posibile.

103
Totui testul U nu trebuie interpretat ca un indicator brut al unei legturi sau
doar ca un instrument al evalurii timpurii. El este singurul test care a fost aplicat n
cteva cercetri foarte serioase i folositoare. n anumite situaii - ca i celelalte teste
deja menionate sau care le vom meniona - este cea mai bun i mai potrivit
modalitate de analiz. Este unul din cele mai utilizate teste n cercetarea de asisten
social i, de obicei, din motive corecte.
Testul median
Un alt test util n situaiile cnd nu se pot asigura msurtori de nivel interval
sau/i o distribuie normal este testul median. Ca i t, el utilizeaz o msur a
tendinei centrale, dar spre deosebire de t, se cer doar msuri de nivel ordinal. Tot
similar cu t este n aceea c el msoar probabilitatea ca dou sub-eantioane
(cteodat un grup experimental i unul de control) s fie suficient de diferite unul
fa de cellat n ceea ce privete variabila dependent, astfel ca respingerea ipotezei
nule s fie garantat.
Cum lucreaz testul median? Se ordoneaz rezultatele i se stabilete rezultatul
median pentru toate valorile. Apoi numrul rezultatelor peste i sub median din
fiecare grup se tabeleaz, iar frecvenele se plaseaz ntr-un tabel de contingen 2x2.
Apoi se calculeaz valoarea unui test cunoscut. Cnd numrul total al cazurilor (din
ambele grupe) este ntre 20 i 40, se utilizeaz de obicei un test exact Fisher pentru a
determina probabilitatea de a comite o eroare de tipul I cnd se respinge ipoteza nul.
Cu eantioane mai mari se potrivete mai bine testul hi2.
Testul median se bazeaz pe ideea c, dac dou grupuri nu sunt de fapt
diferite, sau c ele reflect diferene care se datoreaz n mare msur ntmplrii, ele
vor avea acelai procent de cazuri sub i peste median. O grupare a rezultatelor
deasupra medianei ntr-un grup i sub median n cellalt grup indic o diferen
real privind aceea variabil, depinznd de puterea acestui pattern.
Exemplu
Lou Ann este un asistent social angajat ntr-un centru de consiliere genetic.
Ea a observat c numai jumatate din gravidele mai n vrst (peste 35 ani) care au fost
sftuite s efectueze un test de amniocentesis (testul determin dac fetusul are
probleme genetice) s-au conformat sfatului. Din observaiile sale mai degrab
netiinifice, ea crede c a gsit un factor legat de acest fenomen. Ei i se pare c acele
femei care nu au efectuat testul tind s aibe deja mai muli copii, iar cele care l-au
efectuat au mai puini copii.
Variabila numr de copii este de nivel rapoarte. Dar Lou Ann tie c acesta
nu este normal distribuit n populaie. Ea decide deci s utilizeze testul median. Ea a
grupat datele n cele 4 celule a unei tabele de contingen, pe baza modului n care
fiecare caz se situeaz fa de variabila dependent (a fcut / nu a fcut testul) i fa
de variabila independent, numr de copii (sub sau peste median). Criteriul privind
dimensiunea frecvenelor ateptate pentru fiecare celul pentru testul hi2 fiind
satisfcute (cel puin 5%) ea a utilizat formula cunoscut. Impresia ei iniial a fost
confirmat prin utilizarea testului median. Speculnd pe baza rezultatului s-a ntrebat
dac e posibil ca naterea unui copil, de exemplu, cu sindromul Down, nu reprezint o
preocupare pentru familiile mai numeroase pentru c grija i ajutorul suplimentar
necesar unor astfel de copii ar putea fi preluate de frai. Ea a decis s continue acest
studiu cutnd i alte explicaii posibile.
Exemplul este puin neobinuit pentru c variabila independent a fost tratat
ca fiind de nivel ordinal. (De fapt ea a fost de nivel rapoarte dar cu o distribuie foarte
oblic). Mai tipice sunt cazurile n care variabila dependent este ordinal, n timp ce

104
variabila independent (de exemplu tipul tratamentului) este nominal. Testul este
adecvat pentru oricare din aceste combinaii cu privire la nivelul de precizie a
msurtorilor.
Testul median, spre deosebire de celelalte teste prezente n acest capitol, a fost
prezentat pentru c este potenial folositor n cercetarea din asisten social, i nu
pentru c este folosit des n cercetrile de asisten social. De prea multe ori
observnd c criteriile pentru testul t nu pot fi satisfcute se trece de urgen la testul
hi2. n multe cazuri testul median ar fi mai adecvat. El trateaz msurile de nivel
interval sau de rapoarte ca ordinale, deci de o precizie mai mare dect presupune
testul hi2, care trateaz variabilele ca fiind doar de nivel nominal. Utiliznd hi2 n
asemenea situaii nseamn a ne asuma riscul de a pierde din precizia msurtorilor i
de a crete probabilitatea de a scoate o concluzie eronat din cercetarea noastr.
Testul Kolmogorov-Smirnov, testul celor dou-eantioane
Acest test (referit K-S n cele ce urmeaz) are similariti cu testul median.
Dar el compar nu doar tendina central a datelor ci i dispersia lor, oblicitatea i alte
caracteristici ale distribuiei valorilor unei variabile de nivel ordinal din dou
eantioane. (O variant, testul K-S pentru un eantion, lucreaz similar, dar compar
eantionul cu o distribuie teoretic a acelei variabile.)
Testul K-S se bazeaz pe ideea c dac dou eantione sunt aleator alese
dintr-o aceai populaie i dac ipoteza nul este corect, variaiile variabilei ordinale
i distribuiile valorilor variabilei trebuie s fie foarte asemntoare. Dac diferenele
dintre cele dou eantione sunt considerabile, ele nu sunt chiar diferene aleatoare pe
care doar ntmplarea le-ar fi produs; trebuie s existe o diferen real. Testul este un
mod de a determina dac diferenele dintre distribuiile valorilor variabilei sunt
suficient de mari pentru a exclude ansa ca explicaie i pentru a justifica respingerea
ipotezei nule.
K-S analizeaz datele comparnd frecvenele cumulative pentru intervalele
variabilei de nivel ordinal (de exemplu, ct de multe cazuri au fost evaluate ca puin
mbuntite n grupul de control fa de grupul experimental). De fapt, formula se
focalizeaz asupra punctului (intervalului) la care diferena frecvenelor cumulative
dintre cele dou grupuri este cea mai mare.
Exemplu
Roland este un director districtual ntr-o agenie de asisten public. Mai
muli dintre lucrtorii de culoare i s-au plns c lucrtorii albi au afiat o atitudine
excesiv de suspicioas i punitiv fa de clienii beneficiari de ajutor financiar
(AFDC). Ei i acuzau c clienii nu au fost crezui i c au fost etichetai ca triori.
Nedispunnd de nici o metod care s msoare atitudinile suspicioase i
punitive, Roland a considerat c numrul referatelor de investigare frauduloas este
instrumentul potrivit, chiar dac mai puin precis. Chiar dac numrul exact al
referatelor se poate afla cu exactitate, pentru msurarea atitudinii (adevrata variabil
dependent), doar valori de nivel ordinal pot fi luate n considerare. El a cerut
secretarei s numere referatele de fraud naintate n ultimele 3 luni, pentru fiecare
lucrtor. A alctuit apoi o distribuie de frecvane cumulate pentru lucrtorii negri i
alta pentru cei albi, utiliznd 8 intervale pentru numrul de referate. Decizia de a
utiliza 8 intervale (numrul de referate era cuprins ntre 9 i 32) s-a luat pentru a
conserva precizia msurtorilor disponibile (utiliznd de exemplu doar 3 intervale
s-ar fi eliminat prea multe informaii), dar n acelai timp pentru a nu considera c
diferene de un singur referat, n plus sau n minus, indic o diferen real de
atitudine. Decizia s-a bazat deci pe simul comun i pe etica de cercetare.

105
Dup ce a identificat intervalul pentru care diferenele cumulative ale
distribuiei difereau cel mai mult, Roland a aplicat formula K-S. El a aflat astfel c
exist doar diferene mici ntre albi i negri relative la msurile variabilei, cel puin nu
suficiente pentru a elimina ansa i a respinge ipoteza nul. Dei el nu a privit cu
nencredere plngerile lucrtorilor si (o msur mai bun ar fi putut releva, poate, o
diferen de atitudine), a simit c nu are suficiente dovezi pentru a-i confrunta
lucrtorii cu ceea ce ei percep ca fiind o problem. A hotrt n schimb, ca la
urmtoarele ntlniri, s reexpun ceea ce crede el c ar fi o atitudine potrivit fa de
beneficiarii de ajutor financiar (clienii AFDC).
Testul K-S pentru dou eantioane este util pentru a privi la relaiile dintre o
variabil de nivel ordinal i una de nivel nominal, atunci cnd simpla comparaie a
tendinei centrale nu este suficient. Examinnd ntreaga distribuie a valorilor unei
variabile de nivel ordinal, vom avea un tablou mai complet al similaritilor dintre
dou eantioane. Un alt test, testul Wald-Wolfowitz Runs (care nu va fi expus aici),
merge mai departe n a identifica diferene pe care testul K-S nu le poate detecta.
Testul Wilcoxon Sign, al perechilor cu semn
Cercettorii asistenii sociali gsesec adesea instrumente de msur care sunt
un pic mai precise dect cele de nivel ordinal, dar nu suficient de precise pentru a fi
calificate de nivel interval. Aceasta este de obicei cazul noilor scale dezvoltate pentru
msurarea atitudinilor, percepiilor sau convingerilor. Cteodat, natura amorf a ceea
ce msurm, ne impune s dorim etichete pentru valori care s reflecte intervale
precise, adic diferene egale de cantiti ntre dou clase de valori. Testul Wilcoxon
Sign este util n asemenea situaii, unde, de exemplu, cunoatem c un rezultat de 70
puncte este mai mare dect unul de 60 de puncte i mai tim c aceast diferen este
mai mare dect diferena dintre 62 i 60. Dac aceast ultim determinare poate fi
fcut i dac ne intereseaz doar direcia ei (mai mult, mai puin, sau la fel) pentru
diferenele dintre perechile care constituie cele dou grupuri, noi putem s facem
abstracie de precizia msurtorii. Testul de semn poate fi potrivit i cnd se pot face
numai astfel de determinri mai puin precise.
Testul Wilcoxon Sign se bazeaz pe ideea c, dac un tratament nu provoac
diferenieri, nu vor exista diferene legate de variabila dependent ntre cazurile dintr-
un grup i perechea cazurilor din cellalt grup (ipoteza nul). Acest situaie ideal
presupune respectarea unor cazuri perechi identice (ca la gemeni). Dar, n practic
cazurile perechi se determin pe baza unor pre-teste privind variabila dependent
i/sau una sau mai multe variabile care se consider c ar putea interveni. Dup ce
perechile au fost identificate, membrii unuia din grupuri se identific aleator, perechea
lor intrnd automat n cellalt grup. Testul examineaz mrimea i direcia
diferenelor dintre perechi, generat de aplicarea tratamentului. n cursul procesului,
diferenele dintre perechi se ordonez. Dac preponderena diferenelor sugereaz
rezultate mai mari pentru un grup i cele mai mari diferene sunt tot printre aceste
cazuri, testul Wilcoxon Sign va sugera o diferen statistic semnificativ ntre grupuri,
i ipoteza nul va fi respins. Cu ct este mai puternic o astfel de tendin, n aceast
direcie, cu att este mai probabil ca ipoteza nul s fie respins, i viceversa.
Exemplu
Denise este un consilier asistent social ntr-un centru de sntate pentru
studeni. Dup ani de observaii, s-a ntrebat dac studenii de colegiu cu probleme de
adaptare social au beneficiat mai mult din consilierea fcut de studeni voluntari
neantrenai, sau din partea personalului antrenat. Folosind fiele de urmrire standard
pe o perioad de o lun, ea a identificat un grup prospectiv de clieni diagnosticai ca
avnd probleme moderate de adaptare social. nainte de repartizarea pentru

106
consiliere, ea a identificat 15 perechi potrivite (asemntoare dup criterii ca sexul,
media la admitere, etc.) i a repartizat aleator un membru al fiecrei perechi unui
student voluntar; perechile lor au fost repartizate unui asistent social. Dup ase
edine de consiliere de cte o or, clienilor li s-a administrat o scal de adaptare
social. Instrumentul pe care Denise l-a considerat un indicator al adaptrii sociale
pentru studenii din colegiu, era considerat capabil s genereze informaii mai mult
dect ordinale necesare utilizrii testului Wilcoxon Sign. Au fost comparate valorile
pentru fiecare pereche n ceea ce privete direcia i mrimea diferenelor. Diferenele
au fost ordonate ntr-o list.
Denise a putut astfel observa c acei membri ai perechilor care au fost
consiliai de asistentul social s-au situat cu mult mai bine pe scala de adaptare social
dect perechile lor consiliai de studeni voluntari. Testul Wilcoxon Sign i-a permis s
se simt mult mai confortabil n respingerea ipotezei nule: direcia diferenelor i-a
permis s concluzioneze c acei clieni care au fost consiliai de asistenii sociali au
obinut valori mai mari pe scal. Desigur, ea nu a devenit pregtit s elimine
voluntariatul studenilor, doar pe baza acestui test, dar s-a ntrebat dac ei n-ar putea fi
folosii mai bine n munca cu studenii cu alte probleme. Ea a decis s repete micul ei
studiu, utiliznd o alt msur a adaptrii sociale ca s vad dac rezultatele ei rmn
consistente.
Testul Wilcoxon Sign se limiteaz numai la situaiile n care identificarea
perechilor este posibil. Cnd exist perechi, acest test este relativ puternic i foarte
potrivit pentru situaiile n care msurtorile variabilei sunt suficient de precise ca
tratarea lor doar ordinal s nsemne a nu se profita de avantajele oferite de nivelul
msurtorilor.

10.3. Rezumat
n acest capitol am menionat alte cteva teste ntlnite frecvent n literatura
asistenei sociale. Ele sunt alternative utile pentru testele discutate n capitolele
precedente. Cu excepia lui t am tratat un singur tip de teste, cele neparametrice, care
nu presupun o distribuie normal. Cititorul trebuie s cunoasc c un alt grup de
teste, cele parametrice, sunt disponibile atunci cnd distribuia datelor ndreptesc
utilizarea lor.
Mai subliniem c n-am focalizat pe nelegerea elementar a testrii statistice,
i c n procesul atingerii acestor obiective, am utilizat teste i exemple care examinau
cele mai simple relaii, relaiile dintre numai dou variabile. Testele care exploreaz
legturi mai complexe au fost doar rareori menionate. De fapt, una din cele mai
comune utilizri eronate deriv din situaiile cnd se aplic o serie de analize
univariate sau bivariate, cnd ar fi potrivit analiza multivariat. O astfel de eroare
poate conduce la concluzii eronate. Explicaia noastr pentru aceast omisiune este c
ne-am concentrat discursul n scopul asimilrii unei nelegeri elementare care s
serveasc cititorul cnd i dac s continue n acest domeniu. Am ales s sacrificm
comprehensabilitatea pentru simplicitate cu scopul de a ne ndeplini obiectivul prin
furnizarea unei introduceri prietenoase n domeniul statisticii.

10.4. ntrebri pentru studiu

1. De ce este potrivit testul McNemar pantru asistenii sociali care doresc s evalueze
impactul unui experiment de grup despre stereotipiile despre minoriti ?

107
2. n ce situaii se poate utiliza testul Fisher i nu se poate utiliza testul hi2 ?
3. Ce condiii trebuiesc ndeplinite n mod particular pentru utilizarea testului U
Mann-Whitney pentru un practician individual care evalueaz efectivitatea unei
noi metode de tratament ?
4. De ce testul median este preferabil testului hi2 atunci cnd datele de nivel interval
sau rapoarte nu ntrunesc condiiile necesare utilizrii testului t ?
5. De ce testul Kolmogorov-Smirnov este o comparaie mai comprehensiv pentru
datele de nivel ordinal sau pentru cele de nivel interval dar oblic distribuite din
dou grupuri, dect testul median?
6. Ce tip special de eantionare este necesar pentru un test Wilcoxon Sign ?
7. Ce limite comune au toate testele descrise n acest capitol i n cele precedente?
8. Cum lucreaz toate testele n aceeai manier ?
9. Discutai posibilele dezavantaje ale utilizrii testelor statistice mai puin
cunoscute.

108
BIBLIOGRAFIE

Babbie, Earl, 1991 The Practice of Social Research, Wadsworth publishing


Company, Belmont, California, 493 p.
Bryman, Alan & Cramer, Duncan, 1992 Quantitative data analysis for social
scientists, Routledge Edition, 294 p.
Norusis, J. Marija, 1992 SPSS for Windows. Basw System Users Guide, SPSS Inc.,
672 p.
Rotariu T., Bdescu G., Culic I., Mezei E., Murean C., 1999 Metode statistice
aplicate n tiinele sociale, Editura Polirom, Iai, 335 p.
Weinbach R.W., Grinnell R.M. Jr., 1987 - Statistics for Social Workers, Longman
Inc., New York / London

109