Curs10 ValiditExterna

VALIDITATEA EXTERNĂ
Validitatea externă vizează generalizarea rezultatelor din cadrul unui studiu. În toate
formele de cercetare, rezultatele şi concluziile studiului sunt limitate la participanţi şi condiţii,
care sunt definite ca fiind contururi ale studiului. Termenul de validitate externă se referă la
gradul în care rezultatele cercetării pot fi generalizate la alte condiţii, participanţi, perioade şi
locuri (Graziano & Raulin, 2004).
Validitatea externă se referă la generalizarea concluziilor cu privire la relaţia cauzală
dintre variabilele dependente şi independente dincolo de circumstanţele studiului experimental.
Ar putea rezultatele studiului nostru să fie aplicate la diferite populaţii, condiţii sau seturi de
circumstanţe? Dacă este posibil atunci validitatea externă a studiului este puternică.
Să presupunem a vizat eficacitatea unei noi intervenţii asupra anxietăţii faţă de testare.
Variabila independentă este intervenţia, iar cea dependentă este anxietatea faţă de testare.
Participanţii au fost studenţi în anul 1 la o facultate de psihologie, de la o anumita universitate.
Deşi ar putea părea are nerealist, multe studii sunt realizate pe un eşantion de studenţi pentru că
aceştia reprezintă un eşantion accesibil (Kazdin, 2003). Studenţii au fost evaluaţi pentru a
determina nivel de anxietate şi apoi au fost distribuiţi fie în grupul de control fie în cel
experimental. Noua terapie este eficientă şi reduce anxietatea în mod semnificativ. Astfel
cercetătorii consideră că intervenţia este un tratament eficient al anxietăţii. Pot cercetătorii să-şi
susţină ipoteza bazându-se pe rezultatele acestui studiu?
Validitatea externă reprezintă gradul în care rezultatele cercetării pot fi generalizate altor
condiţii, altor participanţi, altor perioade de timp şi altor zone. În exemplul nostru, cercetătorii au
constatat că intervenţia reduce anxietatea în mod eficient, presupunând că aceasta metodă este
eficientă într-o mare varietate de situaţii şi pentru diferite persoane. Aceste presupuneri ar putea
fi corecte, dar design-ul acestui studiu nu are o validitate externă puternică ceea ce compromite
afirmaţia că intervenţia este eficientă pentru alte populaţii. În primul rând, studiul a fost realizat
pe un eşantion de studenţi din anul 1 de la un curs de introducere în psihologie. Aceasta este un
eşantion foarte limitat. Ar putea fi aceste rezultate să fie aplicate unei populaţii mai largi, cum ar
fi elevii din şcolile elementare sau elevi de liceu? Ar putea rezultatele să fie aplicate studenţilor
de anul 1 care nu urmează cursul de introducere în psihologie? Nu ştim acest lucru pentru că
aceşti indivizi nu au fost incluşi în eșantionul folosit în studiu. În al doilea rând, rezultatele se pot
aplica altor situaţii, cum ar fi alte universităţi, licee, clase şi medii de afaceri? Eficienţa
intervenţiei ar putea fi limitată de situaţia în care a fost efectuat studiul. Aceste rezultate nu ar
putea fi generalizate altor universităţi din ţară sau elevilor de liceu. Cu alte cuvinte, eficacitatea
intervenţiei ar putea fi specifică doar populaţiei pe care a fost realizat studiul. În al treilea rând,
există ceva unic în condiţiile studiului? Studiul a fost realizat în perioada sesiunii finale, când
1
gradul de anxietate ar putea fi mare? Intervenţia ar fi fost la fel de eficientă dacă studiul ar fi fost
realizat într-un alt moment din timpul semestrului? Nu ştim sigur răspunsul. Cea mai adecvată
afirmaţie care poate fi făcută legat de validitatea externă este că intervenţia este eficientă pentru
studenţi de anul 1 de la facultatea de psihologie de la o universitate anume. Oricare alte concluzii
nu pot fi susţinute, cercetările suplimentare în momente, locuri şi condiţii diferite fiind necesare
pentru a susţine alte concluzii.
AMENINŢĂRI LA ADRESA VALIDITĂŢII EXTERNE

Ca şi în cazul validităţii interne, există variabile parazite şi caracteristici ale studiului care
pot limita generalizarea rezultatelor. Acestea sunt reunite sunt sub numele de ameninţări ale
validităţii externe şi includ caracteristicile eşantionului, caracteristicile stimulilor şi ale
condiţiilor, reactivitatea la aranjamentele experimentale, interferenţele tratamentelor multiple,
efectele de noutate, reactivitatea la evaluare, sensibilitatea la testare, sau programarea măsurilor
(Kazdin, 2003). Controlul acestor efecte permite cercetătorilor să aibă mai multă încredere în
generalizarea rezultatelor studiului la alte circumstanţe şi populaţii (Kazdin, Rosnow & Rosenthal,
2002).
Caracteristicile eşantionului
Această sursă de ameninţare a validităţii externe se referă la un fenomen prin care
rezultatele unui studiu se aplică nu numai unui eşantion particular. Prin urmare, nu este clar dacă
rezultatele pot fi aplicate şi altor eşantioane care variază în privinţa caracteristicilor, cum ar fi
vârsta, gen, educaţie şi statut socio-economic (Kazdin, 2003). În exemplul prezentat anterior,
eşantionul era format dintr-un grup de studenţi de o universitate care urmau un curs de
introducere in psihologie. Cum am menţionat deja, nu putem spune că rezultatele acestui studiu
pot fi generalizate la un eşantion diferit, cum ar fi elevi de liceu. În plus, nu putem presupune că
rezultatele ar fi valabile şi pentru alţi studenţi din anul 1. Cercetări suplimentare ulteriore ar
putea descoperi dacă intervenţia ar fi eficientă nu numai pentru studenţii din anul 1 de la
facultatea de psihologie dar şi pentru toţi studenţii din anul 1 de la alte facultăţi. Chiar şi această
diferenţă subtilă a eşantionului poate avea un efect semnificativ asupra generalităţii rezultatelor.
Evident, nu este posibil sau nici practic să includem toate posibilele caracteristici ale populaţiei
în eşantion, de aceea poate apare confuzia între caracteristicile eşantionului şi validitatea externă
a unui studiu. În consecinţă, concluziile formulate pe baza rezultatelor studiului tind să fie
limitate la caracteristicile eşantionului folosit un studiu.
Caracteristicile eşantionului pot cuprinde o mare varietate de trăsături şi caracteristici
demografice, unele dintre cele mai comune fiind vârsta, genul, educaţia şi statutul socio-
economic. Cercetătorii au remarcat faptul că unele caracteristici care au legătură cu diversitatea
nu sunt bine reprezentate în majoritatea cercetărilor (Kazdin, 2003). Principala preocupare este
2
aceea că poate apărea o supra-reprezentare a unor grupuri, cum ar fi studenţii, şi o
subreprezentare a grupurilor minoritare, cum ar fi femeile hispanice americane. Diversitatea
caracteristicilor este o problema importantă a validităţii externe, şi poate avea efecte importante
şi pe termen lung pentru întreaga societate. De exemplu, un studiu conceput pentru a oferi
informaţii necesare pentru a lua o importantă decizie politică publică, ar trebui să includă un
eşantion suficient de diversificat pentru a capta cu precizie caracteristicile grupului care va fi
direct afectat de decizie. Diversitatea caracteristicilor ar trebui să fie luate în considerare în toate
tipurile de cercetare.
Caracteristicile stimulilor şi circumstanţelor
Condiţiile şi caracteristicile studiului limitează generalizarea rezultatelor (Brunswik, 1955;
Pedhazur & Schmelkin, 1991). Fiecare studiu se desfăşoară într-un set unic de condiţii şi
circumstanţe ale design-ului experimental. Cel mai comune exemple includ circumstanţele
cercetării şi cercetătorii implicaţi în studiu. Principala preocupare în legătură cu această
amenințare a validităţii externe este că toate concluziile studiului vor fi influenţate de setul unic
de condiţii şi prin urmare, nu este necesară generalizarea la alt studiu, chiar dacă celelalte studii
utilizează un eşantion similar.
În studiul prezentat anterior ce implica efectul intervenţiei asupra anxietăţii faţă de
testare, s-a constatat că intervenţia a fost eficientă în studenţii din anul 1 de la facultatea de
psihologie de la o universitate de pe Coasta de Est. Un cercetător de pe Coasta de Vest a decis
replicarea studiului folosind un eşantion de studenţi din anul 1 înscrişi la facultatea de
psihologie. Deşi a urmat aceeaşi procedură, acest cercetător nu a constat un efect al intervenției
asupra anxietăţii faţă de testare. Există o serie de explicaţii pentru acest rezultat; cum ar fi
contaminarea caracteristicilor stimulilor şi circumstanţelor în acest ultim studiu. Contextul în
care s-a realizat intervenţia pe Coasta de Vest este diferit de cel de pe Coasta de Est. Similar,
există diferenţe între indivizi din cele două universităţi, cei de pe Coasta de vest ar putea fi mai
puţin competenţi sau mai puţin accesibili decât omologii lor de pe Coasta de Est.
Reactivitatea la măsurile experimentale
Se referă la o potenţială contaminare a efectului variabilei independente produc de
cunoaşterea faptului că cineva este participant în cadrul unui studiu (Christensen, 1988). Cu alte
cuvinte, conştientizarea de către participanţii a faptului că iau parte la un studiu poate avea un
impact asupra atitudinii şi comportamentului lor pe tot parcursul studiului. Acest lucru poate
avea un impact semnificativ asupra rezultate obţinute în studiu şi este, în special, problematic
atunci când participanţii cunosc scopul şi ipotezele studiului. Există o serie de strategii de
limitare a cunoștințelor participanţilor cu privire la studiu care au fost prezentate în cursul
anterior. Ca sursă de ameninţare a validităţii externe, problema apare dacă aceleaşi rezultate ar fi
obţinute de către participanţi care nu ştiu ceea ce se studiază (Kazdin, 2003). Această sursă de
3
ameninţare este una dintre cele mai comune. Motivul principal este acela că standardele etice
solicită ca participanţii să îşi ofere consimţământul informat înainte de participare în marea
majoritate a studiilor de cercetare.
Să presupunem un studiu proiectat pentru a evalua eficacitatea unui program de 10
săptămâni pentru modificarea comportamentului conceput cu scopul de a reduce recidivismul în
cazul infractorilor adolescenţi. Grupul experimental primeşte intervenţia (variabila independentă)
şi grupul de control nu. Cercetătorii constată că grupul experimental prezintă niveluri mai
scăzute de recidivă (variabila dependentă) în comparaţie cu grupul de control. Cercetătorii ar
putea fi tentaţi să susțină că intervenţia a fost responsabilă pentru concluzii; totuşi rezultatele s-ar
putea datora faptului că acest comportament se îmbunătățește deoarece participanţii şi-au asumat
o atitudine conformă cu intervenţia. Alternativ, dacă participanţii din grupul de tratament ar
adopta o atitudine negativă faţă de intervenţie, rezultatele studiului ar putea sugera că intervenţia
nu a avut succes. În orice caz, rezultatul poate fi produsul al reactivităţii faţă de regimul
experimental şi nu faţă de intervenţia în sine.
Inferenţa tratamentului multiplu
Se referă la situaţiile de cercetare în care (1) participanţilor li se administrează mai mult
de o intervenţie experimentală (sau variabila independentă) în cadrul aceluiaşi studiu sau (2)
aceleaşi persoane participă la mai mult de un studiu (Pedhazur & Schmelkin, 1991). Este mai
frecvent în studiile în care apar mai mult de o condiţie experimentală sau variabila independentă.
Implicaţia majoră a acestei ameninţări este aceea că rezultatele cercetării se pot datora
contextului sau seriilor de condiţii în care cercetarea este prezentată. În prima situaţie, variabilele
independente administrate simultan sau secvenţial pot produce un efect de interacţiune. În
general, variabilele independente multiple administrate în acelaşi studiu acţionează ca variabilă
parazită, ce fac dificil de stabilit care dintre acestea este responsabilă pentru rezultatele obţinute.
A doua situaţie se referă la experienţa relativă a participanţilor. Familiarizarea cu cercetarea
poate afecta comportamentul şi răspunsurile participanţilor, ceea ce face dificilă interpretarea
corectă a rezultatelor studiului.
Să presupunem o situaţie obişnuită de interferența tratamentului multiplu poate apărea.
Un studiu cu 12 săptămâni de tratament a fost proiectat pentru a evalua eficacitatea unei
intervenţii combinate pentru tratarea depresiei ce cuprinde atât elemente de terapie psiho-
dinamică, cât şi cognitivă. Participanţii sunt împărţiţi aleatoriu în grupul de control şi de
experimental. Ambele grupuri sunt evaluate pentru a determina severitatea simptomelor. Grupul
experimental a primit 6 săptămâni de terapie psiho-dinamică, urmate de 6 săptămâni de terapie
cognitivă. La sfârșitul celor 12 săptămâni, ambele grupuri, atât cel experimental, cât şi cel de
control, sunt reevaluate în ceea ce priveşte severitatea simptomelor. Rezultatele sugerează că
grupul experimental a manifestat simptome semnificative mai reduse de depresie comparativ cu
4
grupul de control. Cercetătorii au concluzionat că terapia psiho-dinamică combinată cu cea
cognitivă a fost eficientă pentru tratarea depresiei. Rămân totuşi întrebări fără răspuns. Ar fi
tratamentul eficient dacă terapia cognitivă ar fi administrată prima? Ar putea, 6 săptămâni de
terapie cognitivă şi psiho-dinamică, administrate separat, să producă rezultate similare? Deşi
studiul a produs o îmbunătăţire semnificativă a stării pacienţilor, rezultatele puteau fi mai bune
dacă nu ar fi fost utilizate ambele forme de tratament pe aceeași pacienţi.
Efectul de noutate
Se referă la posibilitatea ca efectele variabilelor independente să se datoreze unicității sau
noutăţii stimulilor sau a situației şi nu intervenţiei propriu-zise. Aceste tratamente noi sau
neobișnuite ar putea produce rezultate care dispar odată ce noutatea situaţiei sau condiţiei
dispare. Cu alte cuvinte noutatea intervenţiei sau situației acționează ca o variabila parazită,
noutatea (nu variabila independentă) explică rezultatele. Aceasta amenințare a validității externe
este comuna diferitor tipuri de planuri si circumstanțe experimentale .
Să luăm spre exemplu o situaţie în care certătorii încearcă să determine eficacitatea unei
noi intervenții terapeutice la persoane cu depresie cronică. Autorii au decis să numească această
intervenție ca "terapia zâmbetului" deoarece terapeutul este instruit să zâmbească clientului după
un anumit program în speranța de a încuraja o stare pozitivă si o alta perspectivă asupra vieţii.
Simptomele de depresie sunt evaluate, apoi participanții sunt repartizați aleatoriu fie în grupul de
control fie în una dintre cele trei condiţii experimentale. Condiţiile experimentale au inclus
terapia prin zâmbet, terapia cognitiv-comportamentală şi cea interpersonală. Toți participanţii
sunt supuși terapiilor timp de patru săptămâni, apoi sunt reevaluaţi pentru a determina severitatea
depresiei. Cercetătorii au constat că terapia prin zâmbet a fost mai eficientă decât terapia
cognitiv-comportamentala şi cea interpersonala.
Efectul de noutatea al tratamentului ar fi putea conta în obţinerea acestor rezultate.
Populația inclusă în acest studiu fictiv a cuprins persoane cu depresie cronică, astfel este posibil
ca ei să fi încercat mai multe tipuri de tratament sau cel puţin a fost au urmat un tratament pentru
o perioadă de timp. Deşi aceste modalităţi de tratament sunt distincte, nici una din ele nu
presupune ca terapeutul să zâmbească ca intervenţie. Terapia prin zâmbet este unică şi acest
lucru ar putea conta pentru îmbunătăţirea stării de depresie. Intervenţia a avut loc pe parcursul a
4 săptămâni. În cazul în care rezultatele s-ar datora noutăţii ne-am aştepta ca efectul
tratamentului să dispară în timp si noutatea terapiei prin zâmbet să se diminueze. Patru săptămâni
sunt o perioada suficientă pentru ca noutatea să scadă iar rezultatele studiului după 12 luni s-ar
putea să nu indice un efect semnificativ al acestei terapii. Efectul de noutate ar putea limita
capacitatea cercetătorului de a generaliza rezultatele acestui studiu la situaţii sau contexte în care
nu acest efect nu există. Acest efect poate fi văzut, de asemenea, în afara în ariei de tratament-
intervenție.
5
Acest efect poate fi văzut în afara locului de acţiune a intervenţiei. Să presupunem că
vrem să determinăm eficacitatea unei intervenţii destinata pentru a crește capacitatea de muncă
în echipă şi productivitatea pentru manageri de top din două organizaţii distincte. În condiţiile
ameninţării evidente a validităţii interne datorită lipsei de randomizare, vom explora suplimentar
implicațiile efectului de noutate. Cercetătorii identifica managerii de top din ambele organizaţii
şi administrează intervenţia. O organizație este o companie de producţie iar cealaltă o firmă mare
de management financiar. Cercetătorii constată că intervenția creste productivitatea şi capacitatea
de muncă în echipă, numai în firma de management financiar. Prin urmare cercetătorii ajung la
concluzia ca intervenția este eficienta în un anumit mediu.
Cu toate acestea este posibil ca aceste rezultate să se datoreze unui efect de noutate si nu
intervenției în sine. Dar ce se întâmpla dacă firma de producţie a fost angajat într-un program de
îmbunătăţire a calităţii? Aceste programe implică un nivel ridicat al muncii în echipa şi
interacțiune în grup în timpul programului zilnic. De asemenea, firma de management financiar
nu a abordat problema muncii în echipă în trecut. Prin urmare, diferenţa semnificativă s-ar putea
datorită noutății muncii în echipă într-o organizaţie în care aceasta nu a fost anterior luată în
considerare, şi nu a intervenţiei în sine. Dimpotrivă, intervenţia ar putea sa nu fi fost eficienta în
cadrul companiei de producție pentru că organizaţia a avut deja încorporat modelul în cultura lor
corporativa. Ce se întâmplă dacă am folosi intervenția într-o firmă de management financiar care
a implementat munca în echipă? Am putea constat că intervenţia nu este eficientă. În acest caz în
termenii generalizării, mai corectă ar fi afirmaţia că intervenţia este eficienta in organizaţiile de
management financiar care nu au fost expuse anterior intervenții de construire de echipe.
Reactivitate evaluării
Se referă la un fenomen prin care conştientizarea de către participanţi a faptului că
performanţa lor a fost măsurată poate schimba performanţa lor faţă de ceea ce ar fi fost
(Christensen, 1988; Kazdin, 2003). Reactivitatea este o ameninţare a validităţii externă atunci
când acesta conştientizare determină participanții să răspundă în mod diferit decât ar răspunde în
mod normal în condițiile experimentale.
Reactivitatea poate apărea în o mare varietate de circumstanţe şi poate fi o ameninţare
considerabilă dacă evaluarea formală sau informală este o componentă necesară a studiului. De
exemplu, într-un studiu de psihoterapie participanții au fost evaluaţi în ceea ce privește numărul
şi gravitatea simptomelor de distres. Faptul că evaluarea are loc ar putea provoca participanţii să
denatureze răspunsurile din diferite motive. De exemplu, participanții s-ar putea simţi
inconfortabil sau constrânși, şi ar ascunde simptomele. Sau dimpotrivă, participanţii ar putea
evidenţia nivelul simptomelor lor în cazul în care suspectează că asta ar duce la un tratament mai
intensiv. Deşi reactivitate este comună multor studii medicale şi psihologice, este răspândită în
alte design-uri. De exemplu, întrebând direct angajaţii despre atitudinea lor faţă de management
6
s-ar putea obţine mai multe răspunsuri favorabile decât ne-am putea aştepta daca ei ar completa
un chestionar anonim.
Sensibilizarea pretest si posttest
Se referă la efectele pe care pretestul şi posttestul le-ar putea avea asupra
comportamentului si răspunsurilor participanților la studiu (Bracht & sticlă, 1968; Lana, 1969;
Pedhazur & Schmelkin, 1991). În multe forme de cercetare, participanţii sunt pretestaţi pentru
cuantificarea prezentei unor variabile de interes şi pentru a oferi o nivelul de bază al
comportament pentru a putea fi evaluate efectele intervenţiei experimentale (variabila
independentă). De exemplu, un pretest pentru simptomele de anxietate ar fi folosit pentru a
determina simptomatologia participantului într-un studiu ce investighează eficacitatea unei
terapii noi a anxietăţii. Informațiile pretest vor fi folosite ca o măsură de bază şi de comparaţie cu
posttestul de la finalul studiului, pentru a determina eficacitatea intervenţiei asupra reducerii
simptomelor de anxietate. În general, sensibilizarea pretest este posibilă având participanţii sunt
măsurați anterior administrării intervenţiei experimentale şi cercetătorii sunt interesați în
măsurarea efectelor variabilei independente asupra variabilei dependente.
Ar trebui să fim preocupaţi dacă expunerea la pretest poate contribu, sau poate fi singura
cauza, a modificărilor observate la nivelul variabilei dependente. Cu alte cuvinte, ar fi rezultatele
studiului acelaşi în cazul în care pretestul nu a fost administrat? Acest lucru are implicaţii asupra
validitatea externă deoarece sensibilizarea pretest ar putea face ca rezultatele să fie irelevante în
situaţiile în care pretestul nu a fost administrat. De exemplu, pentru studiul menţionat anterior
efectele tratamentului s-ar putea să nu mai fie găsite în absenta pretestului.
În timp ce pretestarea vizează evaluarea nivelului variabilei înainte de aplicarea intervenției
experimentale, posttestul se realizează pentru a evalua eficienţa variabilei independente. Măsurarea
posttest poate avea efect similar cu al evaluării pretest asupra validităţii externe. Am obţine aceleaşi
rezultate dacă pretestul nu ar fi fost administrat ? Dacă nu, atunci putem spune că sensibilitatea la
posttest poate fi rezultat fie postetului doar fie în combinaţiei cu intervenţia experimentală. Ambele,
pre- şi post- evaluarea, pot face ca participanţii să fie sensibilizați la măsurare. Dacă se întâmplă
acest lucru atunci rezultatele sunt mai puţin generalizabile decât dacă viitoarele cercetări şi
intervenţii ar fi realizate fără a folosi aceeași procedură şi măsurări. Cu alte cuvinte, prezenţa de
pre-şi posttestare devine parte integrantă in intervenţia însăşi. Astfel, efectele variabilei
independente ar fi mai puţin proeminente sau inexistente în absenta sensibilizării pretest sau
posttest.
Momentul evaluării si măsurării
Este frecventă în studiile longitudinale şi se referă la problema dacă aceleaşi rezultate s-ar
obține dacă măsurarea ar fi avut loc într-un alt moment în timp (Kazdin, 2003). Cercetarea
longitudinală se produce în timp şi implică mai multe evaluări pe durata studiului. De exemplu,
7
un studiu longitudinal ar putea găsi rezultate semnificative ale terapiei după evaluarea
simptomelor la 2 luni, dar nu şi la 4 sau 6 luni. Astfel, cercetătorii ar putea ajunge la concluzia că
tratamentul este eficient pentru o tulburare anume. Aceste rezultate ar putea fi o supra-
generalizare, deoarece dacă studiul ar fi continuat mai mult, nu ar fi fost observat acelaşi efect al
tratamentului. Astfel, cea mai potrivită concluzie ar putea fi că tratamentul produce o scădere a
simptomelor până la sau după 2 luni. O concluzie mai specifică este susţinută de studiu, în timp
ce o concluzie mai generală despre eficienţa ar putea să nu fie precisă datorită momentului
măsurării. Şi rezultatele inverse ar putea adevărate: lipsa rezultatelor semnificative după
măsurarea de la 2 luni nu elimina posibilitatea ca rezultatele să fie semnificative, dacă intervenţia
şi măsurarea au loc pe o perioadă mai lungă de timp.
VALIDITATEA DE CONSTRUCT
În contextul designului de cercetare şi metodologiei, termenul de validitate de construct
se referă la interpretarea relaţiei cauzale şi se referă la congruenţa dintre rezultatele studiului şi
baza teoretică care a ghidat cercetarea (Kazdin, 2003). Validitatea de construct se centrează de
obicei asupra variabilei independente a studiului. În esenţă, validitatea de construct pune
întrebarea dacă teoria susţinută de rezultate oferă cele mai bune explicaţii ale rezultatelor. Cu alte
cuvinte, explicaţia relaţiei dintre intervenția experimentală (variabila independentă) şi fenomenul
observat (variabila dependentă) are la baza constructul sau explicaţiei oferită de cercetători
(Campbell & Stanley, 1966; Cook & Campbell, 1979; Christensen, 1988; Graziano & Raulin,
2004; Kazdin, 2003)?
Există două metode principale pentru îmbunătățirea validității de construct a unui studiu.
În primul rând, validitatea de construct puternică este bazată pe afirmaţii clare şi definiţii
operaţionale ale variabilelor studiului. În al doilea rând, teoria care a stat la baza studiului trebuie
să aibă o bază conceptuală puternic şi bună validitate de construct (Graziano & Raulin, 2004).
Cook şi Campbell (1979) fac următoarele sugestii pentru îmbunătăţirea validității de
construct :
• definiţie operațională clară a conceptului sau variabilei independente.
•colectarea datelor care să demonstreze că reprezentarea empirică a variabilei
independentă produce rezultatul aşteptat.
• colectarea datelor pentru a arăta că reprezentarea empirica a variabilei independentă nu
variază cu măsurările variabilelor conexe..
• verificarea manipulării variabilei independente.
Vom folosi un exemplu simplu pentru a ilustra importanţa validităţii de construct într-un
studiu. O echipă de cercetători a fost interesată de studiul factorilor care influenţează rata
8
mortalităţii într-un număr de ţări. Cercetătorii au folosit datele demografice din diferite ţări.
Cercetătorii au presupus că nivelul de educaţie şi veniturile familiei vor fi legate semnificativ de
rata mortalităţii; rata mortalităţii va scădea odată cu creşterea nivelului de educaţie şi venitului.
Cu alte cuvinte, cercetătorii emit ipoteza că există o relaţie negativa între mortalitate şi nivelul de
educaţie şi veniturile familiei. Construcţia teoretică care a stat la baza studiului a fost aceea
conform căreia cei doi factori — nivelul de educaţie şi venitul familial — sunt legaţi negativ de
mortalitate. Cercetătorii efectuează analizele şi constată că ipoteza se confirmă. Cercetătorii
concluzionează că nivelul de educaţie şi veniturile familiei sunt factori protectori care reduc rata
mortalităţii.
Aceasta este explicaţia cea mai probabilă a rezultatelor, sau există o altă explicaţie mai
bună care ar putea ameninţa ipoteza studiului cu privire la cauzalitate (sau valabilitatea de
construct)? Care ar putea fi explicaţia cauzală mai bună a rezultatelor studiului? O explicaţie
alternativă a rezultatelor ar putea fi aceea că nivelurile ridicat de educaţie şi venit familial reduc
rata mortalităţii deoarece sunt legate de un alt factor care nu a fost luat în considerare în studiu.
Un nivel ridicat de studii este pozitiv legat cu nivelul venitului. Un nivel mai ridicat al veniturilor
de obicei oferă acces ridicat la o varietate de privilegii şi servicii, cum ar fi accesul la îngrijirile
medicale de înaltă calitate. Accesul la sănătate este, prin urmare, legat de nivelul de educaţie şi
venitul familial, şi poate fi o explicaţie plauzibilă a rezultatelor obținute în cadrul studiului (altele
decât cele susţinute de cercetători).
Există fenomene care apar în contextul de cercetare care pot acţiona ca ameninţări ale
validității de construct. La fel ca şi în cazul validității interne şi în cazul validităţii externe,
numărul şi tipul ameninţărilor este legat de tipul de design al studiului. În general, aceste
ameninţări sunt caracteristice ale studiului care interferează cu abilitatea cercetătorului de a
extrage inferenţe cauzale cu privire la rezultatele studiului (Kazdin, 2003). Amenințările la
adresa validităţii constructive sunt mai greu de clasificat deoarece acestea pot fi orice se referă la
proiectarea studiului şi construcția teoretică care a stat la baza acestuia. Cu toate acestea, sursele
cele mai comune de ameninţare a validității de construct sunt legate de unele ameninţările
validităţii externe, cum ar fi contextul în care se desfășoară experimentul, aşteptările
experimentatorilor şi caracteristicile participanţilor.
VALIDITATEA STATISTICĂ
Acest tipul final de validitate este adesea trecut cu vederea. Validitatea statistică
(denumita şi validitatea concluziilor statistice) se referă la aspectele evaluării cantitative care
afectează precizia concluziilor formulate pornind de rezultatele studiului (Campbell & Stanley,
1966; Cook & Campbell, 1979). Procedeele statistice sunt de obicei utilizate pentru a testa relaţia
dintre două sau mai multe variabile şi pentru a determina dacă un efect statistic observat se
9
datorează şansei sau este o reflectare corectă a unei relaţii de cauzalitate (Rosnow & Rosenthal,
2002). La nivelul cel mai simplu, validitatea statistică abordează întrebarea dacă concluziile
statistice obţinute pe baza rezultatelor sunt rezonabile (Graziano & Raulin, 2004).
Conceptele de ipoteză de testare şi evaluare statistică sunt interdependente, şi oferă
fundamentarea evaluării validităţii statistice. Evaluarea statistică se referă la baza teoretică,
raţiunea şi calculele statisticilor realizate pentru a evalua natura relaţiei dintre variabilele
dependente şi independente. Alegerea tehnicilor statistice adesea depinde de natura ipoteze
testate în studiu. Acest moment conceptul de testare a ipotezei intră in discuţia cu privire la
validitatea statistică. Fiecare studiu este realizat pentru a testa una sau mai multe ipoteze, acestea
ghidând proiectarea, metodologica, analizele statistice şi concluziile obţinute.
Aşa cum sa discutat anterior există două tipuri principale de ipoteze în cercetare: ipoteza
de nul (H0) şi ipoteza de cercetare (H1, H2, H3, etc. în funcţie de numărul ipotezelor). Ipoteza
de cercetare reprezintă relaţia prezisă dintre variabile ce este examinată în studiu. Dimpotrivă,
ipoteza de nul reprezintă afirmaţia că nici o relaţie între variabile nu a fost examinată
(Christensen, 1988). În acest punct, trebuie să revizuim o convenţie importanta a metodologiei de
cercetare care are legătură cu analizele statistice şi ipotezele testate. Respingerea ipotezei de nul
este un prim pas necesar pentru evaluarea impactului variabilei independente (Graziano &
Raulin, 2004). În termenii analizei statistice, accentul pus întotdeauna pe ipoteza de nul, şi nu pe
ipoteza de cercetare. Cercetătorii resping ipoteza de nul dacă o diferenţă semnificativă statistic
este constatată între condițiile experimentale si de control (Kazdin, 2003). Prin contrast,
cercetătorii nu resping ipoteza de nul dacă nu apare o diferență semnificativă statistic între
condițiile experimentale si de control.
Ca şi în alte forme de validitate există numeroase ameninţări ale validităţii statistice. Cele
mai comune includ puterea statistica scăzută, variabilitatea procedurilor experimentale,
caracteristicile participanților, lipsa de fidelitate a măsurilor, mai multe comparaţii şi rate de
eroare. Fiecare dintre aceste ameninţări poate avea un impact semnificativ asupra capacităţii
studiului de a delimita relaţiile de cauzalitate şi exclude ipoteze rivale plauzibile.
Puterea statistică scăzută.
Este cea mai comună ameninţare a validităţii statistice (Keppel, 1991; Kirk, 1995).
Prezenţa acestei ameninţări produce o probabilitate scăzută de a detecta o diferenţă între
condițiile experimentale şi de control, chiar şi atunci când există cu adevărat o diferență. Puterea
statistică scăzută este direct legată de efecte slabe şi mărimea eşantionului, prezenţa acestora
crescând probabilitatea ca puterea statistică scăzuta să apară. Puterea statistică redusă poate
provoca face ca un cercetător să ajungă la concluzia că nu există rezultate semnificative chiar şi
atunci când rezultate semnificative există în realitate (Rosnow & Rosenthal, 2002).
Variabilitatea
10
Variabilitatea este o altă ameninţare a validității statistice, care se aplică atât
participanţilor cât şi procedurilor utilizate în studiu. Variabilitatea procedurilor metodologice
include o gamă largă de diferenţe şi întrebări legate de caracteristicile designului folosit în
studiu. Aceste diferenţe pot fi găsite în prezentarea variabilei independente, procedurile legate de
desfăşurarea studiului, variabilitatea în măsurile de performanţă în timp, dar şi alţi factori care
sunt legaţi de designul unic al studiului. Variabilitatea caracteristicilor participanţilor se referă:
participanţii la un studiu pot varia pe o varietate de caracteristici şi dimensiuni, cum ar fi vârsta,
educaţia, statutul socio-economic şi competinţa. Datorită diversităţii crescute a caracteristicilor
participanților, este mai puţin probabil ca diferenţă între condiţiile de control şi experimentală să
fie detectată. Când este variabilitatea dintre grupe este scăzută, creşte probabilitatea de a detecta
o diferenţă reală între condiţiile de control şi experimentală. Această ameninţare a validităţii
statistică trebuie luată în considerare încă din stadiul de planificare a studiului, şi de obicei este
controlată prin utilizarea grupurilor omogene, stricte, protocoale procedurale bine definite şi
controalelor statistice în etapa de analiza datelor.
Lipsa de fidelitate a măsurilor
Lipsa de fiabilitate a măsurilor utilizate într-un studiu este o altă sursă de variabilitate
care constituie o amenințare pentru validitatea statistică. Se referă la măsurile utilizate în studiu –
dacă evaluează caracteristicile de interes într-un mod consistent sau fidel (Kazdin, 2003). În
cazul în care măsurile nu sunt fidele, atunci o mai mare variabilitate este introdusa în designul
experimental. La fel ca şi variabilitatea participanţilor şi cea procedurală, acest tip de
variabilitate scade puterea statistică şi face mai puţin probabil că analizele statistice să detecteze
o diferenţă reală între condiţiile de control şi experimentale, când o diferenţă de fapt există.
Comparațiile statistice multiple
O ultimă ameninţarea a validităţi statistice este reprezentată de comparaţii statistice
multiple şi ca ratele de eroare obţinute (Kazdin, 2003; Rosnow & Rosenthal, 2002). Această
ameninţare se referă la numărul de analize statistice utilizate pentru a analiza datele obținute într-
un studiu. În general, dacă numărul de analize statistice creşte, probabilitatea de a găsi o
diferenţă semnificativă între condiţiile experimentale şi de control se poate rezultat doar a şansei
pur matematice. Cu alte cuvinte, rezultatele semnificative sunt un artefact matematic şi nu
reflectă o adevărată diferenţă între condiții. În consecință, cercetătorii trebuie să definească
ipotezele înainte de a începe studiul astfel încât să se efectueze numărul minim de analize
statistice pentru fiecare dintre ipoteze.
Deşi pentru fiecare tip de validitate şi sursele de ameninţare au fost prezentate separat, de
fapt toate tipurile de validitate sunt interdependente, un tip de validitate poate compromite şi
celelalte tipuri. Toate sursele de ameninţare ale validităţii ar trebui luate în considerare pe cât
11
posibil în etapa de proiectare a studiului. Asigurarea unei validităţi interne puternice este
considerată mai importanta decât validitatea externă, deoarece trebuie să controlam ipotezele
rivale înainte să ne gândim la generalizarea rezultatelor unui studiu.
12

Curs10 ValiditExterna

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Curs10 ValiditExterna

Încărcat de

Drepturi de autor:

Formate disponibile

VALIDITATEA EXTERNĂ

AMENINŢĂRI LA ADRESA VALIDITĂŢII EXTERNE

S-ar putea să vă placă și