Sunteți pe pagina 1din 11

Validitatea internă

Validitatea este un concept important al cercetării deoarece se referă la acurateţea


ştiinţifică şi conceptuală a cercetării (Graziano & Raulin, 2004). Scopul principal al tuturor
formelor de cercetare este de produce concluzii valide. Mai mult, cercetătorii sunt interesați să
explice efectele şi interacţiunile variabilelor într-o varietate de contexte. Înţelegerea acestor
interacţiuni necesită o atenţie specială îndreptată asupra conceptului de valabilitate, care
susţine necesitatea de a elimina sau a minimiza efectele produse de variabilele străine
studiului, precum şi a explicaţiilor alternative ale rezultatelor finale ale unui studiu. Ipotezele
alternative sunt interpretări alternative ale interacţiunii dintre variabilele independente şi
dependente; oferă o explicaţie rezonabilă a constatărilor altele decât ipoteza cercetătorului
iniţială (Rosnow & Rosenthal, 2002).
Valabilitatea este, prin urmare, un concept extrem de important şi util pentru toate
formele de cercetare. Scopul său principal este de a creşte acurateţea şi utilitatea rezultatelor
prin eliminarea sau controlul cât mai multor variabile parazite, ceea ce permite o mai mare
încredere în concluziile un anumit studiu. Există patru tipuri de valabilitate (internă, externă,
de construct şi statistică), care pot interacţiona în ceea ce priveşte controlul şi minimizarea
impactului unui variate palete de factori externi care ar putea contamina studiul şi reduce
precizia rezultatelor.
Validitatea internă - se referă la capacitatea design-ului de cercetare de a exclude sau a
elimina explicațiile alternative ale rezultatelor (explicaţiile alternative sunt posibile ipoteze
alternative). Indică gradul în care putem susține existența relaţiei dintre variabile.
Validitatea externă - se referă la generalizarea rezultatelor studiului. În toate planurile
de cercetare rezultatele și concluziile sunt limitate la participanți şi condițiile de cercetare.
Termenul de validitate externă se referă la gradul în care rezultatele pot fi generalizate şi altor
condiții, participanți sau momente.
Validitatea de construct - se referă la congruenţa dintre rezultate studiului şi relația
susținută de teorie. Validitatea de construct vizează măsura în care teoria susținută de
rezultatele cercetării se doveşte a fi cea mai bună explicație a rezultatelor.
Validitatea statistică - se referă la evaluarea cantitativă care poate afecta exactitatea
concluziilor. La un nivel mai simplu această validitate face referire la măsura în care
concluziile statistice sunt rezonabile.

În continuare vom discuta despre fiecare tip de valabilitate, ameninţările asociate şi


implicaţiile sale asupra unui design de cercetare.
Deşi dovezi ale relaţiei cauzale sunt greu de obținut, scopul celor mai multe studii este
de a demonstra faptul că o variabilă independentă a fost direct responsabilă de efectul produs
la nivelul variabilei dependente. Cu alte cuvinte, un cercetător în final doreşte să ştie dacă
1
efectul sau fenomenul observat se datorează variabilei/variabilelor independente manipulate
sau unei/unor variabile parazite necontrolate sau necunoscute (Pedhazur & Schmelkin, 1991).
Ideal, la finalizarea studiului cercetătorul ar dori să facă afirmaţii cu privire la nivelul de
cauzalitate între variabilele dependente şi independente. Prin proiectarea unui plan
experimental puternic, validitatea internă versus ridicată, ipotezele alternative şi influenţele
variabilelor parazite sunt minimizate. Aceasta permite cercetătorului să atribuie rezultatele
studiului cu mai multă încredere variabilei sau variabilelor independente (Kazdin 2003;
Rosnow & Rosenthal, 2002). Variabilele externe necontrolată, altele decât variabilele
independente care ar putea explica rezultatele studiului sunt considerate ca ameninţări la
validităţii interne.
Să presupune, de exemplu, că un cercetător este interesat de eficacitatea a două
programe de formare şi educare a competenţelor parentale privind îmbunătăţirea stării de
depresie a adolescenţilor. Cercetătorul recrutează 100 de familii care îndeplinesc cerinţele
specificate pentru includerea în studiu. Principalul criteriu de includere este acela ca familia
să aibă un adolescent care suferă de depresie. După recrutare, cercetător distribuie aleatoriu
familiile în unul dintre cele două programe de formare a competenţelor. Părinţii primesc
intervenţia pentru o perioadă de 10 săptămâni, apoi sunt trimişi acasă pentru a-şi aplica
competenţele formate. Cercetătorul reevaluează adolescenţilor 6 luni mai târziu, pentru a
vedea dacă apare o îmbunătăţire a simptomelor de depresie ale adolescenţilor . Rezultatele
sugerează că ambele grupuri şi-au îmbunătățit starea. Cercetătorul concluzionează că ambele
programe de formare a competenţelor au fost eficiente în tratarea depresiei la adolescenți.
Având în vedere informaţii, putem considera această concluzie va fiind adecvată? Răspunsul,
este desigur nu. Are o scăzut validitate internă deoarece este imposibil să spunem cu
certitudine că variabila independent (de formare a competențelor) a avut efect asupra
variabilei dependente (depresie). Există o serie de ipoteze alternative rivale, care au nu au fost
controlate şi care ar putea la fel de uşor să explice rezultatele studiului. Multe lucruri s-ar
putea întâmpla pe parcursul celor 6 luni. De exemplu, au fost administrate adolescenţilor
anumite medicamente? Şi-ai îmbunătăţit starea fără intervenţie? Condiţiile de viaţă s-au
schimbat în bine? Nu vom ştie niciodată, deoarece studiul are o slabă validitate internă şi nu a
controlat măcar cele mai simple şi evidente explicaţii alternative.

Ameninţări ale validităţii interne


Deşi terminologia poate varia, cel mai frecvent întâlnite ameninţările la adresa
valabilităţii interne sunt factori istorici, maturizarea, instrumentele, testarea, regresia statistică,
bias-ul selecţiei, uzura, difuzarea sau imitaţia tratamentului şi tratament special sau reacţii la
control (Christensen, 1988; Cook & Campbell, 1979; Kazdin, 2003; Pedhazur & Schmelkin,
1991). Cercetătorii trebuie să fie conştienţi de faptul că fiecare design este subiect a cel puţin
unora dintre aceste ameninţări potenţiale care trebuie controlate în mod corespunzător. Eşecul
2
în folosirea unor metode adecvate de control poate afecta capacitatea cercetătorului în a
realiza inferenţe cauzale.

Factori Istorici
În general, factorii istorici ca sursă de ameninţare a validităţii interne se referă la
evenimente sau incidente care au loc în timpul studiului şi care ar putea avea un impact
neintenţionat şi necontrolat asupra rezultatelor studiului (sau variabilei dependente; Kazdin,
2003). Aceste evenimente sunt suficient de globale pentru a afecta cei mai mulţi dintre
participanţii la studiu. Acestea pot apărea în interiorul sau în afara studiului, de obicei apar
între fazele de pre- şi post-măsurare a variabilei dependente. Impactul factorilor istorici este,
de obicei, observat în faza de post-măsurare şi este mai accentuat în cazul studiilor
longitudinale care se desfăşoară pe o perioadă lungă de timp. În consecinţă, cu cât perioada de
timp între pre- şi post-măsurare este mai mare cu atât mai mare este probabilitatea ca factorii
istorici să contamineze rezultatele studiului (Christensen, 1988).
Un exemplu poate fi studiul anterior în care simptomele de depresie au fost evaluate
la 6 luni după finalizarea programului de formare a competenţelor. Este posibil ca alte
evenimente importante să fi avut loc în această perioadă de timp, acestea putând explica
reducerea simptomelor de depresie ale adolescenţilor. O ar fi posibilitate ar fi ca școala să se
fi încheiat şi vacanţa de vară să fi început, ceea ce a produs o scădere a simptomelor depresive
în eşantionul de adolescenţi. Deci, scăderea depresie ar putea fi cauzată de un factor istoric, şi
nu la variabila independentă (competenţele formate ale părinţilor). Evenimente istorice pot
avea loc în cadrul unui studiu, deşi acest lucru este mai puţin frecvent. De exemplu, o ceartă
între doi cercetători, care are loc în prezenţa participanţilor şi care nu face parte din
intervenţie experimentală poate fi un eveniment care poate avea un efect.

Maturizare
Această ameninţare a validităţii interne este similar cu cea produsă de factorii istorici
şi are legătură cu modificări ce apar în timp. Spre deosebire de factorii istorici, maturizarea se
referă la schimbările interne ale participanţilor, şi care de obicei, sunt legate de trecerea
timpului. Cele mai frecvent citate exemple implică atât schimbările biologice şi cele
psihologice, cum ar fi îmbătrânirea, învăţarea, oboseala sau foame (Christensen, 1988). Ca şi
în cazul factorilor istorici, modificările produse de maturizare au loc între fazele de pre- şi
post-măsurare şi interferează cu interpretările relaţiei cauzale. Ameninţările factorilor istorici
şi maturizare apar în combinaţie în studiile longitudinale. În exemplul nostru cu privire la
formarea competenţelor parentale, este posibil ca simptomele de depresie să scadă deoarece
părinţii au avut 6 luni suplimentare pentru a se dezvolta ca părinţi, indiferent dacă au
participat sau nu la programul de formare a competenţelor? Deşi e puţin probabil, ca aceasta
ipoteză alternativă rivală să poată fi luată în considerare şi controlată, este mai probabilă
3
includerea unui grup de control sau de comparaţie care nu primește nici un fel de pregătire.
Un alt exemplu ar putea fi un studiu care a examinat efectele vizualizării asupra puterii fizice
a adolescenţilor de sex masculin pe o perioadă specifică de timp. Deoarece adolescenţi se
maturizează, ne aşteptăm să vedem o creştere a puterii acestora, indiferent de intervenţie.
Deci, orice declaraţie cu privire la relaţia de cauzalitate dintre vizualizare şi putere în
eşantionul de adolescenţi trebuie luată analizată în contextul maturizării. Această sursă de
ameninţare poate fi minimizată prin utilizarea unui grup de control sau de comparaţie.

Instrumente
Această ameninţare a validităţii interne nu are legătură cu caracteristicile
participanţilor şi se referă la schimbări în măsurarea variabilei independente. Are de obicei
legătură cu schimbări în timp apărute la nivelul instrumentelor de măsurare sau a procedurilor
de măsurare (Christensen, 1988; Kazdin, 2003). În esenţă, instrumentele pot compromite
validitatea internă atunci când schimbările apărute la nivelul variabilei dependente sunt
rezultat al modificărilor în timp ale instrumentelor de măsură şi ale criteriilor de scorare.
Există o mare varietate de tehnici de măsurare şi evaluare pe care cercetătorii le au la
dispoziţie, şi unele dintre acestea sunt mai susceptibile să afecteze validitatea internă. De
obicei efectul instrumentelor este o funcţie a standardizării.
Standardizare se referă la regulile stabilite în administraţia şi scorarea unui instrument
sau ale altor metode de măsurare, şi care de asemenea, cuprinde conceptele psihometrice de
fidelitate şi valabilitate. O caracteristică a măsurării este fidelitatea care se referă la
consecvenţa în măsurarea unei anumite caracteristici. Termenului de validitate indică dacă
scala utilizată în studiu măsoară ceea ce şi-a propus să măsoare. Instrumentele care sunt
standardizate şi au calităţi psihometrice sunt mai puţin susceptibile să ameninţe validitatea
studiilor, în timp ce alte tipuri de metode de măsurare (cum ar fi, evaluatorii independenţi sau
impresiile clinice) cresc dramatic posibilitatea ca apariţiei efectului de ameninţare a validităţii.
De exemplu, un cercetător ar putea folosi o serie de metode de măsurare a depresiei.
Cercetătorul ar putea folosi o măsură standardizată pentru a evalua simptomele de depresie,
cum ar fi ca Scala de Depresie Beck (BDI), care este o scală de auto-raportare creion - hârtie
cunoscută pentru fidelitatea şi validitatea sa (Beck et al., 1961). BDI este, de asemenea,
standardizat - respondenţii sunt expuşi la acelaşi stimuli, care reprezintă un set de întrebări
referitoare la simptomele de depresie. Un nivel ridicat de standardizare în administrare şi
scorare face puţin probabilă apariţia efectelor produse de instrumentele de măsură. Cu alte
cuvinte, cu excepţia cazului în care cercetătorii au modificat itemii BDI, modul de
administrare sau au folosit o altă versiune a instrumentului în timpul studiului, nu ne aşteptăm
ca instrumentul de măsură să ameninţe semnificativ validitatea internă a studiului.
Alte metode de măsurare sunt mai susceptibile să produce efecte asupra validităţii.
Există mai multe modalităţi de a măsura a constructul de depresie. Să presupunem că BDI a
4
fost indisponibil, astfel încât cercetătorul a trebuit să folosească o altă metodă de măsurare a
impactului tratamentului asupra simptomelor de depresie. O soluţie comună pentru această
problemă ar putea fi folosirea evaluatorilor independenţi care să evalueze nivelul simptomelor
de depresie pe criterii clinice de diagnostic care vor evalua participanţii pe parcursul
intervenţiei. Acest tip de măsurare, dacă este slab implementat, poate afecta validitatea
internă. Principala preocupare ar fi aceea că evaluatorii ar putea folosi standarde diferite
pentru a califica simptomele de depresie. Să presupunem că evaluator A are nevoie de
depreciere semnificativă a funcţionării unui participant înainte de recunoaşterea că depresia
sau simptomele depresiv sunt prezente. În plus, standardele de evaluare pentru identificarea
simptomelor şi realizarea diagnosticului de depresie ar putea fluctua semnificativ a lungul
timpului, ceea ce adaugă încă un nivel de dificultate atunci când cercetătorul încearcă să
interpreteze impactul tratamentului (variabila independentă) asupra depresie (variabilă
dependentă). Fără standardizare, există o mare probabilitatea ca schimbările variabilei
dependente în timpul tratamentului să fie rezultatul unor modificări făcute la nivelul criteriilor
de evaluare şi nu intervenţie în sine. Aceste probleme sunt de obicei eliminate prin realizarea
cursurilor de formare şi analizei fidelităţii inter-evaluator (o metodă statistică pentru
determinarea nivelului de consistenţă între diferiți evaluatori).

Testarea
Această sursă de ameninţare a validităţii interne se referă la efectele pe care un test
aplicat la un moment dat le-ar putea avea asupra administraţiilor ulterioare a acelaşi test
(Kazdin, 2003). În esenţă, atunci când participanţii la studiu sunt evaluaţi de mai multe ori pe
aceeaşi variabilă (cu acelaşi instrument sau test), performanţele acestora ar putea fi afectate de
factori, precum practica, memoria sau expectanţele participanţilor şi cercetătorilor (Pedhazur
& Schmelkin, 1991). Această ameninţare a validitatea internă este cel mai des întâlnit în
cercetările longitudinale în care participanţii sunt măsuraţi repetat în timp pe aceleaşi
variabile. Rezultatele studiului ar putea fi legate de repetarea testării sau evaluării şi nu ar fi
determinate de variabila independentă propriu-zisă.
De exemplu, să presupunem un studiu care evaluează impactul unor tehnici imagistice
asupra reţinerii unei serii aleatorii de simboluri. Mai întâi, fiecare participant va fi expus
simbolurilor aleatoare, apoi i se va cere să reproducă cât mai multe simboluri din memorie.
Lista cu simboluri serveşte ca măsură pretest sau performanţă iniţială a memoriei. Apoi,
participanţii sunt expuşi intervenţie, în care o serie de tehnici sunt folosite de către cercetători
pentru a îmbunătăţi retenţia simbolurilor. Cercetătorii cred ca memorarea simbolurilor vor
creşte pe măsură ce participanţii învaţă cele şase tehnici imagistice; cel mai înalt nivel de
reproducere va fi obținut atunci când participanții au învăţat toate tehnicile imagistice. În
acest studiu, tehnica imagistice reprezintă intervenţie sau variabila independentă, iar
memorarea simbolurilor aleatorii reprezintă variabila dependentă. Participanţii sunt expuşi
5
celor şase sarcini de învăţare. În timpul fiecărui sarcini, participantul este învăţat o anumită
tehnică imagistica, este expus stimulilor şi apoi i se cere să reproducă cât mai mulţi stimuli
după o pauză de 15 minute. Pentru toate cele şase sarcini sunt păstrate aceleaşi seturi de
simbolurilor; seturile de simboluri sunt instrument de testare şi de măsurare a rezultatelor.
Să presupunem că studiul se desfășoară şi ipotezele se confirmă. Participanţii obţin
performanţe peste valoarea iniţială obţinută la prima măsurare şi că performanţă acestora se
îmbunătăţeşte în mod constant ca pe măsură ce sunt expuşi tehnicilor suplimentare de
imagistice. Se poate spune că tehnicile folosite sunt cauză pentru îmbunătăţirea performanţei
la proba de memorie? Efectul testării subminează grav credibilitatea rezultatelor. Participanţii
sunt expuşi aceleiaşi încercări iar rezultatul este măsurat folosind acelaşi set de simboluri
aleatorii. Este posibil ca îmbunătăţirea memoriei să fie pur şi simplu un efect al practicii sau al
expunerii repetate la aceeaşi stimulii. Deoarece cercetătorii nu au ţinut cont de această
posibilă explicaţie alternativă, şi nu au folosit un grup de control sau diferiţi stimuli, aceasta
rămâne o explicaţie legitimă a concluziilor.

Regresia Statistică
Această sursă de ameninţare a validităţii internă se referă la un fenomen statistic prin
care scorurile extrem de ridicate sau de scăzute tind să se apropie de media aritmetică sau
media distribuţiei atunci când se repetă testarea (Christensen, 1988; Kazdin, 2003, Neale &
Liebert, 1973). Pentru exemplu anterior, să presupunem că am obţinut următoarele scoruri la
proba pentru măsurarea memorie: 5, 12, 18, 19, 27, 42, 55, şi 62. Media pentru acest set de
scoruri este de 30. Regresia statistică sugerează că timpul şi administrarea repetată a testului
de memorie, ar determina obţinerea de scoruri aproape de medie. Acest lucru este valabil în
special pentru scorurile extreme care se află de departe în afara distribuţiei normale. Aceste
scoruri extreme sunt de asemenea cunoscute ca valori aberante. Într-o distribuţie cu o medie
de 30, ar fi rezonabil să identificăm scorurile de 5 şi 62 ca valori aberante. Astfel, la
următoarea aplicare a testului de memorie, ne-ar aştepta ca aceste scoruri să se apropie mai
mult de medie, indiferent de efectul intervenţiei (sau al variabilei independent). În plus, cea
mai mare mişcare spre medie o vor avea scorurilor mai extreme.
Acest fenomen este deosebit de răspândită în cercetările în care avem design pre- şi
posttest pentru măsurarea variabilelor care ne interesează sau atunci când participanţii sunt
distribuiţi în grupuri experimentale şi de control pe baza scorurilor extreme. Să folosim un alt
exemplu pentru a ilustra acest lucru. Un studiu a fost conceput pentru a evalua impactul unui
nou tratament pentru anxietate. Cercetătorii sunt interesați de efectele noului tratament asupra
nivelurilor de anxietate scăzută, medie şi ridicată, valori determinate pe baza unui scor obţinut
folosind o scală standardizată de măsurare a anxietăţii. Cercetătorii speră că noul tratament va
reduce simptomele de anxietate în fiecare dintre cele trei condiţii. În consecinţă, fiecărui
participant i s-a măsurat anxietatea ca pretest pentru a stabili nivel actual de anxietate al
6
participanţilor şi aceştia sunt distribuiţi în una dintre cele trei grupe: anxietate scăzută, medie
sau ridicată pe baza scorurilor prestabilite. Să presupunem că nivelul de anxietate mediu
pentru întregul eşantion a fost 30, pentru grupul cu anxietate scăzută a fost 12, media pentru
29 grupul cu anxietate medie a fost 29, iar pentru grupul de anxietate ridicată a fost 42.
Fiecare dintre grupuri primeşte tratament, evaluarea realizându-se după 10 săptămâni.
Rezultatele studiului sugerează că anxietatea a crescut în condiţia anxietate redusă, a rămas la
aproximativ acelaşi nivel în condiţia anxietate medie, şi a scăzut în condiţia anxietate ridicată.
Rezultatele indică faptul că tratamentul este mai eficient în condiţia anxietate severă, dar
intensifică simptomele la persoanele cu anxietate scăzută, şi nu are efect asupra celor cu nivel
moderat de anxietate. Deşi aceste descoperiri ar putea fi corecte, este posibil ca rezultatele să
fie rezultatul regresiei statistice. Scorurile din grupul cu anxietate ridicată se apropie de medie
după 10 săptămâni, dând impresia că simptomele s-au redus după intervenţie. Similar,
intensificarea simptomelor în condiţia anxietate scăzută se poate datora faptului că scorurile
mici se deplasează spre medie globală a eşantionului. Prin urmare, este posibil ca să obţinem
aceleaşi rezultate chiar şi fără impactul variabilei independente. Rezultatele grupului cu
anxietate medie nu s-au schimbat deoarece acest grup a avut rezultaele cele mai aproape de
media globală a eşantionului, fiind mai puţin sensibile la efectele regresiei statistice. Este
astfel posibil ca să se formuleze concluzii eronate cu privire la eficienţa tratamentului în
ameliorarea anxietăţii.

Efectul selecţiei
Această ameninţare a validităţii interne se referă la diferenţele sistematice apărute în
distribuirea participanţilor în condiţiile experimentale. Acest factor apare predominant în
cvasi-experimente, când participanţii sunt distribuiţi în condiţii experimentale sau grupuri de
comparaţia în manieră non-randomizată (Christensen, 1988; Kazdin, 2003; Rosnow &
Rosenthal, 2002). Randomizare este o tehnică ce permite controlul diferenţelor sistematice ale
participanţilor în grupe experimental şi de control. În esenţă, randomizare distribuie uniform
şi echivalează grupurile cu privire la orice variabilă parazită posibilă. Fără randomizare este
greu să luăm în considerare şi să controlăm variaţiile sistematice produse de caracteristicile
participanţilor. Efectul selecţiei poate avea un impact negativ asupra capacităţii cercetătorului
de a formula concluzii cu privire la inferenţele cauzale.
Cel mai frecvent exemplu al efectului produs de acest factor este atunci când
cercetătorul desfăşoară cercetarea într-un context sau circumstanţe în care grupurile sunt deja
formate şi nu pot fi modificate. Cu alte cuvinte, randomizare nu este fezabilă sau posibilă. Să
luăm în considerare un design care testează eficacitatea unei intervenţii cu scopul de a
îmbunătăţi abilităţile matematice la elevii din clasa a treia. Deoarece elevii sunt deja atribuiţi
în cele două clase, randomizarea nu este posibil, prin urmare studiul fiind cvasi-experimental.
Ambele clase au fost pre-testate, apoi Clasa 1 a primit intervenţie matematică în timp ce clasa
7
a 2 a nu (grup de control). Apoi ambele clase au trecut prin etapa de post-test. Dacă Clasa 1
obţine performanţe putem concluziona că intervenţie sau variabilă independentă este
responsabilă de acest lucru? Deşi este posibil, există un număr de ipoteze alternative care nu
au fost controlate. Cele mai multe dintre aceste ipoteze fac referire la diferenţele preexistente
dintre cele două grupuri. De exemplu, este posibil ca elevii din Clasa 1 să fie mai motivaţi sau
maturi decât omologii lor din Clasa 2. Orice diferenţă preexistentă între cele două grupuri
reprezintă o ameninţare la adresa termenului de validitate. Oricare dintre aceste diferenţe ar
putea oferi o explicaţie validă pentru rezultatele produse de intervenţie asupra notelor la
matematica.

Uzura/Pierderea participanţilor
Se referă la pierderea diferenţială şi sistematică a participanţilor din grupurile
experimentale şi de control. Participanţii abandonează studiul într-un manieră sistematică şi
neîntânplătoare ceea ce afectează compoziţia originală a grupurilor formate iniţial (Beutler &
Martin, 1999). Astfel, schimbările la nivelul variabilei dependente s-ar putea datora pierderii
participanţilor şi nu manipulării variabilei independente. Cercetătorii subliniată faptul că
această ameninţare a validităţii interne este comună cercetărilor longitudinale şi depinde de
direct de durata studiului (Kazdin, 2003, Phillips, 1985). În general, ratele medii de pierdere
în cercetările longitudinale se găsesc între 40 şi 60%, majoritatea participanţilor renunţând la
studiu în etape timpurii ale studiului (Kazdin, 2003). Fenomenul se aplică celor mai multe
forme de grupe şi design-uri cu un singur caz şi pot reprezenta o ameninţare la adresa
validităţii interne, chiar dacă cercetătorul a repartizat aleatoriu participanți în grupele
experimentale şi de control. Acest lucru se datorează faptului că uzura apare când studiul se
desfăşoară şi după participanţi au fost distribuiţi în grupe.
Uzură creşte posibilitatea ca grupurile să difere în funcţie de anumite caracteristici
care au fost iniţial controlate de prin randomizare. Cu alte cuvinte, participanţii rămaşi nu mai
reprezintă eşantionul original şi grupurile pot să nu mai fie echivalente. Să presupunem că un
cercetător decide să efectueze un studiu asupra eficacităţii unui nou medicament asupra
simptomelor de anxietate. Randomizarea a fost folosită pentru a distribui participanţii fie în
grupul experimental fie în cel placebo (de control). Să presupunem că în timpul studiului,
participanţii la grupul experimental au reacţii adverse relativ severe la medicament şi o
creştere a anxietăţii, ceea ce îi determină să renunţe la studiu. Grupul placebo nu are efecte
adverse, astfel încât rata de abandon este mai mică în acest grup. Anxietăţile medii ale celor
două grupuri au fost comparate la încheierea studiului, rezultatele sugerând că participanţii
din grupul experimental au un nivel mai scăzut al anxietăţii decât cei din grupul placebo.
Rezultatele par să susţină ipoteza că tratamentul a fost eficient pentru tratarea anxietăţii.
Problema acestei concluzii este că rezultatele sunt contaminate de pierderea subiecţilor. Dacă
participanții din grupul experimental nu ar fi renunţat la studiu probabil că rezultatele ar fi fost
8
diferite. În acest exemplu, pierderea participanţilor a ameninţat validitatea după randomizare,
eşantionul final fiind diferit de eşantionul iniţial folosit pentru a forma grupul experimentale şi
de control.

Difuzarea sau imitarea tratamentului


Această sursă de ameninţare este comună pentru diferite forme studii medicale şi
psihoterapeutice, şi se manifestă în prin două seturi distincte, dar legate, de circumstanţe.
Primul set de circumstanţe este reprezentat de expunerea neintenţionată a grupului de control
la intervenţia experimentale sau unei intervenţii similare (variabilă independentă) destinate
doar condiţiei experimentale (Kazdin, 2003; Pedhazur & Schmelkin, 1991). Să presupunem
că un studiu a examinat beneficiile relative ale exerciţiului şi consilierii nutriţională asupra
pierderii în greutate. Cercetătorii au presupus că exerciţiul este mai eficient decât consiliere
nutriţională şi au distribuit participanţii în grupul exerciţiu, consiliere nutriţională şi respectiv
non-intervenţie (grup de control). Grupul experimental a primit un program de exerciţii
personalizate, cei din grupul cu regim au primit consiliere nutriţională, iar cei din grupul de
control au fost doar monitorizaţi în ceea ce priveşte pierdere sau creşterea în greutate pe
aceeaşi perioadă de timp.
Pe parcursul studiului, bine intenţionat, dar greşit, consilierul laudă beneficiile
exerciţiilor fizice membrilor grupului consiliere nutriţională. Această consiliere suplimentară
nu a fost parte a designului original şi cercetătorii nu sunt conştienţi că această consiliere are
loc. Deşi participanţii din grupul consiliere nu primesc exerciţii efective ca intervenţie,
discuţia cu privire la rolul exerciţiilor ar putea avea consecinţe neintenţionate şi necontrolate.
De exemplu, aceste informare ar putea încuraja participanţii din grupul consiliere nutriţională
să caute un program de exerciții propriu sau să îşi schimbe obiceiurile zilnice într-un mod care
ar creşte nivelul de activitate generală (ar fi folosi scările în locul liftului). Astfel, acest grup
de control a primit o intervenţie similară cu cea a grupului experimental. Rezultatele ar putea
fi contaminate, deoarece grupul consiliere nutriţională nu s-a desfășurat aşa cum s-a prevăzută
iniţial, condiţia de exerciţiu s-a extins şi asupra grupului consiliere nutriţională. Ameninţare în
acest exemplu constă în posibilitatea ca grupul exerciţiu şi cel de consiliere să fi primit
intervenţii similare, ceea ce ar fi putut egaliza performanta în cadrul grupurilor (Kazdin,
2003).
Al doilea set de circumstanţe apare atunci când grupul experimental nu primeşte deloc
intervenţie stabilită (Kazdin, 2003; Pedhazur & Schmelkin, 1991). În acest caz, cercetătorul
consideră că grupul experimental a primit intervenţie când în realitate, nu s-a întâmplat acest
lucru. Aceasta este o sursă de ameninţare comună multor forme de cercetare realizate în
domeniul psihoterapiei. De exemplu, un studiu a comparat eficacitatea terapiei
comportamentale şi a celei psihodinamice asupra depresiei. Două terapeuţi au fost recrutaţi şi
instruiţi pentru a aplica intervenţiile. Ambii terapeuţi aveau o orientare psihodinamică, astfel
9
încât ei au primit instruire suplimentară pentru tehnicile comportamentale. Participanţii au
primit una dintre cele două tratamente, iar rezultatele au sugerat că ambele terapii sunt la fel
de eficiente. Ceea ce cercetătorii nu ştiu este că terapeutul care aplica terapia
comportamentală, intenţionat sau nu, s-a abătut de la protocol specific şi a inclus elemente
specifice tratament psihodinamic în condiţie intervenţia comportamentală. Cu alte cuvinte,
grupul terapie comportamentală este posibil să nu fi primit o intervenție comportamentală
doar. În cel mai bun caz a primit un hibrid de tratament psihodinamic şi comportamental. Ca
şi în exemplul nostru anterior, decât să compararea cele două condiţii mai bine cercetătorii au
comparat două condiţii asemănătoare mult mai similare decât s-a prevăzut în designul
originale de cercetare. Astfel, au fost egalizate performanţele celor două grupuri
experimentale, ceea ce a avut ca efect distorsionarea rezultatelor studiului.

Tratament special sau reacţii la control


Această ameninţare este relativ comună deoarece poate fi cauzată de un tratament
special sau compensatoriu, sau de atenţia acordată grupului de control. Chiar şi în absenţa
atenţiei sau tratamentului special, cei din grupul de control îşi pot da seama că sunt într-o
"mică" condiţie şi reacţionează în competiţie sau îşi îmbunătăţesc performanţele. Oricare
dintre aceste situaţii poate egaliza performanţele din condiţiilor experimentale şi cele de
control şi astfel se "elimină" diferenţele de grupuri în ceea ce priveşte variabila dependentă
(Christensen, 1988; Kazdin, 2003; Pedhazur & Schmelkin, 1991). Tratamentul special în sine
este o sursă de ameninţare destul de comună pentru validitatea internă şi avea legătură cu un
număr de activităţi desfăşurate în grup de control (neintervenţie). În acest caz, intervenţia este
variabilă independentă. Aceşti factori variază de la simplă interacţiune umană până la
exemple concrete, cum ar fi o compensaţie financiară sau privilegii speciale.
De exemplu, atenţia singură poate produce o schimbare neintenţionată la nivelul
comportamentului. Să presupunem că există două grupuri într-un studiu asupra depresiei.
Grupul de intervenţie sau experimental primeşte tratament în timp ce grupul de control este
pur şi simplu monitorizat săptămânal în ceea ce priveşte severitatea simptomelor.
Monitorizarea constă în de un interviu structurat de o jumătate de oră cu un asistent de
cercetare. Această atenţie săptămânală ar putea acţiona ca o intervenţie în ciuda faptului că a
fost destinată doar în scopul monitorizării. Probabil că interviurile dau participanţilor din
grupul de control posibilitatea de a discuta despre simptomele lor, cea ce produce o scădere a
simptomelor chiar fără tratamentul în sine. Astfel, suportul sociale poate avea o legătură
pozitivă cu depresia.
Acelaşi efect poate fi observat chiar şi în lipsa contactului uman. De exemplu, doar
completarea unei scale de auto-raportare a simptomelor depresive într-o cameră goală ar putea
avea acelaşi efect prin creşterea gradului de conştientizare a participanţilor din grupul de
control în ceea ce priveşte nivelul actual simptomelor depresive. Reîntărire şi alte stimulente
10
ar putea avea un efect similar. Oferirea participanţilor din grupul de control a unor privilegii
financiare sau alte privilegii speciale ar putea avea un impact asupra nivelului de depresie ca
urmare a creşterii stimei de sine sau reducerii lipsei de speranţă. La fel ca difuzarea sau
imitarea tratamentului, această sursă de ameninţare a validităţii internă ar putea egaliza
performanţele a grupurilor experimentale şi control, ceea ce ar avea ca efect denaturarea
rezultatele studiului.
În concluzie, ameninţările validităţii interne sunt frecvente şi uneori inevitabil. Ele pot
să apară singure sau în combinaţie, şi pot crea ipoteze alternative plauzibile pentru rezultatele
unui studiu. Aceste ipoteze rivale pot face dificilă determinarea relaţiei de cauzalitate. Unele
dintre aceste ameninţări pot fi controlate eficient, în etapa de proiectare desfăşurată înaintea
studiului (de exemplu, grup de control şi randomizare), în timp ce altele (de exemplu,
pierderea diferenţiată a participanților) au loc în timpul studiului. Cumularea acestor
ameninţări reprezintă un aspect critic şi în funcţie de metodologia de cercetare care are loc
este posibil ca studiul să rămână în faza de proiectare.

11

S-ar putea să vă placă și