Documente Academic
Documente Profesional
Documente Cultură
Factori Istorici
În general, factorii istorici ca sursă de ameninţare a validităţii interne se referă la
evenimente sau incidente care au loc în timpul studiului şi care ar putea avea un impact
neintenţionat şi necontrolat asupra rezultatelor studiului (sau variabilei dependente; Kazdin,
2003). Aceste evenimente sunt suficient de globale pentru a afecta cei mai mulţi dintre
participanţii la studiu. Acestea pot apărea în interiorul sau în afara studiului, de obicei apar
între fazele de pre- şi post-măsurare a variabilei dependente. Impactul factorilor istorici este,
de obicei, observat în faza de post-măsurare şi este mai accentuat în cazul studiilor
longitudinale care se desfăşoară pe o perioadă lungă de timp. În consecinţă, cu cât perioada de
timp între pre- şi post-măsurare este mai mare cu atât mai mare este probabilitatea ca factorii
istorici să contamineze rezultatele studiului (Christensen, 1988).
Un exemplu poate fi studiul anterior în care simptomele de depresie au fost evaluate
la 6 luni după finalizarea programului de formare a competenţelor. Este posibil ca alte
evenimente importante să fi avut loc în această perioadă de timp, acestea putând explica
reducerea simptomelor de depresie ale adolescenţilor. O ar fi posibilitate ar fi ca școala să se
fi încheiat şi vacanţa de vară să fi început, ceea ce a produs o scădere a simptomelor depresive
în eşantionul de adolescenţi. Deci, scăderea depresie ar putea fi cauzată de un factor istoric, şi
nu la variabila independentă (competenţele formate ale părinţilor). Evenimente istorice pot
avea loc în cadrul unui studiu, deşi acest lucru este mai puţin frecvent. De exemplu, o ceartă
între doi cercetători, care are loc în prezenţa participanţilor şi care nu face parte din
intervenţie experimentală poate fi un eveniment care poate avea un efect.
Maturizare
Această ameninţare a validităţii interne este similar cu cea produsă de factorii istorici
şi are legătură cu modificări ce apar în timp. Spre deosebire de factorii istorici, maturizarea se
referă la schimbările interne ale participanţilor, şi care de obicei, sunt legate de trecerea
timpului. Cele mai frecvent citate exemple implică atât schimbările biologice şi cele
psihologice, cum ar fi îmbătrânirea, învăţarea, oboseala sau foame (Christensen, 1988). Ca şi
în cazul factorilor istorici, modificările produse de maturizare au loc între fazele de pre- şi
post-măsurare şi interferează cu interpretările relaţiei cauzale. Ameninţările factorilor istorici
şi maturizare apar în combinaţie în studiile longitudinale. În exemplul nostru cu privire la
formarea competenţelor parentale, este posibil ca simptomele de depresie să scadă deoarece
părinţii au avut 6 luni suplimentare pentru a se dezvolta ca părinţi, indiferent dacă au
participat sau nu la programul de formare a competenţelor? Deşi e puţin probabil, ca aceasta
ipoteză alternativă rivală să poată fi luată în considerare şi controlată, este mai probabilă
3
includerea unui grup de control sau de comparaţie care nu primește nici un fel de pregătire.
Un alt exemplu ar putea fi un studiu care a examinat efectele vizualizării asupra puterii fizice
a adolescenţilor de sex masculin pe o perioadă specifică de timp. Deoarece adolescenţi se
maturizează, ne aşteptăm să vedem o creştere a puterii acestora, indiferent de intervenţie.
Deci, orice declaraţie cu privire la relaţia de cauzalitate dintre vizualizare şi putere în
eşantionul de adolescenţi trebuie luată analizată în contextul maturizării. Această sursă de
ameninţare poate fi minimizată prin utilizarea unui grup de control sau de comparaţie.
Instrumente
Această ameninţare a validităţii interne nu are legătură cu caracteristicile
participanţilor şi se referă la schimbări în măsurarea variabilei independente. Are de obicei
legătură cu schimbări în timp apărute la nivelul instrumentelor de măsurare sau a procedurilor
de măsurare (Christensen, 1988; Kazdin, 2003). În esenţă, instrumentele pot compromite
validitatea internă atunci când schimbările apărute la nivelul variabilei dependente sunt
rezultat al modificărilor în timp ale instrumentelor de măsură şi ale criteriilor de scorare.
Există o mare varietate de tehnici de măsurare şi evaluare pe care cercetătorii le au la
dispoziţie, şi unele dintre acestea sunt mai susceptibile să afecteze validitatea internă. De
obicei efectul instrumentelor este o funcţie a standardizării.
Standardizare se referă la regulile stabilite în administraţia şi scorarea unui instrument
sau ale altor metode de măsurare, şi care de asemenea, cuprinde conceptele psihometrice de
fidelitate şi valabilitate. O caracteristică a măsurării este fidelitatea care se referă la
consecvenţa în măsurarea unei anumite caracteristici. Termenului de validitate indică dacă
scala utilizată în studiu măsoară ceea ce şi-a propus să măsoare. Instrumentele care sunt
standardizate şi au calităţi psihometrice sunt mai puţin susceptibile să ameninţe validitatea
studiilor, în timp ce alte tipuri de metode de măsurare (cum ar fi, evaluatorii independenţi sau
impresiile clinice) cresc dramatic posibilitatea ca apariţiei efectului de ameninţare a validităţii.
De exemplu, un cercetător ar putea folosi o serie de metode de măsurare a depresiei.
Cercetătorul ar putea folosi o măsură standardizată pentru a evalua simptomele de depresie,
cum ar fi ca Scala de Depresie Beck (BDI), care este o scală de auto-raportare creion - hârtie
cunoscută pentru fidelitatea şi validitatea sa (Beck et al., 1961). BDI este, de asemenea,
standardizat - respondenţii sunt expuşi la acelaşi stimuli, care reprezintă un set de întrebări
referitoare la simptomele de depresie. Un nivel ridicat de standardizare în administrare şi
scorare face puţin probabilă apariţia efectelor produse de instrumentele de măsură. Cu alte
cuvinte, cu excepţia cazului în care cercetătorii au modificat itemii BDI, modul de
administrare sau au folosit o altă versiune a instrumentului în timpul studiului, nu ne aşteptăm
ca instrumentul de măsură să ameninţe semnificativ validitatea internă a studiului.
Alte metode de măsurare sunt mai susceptibile să produce efecte asupra validităţii.
Există mai multe modalităţi de a măsura a constructul de depresie. Să presupunem că BDI a
4
fost indisponibil, astfel încât cercetătorul a trebuit să folosească o altă metodă de măsurare a
impactului tratamentului asupra simptomelor de depresie. O soluţie comună pentru această
problemă ar putea fi folosirea evaluatorilor independenţi care să evalueze nivelul simptomelor
de depresie pe criterii clinice de diagnostic care vor evalua participanţii pe parcursul
intervenţiei. Acest tip de măsurare, dacă este slab implementat, poate afecta validitatea
internă. Principala preocupare ar fi aceea că evaluatorii ar putea folosi standarde diferite
pentru a califica simptomele de depresie. Să presupunem că evaluator A are nevoie de
depreciere semnificativă a funcţionării unui participant înainte de recunoaşterea că depresia
sau simptomele depresiv sunt prezente. În plus, standardele de evaluare pentru identificarea
simptomelor şi realizarea diagnosticului de depresie ar putea fluctua semnificativ a lungul
timpului, ceea ce adaugă încă un nivel de dificultate atunci când cercetătorul încearcă să
interpreteze impactul tratamentului (variabila independentă) asupra depresie (variabilă
dependentă). Fără standardizare, există o mare probabilitatea ca schimbările variabilei
dependente în timpul tratamentului să fie rezultatul unor modificări făcute la nivelul criteriilor
de evaluare şi nu intervenţie în sine. Aceste probleme sunt de obicei eliminate prin realizarea
cursurilor de formare şi analizei fidelităţii inter-evaluator (o metodă statistică pentru
determinarea nivelului de consistenţă între diferiți evaluatori).
Testarea
Această sursă de ameninţare a validităţii interne se referă la efectele pe care un test
aplicat la un moment dat le-ar putea avea asupra administraţiilor ulterioare a acelaşi test
(Kazdin, 2003). În esenţă, atunci când participanţii la studiu sunt evaluaţi de mai multe ori pe
aceeaşi variabilă (cu acelaşi instrument sau test), performanţele acestora ar putea fi afectate de
factori, precum practica, memoria sau expectanţele participanţilor şi cercetătorilor (Pedhazur
& Schmelkin, 1991). Această ameninţare a validitatea internă este cel mai des întâlnit în
cercetările longitudinale în care participanţii sunt măsuraţi repetat în timp pe aceleaşi
variabile. Rezultatele studiului ar putea fi legate de repetarea testării sau evaluării şi nu ar fi
determinate de variabila independentă propriu-zisă.
De exemplu, să presupunem un studiu care evaluează impactul unor tehnici imagistice
asupra reţinerii unei serii aleatorii de simboluri. Mai întâi, fiecare participant va fi expus
simbolurilor aleatoare, apoi i se va cere să reproducă cât mai multe simboluri din memorie.
Lista cu simboluri serveşte ca măsură pretest sau performanţă iniţială a memoriei. Apoi,
participanţii sunt expuşi intervenţie, în care o serie de tehnici sunt folosite de către cercetători
pentru a îmbunătăţi retenţia simbolurilor. Cercetătorii cred ca memorarea simbolurilor vor
creşte pe măsură ce participanţii învaţă cele şase tehnici imagistice; cel mai înalt nivel de
reproducere va fi obținut atunci când participanții au învăţat toate tehnicile imagistice. În
acest studiu, tehnica imagistice reprezintă intervenţie sau variabila independentă, iar
memorarea simbolurilor aleatorii reprezintă variabila dependentă. Participanţii sunt expuşi
5
celor şase sarcini de învăţare. În timpul fiecărui sarcini, participantul este învăţat o anumită
tehnică imagistica, este expus stimulilor şi apoi i se cere să reproducă cât mai mulţi stimuli
după o pauză de 15 minute. Pentru toate cele şase sarcini sunt păstrate aceleaşi seturi de
simbolurilor; seturile de simboluri sunt instrument de testare şi de măsurare a rezultatelor.
Să presupunem că studiul se desfășoară şi ipotezele se confirmă. Participanţii obţin
performanţe peste valoarea iniţială obţinută la prima măsurare şi că performanţă acestora se
îmbunătăţeşte în mod constant ca pe măsură ce sunt expuşi tehnicilor suplimentare de
imagistice. Se poate spune că tehnicile folosite sunt cauză pentru îmbunătăţirea performanţei
la proba de memorie? Efectul testării subminează grav credibilitatea rezultatelor. Participanţii
sunt expuşi aceleiaşi încercări iar rezultatul este măsurat folosind acelaşi set de simboluri
aleatorii. Este posibil ca îmbunătăţirea memoriei să fie pur şi simplu un efect al practicii sau al
expunerii repetate la aceeaşi stimulii. Deoarece cercetătorii nu au ţinut cont de această
posibilă explicaţie alternativă, şi nu au folosit un grup de control sau diferiţi stimuli, aceasta
rămâne o explicaţie legitimă a concluziilor.
Regresia Statistică
Această sursă de ameninţare a validităţii internă se referă la un fenomen statistic prin
care scorurile extrem de ridicate sau de scăzute tind să se apropie de media aritmetică sau
media distribuţiei atunci când se repetă testarea (Christensen, 1988; Kazdin, 2003, Neale &
Liebert, 1973). Pentru exemplu anterior, să presupunem că am obţinut următoarele scoruri la
proba pentru măsurarea memorie: 5, 12, 18, 19, 27, 42, 55, şi 62. Media pentru acest set de
scoruri este de 30. Regresia statistică sugerează că timpul şi administrarea repetată a testului
de memorie, ar determina obţinerea de scoruri aproape de medie. Acest lucru este valabil în
special pentru scorurile extreme care se află de departe în afara distribuţiei normale. Aceste
scoruri extreme sunt de asemenea cunoscute ca valori aberante. Într-o distribuţie cu o medie
de 30, ar fi rezonabil să identificăm scorurile de 5 şi 62 ca valori aberante. Astfel, la
următoarea aplicare a testului de memorie, ne-ar aştepta ca aceste scoruri să se apropie mai
mult de medie, indiferent de efectul intervenţiei (sau al variabilei independent). În plus, cea
mai mare mişcare spre medie o vor avea scorurilor mai extreme.
Acest fenomen este deosebit de răspândită în cercetările în care avem design pre- şi
posttest pentru măsurarea variabilelor care ne interesează sau atunci când participanţii sunt
distribuiţi în grupuri experimentale şi de control pe baza scorurilor extreme. Să folosim un alt
exemplu pentru a ilustra acest lucru. Un studiu a fost conceput pentru a evalua impactul unui
nou tratament pentru anxietate. Cercetătorii sunt interesați de efectele noului tratament asupra
nivelurilor de anxietate scăzută, medie şi ridicată, valori determinate pe baza unui scor obţinut
folosind o scală standardizată de măsurare a anxietăţii. Cercetătorii speră că noul tratament va
reduce simptomele de anxietate în fiecare dintre cele trei condiţii. În consecinţă, fiecărui
participant i s-a măsurat anxietatea ca pretest pentru a stabili nivel actual de anxietate al
6
participanţilor şi aceştia sunt distribuiţi în una dintre cele trei grupe: anxietate scăzută, medie
sau ridicată pe baza scorurilor prestabilite. Să presupunem că nivelul de anxietate mediu
pentru întregul eşantion a fost 30, pentru grupul cu anxietate scăzută a fost 12, media pentru
29 grupul cu anxietate medie a fost 29, iar pentru grupul de anxietate ridicată a fost 42.
Fiecare dintre grupuri primeşte tratament, evaluarea realizându-se după 10 săptămâni.
Rezultatele studiului sugerează că anxietatea a crescut în condiţia anxietate redusă, a rămas la
aproximativ acelaşi nivel în condiţia anxietate medie, şi a scăzut în condiţia anxietate ridicată.
Rezultatele indică faptul că tratamentul este mai eficient în condiţia anxietate severă, dar
intensifică simptomele la persoanele cu anxietate scăzută, şi nu are efect asupra celor cu nivel
moderat de anxietate. Deşi aceste descoperiri ar putea fi corecte, este posibil ca rezultatele să
fie rezultatul regresiei statistice. Scorurile din grupul cu anxietate ridicată se apropie de medie
după 10 săptămâni, dând impresia că simptomele s-au redus după intervenţie. Similar,
intensificarea simptomelor în condiţia anxietate scăzută se poate datora faptului că scorurile
mici se deplasează spre medie globală a eşantionului. Prin urmare, este posibil ca să obţinem
aceleaşi rezultate chiar şi fără impactul variabilei independente. Rezultatele grupului cu
anxietate medie nu s-au schimbat deoarece acest grup a avut rezultaele cele mai aproape de
media globală a eşantionului, fiind mai puţin sensibile la efectele regresiei statistice. Este
astfel posibil ca să se formuleze concluzii eronate cu privire la eficienţa tratamentului în
ameliorarea anxietăţii.
Efectul selecţiei
Această ameninţare a validităţii interne se referă la diferenţele sistematice apărute în
distribuirea participanţilor în condiţiile experimentale. Acest factor apare predominant în
cvasi-experimente, când participanţii sunt distribuiţi în condiţii experimentale sau grupuri de
comparaţia în manieră non-randomizată (Christensen, 1988; Kazdin, 2003; Rosnow &
Rosenthal, 2002). Randomizare este o tehnică ce permite controlul diferenţelor sistematice ale
participanţilor în grupe experimental şi de control. În esenţă, randomizare distribuie uniform
şi echivalează grupurile cu privire la orice variabilă parazită posibilă. Fără randomizare este
greu să luăm în considerare şi să controlăm variaţiile sistematice produse de caracteristicile
participanţilor. Efectul selecţiei poate avea un impact negativ asupra capacităţii cercetătorului
de a formula concluzii cu privire la inferenţele cauzale.
Cel mai frecvent exemplu al efectului produs de acest factor este atunci când
cercetătorul desfăşoară cercetarea într-un context sau circumstanţe în care grupurile sunt deja
formate şi nu pot fi modificate. Cu alte cuvinte, randomizare nu este fezabilă sau posibilă. Să
luăm în considerare un design care testează eficacitatea unei intervenţii cu scopul de a
îmbunătăţi abilităţile matematice la elevii din clasa a treia. Deoarece elevii sunt deja atribuiţi
în cele două clase, randomizarea nu este posibil, prin urmare studiul fiind cvasi-experimental.
Ambele clase au fost pre-testate, apoi Clasa 1 a primit intervenţie matematică în timp ce clasa
7
a 2 a nu (grup de control). Apoi ambele clase au trecut prin etapa de post-test. Dacă Clasa 1
obţine performanţe putem concluziona că intervenţie sau variabilă independentă este
responsabilă de acest lucru? Deşi este posibil, există un număr de ipoteze alternative care nu
au fost controlate. Cele mai multe dintre aceste ipoteze fac referire la diferenţele preexistente
dintre cele două grupuri. De exemplu, este posibil ca elevii din Clasa 1 să fie mai motivaţi sau
maturi decât omologii lor din Clasa 2. Orice diferenţă preexistentă între cele două grupuri
reprezintă o ameninţare la adresa termenului de validitate. Oricare dintre aceste diferenţe ar
putea oferi o explicaţie validă pentru rezultatele produse de intervenţie asupra notelor la
matematica.
Uzura/Pierderea participanţilor
Se referă la pierderea diferenţială şi sistematică a participanţilor din grupurile
experimentale şi de control. Participanţii abandonează studiul într-un manieră sistematică şi
neîntânplătoare ceea ce afectează compoziţia originală a grupurilor formate iniţial (Beutler &
Martin, 1999). Astfel, schimbările la nivelul variabilei dependente s-ar putea datora pierderii
participanţilor şi nu manipulării variabilei independente. Cercetătorii subliniată faptul că
această ameninţare a validităţii interne este comună cercetărilor longitudinale şi depinde de
direct de durata studiului (Kazdin, 2003, Phillips, 1985). În general, ratele medii de pierdere
în cercetările longitudinale se găsesc între 40 şi 60%, majoritatea participanţilor renunţând la
studiu în etape timpurii ale studiului (Kazdin, 2003). Fenomenul se aplică celor mai multe
forme de grupe şi design-uri cu un singur caz şi pot reprezenta o ameninţare la adresa
validităţii interne, chiar dacă cercetătorul a repartizat aleatoriu participanți în grupele
experimentale şi de control. Acest lucru se datorează faptului că uzura apare când studiul se
desfăşoară şi după participanţi au fost distribuiţi în grupe.
Uzură creşte posibilitatea ca grupurile să difere în funcţie de anumite caracteristici
care au fost iniţial controlate de prin randomizare. Cu alte cuvinte, participanţii rămaşi nu mai
reprezintă eşantionul original şi grupurile pot să nu mai fie echivalente. Să presupunem că un
cercetător decide să efectueze un studiu asupra eficacităţii unui nou medicament asupra
simptomelor de anxietate. Randomizarea a fost folosită pentru a distribui participanţii fie în
grupul experimental fie în cel placebo (de control). Să presupunem că în timpul studiului,
participanţii la grupul experimental au reacţii adverse relativ severe la medicament şi o
creştere a anxietăţii, ceea ce îi determină să renunţe la studiu. Grupul placebo nu are efecte
adverse, astfel încât rata de abandon este mai mică în acest grup. Anxietăţile medii ale celor
două grupuri au fost comparate la încheierea studiului, rezultatele sugerând că participanţii
din grupul experimental au un nivel mai scăzut al anxietăţii decât cei din grupul placebo.
Rezultatele par să susţină ipoteza că tratamentul a fost eficient pentru tratarea anxietăţii.
Problema acestei concluzii este că rezultatele sunt contaminate de pierderea subiecţilor. Dacă
participanții din grupul experimental nu ar fi renunţat la studiu probabil că rezultatele ar fi fost
8
diferite. În acest exemplu, pierderea participanţilor a ameninţat validitatea după randomizare,
eşantionul final fiind diferit de eşantionul iniţial folosit pentru a forma grupul experimentale şi
de control.
11