Sunteți pe pagina 1din 3

Transformarea datelor – Normalizarea distribuțiilor

Procedura transformării datelor se aplică pentru a corecta problemele legate de încălcarea


asumțiilor de normalitate, liniaritate sau varianțe inegale. Asumțiile fiind apoi îndeplinite, vom
putea aplica procedurile parametrice dorite.
Normalitatea distribuţiei datelor este foarte importantă pentru majoritatea tehnicilor
statistice în care se porneşte de la premisa unei distribuţii normale.
Când acest aspect nu se verifică avem la dispoziţie trei soluţii:
 Aplicăm tehnici parametrice cu bootstraping;
 Folosim tehnici non-parametrice;
 Transformăm datele pentru a normaliza pe cât posibil distribuţia.
Distribuţiile non-normale ridică probleme diferite: unele distribuţii sunt platicurtice, altele
puternic asimetrice pozitiv (înclinate la stânga) sau asimetrice negativ (înclinate la dreapta). În
cazuri grave apar apr atât devieri ale boltirii cât şi ale oblicităţii.

Asimetrie pozitivă moderată Asimetrie negativă moderată


Rădăcina pătrată Rădăcina pătrată din numărul reflectat

Asimetrie pozitivă severă Asimetrie negativă severă


Logaritm natural Logaritm natural din numărul reflectat

Asimetrie pozitivă extremă („I”) Asimetrie negativă extremă („J”)


Inversul numărului (1/x) Inversul numărului reflectat

După transformare, se obţine o normalizare aproximativă a distribuţiei, şi se pot folosi orice


fel de statistici care au drept premisă distribuţia normală.
Obs: Singurul lucru care se pierde este unitatea de măsură a variabilei transformate
Ex. Dacă venitul exprimat în RON are o distribuţie asimetrică pozitivă care necesită
logaritmare, valorile transformate reprezentând venitul vor avea ca unitate de măsură „RON
logaritmaţi”
În psihologie rezultatele brute la un test nu au o unitate de măsură clară, iar efectul asupra
unităţii de măsură nu există.

Reflectarea datelor: Se adună 1 la valoarea maximă observată. Din valoarea obţinută se


scade fiecare valoare observată. (1 + X max) – X

O distribuţie platicurtică (aplatizată) se normalizează prin radical.


O distribuţie leptocurtică – ridicarea la pătrat sau la cub, pentru a se împrăştia valorile.

Atenţie! Când calculăm inversul numărului (1/ X) sau numărul reflectat, ordinea scorurilor
subiecţilor se schimbă: subiectul cu scorul cel mai mare devine subiectul cu scorul cel mai mic!

1
Skewness pozitiv Skewness negativ

2
Cele mai frecvente transformări sunt: transformarea prin radical, transformarea prin logarit,
transformarea prin inversare și transformarea prin numărul reflectat (Field, A., 2013).
(a) Transformarea prin radical presupune aplicarea funcției radical pentru scorurile brute
ale variabilei care ne interesează. Trebuie să fim atenți ca scorurile brute să fie pozitive. Dacă
scorurile brute conțin valori negative, vom aduna mai întâi la variabila analizată o constantă și abia
apoi vom aplica funcția radical. Calea în SPSS este Transform, Compute Variable, din câmpul
Function group alegem Arithmetic, apoi din câmpul Functions and Special Variables alegem Sqrt
și click pe săgeată în sus. Transformarea prin radical aduce scorurile extreme mai aproape de
centru, fiind utilă pentru transformarea distribuțiilor cu asimetrie pozitivă. Această transformare
reduce valorile Skewness pozitiv, Kurtosis pozitiv, fiind o corecție și pentru cazul varianțelor
inegale sau a absenței relației de liniaritate dintre variabile.
(b) Transformarea prin logaritmare presupune aplicarea funcției logaritm (log (X)). La fel
ca în cazul funcției radical, este necesar ca scorurile brute să fie pozitive. Această transformare
reduce “coada” din dreapta distribuției. Calea în SPSS este similară ca în cazul funcției radical,
doar că vom alege funcția Lg10. Transformarea prin logaritm poate fi utilă și dacă avem probleme
cu relația de liniaritate între variabile, putând face ca o relație curbiliniară să devină liniară. Această
transformare reduce valorile Skewness pozitiv, Kurtosis pozitiv, fiind o corecție și pentru cazul
varianțelor inegale sau a absenței relației de liniaritate dintre variabile.
(c) Transformarea prin inversare (1/ X) presupune construirea unei noi variabile prin
împărțirea valorii 1 la fiecare scor al variabilei analizate. Prin această transformare se reduce
impactul scorurilor mari, numerele foarte mari devenind aproape de zero. Trebuie să reținem că
scorurile foarte mari devin după transformare scoruri mici iar scorurile mici devin mari. Astfel, se
inversează ordinea inițială a scorurilor din variabilă (scorul maxim devine minim iar cel minim
devine maxim). Acest lucru este foarte important în cazul aplicării ulterioare a unor tehnici
statistice bazate pe coeficienții de corelație. În cazul corelației, dacă înainte de transformare,
corelația dintre X și Y era pozitivă, după transformare această corelație devine negativă, și
reciproc. Această transformare reduce valorile Skewness pozitiv, Kurtosis pozitiv, fiind o corecție
și pentru cazul varianțelor inegale.
(d) Transformarea prin numărul reflectat – se folosește în cazul distribuțiilor cu asimetrie
negativă. Toate transformările menționate mai sus pot fi folosite în cazul unor distribuții cu
asimetrie pozitivă (Skewness pozitiv). În cazul distribuțiilor cu asimetrie negativă (skewness
negativ), se procedează mai întâi la transformarea prin numărul reflectat. Pentru aceasta, vom
scădea fiecare scor brut al variabilei din scorul maxim observat la care am adăugat valoarea 1,
astfel: [(Xmax+ 1) – X]. În continuare, putem aplicare oricare dintre transformările de mai sus (prin
radical, logaritm sau inversare). Vom fi atenți că transformarea prin numărul reflectat conduce la
inversarea ordinii scorurilor, la fel ca în cazul transformării prin inversare, urmând consecințele
amintite mai sus.
O variantă rapidă a efectului acestor transformări în cazul varianțelor neomogene poate fi
urmând calea în SPSS Descriptives Statistics – Explore, unde vom aplica testul Levene activând
opțiunea Transformed și alegând transformarea dorită din lista afișată.
În cazul în care nici o transformare nu ajută la normalizarea distribuției, o soluție la
îndemână ar fi dihotomizarea variabilei respective și folosirea ei în analizele statistice ca variabilă
dihotomică.