Sunteți pe pagina 1din 7

Capitolul 10

Reprezentări grafice de tip nor de puncte

Diagramele de tip nor de puncte (sau scatterplot) ne vin în ajutor atunci când dorim să
identificăm tipul de relaţie dintre două variabile continue. O condiţie principală care trebuie
verificată înainte de a rula anumite analize statistice, precum corelaţia parametrică sau regresia,
este existenţa unei relaţii liniare între variabilele implicate. Acest lucru poate fi realizat doar
vizual, cu ajutorul unui grafic de tip scatterplot.
Mai mult chiar, o diagramă “nor de puncte” ne poate ajuta să identificăm valorile extreme
din seria de date, dacă există.
Vom utiliza pentru acest exemplu două variabile din baza de date Employee data:
salbegin (salariul iniţial al unui angajat) şi salary (salariul curent). Dorim să stabilim dacă relaţia
dintre ele este sau nu liniară.
Credem că cititorul este deja bine familiarizat cu tehnica de construire a graficelor în
SPSS; drept urmare, nu vom mai insista asupra detaliilor (care se găsesc în capitolele 8 şi 9), ci
vom descrie pe scurt etapele ce trebuie urmate.
După activarea modulului de construire a graficelor (vezi figura 8.1), se va selecta
opţiunea Scatter/Dot din lista tipurilor de diagrame, apoi va fi trasă în fereastra de previzualizare
prima icoană de pe rândul de sus. Apoi vor fi definite axele de coordonate, astfel:
- pe axa X vom plasa variabila salbegin;
- pe axa Y vom plasa variabila salary.
Amplasarea variabilelor pe cele două axe nu se face tocmai la întâmplare; pe axa
categoriilor trebuie să fie reprezentată variabila independentă, iar pe axa valorilor variabila
dependentă. În cazul nostru, este logic să considerăm că salariul actual al unui angajat va depinde
de cel iniţial, şi nu invers.
Iată cum va arăta caseta Chart Builder după efectuarea acestor operaţii:
Fig. 10.1. Definirea unui grafic de tip nor de puncte

După cum se observă, în meniul Statistic din caseta Element Properties este selectată
opţiunea Values pentru variabila dependentă salary. Vom pastra această opţiune, deoarece este
cea care ne convine şi nouă: dorim ca pe axa Y să reprezentăm valorile acestei variabile.
După ce apăsăm butonul OK obţinem graficul nor de puncte:
Fig. 10.2. Grafic de tip nor de puncte

Din inspectarea acestui grafic se poate observa că relaţia dintre variabile este foarte
probabil una liniară, panta dreptei fiind pozitivă (valorilor mai mari ale salariului iniţial le
corespund de regulă valori mai mari ale salariului actual).
Dacă vrem să confirmăm această observaţie, putem să adăugăm la grafic o linie de
tendinţă. Mai întâi trebuie să facem dublu clic pe suprafaţa diagramei, pentru a deschide caseta
de editare. Apoi, din meniul Elements vom selecta opţiunea Fit Line at Total, astfel:
Fig. 10.3. Inserarea unei linii de tendinţă în diagrama scatterplot

Iată noul grafic cu linia de tendinţă adăugată:

Fig. 10.4. Diagramă scatterplot cu linie de tendinţă

Putem constata că norul de puncte are într-adevăr tendinţa de a se grupa în jurul dreptei,
această tendinţă fiind mult mai accentuată pentru valorile mici ale celor două variabile.

Avem desigur şi posibilitatea să construim un grafic de tip “scatterplot grupat”, atunci


când ne interesează să studiem relaţia dintre variabile pe două grupuri diferite – de exemplu, în
cazul nostru, bărbaţi şi femei. După ce folosim comanda Graphs>Chart Builder pentru a
deschide modulul de creare a diagramelor, urmăm paşii de mai jos:
- selectăm opţiunea Scatter/Dot
- tragem în fereastra a doua icoană de pe rândul de sus;
- pe axele X şi Y punem cele două variabile continue (salbegin şi salary, respectiv)
- în chenarul Set Color tragem variabila gender.
La final caseta de dialog se va prezenta după cum urmează:
Fig. 10.5. Definirea unui grafic de tip scatterplot grupat

Graficul rezultat arată astfel:


Fig. 10.6. Diagramă de tip scatterplot grup

Se pot observa cei doi nori de nuanţe diferite: norul mai închis la culoare reprezintă
distribuţia salariilor pe grupul bărbaţilor, iar cel mai deschis distribuţia salariilor pe grupul
femeilor.
Dacă dorim să adăugăm linii de tendinţă la grafic, pentru a identifica mai corect tipul de
relaţie, o putem face tot în caseta de editare a graficului, folosind comanda Elements>Fit Line at
Subgroups, dupa cum se observă în figura de mai jos:
Fig. 10.7. Adăugarea liniilor de tendinţă la graficul scatterplot grupat

La final graficul nostru va arăta astfel:

Fig. 10.8. Grafic scatterplot grupat cu linii de tendinţă

Se poate din nou observa că distribuţiile valorilor sunt relativ asemănătoare pe cele două
grupuri, iar relaţia dintre variabile este una aproximativ liniară pentru ambele grupuri.