Documente Academic
Documente Profesional
Documente Cultură
Diagramele de tip nor de puncte (sau scatterplot) ne vin în ajutor atunci când dorim să
identificăm tipul de relaţie dintre două variabile continue. O condiţie principală care trebuie
verificată înainte de a rula anumite analize statistice, precum corelaţia parametrică sau regresia,
este existenţa unei relaţii liniare între variabilele implicate. Acest lucru poate fi realizat doar
vizual, cu ajutorul unui grafic de tip scatterplot.
Mai mult chiar, o diagramă “nor de puncte” ne poate ajuta să identificăm valorile extreme
din seria de date, dacă există.
Vom utiliza pentru acest exemplu două variabile din baza de date Employee data:
salbegin (salariul iniţial al unui angajat) şi salary (salariul curent). Dorim să stabilim dacă relaţia
dintre ele este sau nu liniară.
Credem că cititorul este deja bine familiarizat cu tehnica de construire a graficelor în
SPSS; drept urmare, nu vom mai insista asupra detaliilor (care se găsesc în capitolele 8 şi 9), ci
vom descrie pe scurt etapele ce trebuie urmate.
După activarea modulului de construire a graficelor (vezi figura 8.1), se va selecta
opţiunea Scatter/Dot din lista tipurilor de diagrame, apoi va fi trasă în fereastra de previzualizare
prima icoană de pe rândul de sus. Apoi vor fi definite axele de coordonate, astfel:
- pe axa X vom plasa variabila salbegin;
- pe axa Y vom plasa variabila salary.
Amplasarea variabilelor pe cele două axe nu se face tocmai la întâmplare; pe axa
categoriilor trebuie să fie reprezentată variabila independentă, iar pe axa valorilor variabila
dependentă. În cazul nostru, este logic să considerăm că salariul actual al unui angajat va depinde
de cel iniţial, şi nu invers.
Iată cum va arăta caseta Chart Builder după efectuarea acestor operaţii:
Fig. 10.1. Definirea unui grafic de tip nor de puncte
După cum se observă, în meniul Statistic din caseta Element Properties este selectată
opţiunea Values pentru variabila dependentă salary. Vom pastra această opţiune, deoarece este
cea care ne convine şi nouă: dorim ca pe axa Y să reprezentăm valorile acestei variabile.
După ce apăsăm butonul OK obţinem graficul nor de puncte:
Fig. 10.2. Grafic de tip nor de puncte
Din inspectarea acestui grafic se poate observa că relaţia dintre variabile este foarte
probabil una liniară, panta dreptei fiind pozitivă (valorilor mai mari ale salariului iniţial le
corespund de regulă valori mai mari ale salariului actual).
Dacă vrem să confirmăm această observaţie, putem să adăugăm la grafic o linie de
tendinţă. Mai întâi trebuie să facem dublu clic pe suprafaţa diagramei, pentru a deschide caseta
de editare. Apoi, din meniul Elements vom selecta opţiunea Fit Line at Total, astfel:
Fig. 10.3. Inserarea unei linii de tendinţă în diagrama scatterplot
Putem constata că norul de puncte are într-adevăr tendinţa de a se grupa în jurul dreptei,
această tendinţă fiind mult mai accentuată pentru valorile mici ale celor două variabile.
Se pot observa cei doi nori de nuanţe diferite: norul mai închis la culoare reprezintă
distribuţia salariilor pe grupul bărbaţilor, iar cel mai deschis distribuţia salariilor pe grupul
femeilor.
Dacă dorim să adăugăm linii de tendinţă la grafic, pentru a identifica mai corect tipul de
relaţie, o putem face tot în caseta de editare a graficului, folosind comanda Elements>Fit Line at
Subgroups, dupa cum se observă în figura de mai jos:
Fig. 10.7. Adăugarea liniilor de tendinţă la graficul scatterplot grupat
Se poate din nou observa că distribuţiile valorilor sunt relativ asemănătoare pe cele două
grupuri, iar relaţia dintre variabile este una aproximativ liniară pentru ambele grupuri.