Sunteți pe pagina 1din 8

Asist. univ. dr.

Alexandru Apostol
Facultatea de Filosofie și Științe Social-Politice
Universitatea „Alexandru Ioan Cuza” din Iași
TUTORIAT AS.ID – Prelucrarea statistică a datelor

-Aspecte discutate la întâlnirile de seminar din 8 și 15 ianuarie 2022-

1. Elemente introductive. Aspecte generale privind PSPP (în curs sunt date între paginile 2-5, conform
numerotării pdf-ului). Am insistat pe faptul că PSPP, la fel ca SPSS, are două ferestre importante
(DATA VIEW și VARIABLE VIEW). Data view este utilizată pentru introducerea datelor într-o bază și
pentru vizualizarea acestora, iar Variable view pentru definirea și vizualizarea variabilelor aferente
unei baze de date. Alternarea între cele două ferestre se realizează prin click stânga.

2. Caracteristici ale variabilelor. Distincții între variabile. Acestea sunt prezentate suportul de curs.
3. Definirea variabilelor – suport de curs. De reținut este faptul că definirea variabilelor se realizează
exclusiv în fereastra Variable view (indicată mai sus). De asemenea, noi operăm cel mai des cu două
tipuri de variabile – NUMERIC (pentru date cantitative) și STRING (pentru date calitative).
4. În fereastra variable view, există un cap de tabel predefinit: variable, name, type, width... Acesta
este descris pe larg în suportul de curs.
Asist. univ. dr. Alexandru Apostol
Facultatea de Filosofie și Științe Social-Politice
Universitatea „Alexandru Ioan Cuza” din Iași
5. Realizarea unei baze de date – a se vedea suportul de curs. La aplicația 1, veți avea de definit o
singură variabilă de tip numeric. Utilizați informațiile anterioare.
6. Elemente de statistică univariată. La întâlnirea din 8 ianuarie, am calculat următorii indicatori
statistici: media (mean), mediana (median), modul (mode), suma (sum), amplitudinea (range),
minimum (valoarea minimă), maximum (valoarea maximă), standard deviation (deviația standard),
eroarea standard a medie (S.E. Mean), Skewness& Kurtosis. Despre acești indicatori, puteți lectura
suportul de curs. Totodată, FORMULELE prezentate NU intră în atenția noastră, ci doar explicațiile
privind indicatorii.

7. Generarea unui set de date. Prin comanda Analyze- Descriptive statistics-Frequencies:

Se generează următoarea fereastră

Pentru exemplificări, am utilizat baze de date deja create (cum aveți la aplicațiile 2, 3 și 4 și care
sunt deja urcate pe platformă)
În fereastra din stânga sunt enumerate variabilele.
În fereastra din dreapta sus (variables) pot fi mutate variabilele care vor fi analizate (se selectează
cu mouseul din dreapta printr-un click, apoi se apasă săgeata și acestea vor trece în fereastra din
dreapta)
În fereastra din dreapta-centru (statistics) sunt indicatorii statistici. ATENȚIE! Nu toți sunt
preselectați, ci trebuie să îi selectați dumneavoastră.
Butonul de charts este util pentru selectarea și crearea de grafic.
Apoi, după ce sunt selectate varibilele de analizat și se selectează tipul de grafic solicitat
(histogramă – variabile cantitative; bar chart – variabile calitate), se apasă OK și se va deschide o
nouă fereastră (separată), de tip output.
8. Interpretarea datelor generate
Asist. univ. dr. Alexandru Apostol
Facultatea de Filosofie și Științe Social-Politice
Universitatea „Alexandru Ioan Cuza” din Iași
9. Corelația Pearson. În PSPP comanda este:
Analyze-Bivariate Correlation

Corelațiile se realizează între variabile de tip numeric (variabile cantitative). Spre exemplu, dacă
dorim să realizăm o corelație între nivelul salarial de la început (salbegin) și nivelul salarial actual
(salary) (baza employee_data):

În fereastra Bivariate Correlation (declanșată după selectarea comenzilor din pictograma de mai
sus), sunt mutate variabilele de interes din dreapta în partea stângă. Apoi se apasă OK și se obține
un output, cu rezultatele corelației:

A se vedea
pagina
următoare
Asist. univ. dr. Alexandru Apostol
Facultatea de Filosofie și Științe Social-Politice
Universitatea „Alexandru Ioan Cuza” din Iași

La pagina 46 din curs sunt explicate datele obținute în urma generării acestei comenzi. Pe scurt,
există o corelație puternică (coeficientul Pearson fiind de .88, deci foarte aproape de pragul
maximal 1).

10. Asocierea variabilelor calitative (Chi-square), va fi discutată la întâlnirea din 15 ianuarie. Explicarea
acestei operațiuni este realizată punctual, prin inserarea de capturi de ecran, detaliate prin
informații legate de interpretarea datelor.
În vederea realizării acestei operațiuni în softul PSPP, comenzile sunt: ANALYZE-DESCRIPTIVE
STATISTICS-CROSSTABS

După ce generăm această comandă, se va deschide următoarea fereastră (a se vedea pagina


următoare)
Asist. univ. dr. Alexandru Apostol
Facultatea de Filosofie și Științe Social-Politice
Universitatea „Alexandru Ioan Cuza” din Iași

În secțiunea din stânga sunt înșiruite variabilele bazei de date, iar în secțiunile Rows și Column din
partea dreapta trebuie mutate variabilele pe care le dorim analizate. În exemplul de mai jos, am
luat în considerare d1 și variabila gen:

La final dăm OK și obținem un ouput care ne indică următoarele rezultate:


Asist. univ. dr. Alexandru Apostol
Facultatea de Filosofie și Științe Social-Politice
Universitatea „Alexandru Ioan Cuza” din Iași

De interes este tabelul care va cuprinde valoarea coeficientului Paerson Chi-square, regăsit în
partea inferioară. Valoarea este 28,8, însă pentru un grad de libertate (df=3) și prag de semnificație
(asymp sig.) 0,000.
Pentru a vedea dacă este vreo asociere între cele două variabile, comparăm valoarea lui chi-square
obținută (28,8) cu valoarea din tabelul din suportul de curs. Ne uităm la intersecția df=3, cu prag de
semnif. 0,01 (cea mai apropiată de pragul nostru de 0,00) și observăm că valoarea este 16,27:

Așadar, valoarea obținută de 28,8 este mai mare decât 16,27. Putem spune că există o asociere
între gen și percepția privind maniera în care merg lucrurile în țară.
În situația ipotetică în care valoarea obținută în tabelul generat de output ar fi fost mai scăzută
comparativ cu cea din tabelul din suportul de curs, atunci această asociere era inexistentă. Cu alte
cuvinte, genul NU influențează opinia despre felul în care merg lucrurile în țara noastră.

11. Comanda de analiză a unor sub-grupe de populație

Comanda este DATA-SPLIT FILE


Asist. univ. dr. Alexandru Apostol
Facultatea de Filosofie și Științe Social-Politice
Universitatea „Alexandru Ioan Cuza” din Iași
Se va genera următoarea fereastră:

După cum se poate observa, în această situație sunt analizate toate cazurile. Însă, pentru a
compara grupurile după o anumită variabilă (spre exemplu, gen – gender în engleză), este necesară
bifarea căsuței Compare groups. De asemenea, variabile gen (gender) trebuie mutată în căsuța
Groups based on. Se ajunge la următoarea configurație:

Se apasă OK, iar din acest moment splitarea (divizarea bazei de date) după variabila gen este
declanșată. Acest lucru este vizibil în partea de jos a ferestrei de lucru din program:
Asist. univ. dr. Alexandru Apostol
Facultatea de Filosofie și Științe Social-Politice
Universitatea „Alexandru Ioan Cuza” din Iași
În final, pentru a compara rezultatele între grupurile alcătuite din bărbați și femei, se vor realiza
operațiunile normale (descrise la punctul 6 din prezentul document)

Pentru înțelegerea mai bună a tuturor operațiunilor, vă rog să confruntați informațiile din document, cu
cele din suportul de curs, fiind indicate toate paginile care sunt de interes.

MULT SUCCES!

S-ar putea să vă placă și