Sunteți pe pagina 1din 8

TUTORAT – Prelucrarea statistică a datelor 2019-2020

-Aspecte discutate la întâlnirile de seminar din 12 și 19 ianuarie 2019-

1. Elemente introductive. Aspecte generale privind PSPP (în curs sunt date între paginile 2-5, conform
numerotării pdf-ului). Am insistat pe faptul că PSPP, la fel ca SPSS, are două ferestre importante
(DATA VIEW și VARIABLE VIEW). Data view este utilizată pentru introducerea datelor într-o bază și
pentru vizualizarea acestora, iar Variable view pentru definirea și vizualizarea variabilelor aferente
unei baze de date. Alternarea între cele două ferestre se realizează prin click stânga.

2. Caracteristici ale variabilelor. Distincții între variabile. Acestea sunt prezentate în paginile 2-8.
3. Definirea variabilelor – paginile din curs 8-11. De reținut este faptul că definirea variabilelor se
realizează exclusiv în fereastra Variable view (indicată mai sus). De asemenea, noi operăm cel mai
des cu două tipuri de variabile – NUMERIC (pentru date cantitative) și STRING (pentru date
calitative).
4. În fereastra variable view, există un cap de tabel predefinit: variable, name, type, width... Acesta
este descris pe larg în suportul de curs, la paginile 8-11.
5. Realizarea unei baze de date – paginile din curs 11-14. La aplicația 1 de seminar, veți avea de definit
o singură variabilă de tip numeric. Utilizați informațiile anterioare. Pagina 15 NU intră în atenția
noastră (sunt elemente de sintaxă).
6. Elemente de statistică univariată – paginile din curs 16-17. La întâlnirea din 12 ianuarie, am calculat
următorii indicatori statistici: media (mean), mediana (median), modul (mode), suma (sum),
amplitudinea (range), minimum (valoarea minimă), maximum (valoarea maximă), standard
deviation (deviația standard). Despre acești indicatori, puteți lectura paginile 18-19. Atenție! Alți
indicatori în afară de cei enumerați nu au fost discutați. Totodată, FORMULELE prezentate NU intră
în atenția noastră, ci doar explicațiile privind indicatorii.

7. Generarea unui set de date. Prin comanda Analyze- Descriptive statistics-Frequencies:

Se generează următoarea fereastră

Pentru exemplificări, am utilizat baze de date deja create (cum aveți la aplicațiile 2, 3 și 4 și care
sunt deja urcate pe platformă)
În fereastra din dreapta sunt enumerate variabilele.
În fereastra din stânga sus (variables) pot fi mutate variabilele care vor fi analizate (se selectează
cu mouseul din dreapta printr-un click, apoi se apasă săgeata și acestea vor trece în fereastra din
dreapta)
În fereastra din stânga-centru (statistics) sunt indicatorii statistici. ATENȚIE! Nu toți sunt
preselectați, ci trebuie să îi selectați dumneavoastră.
Butonul de charts este util pentru selectarea și crearea de grafic.
Apoi, după ce sunt selectate varibilele de analizat și se selectează tipul de grafic solicitat (spre
exemplu, bar chart), se apasă OK și se va deschide o nouă fereastră (separată), de tip output.
8. Interpretarea datelor generate (Un exemplu de interpretare se regăsește la pagina 20 din suportul
de curs. În interpretarea datelor din exemplu, sunt enumerați și alți indicatori, în afară de cei
enumerați și pe care nu i-am discutat).
9. Alte reprezentări grafice și calcule prezentate în paginile 25-38 NU au fost discutate. Majoritatea
informațiilor din aceste pagini NU vor intra în atenția noastră. La fel și în cazul paginilor 41-42.
10. Despre testarea ipotezelor, paginile 38-40 și despre corelații (paginile 43-45) am discutat la nivel
general. Le puteți lectura în perspectiva unor eventuale studii pe care le veți derula.
11. Corelația Pearson, prezentată în paginile de curs 45-46. În PSPP comanda este:
Analyze-Bivariate Correlation

Corelațiile se realizează între variabile de tip numeric (variabile cantitative). Spre exemplu, dacă
dorim să realizăm o corelație între nivelul salarial de la început (salbegin) și nivelul salarial actual
(salary) (baza employee_data):

În fereastra Bivariate Correlation (declanșată după selectarea comenzilor din pictograma de mai
sus), sunt mutate variabilele de interes din dreapta în partea stângă. Apoi se apasă OK și se obține
un output, cu rezultatele corelației:

A se vedea
pagina
următoare
La pagina 46 din curs sunt explicate datele obținute în urma generării acestei comenzi. Pe scurt,
există o corelație puternică (coeficientul Pearson fiind de .88, deci foarte aproape de pragul 1).
Valorile ce pot fi obținute într-o corelație sunt explicate la pagina din 43 din curs, încadrate într-un
chenar.

12. Coeficientul de variație (Pagina 47 NU intră în atenția noastră)


13. Corelația parțială (Paginile 48 și 49) NU a fost discutată și nu intră în atenția noastră.
14. Corelația ca metodă neparametrică, respectiv Regresia (paginile 49-59 NU intră în atenția noastră)
15. Asocierea variabilelor calitative (Chi-square), a fost discutată la întâlnirea din 19 ianuarie (paginile
60-64). Explicarea acestei operațiuni este realizată punctual, prin inserarea de capturi de ecran,
detaliate prin informații legate de interpretarea datelor.
În vederea realizării acestei operațiuni în softul PSPP, comenzile sunt: ANALYZE-DESCRIPTIVE
STATISTICS-CROSSTABS

După ce generăm această comandă, se va deschide următoarea fereastră (a se vedea pagina


următoare)
În secțiunea din stânga sunt înșiruite variabilele bazei de date, iar în secțiunile Rows și Column din
partea dreapta trebuie mutate variabilele pe care le dorim analizate. În exemplul de mai jos, am
luat în considerare d1 și variabila gen:

La final dăm OK și obținem un ouput care ne indică următoarele rezultate:


De interes este tabelul care va cuprinde valoarea coeficientului Paerson Chi-square, regăsit în
partea inferioară. Valoarea este 28,8, însă pentru un grad de libertate (df=3) și prag de semnificație
(asymp sig.) 0,000.
Pentru a vedea dacă este vreo asociere între cele două variabile, comparăm valoarea lui chi-square
obținută (28,8) cu valoarea din tabelul din suportul de curs (pg. 63). Ne uităm la intersecția df=3, cu
prag de semnif. 0,01 (cea mai apropiată de pragul nostru de 0,00) și observăm că valoarea este
16,27:

Așadar, valoarea obținută de 28,8 este mai mare decât 16,27. Putem spune că există o asociere
între gen și percepția privind maniera în care merg lucrurile în țară.
În situația ipotetică în care valoarea obținută în tabelul generat de output ar fi fost mai scăzută
comparativ cu cea din tabelul din suportul de curs, atunci această asociere era inexistentă. Cu alte
cuvinte, genul NU influențează opinia despre felul în care merg lucrurile în țara noastră.
16. Paginile 64-68 (de la sensul și intensitatea asocierii) NU vor intra în atenția noastră.
17. De la pagina 69 până la pagina 89 sunt descrise comenzile ce pot fi generate în SPSS (ele se
aseamănă cu cele din PSPP).
Ceea ce am discutat este legat de compararea unor subgrupuri de populație, comanda SPLIT FILE
(descrisă la pagina 76)

Comanda este DATA-SPLIT FILE


Se va genera următoarea fereastră:

După cum se poate observa, în această situație sunt analizate toate cazurile. Însă, pentru a
compara grupurile după o anumită variabilă (spre exemplu, gen – gender în engleză), este necesară
bifarea căsuței Compare groups. De asemenea, variabile gen (gender) trebuie mutată în căsuța
Groups based on. Se ajunge la următoarea configurație:

Se apasă OK, iar din acest moment splitarea (divizarea bazei de date) după variabila gen este
declanșată. Acest lucru este vizibil în partea de jos a ferestrei de lucru din program:
În final, pentru a compara rezultatele între grupurile alcătuite din bărbați și femei, se vor realiza
operațiunile normale (descrise la punctul 6 din prezentul document)

Pentru înțelegerea mai bună a tuturor operațiunilor, vă rog să confruntați informațiile din document, cu
cele din suportul de curs, fiind indicate toate paginile care sunt de interes.

MULT SUCCES!

Asist. Asoc. Dr. Alex. Apostol

S-ar putea să vă placă și