Sunteți pe pagina 1din 17

Analiza computerizată a datelor

Exerciții seminar
 Crearea bazelor de date
DATA VIEW – se introduc doar valorile numerice sau categoriile specifice fiecărei variabile
VARIABLE VIEW - se introduc denumirile variabilelor.

 Calculare inventar statistic de bază


ANALYZE – DESCRIPTIVE STATISTICS – FREQUENCIES
- STATISTICS – se bifează: mean, median, mode, minim, maxim, variance, std. dev.

 Identificarea frecvențelor și a procentelor de apariție a diferitelor valori


Tabelul 2 din output.

 Calcularea intervalelor corespunzătoare scorurilor scăzute, medii și ridicate ale


unei distribuții
Medie ± S: intervalul scorurilor medii

 Calcularea scorului total al subiecților la mai multe variabile


TRANSFORM – COMPUTE

 Recodarea scorurilor
TRANSFORM – RECODE INTO DIFFERENT VARIABLE

 Folosirea comenzilor splite file.


DATA – SPLITE FILE

1
Tutorial 1

1. Realizati, folosind aplicatia SPSS, o baza de date care va conţine următoarele variabile,
NS (numele întreg al variabilei – nivel de sociabilitate), NO (numele întreg al variabilei – nivel
optimism) şi gen (cu valorile 1 – feminin şi 2 – masculin).
Valorile variabilelor sunt urmatoarele:
NS NO Gen
35.00 17.00 1
12.00 26.00 1
33.00 17.00 2
11.00 22.00 2
15.00 31.00 2
13.00 18.00 1
20.00 24.00 2
17.00 17.00 1
32.00 9.00 1
11.00 14.00 1
15.00 6.00 2
21.00 7.00 1

a. Scrieţi inventarul statistic de bază şi precizați intervalul corespunzător scorurilor


scăzute, medii și ridicate pentru variabila nivel de sociabilitate.

Rezolvare si indicatii:
ANALYZE – DESCRIPTIVE STATISTICS – FREQUENCIES
-STATISTICS – se bifează: mean, median, mode, minim, maxim, variance, std. dev.

Observatie: mean (media, se noteaza cu „M” sau cu „x̅”, median (Mediana se noteaza cu
„Me”), mode (valori mod), minim, maxim, variance (varianta se noteaza cu „s²”), std. dev
(abaterea standard se noteaza cu „s” ).

N = 12
M = 19.58
Me = 16
Mode1 = 11
Mode2 = 15 Distributia este multimodală.
s = 8.89
s² = 79.17
Min = 11
Max = 35

Observatie: Atunci cand distributia este multimodală, în Tabelul SPSS (Output) se va


afișa valoarea Mode cea mai mica cu „a” (b) alaturi. Pentru a afla si celelalte valori mode
se verifica tabelul de frecvențe.

2
Intervalul scorurilor scăzute, medii și ridicate

-s M +s
Intervalul scorurilor mici: < M - s
Intervalul scorurilor medii: [ M – s; M + s]
Intervalul scorurilor mari: > M + s

Intervalul scorurilor mici: < M – s = < 19.58 - 8.89 = < 10.69


Intervalul scorurilor medii: [ M – s; M + s] = [10.69; 28.47]
Intervalul scorurilor mari: > M + s = > 19.58 + 8.89 = > 28.47

b. Precizați valoarea minimă și maximă pentru variabila nivel optimism și menționați ce


procent din lotul testat a obținut scorul (valoarea) 17.

Rezolvare si indicatii:
Min = 6
Max = 31
25% dintre participanti au obtinut scorul 17. Coloana percent!

c. Care este valoarea cu frecvența cea mai mare, pentru variabila sociabilitate?

Rezolvare:
Valorile cu frecventele cele mai mari sunt 11 si 15.

d. Calculați scorul total al rezultatelor la cele doua probe, pentru fiecare persoană.
TRANSFORM – COMPUTE

e. Recodați scorul la variabila optimism în două categorii: scoruri scăzute și scoruri


ridicate. Menționați în care din cele două categorii se încadrează primul subiect.

Rezolvare si indicatii:
Reamintire tipuri variabile:
1) Cu scală nominală - calitativa
2) Cu scală ordinală - calitativa
3) Cu scală de interval – cantitativa
4) Cu scală de raport (0 absolut) - cantitativa

Me (mediana)

3
Scoruri scazute: < Me (inclusiv) Cod 1
Scoruri ridicate: > Me Cod 2

TRANSFORM – RECODE INTO DIFFERENT VARIABLE

Raspuns: Primul subiect se incadreaza in categoria scoruri scazute.

f. Realizați cerința a separat pentru persoanele de gen feminin și cele de gen masculin.

Rezolvare si indicatii:
DATA – SPLITE FILE
I. Genul Feminin
N=7
M = 20.14
Me = 17
Mode1 = 11
Mode2 = 12 Distributia este multimodală.
Mode3 = 13
Mode4 = 17
Mode5 = 21
Mode6 = 32
Mode7 = 35
s = 9.77
s² = 95.47
Min = 11
Max = 35
Intervalul scorurilor mici: < M – s  < 10.37
Intervalul scorurilor medii: [ M – s; M + s] = [10.37; 29.91]
Intervalul scorurilor mari: > M + s  > 29.91

II. Genul Masculin


N=5
M = 18.8
Me = 15
Mode = 15
s = 8.55
s² = 73.2
Min = 11
Max = 33

Intervalul scorurilor mici: < M – s = < 10.25


Intervalul scorurilor medii: [ M – s; M + s] = [10.25; 27.35]
Intervalul scorurilor mari: > M + s = > 27.35

4
2. Realizaţi, folosind aplicaţia SPSS, o bază de date care va conţine următoarele variabile:
NA (nivel agresivitate): 10, 15, 14, 17, 15, 20, 12, 16, 18, 20
NC (nivel conştiinciozitate): 20, 15, 14, 17, 10, 9, 18, 15, 7, 14
Gen: 1, 2, 2, 2, 1, 1, 1, 2, 1, 2
1 – feminin; 2 – masculin

a. Scrieţi inventarul statistic de bază şi precizați intervalul corespunzător scorurilor scăzute,


medii și ridicate pentru variabila nivel de agresivitate.
Rezolvare:
N = 10
M = 15.7
Me = 15.5
Mode1 = 15
Mode2 = 20 Distributia este multimodală.
s = 3.23
s² = 10.45
Min = 10
Max = 20
Intervalul scorurilor scazute: < M – s = < 12.47
Intervalul scorurilor medii: [ M – s; M + s] = [12.47; 18.93]
Intervalul scorurilor ridicate: > M + s = > 18.93

b. Precizați valoarea minimă și maximă pentru variabila nivel conștiinciozitate și menționați


ce procent din lotul testat a obținut scorul (valoarea) 17.
Rezolvare:
Min = 7
Max 20
10% dintre participanti au obtinut scorul 17.
c. Care este valoarea cu frecvența cea mai mare, pentru variabila conștiinciozitate?
Rezolvare:
Valorile cu frecventele cele mai mari sunt 14 si 15.

d. Calculați scorul total al rezultatelor la cele doua probe, pentru fiecare persoană.
Rezolvare: Transform compute

e. Recodați scorul la variabila conștiinciozitate în două categorii: scoruri scăzute și scoruri


ridicate. Menționați în care din cele două categorii se încadrează primul subiect.
Rezolvare: Me = 14.5 Primul subiect se incadreaza in categoria scoruri ridicate.

f. Realizați cerința a separat pentru persoanele de gen feminin și cele de gen masculin.
Rezolvare:

5
I. Genul feminin
N=5
M = 15
Me = 15
Mode1 = 10
Mode2 = 12 Distributia este multimodală.
Mode3 = 15
Mode4 = 18
Mode5 = 20
s = 4.12
s² = 17
Min = 10
Max = 20
Intervalul scorurilor scazute: < M – s = < 10.88
Intervalul scorurilor medii: [ M – s; M + s] = [10.88; 19.12]
Intervalul scorurilor ridicate: > M + s = > 19.12

II.Genul masculin
N=5
M = 16.40
Me = 16
Mode1 = 14
Mode2 = 15 Distributia este multimodală.
Mode3 = 16
Mode4 = 17
Mode5 = 20
s = 2.30
s² = 5.30
Min = 14
Max = 20
Intervalul scorurilor scazute: < M – s = < 14.1
Intervalul scorurilor medii: [ M – s; M + s] = [14.1; 18.7]
Intervalul scorurilor ridicate: > M + s = > 18.7

6
CORELATIA
Definiție: Analiza corelationala este un test care se aplică pentru a analiza
legătura/asocierea între variabile. Noi vom aplica doar Corelația Pearson „r”.
ANALYSE – CORRELATE – BIVARIATE

În cadrul analizei corelaționale interpretăm:


1) Natura/semnul corelației
- Coeficientul de corelație r poate lua valori între [-1; 1]

- Dacă r < 0 atunci legătura între variabile este negativă (invers proporțională) EX„ -.05”
Scorurile mari de la prima variabilă se asociază cu scorurile mici de la a doua variabilă.
Scorurile mici de la prima variabilă se asociază cu scorurile mari de la a doua variabilă.
Scorurile medii de la prima variabilă se asociază cu scorurile medii de la a doua variabilă.

- Dacă r > 0 atunci legătura între variabile este pozitivă (direct proporțională)
Scorurile mari de la prima variabilă se asociază cu scorurile mari de la a doua variabilă.
Scorurile mici de la prima variabilă se asociază cu scorurile mici de la a doua variabilă.
Scorurile medii de la prima variabilă se asociază cu scorurile medii de la a doua variabilă.

- Dacă r = 0 atunci nu există o legătură între variabile

2) Mărimea corelației – le analizam in modul (facem abstractie de - )


Între 0 și 0.29  corelatie slaba
Intre 0.30 si 0.49  corelatie medie
Intre 0.50 si 1  corelatie puternica

3) Semnificatia corelatiei – pragul de semnificatie „p” (denumirea „sig” in output)


Pragul de semnificație p = măsura în care ne putem înșela în ceea ce privește rezultatele

p ≤ 0.05  corelatia este semnificativa: Exista o legatura semnificativa intre variabilele x


si y. 😊

p > 0.05  corelatia este nesemnificativa. Nu exista o legatura semnificativa intre


variabile x si y. ☹

7
Pentru exercițiile de mai jos, folosiți baza de date gândire critică (disk D).
1. Analizați legătura/ asocierea dintre următoarele variabile:
a. Istorie și geografie
Rezolvare:
ANALYSE – CORRELATE – BIVARIATE

N = 121
r = 0.53
p < 0.001
1) Natura/Semnul r = 0.53 > 0  legătura între variabilele istorie și geografie este pozitivă
2) Marimea r = 0.53 > 0.50  legatura puternica intre variabilele istorie si geografie
3) Semnificatia p < 0.001 < 0.05  Exista o legatura semnificativa intre variabilele istorie si
geografie
Observatie: atunci cand la p (sig) observam ca scrie .000 notam p < 0.001

b. Medie generală semestrul 1 și media la științele umaniste


Rezolvare:
N = 121
r = 0.89
p < 0.001
1) Semnul r = 0.89 > 0  legătura între variabilele Medie generală semestrul 1 și media la
științele umaniste este pozitivă
2) Marimea r = 0.89 > 0.50  legatura puternica intre variabilele Medie generală semestrul
1 și media la științele umaniste
3) Semnificatia p < 0.001 < 0.05  Exista o legatura semnificativa intre Medie generală
semestrul 1 și media la științele umaniste

c. Fizică și nivel performanță test gândire critică.


Rezolvare:
N = 81
r = 0.21
p = 0.059
1) Semnul r = 0.21 > 0  legătura între variabile este pozitiva
2) Marimea r = 0.21 < 0.29  legatura slaba intre variabile
3) Semnificatia p = 0.059 > 0.05  legatura nesemnificativa intre variabile

8
2. Calculați scorul total al rezultatelor la variabilele română, franceză, engleză
(științe_umaniste) și scorul total al rezultatelor la variabilele matematică, fizică și chimie
(științe_exacte). Analizați legătura dintre variabilele calculate.
Rezolvare:
N = 31
r = 0.34
p = 0.061
1) Semnul r = 0.34 > 0  legătura între variabile este pozitivă
2) Marimea r = 0.34 apartine [0.30; 0.49] legatura medie intre variabile
3) Semnificatia p = 0.061 > 0.05  legatura nesemnificativa intre variabile

3. Analizați legătura dintre următoarele variabilele test deducție și test intuiție, separat
pentru subiecții de gen feminin și masculin.
Rezolvare:
Split file in functie de gen!
Feminin
N = 15
r = 0.016
p = 0.95
1) Semnul r = 0.016 > 0  legătura între variabile este pozitivă
2) Marimea r = 0.016 < 0.29  legatura slaba intre variabile
3) Semnificatia p = 0.95 > 0.05  legatura nesemnificativa intre variabile
Masculin
N = 106
r = 0.078
p = 0.427
1) Semnul r = 0.078 > 0  legătura între variabile este pozitivă
2) Marimea r = 0.078 < 0.29  legatura slaba intre variabile
3) Semnificatia p = 0.427 > 0.05  legatura nesemnificativa intre variabile

9
Tutorial 2
Teste de comparație
Observatii
Variabila independenta
Variabila dependenta - „vedeta”
Esantioane perechi ≠ esantioane independente

Pentru exercițiile de mai jos, folosiți baza de date gândire critică (disk D). Menționați testul
statistic care trebuie utilizat, pentru fiecare exercițiu, scrieți și interpretați valorile obținute.
1. Comparați rezultatele subiecților din eșantionul analizat cu rezultatele subiecților dintr-o
populație cu media 7, la variabila media la științele umaniste.

Observatii
Testul One Sample T Test (Testul T pentru un esantion) – este un test care se utilizeaza
pentru compararea mediei esantionului la o variabila cu media populatiei.
ANALYSE – COMPARE MEANS – ONE SAMPLE T TEST
Rezolvare:
Mpopulatie = 7
Mesantion = 6.88

Ipoteze
H0 (de nul) = Nu exista diferente semnificative intre rezultatele subiectilor din esantion si cele
ale subiectilor din populatia cu media 7 la variabila media la stiinte umaniste.
H1 (de cercetare) = Exista diferente semnificative intre rezultatele subiectilor din esantion si cele
ale subiectilor din populatia cu media 7 la variabila media la stiinte umaniste.
t(df):
t(120) = -1.04 , p = 0.29 > 0.05  acceptam H0 si respingem H1  Nu exista diferente
semnificative intre rezultatele subiectilor din esantion si cele ale subiectilor din populatia cu
media 7 la variabila media la stiinte umaniste.
!! Daca apar diferente semnificative precizam si sensul lor!! .. in sensul ca media la esantion
este mai mica/mare fata de media populatiei.

10
2. Comparați rezultatele subiecților la variabilele media generală semestrul 1 și media la
științele umaniste.
Observatii
Testul Paired Sample T Test (Testul T pentru doua esantioane perechi) este un test care ce
utilizeaza pentru compararea mediilor a doua esantioane perechi.
(2 variabile diferite la aceeasi participanti sau aceeasi variabila in momente diferite la aceeasi
participanti).

ANALYSE – COMPARE MEANS – PAIRED SAMPLE T TEST


Rezolvare:
M media gen sem 1 = 7.40
M media stiinte umaniste = 6.88

H0 = Nu exista diferente semnificative intre rezultatele participantilor la variabilele media


generala sem 1 si media stiinte umaniste.
H1 = Exista diferente semnificative intre rezultatele participantilor la variabilele media
generala sem 1 si media stiinte umaniste.

t(120) = 10.19 p < 0.001 < 0.05  Respingem H0 si acceptam H1  Exista diferente
semnificative intre rezultatele participantilor la variabilele media generala sem 1 si media
stiinte umaniste in sensul ca rezultatele participantilor la variabila media gen sem 1 sunt
semnificativ mai mari fata de rezultatele participantilor la variabila media la stiinte umaniste.

11
3. Comparați rezultatele subiecților de gen masculin cu ale celor de gen feminin la variabila
media generală semestrul 1.

Observatii
Testul Independent Sample T Test (Testul T pentru doua esantioane independente) este un
test care se utilizeaza pentru compararea mediilor a doua esantioane independente (2 grupe
diferite de participanti).
ANALYSE – COMPARE MEANS – INDEPENDENT SAMPLE T TEST
VI la Grouping Variable, VD la Test Variable
Rezolvare
VI genul particiantilor – Masculin (Cod 1)
- Feminin (Cod 2)
VD - media generală semestrul 1.

M masculin = 7.42
M feminin = 7.23

H0 = Nu exista diferente semnificative intre rezultatele participantilor de gen masculin si


rezultatele participantilor de gen feminin la variabila media generală semestrul 1.
H1 = Exista diferente semnificative intre rezultatele participantilor de gen masculin si
rezultatele participantilor de gen feminin la variabila media generală semestrul 1.

Observatie
Testul Levene – (din coloana 2) daca p > 0.05 atunci citim randul 1
p < 0.05 atunci citim randul 2

Testul Lavene p = 0.051 > 0.05  citim randul 1


t(119) = 0.84 p = 0.39 > 0.05  Acceptam H0 si respingem H1  Nu exista diferente
semnificative intre rezultatele participantilor de gen masculin si rezultatele participantilor de
gen feminin la variabila media generală semestrul 1.

!! Daca apar diferente semnificative precizam si sensul lor!!

12
4. Comparați rezultatele subiecților din mediul urban, rural și a celor din altă țară la
variabila dominare retestare. Pentru acest exercițiu folosiți baza de date adicție analiză
computerizată (disk D).
Observatii
Testul One Way Anova este un test care se utilizeaza pentru compararea mediilor pentru mai
mult de doua esantioane independente. Variabila independenta are mai mult de doua niveluri.
ANALYSE – COMPARE MEANS – ONE WAY ANOVA
La POST HOC bifam BONFERRONI – CONTINUE; La OPTIONS bifam DESCRIPTIVE
Vi se trece la Factor , iar VD la Dependent list
Rezolvare
VI – Mediul de provenienta - rural (cod 1)
- urban (cod 2)
- alta tara (cod 3)
VD dominare retestare

M rural = 14.87
M urban = 13.37
M alta tara = 10.77

H0 = Nu exista diferente semnificative intre rezultatele participantilor din mediul rural, urban si
alta tara la variabila dominare retestare.
H1 = Exista diferente semnificative intre rezultatele participantilor din mediul rural, urban si alta
tara la variabila dominare retestare.

Tabel Anova:
F(between; within)
F(2;47) = 4.01 p = 0.025 < 0.05  acceptam H1 si respingem H0  Exista diferente
semnificative intre rezultatele participantilor din mediul rural, urban si alta tara la variabila
dominare retestare.

Tabel Multiple Comparisons


M rural – M urban = 1.5, p = 0.98 > 0.05  dif nesemnificativa
M rural – M alta tara = 4.09, p = 0.02 < 0.05  dif semnificativa
M urban – M alta tara = 2.59, p = 0.25 > 0.05  dif nesemnificativa

13
Concluzii
1) Nu exita diferente semnificative intre participantii din mediul rural si part din mediul
urban la variabila dominare retestare.
2) Nu exista diferente semnificative intre participantii din mediul urban si part din alta tara
la variabila dominare retestare.
3) Rezultatele participantilor din mediul rural sunt semnficativ mai mari fata de rezultatele
part din alta tara la variabila dominare retestare.
Pentru exercițiile de mai jos, folosiți baza de date adicție analiză computerizată (disk D).
Menționați testul statistic care trebuie utilizat, pentru fiecare exercițiu, argumentați alegerea,
scrieți și interpretați valorile obținute.

14
5. Comparați rezultatele subiecților la variabilele depresie și depresie retestare.
Testul Paired Sample T Test
Rezolvare:

M depresie = 12.84
M depresie retestare = 17.94

H0 = Nu exista diferente semnificative intre rezultatele participantilor la variabilele depresie


si depresie retestare.
H1 = Exista diferente semnificative intre rezultatele participantilor la variabilele depresie si
depresie retestare.

t(49) = -2.14 p = 0.037 < 0.05  Respingem H0 si acceptam H1  Exista diferente


semnificative intre rezultatele participantilor la variabilele depresie și depresie retestare in
sensul ca rezultatele participantilor la variabila depresie retestare sunt semnificativ mai mari
fata de rezultatele participantilor la variabila depresie

6. Comparați rezultatele subiecților cu nivel scăzut al anxietății cu cele ale subiecților cu


nivel ridicat al anxietății la variabila dominare retestare.
Testul Independent Sample T Test
Rezolvare
VI nivelul anxietatii – scazut (Cod 1)
- ridicat (Cod 2)
VD - dominare retestare.

M nivel anx scazut = 14.76


M nivel anx ridicat = 10.91

H0 = Nu exista diferente semnificative intre rezultatele participantilor cu nivel scazut de


anxietate si rezultatele participantilor cu nivel ridicat de anxietate la variabila dominare retestare.
H1 = Exista diferente semnificative intre rezultatele participantilor cu nivel scazut de anxietate si
rezultatele participantilor cu nivel ridicat de anxietate la variabila dominare retestare.

Testul Lavene p = 0.813 > 0.05  citim randul 1


t(48) = 3.28 p = 0.002 < 0.05  Acceptam H1 si respingem H0  exista diferente semnificative
intre rezultatele participantilor cu nivel scazut de anxietate si rezultatele participantilor cu nivel
ridicat de anxietate la variabila dominare retestare in sensul ca rezultatele participantilor cu nivel

15
scazut de anxietate sunt semnificativ mai mari fata de rezultatele participantilor cu nivel ridicat
de anxietate.

7. Comparați rezultatele subiecților din eșantionul analizat cu rezultatele subiecților dintr-o


populație cu media 8.2, la variabila sociabilitate retestare.
Testul One Sample T Test
Rezolvare:

Mpopulatie = 8.2
Mesantion = 18.46

Ipoteze
H0 = Nu exista diferente semnificative intre rezultatele subiectilor din esantion si cele ale
subiectilor din populatia cu media 8.2 la variabila sociabilitate retestare.
H1 = Exista diferente semnificative intre rezultatele subiectilor din esantion si cele ale subiectilor
din populatia cu media 8.2 la variabila sociabilitate retestare.
t(49) = 11.6 p < 0.001 < 0.05  acceptam H1 si respingem H0  Exista diferente semnificative
intre rezultatele subiectilor din esantion si cele ale subiectilor din populatia cu media 8.2 la
variabila sociabilitate retestare, in sensul ca rezultatele subiectilor din esantion sunt semnficativ
mai mari fata de rezultatele subiectilor din populatie.
8. Comparați rezultatele funcționarilor, vânzătorilor și inginerilor la variabila sociabilitate
retestare.
Testul One Way Anova
Rezolvare
VI – profesia - functionari (cod 1)
- vanzatori (cod 2)
- ingineri (cod 3)
VD sociabilitate retestare.
M functionari = 14.37
M vanzatori = 17.43
M ingineri = 23

H0 = Nu exista diferente semnificative intre rezultatele participantilor de profesie funcționari,


vânzători și ingineri la variabila sociabilitate retestare.
H1 = Exista diferente semnificative intre rezultatele participantilor de profesie funcționari,
vânzători și ingineri la variabila sociabilitate retestare.

16
F(2;47) = 12.21 p < 0.001 < 0.05  acceptam H1 si respingem H0  Exista diferente
semnificative intre rezultatele participantilor de profesie funcționari, vânzători și ingineri la
variabila sociabilitate retestare.

M functionari – M vanzatori = -3.06, p = 0.30 > 0.05  dif nesemnificativa


M functionari – M ingineri = -8.62, p < 0.001 < 0.05  dif semnificativa
M vanzatori – M ingineri = -5.56, p = 0.009 < 0.05  dif semnificativa

Concluzii
1) Nu exita diferente semnificative intre participantii de profesie functionari si part de
profesie vanzatori la variabila sociabilitate retestare.
2) Rezultatele participantilor de profesie ingineri sunt semnificativ mai mari fata de
rezultatele part de profesie functionari la variabila sociabilitate retestare.
3) Rezultatele participantilor de profesie ingineri sunt semnificativ mai mari fata de
rezultatele part de profesie vanzatori la variabila sociabilitate retestare.

17

S-ar putea să vă placă și