Documente Academic
Documente Profesional
Documente Cultură
Definirea variabilelor
Avem urmatoarele date:
Nume
P.P.
G.G.
A.H.
A.B.
M.I.
M.A.
A.T.
T.A.
D.F.
F.E.
Gen
M
F
F
M
M
M
F
F
M
M
Varsta
35
27
44
18
25
32
45
23
39
19
Scor test
109
112
99
90
110
92
111
105
99
78
Minim, maxim
Vom calcula minimul varstei si maximumul scorului, de pe sheetul Variable
View:
Analyze -> Descriptive Statistics ->selectam variabila Varsta
->Options : bifam Minim (debifam pe celelalte) -> Ok
Analog,
Analyze -> Descriptive statistics ->selectam variabila Scor (si
deselectam variabila varsta) -> options: bifam Max ->Ok
Page 1
Page 2
Page 3
Observatie: Pentru recodificare calculam intai min si max, scadem min din max
si impartim la numarul de unitati la care facem referire, pentru a avea intervale
cat mai apropiate ca numar de valori,daca dorim sa avem intervale omogene.
Stiind acum min si max, le putem recodifica pe intervale de varste, carora
le artibuim alte valori, ca de exemplu:
18-25 ani ->1
26-35 ani ->2
36-45 ani ->3
Pentru a recoda aceste variabile vom face urmatorii pasi:
Transform -> Recode into different variables -> selectam variabila
Varsta, apoi denumin Output variable (Name: numele intervalelor
varsta, Label: explicatia intervalelor) -> Old and new values -> In
cadranul Old value bifam Range: 18 through 25, in cadranul New Value:
1 -> Add.
Analog, introducem toate intervalele, iar la sfarsit -> Continue ->Ok
Rezultatul va fi o noua coloana cu recodarea variabilelor respective, la care
trebuie sa mai modificam Decimals =0.
Pentru variabilele Scor, vom aplica Media aritmetica, Mediana si Modul
pentru Scor:
Analyze Descriptive statistics -> Frequencies -> selectam variabila->
debifam Min si Max, si bifam Mean (media aritmetica), Median si Mode.
-> Continue ->Ok
Va aparea urmatorul Output (Fig.3):
Page 4
Esantionarea
Esantionarea aleatoare urmareste stabilirea unui esantion aleator. Se
poate face prin numerotarea elementelor totale , apoi extragerea biletelelor din
caciula la intamplare. De cate ori trag un biletel, il bag la loc . Intotdeauna extrag
din toate, pana cand extrag unul care nu se repeta. Principalul neajuns este
acela ca exista posibilitatea extragerii unui esantion nereprezentativ.
La esantionarea stratificata stabilesc esantionul pe baza de pondere.
Asa o sa stiu cate elemente trebuie sa intervievez din fiecare grup . Dupa
stabilirea numarului de elemente din fiecare grup, trec la esantionare aleatoare.
Esantionarea cluster: se aplica un studiu asupra a trei blocuri cu cate 10
locatari din aceeasi zona, strazi diferite. Grupez elementele componente ale
fiecarui bloc pe strazi si prin esantionare aleatoare aleg strada pe care merg sa
studiez.
Esantionarea sistematica presupune existenta unui algoritm . Pasul
unu: pornesc de la a doua casa. Regula stabilita : chestionez fiecare a cincea
casa. Se numeste pas statistic.
Definitii: Avem 20 de subiecti.
Lot lotul de subiecti nu are reprezentativitate (lot de 20 de subiecti)
Page 5
A A C B C C B A C B C A B A A C C A B C
Apoi esantionam variabilele de mai sus, dup acum urmeaza:
3 -> A
2 -> B
5 -> C
I.e., vom avea un esantion reprezentativ pentru multimea anterioara,
cu un total de 10 valori.
Page 6
Page 7
Page 8
Page 9
Page 10
Calculam:
Z=(X-X)/ =(70-100)/15=-30/15= -2 , iar pentru cea de-a doua valoare:
Z=(X-X)/=(130-100)/15=2
In ambele cazuri, rezultatele +2 si -2 arata ca cele doua valori ale lui X sunt la
distanta de doua abateri standard fata de X (2S).
2S = 0,4772
Analog, pentru a afla procentajul, inmultim valoarea de mai sus cu 100
47,72 % din populatia data in problema de mai sus, are in IQ cuprins intre 70
si 100 (si respectiv 100 si 130).
Observatie: Intr-o distributie normala 95% dintre date se afla in intervalul [-2,
+2] abatere standard (2S); intervalul [-3, +3] abatere standard reprezinta 99%
din populatia data. Vom explica pe histograma urmatoare:
Page 11
Exercitiu: Pentru variabila varsta, (din tabelul de date) in SPSS vom calcula
Scorul Z:
Analyze -> Descriptive Statistics -> Descriptives -> selectam variabila
-> bifam Standardized values as variables -> OK
Va rezulta Outputul:
Page 12
Iar in Data View apare coloana Zvarsta (cu valorile abaterilor standard):
Observatii:
1. Media unei distributii Z este intotdeauna 0.
2. Abaterea standard a unei distributii Z este intotdeauna 1.
Testul T
Page 13
Exemplu:
Page 14
Page 15
Page 16
Page 17
Avem tabelul:
Page 18
Presupunem ca stim media pentru o anumita variabila, pe care vrem sa o comparam cu media
aceleiasi variabile din grupul nostru. Pentru tabelul de mai sus, vom avea, de exemplu,
media=8.2
Vom avea urmatorii pasi:
Analyze -> Compare Means -> One Sample T-Test -> selectam mediebac -> o mutam in
Test Variables -> la Test Values, trecem valoarea 8.2 -> OK ca in figura de mai jos:
Rezulta Output-ul:
Page 19
Sig. 2-tailed = 0.775 > 0.05 => acceptam ipoteza de Nul (H0), conform careia
nu exista diferente semnificative intre valoarea de referinta si media variabilei
din tabelul nostru. Mai avem si df=29 (grade de libertate).
Notiuni de filtrare a datelor in SPSS
In cazul in care avem rapoarte foarte mari cu care trebuie sa operam, avem
posibilitatea de le filtra, cu scopul de a folosi doar variabilele care ne sunt
necesare.
Avem, de exemplu, tabelul SPSS:
Ne propunem sa facem diverse calcule doar pentru datele care intrunesc conditia
ca variabila varsta sa fie >=25 (adica luam in calcul doar persoanele mai mari de
25 de ani), iar variabila scor >=99 (luam in calcul persoanele care au un scor
mai mare sau egal cu 99) si aplicam pe acel grup diverse formule statistice.
Data -> Select cases -> bifam IF -> IF (if condition is satisfied) -> IF ->
selectam variabila varsta -> adaugam criteriul (aici vom folosi >=25) ->
imediat adaugam separatorul | ->selectam variabila Scor -> adaugam
criteriul >=99 ->Continue ->OK.
Page 20
Vom inchide Output-ul, si vom vedea pe coloana cu Nr Crt din stanga tabelului o
bara diagonala la pozitia care nu intruneste conditiile setate de noi:
Aceasta inseamna ca orice formula am aplica pe acest tabel filtrat, valorile din
pozitia 4 si 10 nu vor fi luate in considerare.
Daca dorim, de exemplu, sa suspendam pentru moment , pentru variabila
Varsta, unde sunt deja atribuite intervale (prin recodare: 1= 18-24 ani, 2= 25-40
ani si 3=41-50 ani), aplicam:
Page 21
Data -> Select cases -> bifam IF -> IF (if condition is satisfied) -> IF ->
selectam variabila Categ -> adaugam criteriul ( categ=2) -> Continue ->
OK
In Data view vom avea:
Dupa cum se vede, pozitiile care cunt neluate in calcul sunt taiate, iar la
penultima coloana, apare cu 0 si 1 ce nu a fost si ce a fost luat in calcul.
Testul
Testul se foloseste atunci cand ne dorim sa verificam daca exista sau
nu diferente intre valorile observate si cele asteptate.
Exemplul 1:
Avem un zar (cu cifre de la 1 la 6). Ne asteptam ca la 36 de aruncari,
fiecare cifra de pe zar sa apara de cate 6 ori. In realitate exista o
probabilitate mica sa se intample asa ceva
Exemplul 2:
La un numar de 30 de aruncari ale unei monede ne asteptam sa avem un
raport in care in urma a 15 de aruncari sa avem ban, iar in celelalte 15
sa avem stema. Valorile observate in urma experimentului pot diferi de
valorile asteptate.
In SPSS vom avea un tabel in care vom defini variabilele Asteptata si
Observata (String, Scale, atribuim 1 pentru ban, 2 pentru
stema), apoi vom trece pe coloana cu variabila Asteptata ban de 15
ori, stema de 15 ori. Vom trece rezultatele observate in urma auncarii
monedei de 30 de ori si apoi vom calcula Testul :
Page 22
Analyze -> Descriptive Statistics -> Crosstabs -> Select -> Rows:
Observata, Columns: Asteptata -> Click pe Statistics -> bifam Chisquare -> Continue ->OK
Output-ul este:
Corelatii
Avem, spre exemplu, doua variabile: X1 si X2
r coeficientul de corelatie
Coeficientul de corelatie (r) poate lua valori in intervalul [-1; +1]
Daca r +1 , atunci exista o corelatie pozitiva intre cele doua
variabile, adica:
X1 => X2 (daca variabila X1 creste, atunci variabila X2 creste).
Aici avem:
r 0.70-0.80 => corelatie pozitiva puternica
r 0.40-0.70 => corelatie pozitiva medie
r 0.10-0.40 => corelatie pozitiva slaba
Daca r = 0 , atunci nu exista niciun fel de corelatie intre cele doua X1
si X2
Daca r -1 , atunci exista o corelatie negativa intre cele doua
variabile, adica:
X1 => X2 (daca variabila X1 creste, atunci variabila X2 scade)
Aici avem:
r -0.70/ -0.80 => corelatie negativa puternica
r -0.40/-0.70 => corelatie negativa medie
r -0.10/-0.40 => corelatie negativa slaba
Concluzie: cu cat r se apropie mai mult de valoarile +1 sau -1, cu atat
corelatia (pozitiva/negativa) este mai puternica.
Exemplu: Dorim sa vedem atat daca exista corelatie intre cele doua
variabile Varsta si Scor (luate ca exemplu si in situatiile anterioare), cat si
cu ce fel de corelatie ne confruntam. In SPSS vom avea urmatoarea cale:
Page 24
Page 25
Page 26