Documente Academic
Documente Profesional
Documente Cultură
Co !elia Ma"i#
Bucureti, 2010
CUPRINS
CUPRINS...................................................................................................................................2 CAPITOLUL 3. ELEMENTE DE ANALIZ STATISTIC..............................................3 3.1. Caracteristicile statistice, variabile i scale de msurare.........................................3 3.2. Mrimile medii, indicatorii variaiei i asimetriei...................................................4 Mrimile medii....................................................................................................................4 Valorile medii de poziie i de structur.............................................................................8 Indicatorii variaiei i asimetriei......................................................................................13 Scoruri standard, curba normal, ipoteze statistice, coe icientul de corelaie................1! Scorurile standard i curba normal................................................................................1! "oe icientul de corelaie #earson....................................................................................$$ Capitolul 4. Analize i aplicaii statistice. Pro ramul !P!!.......................................24 4.1. %ncrcarea, editarea i trans ormarea datelor. ........................................................$& "omponenta 'ata (ditor...........................................................................................$& 4.$. "omponenta )utput Vie*er......................................................................................3& 4.3. +nalize i aplicaii statistice......................................................................................4, BIBLIOGRAFIE.....................................................................................................................58
=-i
-3
i31
unde%
-
-i
n
!'t! "!$ia a*it"!ti(& 'i"pl&& reprezint termenii individuali ai seriei .-1, -2, ; -n/ iar suma acestora este% -1 < -2 < ; < -n 3 -i i31 reprezint numrul de termeni pentru care se calculeaz media.
"n urmtorul e-emplu sunt prezentate notele obinute la teste i la interviu de ctre 4 studeni care s+au prezentat pentru promovarea unui e-amen% N "! 't $!#/i !tudent 1 !tudent 2 !tudent 3 !tudent 4 !tudent 4 + Not! la t!'t l ) 15 8 8 6 15 - 3 4394 3 7,:5 Not! la t!'t l 2 6 8 7 6 6 - 3 4294 3 7,45 Not! la i#t!*,i 7 7 6 7 8 - 3 4594 3 7,55
"n ultima linie a tabelului s+au calculat mediile aritmetice simple pentru teste i interviu. Mrimile medii ponderate se pot calcula atunci c'nd #iecrei variante a unei caracteristici i se poate ataa o #recven.
=-i#i
-p 3 m
i31
unde%
-p
=#i
i31
-i #i
m
este "!$ia a*it"!ti(& po#$!*at&& reprezint termenii variantelor .-1, -2, ; -n/& reprezint #recvena sau ponderea #iecrei variante& reprezint numrul variantelor pentru care se calculeaz media.
)ac vom or aniza datele ast#el $nc't s evideniem #recvenele pentru notele obinute $n dou variante .varianta 1 corespunztoare intervalului de note cuprinse $ntre 6 i 15 i varianta 2 pentru intervalul de note cuprinse $ntre 8 i 7/ atunci termenii variantelor vor trebui calculai ca #iind mi>locul #iecrui interval. "n acest caz vom obine urmtorul tabel% 0a*ia#t! 4 5 )6 758 M!$ia po#$!*at& Mi1lo( l $! i#t!*,al 2-i3 6,4 8,4 + F*!(,!#/& #ot! t!'t ) .#i/1 3 2 -p 3 7,8 F*!(,!#/& #ot! t!'t 2 2#i 32 3 2 -p 3 7,8 F*!(,!#/& #ot! i#t!*,i 2#i33 1 4 -p 3 8,6
? alt aplicaie a mediei ponderate este atunci c'nd se utilizeaz ponderi .coe#icieni de importan/ pentru termenii individuali ai seriei sau pentru intervale. Pentru e-empli#icare vom presupune c se dorete ca notele obinute la proba interviu s #ie ponderate ast#el% Nota 15 6 7 8 @: Po#$!*! 5,4 5,3 5,2 5,1 5
)ac se lucreaz cu ponderi subunitare, atunci $ntotdeauna suma ponderilor acordate trebuie s #ie 1. "n cazul utilizrii valorilor procentuale, suma ponderilor va trebui s #ie 155. Aevenind la primul tabel, con#orm ponderilor dorite vom avea% Not! i#t!*,i 7 7 6 7 Po#$!*i 5,2 5,2 5,3 5,2
5,1 +
Media armonic a termenilor unei serii se de#inete ca #iind acea valoare a crei mrime invers este media aritmetic rezultat din valorile inverse ale termenilor aceleiai serii. )ac -1, -2, ; -n reprezint termenii seriei, atunci valorile lor inverse vor #i% , ,;, 1 1 1 . -1 -2 -n 2ormula de calcul a mediei armonice simple este% -a 3 n n unde% 19 i -a mediile este "!$ia a*"o#i(& 'i"pl& & #i% Pentru e-emplul anterior armonice calculate vor i31 -i reprezint termenii individuali ai seriei .-1, -2, ; -n/& n reprezint de termeni se la calculeaz N "! 't $!#/i Not! la t!'tnumrul l) Not! la t!'tpentru l 2 care Not! i#t!*,i media. !tudent 1 15 6 7 !tudent 2 8 8 7 !tudent 3 8 7 6 !tudent 4 6 6 7 !tudent 4 15 6 8 -a 3 7,37 -a 3 7,32 -a 3 8,64 +
"n tabel se observ c valorile mediilor armonice calculate sunt mai mici dec't cele ale mediilor aritmetice. "n acest sens trebuie cunoscut #aptul c, $ntotdeauna dac valorile termenilor sunt pozitive atunci valorile mediilor armonice calculate vor #i mai mici dec't cele ale mediilor aritmetice. ,-presia mediei armonice ponderat este%
-ap
=#i 3 m = #i9-i
i31 i31
unde%
-ap
-i #i
m
este "!$ia a*"o#i(& po#$!*at&& reprezint termenii variantelor .-1, -2, ; -n/& reprezint #recvena sau ponderea #iecrei variante& reprezint numrul variantelor pentru care se calculeaz media.
Media ptratic Media ptratic se obine $n mod similar cu media aritmetic dar cu deosebirea c valorile termenilor seriei se ridic la ptrat, iar apoi se e-tra e radicalul de ordinul 2 din suma acestora raportat la numrul de termeni pentru care se calculeaz.
=-i2
-12 < -22< ; < -n2 3
i31
n
-pa
2ormulele de calcul ale mediei ptratice simple . ptratice ponderate . -pap / sunt%
m
/ i ale mediei
-pa
.
i =1
2 i
-pap
.
i= 1 m
2 i i
i =1
unde%
-pa -pap
-i #i
m n
este "!$ia p&t*ati(& 'i"pl&& este "!$ia p&t*ati(& po#$!*at&& reprezint termenii seriei sau ai variantelor .-1, -2, ; -n/& reprezint #recvenele sau ponderile variantelor& reprezint numrul variantelor pentru care se calculeaz media& reprezint numrul de termeni pentru care se calculeaz media.
Pentru e-emplul prezentat mediile ptratice calculate vor #i% N "! 't $!#/i !tudent 1 !tudent 2 !tudent 3 !tudent 4 !tudent 4 + Not! la t!'t l ) 15 8 8 6 15 -pa 3 7,85 Not! la t!'t l 2 6 8 7 6 6 -pa 3 7,43 Not! la i#t!*,i 7 7 6 7 8 -pa 3 7,52
,ste de reinut #aptul c $ntotdeauna media ptratic este mai mare dec't media aritmetic, indi#erent de semnul termenilor. Cu c't valorile termenilor sunt mai mari cu at't ei vor in#luena mai mult valoarea mediei ptratice. )in acest motiv media ptratic se va #olosi atunci c'nd se dorete s se acorde o importan mai mare nivelurilor mai ridicate ale termenilor seriei.
Media geometric M!$ia 8!o"!t*i(& se calculeaz ca radical de ordinul n din produsul celor n termeni ai seriei.
-1.-2.;-n 3
.
i= 1
eometrice simple .
-/
/ i ale mediei
m
eometrice
-/
.
i= 1
-/p
i =1
.i
i =1
unde%
-/ -/p
-i
este media eometric simpl& este media eometric ponderat& reprezint termenii seriei sau ai variantelor .-1, -2, ; -n/&
i
.
i= 1
#i
m n
reprezint #recvenele sau ponderile variantelor& reprezint numrul variantelor pentru care se calculeaz media& reprezint numrul de termeni pentru care se calculeaz media.
,ste evident c prin proceduri manuale calculul mediei eometrice este #oarte laborios. Pentru a putea #i calculat media eometric este necesar ca toi termenii seriei s #ie pozitivi i mai mari dec't 5. ,ste de reinut #aptul c $ntotdeauna media eometric va #i mai mic dec't media aritmetic. Aelaia $ntre mediile prezentate este%
-a
-/
B - B
-pa
M!$ia#a .Me/ reprezint valoarea central a unei serii statistice care $mparte termenii unei seriei $n dou pri e ale. Cumtatea in#erioar va conine termenii ale cror valori sunt mai mici dec't valoarea medianei iar >umtatea superioar va conine termenii care au o valori mai mari dec't valoarea medianei. Lo( l "!$ia#!i .DMe/ $ntr+o serie de n termeni este% DMe 3
n +1 2
m Dme# 3 i =1 2
+1 i
I#t!*,al l "!$ia# va #i considerat acela $n care #recvenele cumulate depesc locul medianei $n serie. 2ormula de calcul a medianei $ntr+o serie de distribuie de #recvene este%
Me 3 -5 < d
0me
m
unde% Me este "!$ia#a& -5 este limita in#erioar a intervalului median& d reprezint mrimea intervalului median& Dme# reprezint locul medianei& #m este #recvena intervalului median& #p este #recvena intervalului precedent celui median.
Pentru o bun $nele ere a semni#icaiei i calcului medianei vom considera urmtorul e-emplu care prezint rezultatele $n puncte obinute de 6 studeni la un test. N "! 't $!#/i P #(t! o-/i# t! !tudent 1 235 !tudent 2 315 !tudent 3 245 !tudent 4 315 !tudent 4 145 !tudent : 175 !tudent 8 75 !tudent 7 345 !tudent 6 225 !e dorete or anizarea datelor $ntr+un alt tabel care s evidenieze #recvenele pentru urmtoarele intervale de puncte obinute de studeni% B 155, $ntre 155 i 255, $ntre 255 i 355, E 355. Pentru aceasta vom realiza urmtorul tabel $n care vor #i $nscrise i #recvenele cumulate% G* p! $! p #(t! N "&* $! 't $!#/i 6 F*!(,!#/! ( " lat!
o-/i# t! B 155 155 + 255 255 + 355 E 355 1otal Docul medianei .DMe#/ va #i%
29i3 1 2 3 3 =#i 3 6
1 3 : 6
m Dme# 3 i =1
2 deoarece aici #recvenele cumulate depesc locul medianei $n serie. Mediana .Me/ va #i cuprins $ntre 255 i 355 adic% 255 B Me B 355. )eci limita in#erioar a intervalului median .-5/ este 255. Mrimea intervalului median .d/ este 155. )in tabel se observ c suma cumulat a #recvenelor precedente intervalului median .=# p/ este 3. )e asemenea #recvena intervalului median .#m/ este tot 3. Con#orm #ormulei de calcul a medianei avem%
Me 3 -5 < d
0me
m
3 2:: puncte
Modulul
Mo$ l l .Mo/ reprezint valoarea termenului dintr+o serie care are #recvena ma-im.
15
Aevenind la e-emplul anterior $n care se prezint rezultatele $n puncte obinute de 6 studeni la un test observm c doi studeni .studentul 2 i studentul 4/ au obinut 315 puncte. )eci #recvena ma-im este 2 i ea corespunde termenului 315, ceea ce $nseamn c Mo 3 315 puncte. Pentru acest e-emplu media aritmetic este 231,11. )ac vom sorta tabelul dup punctele obinute vom observa c mediana Me 3 235% N "! 't $!#/i !tudent 8 !tudent 4 !tudent : !tudent 6 !tudent 1 !tudent 3 !tudent 2 !tudent 4 !tudent 7 P #(t! o-/i# t! 75 145 175 225 235 245 315 315 345
Modulul poate #i calculat de asemenea i pentru o serie de intervale de distribuie de #recvene. "n acest caz intervalul modal este intervalul corespondent intervalului corespondent celei mai mari #recvene. Pentru analize se va #olosi media aritmetic ponderat. )eoarece $ntr+o serie de distribuie de #recvene pot e-ista mai multe intervale corespunztoare #recvenei ma-ime rezult deci c pot e-ista mai multe module i mai multe intervale modale. "n aceste cazuri seria este plurimodal. 2ormula de calcul a modulului $ntr+o serie de intervale este% unde% Mo este "o$ l l& -5 reprezint limita in#erioar a intervalului modal& d reprezint mrimea intervalului modal& F1 3 #m * #m+1& F2 3 #m * #m<1& #m este #recvena intervalului modal& #m+1 este #recvena intervalului precedent celui modal& #m<1 este #recvena intervalului urmtor celui modal.
F1 Mo 3 -5 < d F1 < F2
Pentru e-empli#icare vom considera c $ntr+o companie e-ist urmtoarea distribuie de #recvene a veniturilor an a>ailor%
11
4 4 2 1
!e observ c #recvena cea mai mare .#m/ este : i corespunztor acesteia intervalul modal este cel cuprins $ntre 1555G i 1455G. )eci #m+1 3 4 iar #m<1 3 4. Dimita in#erioar a intervalului modal .-5/ este 1555G iar d 3 1455 * 1555 3 455. :+4 Mo 3 1555 < 455 .: * 4/ < .: * 4/ Pentru analize se recomand i calculul mediei aritmetice ponderate% .m 3 numrul de intervale 3 8/ 3 11:8G
=-i#i
-p 3 m
i31
=#i
i31
)eoarece valoarea modulului este mai mic dec't valoarea mediei rezult concluzia c $n e-emplul prezentat #recvenele termenilor mai mici sunt mai numeroase dec't #recvenele termenilor mai mari. "n cazul unei distribuii per#ect simetrice media, mediana i modulul au valori e ale. Mediana poate #i utilizat pe scale ordinale i pe scale de interval . scale $n !P!!/. Modulul poate #i utilizat pentru orice tip de scal dar este sin urul indicator pentru scala nominal.
Cuartile, decile, percentile Pentru seriile cu asimetrie mare i care au o amplitudine mare a variaiei se calculeaz i ali indicatori de poziie cum sunt% Huartilele, decilele, centilele i percentilele.
12
Iuartilele sunt acele valori ale termenilor care separ seria $n patru pri e ale. )eosebim ast#el Huartila in#erioar .I1/ care delimiteaz s#ertul in#erior .24J/ al termenilor, Huartila a doua .medie/ .I2/ care este e al cu mediana deoarece $mparte termenii $n dou pri e ale .45J/ i Huartila superioar .I3/ care delimiteaz s#ertul superior .84J/. "n mod similar decilele $mpart seria $n 15 pri e ale iar centilele $n 155 de pri e ale. Aezult c vor e-ista 6 decile i 66 centile. Pentru e-empli#icare vom considera urmtorul tabel care prezint punctele obinute de studeni la un test, trans#ormate $n note% N "! 't $!#/i !tudent 1 !tudent 2 !tudent 3 !tudent 4 !tudent 4 !tudent : !tudent 8 !tudent 7 !tudent 6 P #(t! o-/i# t! 235 315 245 315 145 175 75 345 225 Nota 7 15 6 15 8 8 : 15 7
Pe baza acestui tabel vom realiza tabelul sintetic al #recvenelor% Nota F*!(,!#/a A-'ol t& R!lati,& a-'ol t& ( " lat& *!lati,& ( " lat& 29i3 29(3 29*;9i<43 29*(3 1 1 5,11 5.11 2 3 5,22 5.33 2 4 5,22 5,44 1 : 5,11 5,:: 3 6 5,34 1 4 )
: 8 7 6 15 1otal
2recvena relativ cumulat procentual .adic $nmulit cu 155/ se numete *a#8 p!*(!#til. P!*(!#til!l! reprezint valoarea dintr+o distribuie care corespunde unui anumit ran percentil. Iuartilele sunt percentilele corespunztoare ran urilor percentile 24J, 45J i 84J. Ast#el $n e-emplul prezentat pentru nota 7 corespunde ran ul percentil 44J ceea ce $nseamn c 44J dintre studeni au obinut la test o not mai mic sau e al cu 7. Putem spune i c ran ului percentil 44J $i corespunde percentila 7.
A 3 -ma- + -min A"plit $i#!a *!lati,& a ,a*ia/i!i .AJ/ se calculeaz ca raport $ntre amplitudinea absolut a variaiei i nivelul mediu al variaiei% AJ 3 155 .A 9 - / A-at!*il! i#$i,i$ al! a-'ol t! .d de la deviation/ se calculeaz ca di#erene $ntre #iecare variant $nre istrat i media aritmetic a acestora. di 3 -i + ,ste evident c $ntotdeauna suma abaterilor absolute este nul% =. -i + - / 3 5. "n procedurile statistice se recomand calcularea acestei sume $n modul% =K -i + - K.
A-at!*il! i#$i,i$ al! *!lati,! .dJ/ se calculeaz ca raport $ntre abaterile absolute la nivelul mediu al caracteristicii% di J 3 155 .di 9 -i/ A-at!*!a = a*til& .AI/ se calculeaz ca di#eren $ntre Huartila 3 i Huartila 1% AI 3 I3 * I1 A-at!*!a '!"i5i#t!*= a*til& are urmtoarea e-presie% A!I 3 .I3 * I1/ 9 2
Indicatorii sintetici ai variaiei Lndicatorii sintetici ai variaiei .$mprtierii/ sunt% abaterea medie liniar, abaterea medie ptratic, dispersia i coe#icientul de variaie.
14
A-at!*!a "!$i! li#ia*& .dm/ se calculeaz ca o medie aritmetic a termenilor seriei de la media lor. dm 3 .=K -i + - K/ 9 n A-at!*!a 'ta#$a*$ .s/ se calculeaz ca o medie ptratic din abaterile tuturor variantelor seriei de la media lor aritmetic%
s3
. .i . / 2
i =1
Co!9i(i!#t l $! ,a*ia/i! .cv/ se calculeaz ca raport $ntre abaterea medie ptratic i nivelul mediu al seriei% cv 3 s 9 Di'p!*'ia .variana s2/ se calculeaz ca o medie aritmetic a ptratelor abaterilor termenilor #a de media lor
s2 3
. .i . / 2
i =1
!+a demonstrat c valorile pentru abaterea standard i pentru dispersie calculate dup #ormulele de mai sus pentru un eantion conin o imprecizie . bias/. Cu c't eantionul este mai mic cu at't dispersia va #i in#luenat mai mult de valoarea de la numitor. !e poate introduce ast#el o corecie n * 1 .la numitor/. Adic $n ambele #ormule $n loc de n putem avea n * 1. (aloarea n * 1 de la numitor este denumit # "&* l 8*a$!lo* $! li-!*tat!.
Indicatori ai formei distribuiei 2orma ra#ic a unei distribuii normale poate avea #a de mediana .Me/ o abatere de simetrie pe orizontal orientat ctre st'n a .simetrie ne ativ/ sau ctre dreapta acesteia .simetrie pozitiv/. Atunci c'nd pentru o distribuie Me 3 Mo 3 -
14
spunem despre aceasta c este per#ect simetric. Mrmtorul ra#ic ilustreaz #orma acestei distribuii $n care% Me 3 Mo 3 - 3 445
"n #uncie de distribuie pot #i obinute i alt#el de ra#ice ale curbei, prea aplatizate sau prea $nalte. Pentru a corecta aceste cazuri se utilizeaz indicele de boltire .1urtosis/.
)e asemenea, aa cum am speci#icat anterior putem $nt'lni dou #orme de ra#ice cu simetrie ne ativ sau cu simetrie pozitiv%
1:
Pentru corecta simetria ne ativ sau pozitiv se utilizeaz indicele de simetrie sau de oblicitate .s1e*ness/. I#$i(!l! $! -olti*! 2kurtosis3 se calculeaz $n mod similar cu abaterea standard dar prin ridicarea la puterea a patra. ,l variaz $n >urul valorii 5. Lndicele de boltire cu valori pozitive indic o curb $nalt iar cel cu valori ne ative o curb aplatizat. I#$i(!l! $! 'i"!t*i! 'a $! o-li(itat! 2skewness3 se calculeaz $n mod similar cu abaterea standard dar prin ridicarea la puterea a treia. Pentru valoarea 5 el indic o simetrie per#ect. (alorile pozitive sau ne ative indic o asimetrie st'n a 9 dreapta mai mult sau mai puin pronunat. 0alo*il! !>t*!"! al! #!i $i't*i- /ii pot #i #oarte bine evideniate prin intermediul unui ra#ic numit 2o. and 34is1er #lot sau pe scurt 2o. #lot, creat de 1uNeO. G*a9i( l Box Plot se prezint sub #orma unui dreptun 0i care are baza $n dreptul Huartilei 24 i latura superioar $n dreptul Huartilei 84. )eci $nlimea acestui dreptun 0i cuprinde 45J din valorile distribuiei. Mediana este reprezentat prin intermediul unei linii ce apare $n interiorul dreptun 0iului. Pentru e-empli#icare vom considera urmtoarea distribuie care conine punctele obinute la un test% 45, :5, 85, 75, 65, 155, 115, 125, 135, 14,, 141, 14$, 143, 144, 145 !e observ .evideniat cu caractere $nclinate/ a lomerarea mai multor valori $n partea superioar a distribuiei .$n intervalul 145 * 144/. Lat $n continuare ra#icul 2o. #lot corespunztor acestei distribuii, realizat cu !P!!%
18
G*a9i( l team and !eaf Plot .tulpin i #runz/ creat tot de ctre 1uNeO prezint de asemenea $ntr+o #orm su estiv e-plorarea unei distribuii sco'nd $n eviden #recvenele rupate. Lat $n continuare ra#icul Steam and 0ea #lot corespunztor aceleiai distribuii i realizat cu !P!!%
!e observ c sunt evideniate toate cele 14 valori ale distribuiei dintre care 4 se a#l sub 155 ele #iind 45, :5, 85, 75, 65 av'nd corespondent $n ra#ic linia a doua% .5 . 4:876/. )e asemenea 15 valori sunt mai mari sau e ale cu 155, dintre care : aparin domeniului 145. Aceste valori sunt evideniate $n linia a treia% .1 . 5123444444/.
17
"n continuare va #i prezentat un e-emplu de trans#ormare a punctelor obinute la un test, $n scoruri z. Media i abaterea standard sunt 231,11 respectiv 74,64. N "! 't $!#/i !tudent 1 !tudent 2 !tudent 3 !tudent 4 !tudent 4 !tudent : !tudent 8 !tudent 7 !tudent 6 - 3231,11& s374,64& P #(t! o-/i# t! 235 315 245 315 145 175 75 345 225 S(o* l 2#ota3 % +5,512 <5,618 <5,216 <5,618 +5,643 +5,464 +1,847 <1,373 +5,126 !uma 3 5
16
Convertirea valorilor unei distribuii $n scoruri z nu modi#ic #orma acesteia. !uma scorurilor $ntr+o distribuie z este $ntotdeauna 5. S(o* *il! t .64rustone/ se calculeaz pe baza scorurilor z dup urmtoarea relaie% ti 3 45 < 15 zi SAT 2 c"olastic #ssessement $est3 se calculeaz similar tot pe baza notelor z% !A1i 3 455 < 155 zi Cel mai #recvent se utilizeaz scorurile z i t. !imilar se calculeaz pentru eantioane scorurile z i t. "n acest caz - i se $nlocuiete cu media eantionului, - cu media populaiei din care s+a e-tras eantionul iar s cu eroarea standard a mediei de eantionare. Corespunztor scorurilor .z i t/ e-ist testele z i t cu a>utorul crora pot #i con#irmate sau in#irmate ipotezele. Pentru a lucra cu aceste teste $ntotdeauna trebuie s e-iste ipot!%a (!*(!t&*ii .de e-emplu% parcur erea unui curs anterior in#lueneaz per#ormanele studenilor la test/ i o ipot!%& $! # l care in#irm ipoteza cercetrii .de e-emplu% parcur erea unui curs anterior nu in#lueneaz per#ormanele studenilor la test/. Pentru #iecare scor z sau t se calculeaz o probabilitate p corespunztoare .ce poate #i sit $n tabelele z sau t/. )eoarece nu e-ist o aranie 155J pentru acceptarea sau respin erea unei ipoteze, atunci trebuie s #ie asumat un risc de eroare. Rivelul convenional minim acceptat pentru acesta este de 4J. Rivelul de risc poate #i e-primat i prin opusul lui .64J aa cum lucreaz !P!!/. "n acest caz 64J nu reprezint eroarea ma-im acceptat ci nivelul minim de $ncredere $n rezultatul e-perimentului. ? e-plicitare ra#ic a erorii ma-im acceptate este%
)ac scorul eantionului se a#l $n zona 0aurat de 4J atunci ipoteza de nul se respin e i se accept ipoteza cercetrii. Cu alte cuvinte dac p 7 ,,,5 atunci se accept ipoteza cercetrii.
,vident problema se >udec similar i pentru zona de 4J din st'n a ra#icului. Acesta este un test statistic unilateral .one tailed/.
25
Pentru a veri#ica ipoteza cercetrii simultan pe ambele laturi .st'n a * dreapta/ ale distribuiei se aplic testul z sau t bilateral .two tailed/%
)ac scorul eantionului se a#l $n oricare dintre zonele 0aurate de 4J atunci ipoteza de nul se respin e i se accept ipoteza cercetrii. Cu alte cuvinte dac p 7 ,,,5 atunci se accept ipoteza cercetrii.
!e recomand utilizarea testului z pentru un eantion de minim 35. Atunci c'nd volumul eantionului este B 35 sau c0iar E 35 se poate utiliza testul t. Di't*i- /ia t mai este denumit i distribuia !tudent. ,a are toate caracteristicile unei distribuii normale, are aceeai #orm de clopot dar care de aceast dat depinde de numrul radelor de libertate d# . de/rees o freedom/. Cu c't d# este mai mic cu at't #orma curbei devine mai aplatizat. Pentru un test statistic t aplicat unui si ur eantion e-presia de calcul a d# este% unde% d# reprezint numrul radelor de libertate& d# 3 R * 1 R este volumul eantionului. )ac testul t se aplic pentru dou eantioane primul de volum R1 iar al doilea de volum R2 atunci% d# 3 R1 < R2 * 2 Pentru a putea aplica testul t trebuie ca cele dou eantioane s #ie omo ene. !e recomand ca volumul cele dou eantioane s #ie e al .R1 3 R2/ iar dispersiile acestora s #ie apropiate. "n acest sens se poate aplica un t!'t $! o"o8!#itat! !evene%s $est care veri#ic valorile dispersiilor i calculeaz un indicator 2 numit *apo*t l Fi'?!*. )ac valorile 2 sunt mari atunci c0iar dac probabilitatea p calculat este mai mic dec't 5,54 aceasta indic #aptul c dispersiile sunt 0etero ene. Aezult ast#el c ipoteza nu poate #i acceptat. !P!! o#er i o alt posibilitate de calcul a valorilor t i pentru dispersii 0etero ene . 8ne9ual variances/. Aceast alternativ asi ur o acuratee mai mare a rezultatelor i a>ut cercettorul s poat discerne cu si uran dac accept sau respin e o ipotez. 1rebuie reinut c $n toate testele statistice criteriul de baz pentru semni#icaia statistic ig& .Si/ni icance/ este probabilitatea .p/ calculat pentru testul bilateral .two tailed sau '(tailed significance/.
21
Atunci c'nd se lucreaz cu mai mult de dou eantioane odat se poate utiliza testul AR?(A .#)alis:s * +#raiance/.
22
345,55 225,55
15 7
Coe#icientul de corelaie Pearson calculat pentru cele dou variabile este r 3 5,688. (aloarea acestuia arat c $ntre cele dou variabile e-ist o le tur puternic i o corelaie pozitiv. Ura#icul Scatter red #oarte su estiv aceste in#ormaii. "n concluzie se poate a#irma c studenii care au obinut un numr mare de puncte la test au obinut note mari la e-amenul #inal. C0iar dac $n analiza statistic cel mai utilizat este coe#icientul de corelaie Pearson totui se mai poate lucra i cu ali coe#icieni de corelaie cum sunt Vendall i !pearman. !emni#icaia acestora este similar cu cea a coe#icientului de corelaie Pearson. Lat pentru e-emplul prezentat valorile celor doi coe#icieni calculai de ctre !P!! pentru '(tailed significance% =endall>s tau?b "orrelation "oe icient Si/. @$AtailedB 3 5,641 Spearman>s r4o "orrelation "oe icient Si/. @$AtailedB 3 5,686 Prezentarea $n detaliu a acestora nu #ace obiectul acestui curs. Ln#ormaii teoretice suplimentare at't despre testele statistice c't i despre corelaii pot #i site $n cursurile avansate de statistic. Mai multe in#ormaii despre utilizarea practic a testelor statistice i a coe#icientului de corelaie vor #i date $n urmtorul capitol $n paralel cu prezentarea pro ramului !P!! i cu aplicaiile acestuia redate prin intermediul unor studii de caz.
23
)ac se va selecta a doua opiune .6:pe in data/ i se va apsa apoi butonul OB sau dac se va rspunde cu Cancel acestui dialo se va intra $n inter#aa de lucru cu baza de date .vizibil $n #undal * S#SS 'ata (ditor/. !P!! a #ost proiectat s #uncioneze ca un produs so#tWare de tip desc0is care s permit cu uurin sc0imbul de date cu alte baze de date sau produse so#tWare. Ast#el prin intermediul meniului ,ile este posibil oric'nd un import 9 e-port de date, crearea unor date noi sau salvarea datelor e-istente. Aceste operaiuni pot #i realizate cu a>utorul opiunilor ;e*, )pen, )pen 'atabase, Cead 6e.t 'ata, Save, Save +s ; din cadrul meniului ,ile.
24
!c0imbul de date sau obiecte .tabele, ra#ice etc/ $ntre !P!! i alte pro rame se poate realiza #oarte ele ant prin intermediul mecanismului "lipboard al sistemului de operare ."op:, #aste, "ut/.
!P!! poate $ncrca direct din 0ard disc date din #iiere care se a#l $n #ormat te-t, ,-cel, Dotus, d[ase sau se poate conecta prin ?)[C la alte baze de date cum sunt% M! Access, M! !ID, Parado-, Post res, ?racle etc pentru a $ncrca date din tabelele acestora sau date rezultate $n urma unor intero ri.
!P!! este un instrument #le-ibil care permite lucrul intuitiv cu meniuri i butoane ce pot #i con#i urate de ctre utilizatori con#orm pre#erinelor acestora. Lat modul $n care pot #i con#i urate barele de butoane .6oolbars/ i meniurile produsului%
24
din opiunea 6oolbars a meniului Vie* poate #i lansat o caset de dialo care permite con#i urarea barelor de butoane iar prin intermediul meniului 8tilities poate #i lansat editorul de meniuri%
)up un clic $n Variable Vie* va #i a#iat #ereastra variabilelor. ?bservm c e-ist de>a o #ormatare implicit pentru (AA55551. Aceasta este declarat ca #iind de tip numeric, cu o lun ime de 7 caractere din care 2 zecimale ce se va a#ia aliniat la dreapta i care va #i msurat pe o scal de tip Scale .raport 9 interval/.
2:
)up ce vom selecta variabila .(AA55551/ vom putea modi#ica numele acesteia prin tastare. Roul nume ales va #i P #(t!). !ub !P!! #iecare variabil poate avea o etic0et care se va a#ia $n capul de tabel al datelor sau $n rapoartele #inale. Presupunem c am editat similar etic0eta acestei variabile + P #(t! o-/i# t! la t!'t l). "n acelai mod se va crea o nou variabil P #(t!2 cu etic0eta P #(t! o-/i# t! la t!'t l2 i o alt variabil nominal S!> care va conine doar dou valori% 1 pentru masculin i 2 pentru #eminin. Pentru a se seta aceste valori s+a dat clic pe butonul ; %
,ste de remarcat #aptul c !P!! marc0eaz datele ne$ncrcate .sau lips/ cu un punct. Acestea sunt numite Missin/ Values. Atunci c'nd proceseaz datele !P!! va e-clude cazurile care au valori lips sau $n #uncie de model le va apro-ima. )ac meniurile (dit i Vie* ne o#er #uncii comune i utile pentru copierea, mutarea, ter erea i a#iarea datelor i variabilelor . "op:, #aste, "ut, "lear, Donts, Erid 0ines etc/, nu acelai lucru se poate a#irma despre "!#i l -ata care merit o tratare special.
28
Prin intermediul acestui meniu pot #i de#inite proprietile variabilelor i ale datelor, pot #i inserate cazuri i variabile noi, seriile de date pot #i sortate, se pot adu a date din alte #iiere e-terne .Mer/e Diles/, liniile pot #i trans#ormate $n coloane i coloanele $n linii .6ranspose/, pot #i identi#icate cazurile duplicate, se poate $mpri baza de date $n sub rupuri .Split Dile/, se poate lucra cu cazuri cu Y reutiZ speci#ice .3ei/4t "ases/ etc. Mnele dintre aciunile enumerate anterior pot #i realizate at't $n #ereastra datelor c't i $n cea a variabilelor prin intermediul meniurilor conte-tuale sau a barei de unelte%
)eoarece nu $ntotdeauna semni#icaiile ultimelor trei opiuni din meniul 'ata .Split Dile, Select "ases i 3ei/4t "ases/ sunt $nelese corect de ctre utilizatorii !P!! $nceptori, acestea vor #i prezentate i e-plicate $n continuare prin intermediul unor e-emple re#eritoare la utilizarea lor. )ac se dorete $mprirea bazei de date $n rupuri pentru o analiz detaliat $n #ereastra de raportare .a#iare/ a rezultatelor .)utput S#SS Vie*er/, atunci va putea #i utilizat op/i #!a plit ,ile al crui e#ect va #i vizibil doar $n #ereastra de a#iare a rezultatelor .nu i $n S#SS 'ata (ditor/. )e e-emplu dac se dorete a#iarea mediei, medianei, modulului i a abaterii standard pentru punctele obinute la testul 1, #ereastra )utput S#SS Vie*er va arta ast#el%
27
Not& 2elul $n care a #ost obinut acest raport . Drecuencies/ va #i prezentat atunci c'nd va #i descris meniul .+nal:ze/. Pentru a $mpri datele $n dou rupuri con#orm se-ului .masculin, #eminin/ $n vederea unor analize separate vom utiliza opiunea plit ,ile i vom speci#ica acest lucru $n urmtorul dialo care va aprea%
"n acest caz atunci c'nd va #i a#iat raportul solicitat, el va conine urmtoarele in#ormaii%
26
)ac se dorete anularea e#ectului Split Dile atunci se solicit din nou aceast opiune din meniul 'ata i se trece variabila de rupare .!e-/ $napoi $n sub#ereastra variabilelor .din partea st'n /, dup care se $nc0ide dialo ul%
!electarea unor cazuri pentru aplicarea procedurilor de analiz separat, doar pentru acestea se poate realiza prin intermediul opiunii elect Cases din acelai meniu 'ata.
35
Pentru e-empli#icare vom presupune c dorim s selectm pentru analize doar cazurile $n care studenii au obinut la testul 1 un numr de puncte mai mare de 255 .Puncte1E255/. "n acest sens dup solicitarea Select "ases se va speci#ica $n dialo ul care va aprea variabila dorit .Puncte1/ dup care se va $nscrie condiia $n urmtorul dialo I .tradus dac i disponibil dup apsarea butonului I /%
"n urma acestei aciuni #ereastra 'ata (ditor va prezenta cazurile neselectate marcate cu o linie dia onal $n capul de linie. "n acelai timp !P!! va crea o variabil nou ilter?F care va speci#ica pentru #iecare caz dac a #ost selectat sau nu. ,vident, $n mod asemntor va putea #i realizat cu uurin i o alt selecie de e-emplu doar pentru se-ul masculin .!e-31/%
?piunea /eig"t Cases d cazurilor o Y reutateZ di#erit creat prin simularea unei replicri a acestora. )e e-emplu dac avem seria 1, 2, 4, 4, :, 8, 3, 4 atunci 1 va #i considerat cu reutatea cea mai mic, el va avea o sin ur replicare. Pentru 2 c0iar
31
dac apare o sin ur dat $n serie se vor crea dou replicri, a. Lat $n continuare analiza de #recvene a#iat $n #ereastra )utput S#SS Vie*er .st'n a/ atunci c'nd 3ei/4t "ases nu este activat .modul normal de lucru/ i $n .dreapta/ atunci c'nd 3ei/4t "ases este activat% Atenie\ )ac s+a selectat 3ei/4t "ases, e#ectul acestuia rm'ne activat permanent. "n datele salvate cu 3ei/4t "ases activ se va salva automat i aceast setare. Pentru revenirea la modul de lucru normal este necesar deselecarea .prin bi#area opiunii 'o not *ei/4t cases/. M!#i l $ransform este de asemenea un meniu important al pro ramului !P!!. Aa cum su ereaz numele, acest meniu este important pentru trans#ormarea i crearea datelor. Ast#el pot #i enerate variabile derivate .c'mpuri calculate/, recodi#icate i contorizate datele, se pot enera ran uri etc. "n continuare va #i prezentat lucrul cu opiunile meniului 6rans orm #iind #olosite $n acest sens c'teva e-emple.
(om presupune c se dorete crearea unor ran uri corespunztoare valorilor variabilei Puncte1 ast#el% + pentru 5 @ Puncte1 @ 155 variabila Aan Puncte1 3 1 + pentru 151 @ Puncte1 @ 255 variabila Aan Puncte1 3 2 + pentru 251 @ Puncte1 @ 355 variabila Aan Puncte1 3 3 + pentru 351 @ Puncte1 @ 155 variabila Aan Puncte1 3 4 Pentru aceasta va trebui s ale em din meniul 6rans orm op/i #!a Recode. Mai $nt'i vom crea o variabil Aan Puncte1 .prin $nscrierea numelui $n )utput variable/%
32
)up apsarea butonului )ld and ;e* Values vom speci#ica $n urmtorul dialo intervalele de clas pentru ran uri%
"n urma acestei aciuni $n #ereastra 'ata (ditor va aprea corespunztor ran urilor alese, noua variabil Aan Puncte1%
? alt modalitate de a ierar0iza datele con#orm unor ran uri este utilizarea opiunii Rank Cases. )up apelarea acestei opiuni va aprea un dialo prin intermediul cruia se va speci#ica variabila pentru care se dorete crearea ran urilor%
33
"n acest e-emplu s+a ales aceeai variabil .Puncte obinute la testul 1/. )up apsarea butonului ?V $n #ereastra editorului de date va aprea o variabil nou APuncte1. !ort'nd datele dup aceast variabil vom avea%
Lat $n continuare dou e-emple care vor a>uta la $nele erea utilitii opiunii Compute din cadrul meniului 6rans orm. )eoarece dorim s realizm analize care s in seama i de v'rst, am inserat $n baza de date o variabil nou numit )ataRasterii. )up $ncrcarea datelor corespunztoare acestei coloane #ereastra editorului de date conine%
(a trebui s crem i s calculm o variabil ('rsta, derivat din )ataRasterii. "n acest sens vom avea% (arsta 3 2554 * Anul]Rasterii. !+a considerat anul curent ca #iind 2554. "n acest sens !P!! pune la dispoziie #uncia ^)A1,._,AA. 'ateValue/ care va $ntoarce anul dintr+o valoare tip dat calendaristic. )e e-emplu ^)A1,._,AA.52.12.1671/ 3 1671. )eci dup selectarea opiunii "ompute va aprea urmtorul dialo $n care am $nscris $n c'mpul 6ar/et Variabile numele variabilei ce va #i creat .(arsta/ i apoi prin redactare i cu a>utorul eneratorului de #ormule am compus e-presia .din ;umeric (.pression/% 2554 + ^)A1,._,AA.)ataRasterii/.
34
"n urma acestei aciuni $n S#SS 'ata (ditor a aprut ca un c'mp calculat v'rsta studenilor .(arsta/%
)ac se dorete obinerea unei noi variabile Puncta>Mediu al celor dou teste care s se calculeze dup #ormula% Puncta>Mediu 3 .Puncte1 < Puncte2/ 9 2 atunci $n dialo ul "ompute Variable va trebui s se completeze $n c'mpul 6ar/et Variabile numele variabilei .Puncta>Mediu/ iar $n ;umeric (.pression .Puncte1 < Puncte2/ 9 2. )up apsarea butonului ?V #ereastra editorului va conine%
34
3:
!eciunea din st'n a $n care apar pe o structur tip YarboreZ itemii de selecie #ormai din titlurile componentelor #iecrui raport, i seciunea din dreapta care conine titlurile, tabelele, valorile, te-tele a>uttoare etc ale soluiilor #urnizate de !P!! i care constituie de #apt situaia #inal de raport. Mn clic $ntr+un item de selecie activeaz componenta corespondent a#lat $n seciunea din dreapta. "n ima inea anterioar este prezentat un raport rezultat al opiunii Ceports A )0+# "ubes din meniul +nal:ze. (om denumi aceast ima ine )utput3 < S#SS Vie*er. )atele pe baza crora s+a realizat acest raport, e-istente $n 'ata (ditor sunt%
38
Meniul +nal:ze o#er toate opiunile pe baza crora pot #i realizate analize statistice sub !P!!. Prima opiune este Ceports. )up un clic dat pe opiunea ?DAP .*nline #nal:tical Processin/B "ubes a submeniului Ceports a aprut dialo ul )0+# "ubes prin intermediul cruia s+au selectat variabilele pentru care se dorete o analiz ?DAP.
Apsarea butonului Statistics o#er posibilitatea ale erii indicatorilor statistici ce se dorete a #i calculai $n cadrul acestei analize .)0+# "ubes Statistics/%
2orma iniial #urnizat de !P!! pentru acest raport $n )utput Vie*er a #ost%
Aaportul )0+# "ubes .la #el ca i alte rapoarte/ o#er posibilitatea studierii $ntr+o #orm interactiv a indicatorilor statistici dorii. Ast#el un clic dublu dat $n tabelul
37
)0+# "ubes determin un studiu $n detaliu pe baza seleciilor disponibile dup v'rst i se-% )e asemenea un clic dublu dat $n titlul rapoartelor sau $n oricare te-t e-istent o#er posibilitatea sc0imbrii i #ormatrii acestora prin intermediul unei bare de unelte .Dormattin/ 6oolbar/%
? #acilitate #oarte important pe care aceast bar o o#er este #ivot "ontrols .vezi butonul marcat din ima inea barei/. Aceast #acilitate este disponibil pentru con#i urarea $ntr+un raport a oricrui tabel .cu una sau mai multe intrri/. A'ndurile .ro*s/ i coloanele .columns/ pot #i create interactiv prin dra/ G drop .tra erea lor cu a>utorul mouse+ului/. "n e-emplul urmtor s+a dorit obinerea unui raport ?DAP detaliat pe se-e i pe v'rste.
Prin Ytra ereaZ variabilei !e- i a variabilei (arsta pe r'nduri .Co*s/ s+a obinut tabelul prezentat $n prima ima ine a acestui capitol numit )utput3 < S#SS Vie*er. ? alt #acilitate interesant a barei de unelte de #ormatare este i cea o#erit pentru realizarea reprezentrii ra#ice a coninutului oricrui tabel dintr+un raport. Lat $n continuare un ra#ic de tip #ie .plcint/ pe v'rste care a #ost realizat pentru tabelul din aceeai ima ine )utput3 < S#SS Vie*er. .(ezi aceast ima ine i datele din 'ata (ditor pe baza crora a #ost construit raportul din ima ine/.
36
Indicatorii descriptivi ?piunea Case ummaries a submeniului Ceports o#er o ima ine de ansamblu asupra valorii indicatorilor statistici descriptivi ai unor variabile ce pot #i prezentai rupai pe baza altor variabile. Pentru e-empli#icare s+a utilizat acelai set de date ca i pentru )0+# "ubes. Primul dialo care apare dup lansarea opiunii este Summarize "ases. Prin intermediul acestui dialo se pot selecta variabilele pentru analiz. "n cazul nostru s+au ales Puncte1 i (arsta iar pentru rupare !e-. Da apsarea butonului Statistics apare urmtorul dialo Summar: CeportH Statistics prin intermediul cruia vor #i selectai indicatorii statistici dorii%
)up un clic dat pe butonul ?V, !P!! va a#ia $n )utput < S#SS Vie*er urmtorul raport%
M!#i l -escriptives tatistics o#er posibilitatea calcului i analizei indicatorilor statistici descriptivi. Pentru toate e-empli#icrile acestui meniu vom lua $n considerare urmtorul set de date%
41
Prima opiune a meniului este ,re0uencies, sin ura care permite analiza de #recvene. )ialo ul Dre9uencies o#er posibilitatea selectrii variabilei .variabilelor/ pentru analiz iar dialo ul Statistics prezint indicatorii statistici ce pot #i calculai pentru raport.
[utonul "4arts disponibilizeaz un alt dialo prin intermediul cruia se poate speci#ica dac se dorete ca raportul s conin o reprezentare ra#ic i se poate selecta tipul de ra#ic dorit.
)up apsarea butonului ?V, raportul prezentat $n )utput < S#SS Vie*er va conine%
42
Op/i #!a -escriptives, dup selectarea variabilei pentru analiz .Puncte obinute la testul 1/ i ale erea indicatorilor statistici .minim, ma-im, media, abaterea standard i dispersia/ va o#eri urmtorul raport%
Op/i #!a .xplore este util atunci c'nd se dorete un studiu complet al indicatorilor statistici descriptivi pentru una sau mai multe variabile considerate a #i dependente .'ependent 0ist/ de una sau mai multe variabile cate oriale .Dactors/. Ca atare $n prima caset de dialo care va aprea dup lansarea acestei opiuni se vor selecta variabilele de analizat $n 'ependent 0ist iar .opional/ $n Dactor 0ist se vor selecta variabilele cate oriale $n #uncie de care se dorete analiza. "n acest dialo apare i un c'mp 0abel cases b: .rar utilizat/ care permite etic0etarea cazurilor la a#iare. "n e-emplul care urmeaz s+a utilizat acelai set de date .#olosit anterior/, ale 'ndu+se variabila Puncte1 pentru analiz i variabila (arsta ca variabil cate orial%
43
Aaportul corespunztor a#ieaz .$n mod implicit/ un sumar al cazurilor procesate, indicatorii statistici descriptivi i reprezentrile ra#ice StemAandA0ea #lots structurate pe v'rste.
44
De$% ipti&e$ 2uncte o3tinute %a te0tu%1 (ar0ta 20,00 Mean 95 !on"idence #nter$a% "or Mean 5 &ri''ed Mean Median (ariance )td. *e$iation Mini'u' Ma+i'u' ,an-e #nter.uarti%e ,an-e )/ewne00 1urto0i0 Mean 95 !on"idence #nter$a% "or Mean 5 &ri''ed Mean Median (ariance )td. *e$iation Mini'u' Ma+i'u' ,an-e #nter.uarti%e ,an-e )/ewne00 1urto0i0 Mean 95 !on"idence #nter$a% "or Mean 5 &ri''ed Mean Median (ariance )td. *e$iation Mini'u' Ma+i'u' ,an-e #nter.uarti%e ,an-e )/ewne00 1urto0i0 Mean 95 !on"idence #nter$a% "or Mean 5 &ri''ed Mean Median (ariance )td. *e$iation Mini'u' Ma+i'u' ,an-e #nter.uarti%e ,an-e )/ewne00 1urto0i0 )tati0tic 265,00 182,32 347,68 265,00 265,00 2700,000 51,962 220 310 90 90 ,000 -6,000 280,00 -101,19 661,19 . 280,00 1800,000 42,426 250 310 60 . . . 250,00 -1020,62 1520,62 . 250,00 20000,000 141,421 150 350 200 . . . 146,67 3,24 290,09 . 180,00 3333,333 57,735 80 180 100 . -1,732 . )td. 4rror 25,981
21,00
22,00
. . 100,000
23,00
. . 33,333
1,225 .
44
Op/i #!a Crosstab permite realizarea unor tabele cu dubl intrare. Caseta de dialo corespunztoare ne o#er un suport interactiv pentru selectarea variabilelor reprezentate pe r'nduri .Co*s/, pe coloane ."olumns/ i a valorilor din celulele de intersecie ale acestora. "n mod implicit valorile celulelor vor reprezenta numrul de cazuri ."ounts/ ale #iecrei intersecii. Lat $n continuare raportul Crosstabulation a#iat $n )utput < S#SS Vie*er%
4:
Aa cum s+a artat anterior testul 1 este util pentru testarea di#erenelor $ntre valorile medii ale unei variabile care pot #i msurate $ntre di#erite rupuri la momente di#erite de timp, sau $n comparaie cu o populaie statistic ale crei valori pentru respectiva variabil sunt cunoscute. Cele mai #recvente aplicaii ale testului 1 sunt le ate de testarea di#erenei $ntre rupuri dependente sau independente. T!'t l T p!#t* 8* p *i i#$!p!#$!#t! este utilizat atunci c'nd aceeai variabil a #ost msurat $ntre dou asemenea rupuri i cercettorul vrea s tie dac di#erena mediilor $ntre rupuri este semni#icativ statistic. Prin rupuri independente $nele em acele rupuri care conin subieci di#erii. (om considera $n continuare un set de date pe baza cruia dorim s veri#icm dac notele #inale ale unui rup de 14 studeni compus din 8 biei i 8 #ete di#er semni#icativ $n #uncie de se-ul acestora. !etul de date este% Nota 9i#al& 7 6 : 7 6 7 8 8 15 8 6 : 8 7 S!> masculin masculin masculin masculin #eminin #eminin #eminin #eminin #eminin masculin #eminin masculin #eminin masculin 0D*'ta 25 25 23 25 21 21 22 23 22 23 25 22 23 22
Op/i #!a Means .medii/ a meniului "ompare Means ar trebui s #ie prima consultat, deoarece ea ne poate o#eri o in#ormaie interesant relativ la notele medii ale celor dou se-e. Prin intermediul primului dialo al opiunii . Means/ vom selecta
48
variabila dependent .Rota/ i variabila independent .!e-/. Mn clic pe butonul )ptions va desc0ide un nou dialo prin care vom putea ale e indicatorii statistici ce vor #i a#iai.
Aaportul #inal .Aeport/ care ne va prezenta cele dou medii 8,43 pentru biei i 7,14 pentru #ete este%
Pe baza acestui raport s+ar putea tra e urmtoare concluzie% notele #etelor sunt mai mari, deci notele depind de se-. )ar s nu ne rbim cu aceast a#irmaie care $nc nu este dec't o ipotez pe care va trebui s o veri#icm prin intermediul unui test 1 pentru rupuri independente. Op/i #!a Independent( amples $ $est ne d aceast posibilitate. Primul dialo .IndependentASamples 6 6est/ ne o#er suportul pentru a putea ale e variabilele dorite. Am selectat ca variabil testat Rota i ca variabil de rupare !e-. )eoarece rupurile nu sunt de#inite .!e- .P P// un clic $n butonul 'e ine Eroups ne va a>uta $n acest sens. Pentru c variabila de rupare este !e- i pentru c atunci c'nd a #ost de#init i s+au atribuit dou valori% 13masculin i 23#eminin, vom speci#ica acest lucru $n dialo ul 'e ine Eroups.
47
G o'p Stati$ti%$ )e+ 'a0cu%in "e'inin 5 7 7 Mean 7,43 8,14 )td. *e$iation 1,134 1,215 )td. 4rror Mean ,429 ,459
5ota "ina%a
I!)epe!)e!t Sa#ple$ Te$t Le$ene;0 &e0t "or 4.ua%it< o" (ariance0 t-te0t "or 4.ua%it< o" Mean0 95 !on"idence #nter$a% o" t8e *i""erence Lower Upper -2,083 -2,084 ,654 ,655
: 5ota "ina%a 4.ua% $ariance0 a00u'ed 4.ua% $ariance0 not a00u'ed ,090
)i-. ,769
t -1,137 -1,137
d" 12 11,943
!e observ $n ultimul tabel testul 0evene care a #ost aplicat pentru veri#icarea omo enitii. Aeamintim #aptul c o valoare mic a raportului 2 .2ic0er/ i o probabilitate .Si/./ B 5,54 con#irm #aptul c omo enitatea dispersiilor este asi urat. )ac omo enitatea dispersiilor nu e-ist, atunci citirea rezultatelor trebuie #cut pe linia a doua .(9ual variances not assumed/. ?bservm c pentru acest test nota t calculat este t 3 +1,138, numrul radelor de libertate d# 3 R * 2 3 12 i probabilitatea Si/.@$AtailedB 3 5,287. )eoarece 5,287 E 5,54 atunci ipoteza cercetrii este in#irmat i este acceptat ipoteza de nul% notele nu depind de se-. Op/i #!a *ne( ample $ $est se poate aplica atunci c'nd se veri#ic media unui eantion #a de media unei populaii creia aparine acel eantion. "n cazul e-emplului nostru vom presupune c nota medie obinut la respectiva disciplin .probabil obli atorie/ de ctre toi studenii absolveni ai universitii, pe parcursul mai multor ani este cunoscut, ea #iind 8. )orim s veri#icm ipoteza con#orm creia notele studenilor din eantion se $ncadreaz $n aceast tendin. "n acest sens vom lansa opiunea )neASample 6 6est i vom speci#ica nota 8 $n c'mpul 6est Value. Aaportul obinut dup apsarea butonului ?V va #i%
O!e(Sa#ple Te$t &e0t (a%ue 9 7 95 !on"idence #nter$a% o" t8e *i""erence Lower Upper ,10 1,47
5ota "ina%a
t 2,474
d" 13
!e observ c Si/. 3 5,527 B 5,54. Aezult c ipoteza cercetrii se accept. !ub !P!! t!'t l T poat! 9i apli(at .i p!#t* 8* p *i $!p!#$!#t! . Acest test necesit dou msurri ale aceleiai variabile la dou momente di#erite de timp. 2iecare caz va corespunde unei sin ure persoane. Ast#el poate #i veri#icat de e-emplu dac absolvirea unui curs pltit de o companie pentru anumit un rup de an a>ai contribuie sau nu la creterea per#ormanelor acestora. "n acest sens este necesar msurarea per#ormanelor an a>ailor care au urmat cursul, $nainte i dup absolvire. Pe baza di#erenelor care
46
apar $ntre medii se va accepta sau se va respin e ipoteza bazat pe presupunerea c respectivul curs a contribuit la creterea per#ormanelor an a>ailor. Op/i #!a Paired( amples $ $est .testul 1 pentru rupuri perec0e/ ne o#er posibilitatea s aplicm testul 1 pentru dou rupuri dependente. "n cazul e-emplului enunat variabila msurat va #i nota care cuanti#ic per#ormana an a>ailor $nainte i dup absolvirea cursului. (om de#ini dou variabile Rota1 i Rota2. (ariabila Rota1 conine notele an a>ailor $nainte de curs i variabila Rota2 notele an a>ailor dup curs. !etul de date care include cele dou note ale unui rup de 1: an a>ai ce au urmat cursul este%
)up lansarea opiunii #airedASamples 6 6est din cadrul meniului "ompare Means, va aprea urmtorul dialo prin intermediul cruia vor #i selectate cele dou variabile supuse studiului .Rota1 i Rota2/%
45
!e observ Si/.@$AtailedB 3 5,544 care este B 5,54. Aezult c ipoteza cercetrii se accept. Cursul a contribuit la creterea per#ormanelor an a>ailor. A#ali%a $i'p!*'io#al& ANO0A .#)alis:s * +#riance/ constituie un alt instrument statistic #oarte #le-ibil cu a>utorul cruia pot #i comparate di#erenele dintre mai mult de dou valori medii ale unor variabile. ,-ist dou modele AR?(A ce pot #i utilizate. Primul este *ne(/a3 ANO0A care este similar cu testul 1 cu e-cepia c pot #i testate simultan mai mult de dou di#erene $ntre medii. Al doilea model este $wo(/a3 ,actorial ANO0A i reprezint o e-tensie a primului model. )i#erena const $n posibilitatea utilizrii unei analize #actoriale care poate avea mai mult dec't o sin ur variabil de rupare. Pentru a e-empli#ica lucrul cu cele dou modele AR?(A vom mai adu a tabelului de date din .'ata (ditor/ dou variabile (arsta i !e-. !etul de date va #i%
(om presupune c cercettorul dorete s cunoasc dac v'rsta an a>ailor in#lueneaz creterea per#ormanelor realizate de ctre acetia dup absolvirea unui
41
curs. )eci variabila dependent va #i Rota2 iar variabila #actor (arsta. )in tabelul de date se observ c v'rsta an a>ailor este cuprins $ntre 25 i 23 de ani. ?piunea *ne(/a3 ANO0A disponibil de sub acelai meniu Means va lansa un dialo prin intermediul cruia va #i setat semni#icaia celor dou variabile%
Con#orm rezultatelor din raport Si/. 3 5,2:4 E 5,54 concluzionm c se respin e ipoteza cercetrii con#orm creia v'rsta in#lueneaz per#ormanele an a>ailor care au absolvit cursul. M!#i l 4eneral !inear Model o#er posibilitatea unor analize AR?(A .#actoriale/ realizate simultan pentru una sau mai multe variabile ce pot #i in#luenate de mai muli #actori. (or #i prezentate $n acest sens opiunile 8nivariate i Multivariate.
42
Mer 'nd pe acelai e-emplu, vom presupune c cercettorul dorete o analiz comple- prin care s studieze e#ectul separat i $mpreun a doi #actori + v'rsta i se-ul + asupra variabilei de per#orman Rota2. Lpoteza cercetrii este% v'rsta i se-ul in#lueneaz per#ormanele an a>ailor msurate prin valorile variabilei Rota2.
Op/i #!a 5nivariate permite realizarea unor ast#el de analize. Prin intermediul dialo ului cu acelai nume se pot selecta variabilele tip #actor i variabila dependent%
Aezult c ipoteza cercetrii nu poate #i acceptat nici separat pentru #iecare #actor nici $mpreun pentru cei doi #actori .(arsta i !e-/. 1oate valorile Si/. .5,43:, 5,456, 5,744/ sunt mai mari dec't 5,54.
43
Op/i #!a Multivariate permite lucrul cu mai multe variabile care pot #i dependente simultan de mai muli #actori. Pentru e-empli#icare con#orm setului de date utilizat $n e-emplele anterioare vom presupune c se dorete studiul a dou variabile dependente .Rota1 i Rota2/ $n #uncie de doi #actori .(arsta i !e-/. "n acest sens dialo ul Multivariate va #i%
)ource !orrected Mode% #ntercept )e+ (ar0ta )e+ = (ar0ta 4rror &ota% !orrected &ota%
44
a. , ).uared 9 ,503 6>d?u0ted , ).uared 9 ,0687 3. , ).uared 9 ,380 6>d?u0ted , ).uared 9 -,1637
!e observ c toate valorile Si/. .at't pentru Rota1 c't i pentru Rota2/ sunt mai mari dec't 5,54. Aezult c pentru toate cazurile ipoteza cercetrii nu va #i acceptat. !e poate concluziona% rezultatele obinute at't $nainte de participarea la curs c't i cele obinute dup absolvirea cursului nu cresc semni#icativ nici pe seama #actorului v'rsta nici pe seama #actorului se- nici simultan pe baza celor doi #actori. M!#i l Corelate ne o#er posibilitatea de a putea studia corelaia $ntre dou variabile prin intermediul coe#icienilor de corelaie. !+a artat $ntr+un capitol anterior c atunci c'nd se dorete msurarea valorilor a dou variabile din acelai eantion pentru a se a#la dac $ntre acestea e-ist o relaie i care este intensitatea relaiei se utilizeaz coe#icienii de corelaie. Cel mai #recvent se utilizeaz coe#icientul de corelaie Pearson. 2elul corelaiei se e-prim prin semnul coe#icientului de corelaie .r/ iar i#t!#'itat!a l!8&t *ii dintre cele dou variabile se e-prim prin valoarea acestuia care va #i cuprins $n intervalul S+1, <1T. ! considerm c dorim s studiem dac $ntre notele #inale obinute de un rup de studeni i numrul de ore alocate sptm'nal de ctre acetia pentru studiu e-ist o le tur .o relaie/. (om realiza un sonda> prin care le vom solicita studenilor participani s speci#ice aceste date. Lpoteza cercetrii este% $ntre notele #inale i numrul de ore alocate sptm'nal studiului e-ist o corelaie .le tur/ semni#icativ. Presupunem c datele sonda>ului aplicat unui rup de 14 studeni i $nscrise $n 'ata (ditor sunt%
44
Op/i #!a Bivariate din cadrul meniului "orelate ne o#er posibilitatea s realizm acest studiu de corelaie. )ialo ul 2ivariate "orelations ne a>ut s selectm variabilele pentru care dorim calculul coe#icienilor de corelaie i s speci#icm care coe#icieni de corelaie dorim s #ie calculai i ce test de semni#icaie vom utiliza.
4:
?bservm c $ntre cele dou variabile e-ist o corelaie pozitiv #oarte intens .r35,615/. Aezult c ipoteza cercetrii va #i acceptat.
48
Bi-lio8*a9i!
1. An 0elac0e. C. .2556/. 6ratat de statistic teoretic i economic . [ucureti% ,ditura ,conomic. 2. [i>i, M. et.al. .2515/. Statistic pentru economiti. [ucureti% ,ditura ,conomic. 3. 2ield, A. .2554/. 'iscoverin/ statistics usin/ S#SS. 10ousand ?aNs. !a e Publications. 4. Caba, ,., Urama., A. .2554/. +naliza statistic cu S#SS sub 3indo*s . Lai% ,ditura Polirom. 4. Popa, M. .2557/. Statistic pentru psi4olo/ie. 6este i aplicaii S#SS. Lai% ,ditura Polirom. :. !alNind, R. .2515/. Statistics or #eople 34o @64in1 64e:B Iate Statistics 3e < !P!! 8. v 17.5. MniversitO o# Vansas, !a e Publications. 7. (asilescu, U. .2552/. +naliza statistic economic i metode de evaluare a irmei. [ucureti% ,ditura )idactic i Peda o ic.
47