Sunteți pe pagina 1din 70

Utilizarea SPSS i Excel pentru aplicaiile SACM

Pentru prelucrarea unui set de date memorat ntr-un document Excel se pot
utiliza att funciile statistice ale aplicaiei, ct i proceduri obinute prin Tools
Data Analysis.
Funciile statistice uzuale sunt (n ordine alfabetic!
AVEDEV " abaterea medie absolut
AVERAGE " media aritmetic
!"#MD!ST " funcia de repartiiebinomial
C$!D!ST " funcia de repartiie #$
C$!!"V " in%ersa funciei de repartiie #$
C$!TEST " aplicarea testului #$
C#"%!DE"CE " inter%alul de ncrederepentru medie
%D!ST " funcia de repartiie F
%!"V " in%ersa funciei de repartiie F
%TEST " aplicarea testului F
$ARMEA" " media armonic
&URT " coeficientul de aplatizare
M!", MA' " %alorile extreme din list
MED!A" " mediana
M#DE " %aloarea mod
"#RMD!ST " funcia de repartiienormal
"#RM!"V " in%ersa funciei de repartiienormal
"#RMSD!ST " funcia de repartiienormal standard
"#RMS!"V " in%ersa funciei de repartiienormal standard
PERCE"T!(E " &uantile
)UART!(E " &uartile
RA"& " ran'ul ar'umentului ntr-o list
S&E* " coeficientul de asimetrie
STA"DARD!+E " %aloarea standardizat aar'umentului
STDEV " abaterea standard
TD!ST " funcia de repartiie (tudent, t
T!"V " in%ersa funciei de repartiie(tudent
TTEST " aplicarea testului (tudent
VAR " dispersia
Pentru a utiliza procedurile statistice, trebuie ca prin Tools A,,!ns s se
%erifice dac este instalat utilitarul Analysis ToolPa-.
)n caz afirmati%, comanda Tools Data Analysis %a desc*ide dialo'ul Data
Analysis din care sunt accesibile oserie de prelucrri statistice conduse de
dialo'urile asociate. +stfel, Descriptive
Statistics %a produce indicatorii statistici ai unei %ariabile continue.
,ot n partea de descriere statistic poate fi ncadrat i metoda de creare a
cuburilor -.+P prin Data Pi.ot Ta/le, metod prin care se obin distribuiile
simple sau multi%ariate ale unor %ariabile discrete sau indicatorii
statisticieseniali ai subpopulaiilor.
/e asemenea, nu trebuie uitat c toate procedurile le'ate de reprezentrile
'rafice, iniiate prin !nsert 0 C1art (sau uneltele corespunztoare sunt o parte a
prelucrrii statistice descripti%e oferind 'rafice, *isto'rame etc.
Procedurile prezentate sunt disponibile prin dialo'ul Tools 0 Data Analysis2
RANDOM NUMBER GENERATION
0tiliznd aceast procedur se pot 'enera serii de numere aleatoare distribuite
dup 1 tipuri diferite de funcii de repartiie. 2ezultatul const n una sau mai
multe coloane de numere, fiecare coloan reprezentnd %alori ale unei %ariabile
repartizate dup o funcie de repartiie precizat.
Pentru fiecare 'enerare se %a da numrul de coloane (%ariabile 'enerate,
numrul de %alori (acelai pentru toate %ariabilele, tipul funciei de repartiie,
parametrii funciei i locul unde se %or nscrie rezultatele.
/eoarece parametrii unei funcii de repartiie depind de tipul funciei,
prezentarea procedurii %a fi particularizat pentru cte%a clase de funcii.
/ialo'ul principal al procedurii 2andom 3umber 4eneration este prezentat n
fi'ura care urmeaz.
(e obser% cele patru componente principale ale dialo'ului! zona care
precizeaz tipul de 'enerare (numr de %ariabile, numr de %alori, tipul
distribuiei, zona cu parametrii funciei de repartiie " specific funciei
selectate ", zona parametrului de iniializare a 'enerrii aleatoare i zona de
precizare a domeniului rezultat.
3umber of 5ariables " se precizeaz numrul de %ariabile 'enerate, adic
numrul de coloane6
3umber of 2andom 3umbers " se precizeaz numrul de %alori 'enerate,
acelai pentru toate %ariabilele6
/istribution " se ale'e funcia de repartiie a %ariabilelor 'enerate.
Iniializarea generrii
2andom (eed " Procesele de 'enerare aleatoare sunt caracterizate i prin fixarea
unei %alori iniiale funcie de care se ncepe procesul de 'enerare. +ceast
%aloare, care nu nseamn prima %aloare 'enerat, este un numr ntre' ntre 7
i 8$999. /ac nu se precizeaz aceast %aloare, atunci se %a considera n mod
automat un numr aleator (obinut din data curent i timpul curent.
/iferena ntre cele dou situaii este! la ale'erea automat se 'enereaz de
fiecare dat serii diferite6 la ale'erea de ctre utilizator se %a 'enera aceeai
serie de fiecare dat cnd se indic acelai numr. Prin urmare, se %a completa
aceast zon doar dac, pentru a simula o anumit comportare sau prelucrare,
este ne%oie de 'enerarea aceleeai serii de numere aleatoare n utilizri
succesi%e.
Output options
-utput 2an'e, 3e: ;or<s*eet Pl=, 3e: ;or<boo< " potri%it descrierii de la
/escripti%e (tatistics. Precizeaz domeniul din foaia de calcul unde se %or
nscrie rezultatele.
Parameters
(tructura acestei zone depinde de funcia de distribuie selectat.
Repartiie ,iscret3 4Discrete5
(tructura zonei Parameters este prezentat n fi'ur. - ,istri/uie ,iscret3 este
distribuia unei %ariabile care ia un numr finit de %alori cu probabiliti fixate.
/eoarece %alorile trebuie s fie numerice, acest tip de repartiie
poate fi utilizat pentru probleme care implic %ariabile nominale atunci cnd
cate'oriile nominale sunt codificate numeric.
Precizarea distribuiei se face enumernd, ntr-o zon continu, %alorile posibile
i probabilitile asociate acestora, de 'enul
7 9,>9
$ 9,7?
8 9,$9
> 9,$?
pentru o %ariabil care ia %aloare 7 cu probabilitatea 9,>, %aloarea $ cu
probabilitatea 9,7? etc.
+cest exemplu poate s corespund repartiiei unei %ariabile nominale pentru
care cate'oriile au fost codificate cu 7, $, 8, sau >.
5alue and Probabilit= @nput 2an'e " se precizeaz domeniul care conine
definirea repartiiei discrete! un domeniu dreptun'*iular care d probabilitile
%alorilor numerice posibile.
/omeniul poate fi selectat dinamic.
Repartiie nor6al3 4"or6al5
(tructura zonei Parameters este prezentat n fi'ura alturat. Pentru
determinarea distribuiei este necesar s se precizeze %alorile pentru media i
abaterea standard a populaiei.
Aean " se precizeaz %aloarea pentru media populaiei.
(tandard /e%iation " se precizeaz %aloarea pentru abaterea standard a
populaiei.
5alorile implicite sunt cele ale repartiiei normale standard, media 9 i
abaterea standard
SAMPING
Procedura de sondaB permite obinerea unei submulimi dintr-o mulime de
%alori existent. Parametrii prezeni n dialo'ul procedurii sunt explicai n
continuare.
Input
@nput 2an'e " se specific domeniul, sau denumirea domeniului, care conine
datele din care se %a face selecia. /omeniul poate fi selectat i n mod dinamic.
/atele care Boac rolul populaiei statistice trebuie s fie de tip numeric i
or'anizate, de preferin, sub forma unei coloane sau a unei linii. Prima celul
poate conine denumirea setului de date. )n cazul n care selecia se face dintre
nre'istrrile unei baze de date (fiecare nre'istrare a%nd, uzual, mai multe
cmpuri se %a indica drept domeniu doar coloana unui cmp
cum ar fi numrul nre'istrrii, sau codul (numeric de identificare etc.
Input
@nput 2an'e " se specific domeniul, sau denumirea domeniului, care conine
datele din care se %a face selecia. /omeniul poate fi selectat i n mod dinamic.
/atele care Boac rolul populaiei statistice trebuie s fie de tip numeric i
or'anizate, de preferin, sub forma unei coloane sau a unei linii. Prima celul
poate conine denumirea setului de date. )n cazul n care selecia se face dintre
nre'istrrile unei baze de date (fiecare nre'istrare a%nd, uzual, mai multe
cmpuri se %a indica drept domeniu doar coloana unui camp cum ar fi numrul
nre'istrrii, sau codul (numeric de identificare etc.
.abels " boxa de control %a fi marcat dac domeniul indicat conine pe prima
poziie denumirea setului de date.
Sampling Met!o"
)n acest 'rup se precizeaz metoda de selecie.
Periodic " selectarea acestui buton radio permite indicarea n cmpul Period a
cotei fixe de formare a eantionului. /ac, de exemplu, se completeaz ?, atunci
eantionul este format din al ?-lea element i toate cele care urmeaz din ? n ?
(al 79-lea element, al 7?-lea, al
$9-lea etc.
2andom " selectarea acestui buton radio indic o formare aleatoare a
eantionului. Fiecare element are aceeai probabilitate de a fi ales. /in acest
moti%, dac mulimea de baz este relati% restrns, atunci unele elemente pot s
apar de mai multe ori n eantionul constituit. 5olumul eantionului se
specific n cmpul 3umber of (amples.
Output options
-utput 2an'e, 3e: ;or<s*eet Pl=, 3e: ;or<boo< " potri%it descrierii de la
/escripti%e (tatistics. Precizeaz domeniul din foaia de calcul unde se %or
nscrie rezultatele. 2ezultatul este o coloan cu %alorile selectate.
Veri7icarea ipotezelor statistice
(unt disponibile proceduri pentru efectuarea a trei tipuri de teste statistice!
" test F pentru compararea dispersiilor6
" test t pentru compararea mediilor, n toate %ariantele principale (eantioane
corelate, dispersii e'ale, dispersii nee'ale6
" test z pentru compararea mediilor.
Fiecare procedur are ca rezultat att probabilitatea critic a testului respecti%,
ct i %aloarea critic pentru un ni%el de semnificaie fixat de utilizator. @poteza
nul este, pentru fiecare test, aceea a e'alitii, deci respin'erea ei se %a face
dac probabilitatea critic este mai mic dect C, sau dac %aloarea calculat
este mai mare dect %aloarea critic.
Dompararea mediilor unor (subpopulaii se realizeaz prin proceduri apelate
din dialo'ul desc*is prin Tools Data Analysis.
+tunci cnd se compar mediile a dou populaii pe baza unor eantioane
necorelate este necesar parcur'erea etapelor!
7. ,estarea e'alitii dispersiilor prin procedura F-Test Two-Sample for
Variances.
$. )n funcie de decizia n test se %a aplica
E t-Test: Two-Sample Assuming Equal Variances n cazul nerespin'erii
ipotezei nule din testul F
E t-Test: Two-Sample Assuming Unequal Variances n cazul respin'erii
ipotezei nule n testul F.
/ac eantioanele sunt corelate, situaie caracteristic comparrii rezultatelor
unui 'rup nainte i dup efectuarea unui experiment, se aplic procedura t-
Test:
Paired Two Sample For eans.
#$TEST T%O$SAMPE #OR &ARIAN'ES
/ialo'ul iniiat de ale'erea opiunii F-,est ,:o-(ample for 5ariances este
prezentat n fi'ura@@@.$?. )n zona @nput se %or indica domeniile ocupate de cele
dou eantioane i pra'ul de semnificatie ales. Fona -utput %a preciza domeniul
unde se nscriu rezultatele prelucrrii.
Input
5ariable 7 2an'e " se %a preciza domeniul primului eantion. Este obli'atoriu
ca acesta s fie o coloan sau o linie. /omeniul poate fi ales dinamic sau dat
prin denumirea sa.
5ariable $ 2an'e " se %a preciza domeniul celui de al doilea eantion. Este
obli'atoriu ca acesta s fie o coloan sau o linie i s nu se intersecteze cu
domeniul primului eantion.
/omeniul poate fi ales dinamic sau dat prin denumirea sa.
.abels " se %a marca boxa de control dac domeniile eantioanelor conin n
prima celul denumirea (etic*eta %ariabilei.
+lp*a " se precizeaz %aloarea ni%elului de semnificaie. @mplicit se %a
considera C G 9,9?.
Output options
-utput 2an'e, 3e: ;or<s*eet Pl=, 3e: ;or<boo< " potri%it descrierii de la
/escripti%e (tatistics. Precizeaz domeniul din foaia de calcul unde se %or
nscrie rezultatele.
2ezultatele sunt formatate ca un tabel pentru care se %a preciza poziia colului
din stn'a sus. (emnificaia rubricilor din tabel este explicat n exemplul
prezentat.
E(emplu
0n exemplu de aplicare a procedurii F-,est este artat n fi'ura urmtoare
(numrul zecimalelor afiate a fost redus.
Aean " mediile eantioanelor6
5ariance " dispersiile eantioanelor6
-bse%ations " %olumele eantioanelor6
df " 'radele de libertate6
F " statistica testului F (ctul dispersiilor6
P(FHGf one-tail " probabilitatea critic unilateral, adic probabilitatea ca o
%ariabil f, repartizat Fis*er-(nedecor, cu numerele respecti%e de 'rade de
libertate, s depeasc %aloarea calculat.
@poteza nul a e'alitii dispersiilor poate fi respins dac %aloarea raportat aici
este mai mic sau e'al cu ni%elul de semnificaie ales. /e exemplu, pentru C G
9,$? (un pra' neuzual se poate respin'e ipoteza nul ntruct 9,$98 H 9,$?.
F Dritical one-tail " %aloarea critic a testului. /etermin re'iunea de respin'ere
a testului, la pra'ul de semnificaie fixat n dialo'ul procedurii. /ac %aloarea
F, din linia a ?-a a rezultatelor, este mai mare sau e'al cu %aloarea critic,
nseamn c aparine re'iunii de respin'ere i deci se poate respin'e ipoteza
e'alitii dispersiilor. )n tabel a%em 7,>79 H 7,IJ> i deci nu se poate respin'e
ipoteza nul (la pra'ul fixat.
Doncluzia testului este aceea c ipoteza nul nu poate fi respins. (e %a tolera
prin urmare ipoteza c dispersiile sunt e'ale sau, cu alte cu%inte, c n
populaiile din care pro%in eantioanele %ariabila urmrit prezint acelai 'rad
de mprtiere.
TESTE STUDENT )t*
(unt disponibile trei teste bazate pe distribuia (tudent. )n toate cazurile se
%erific ipoteza nul pri%ind mediile att ntr-un test unilateral, ct i bilateral.
@poteza nul pri%ete o diferen fixat a mediilor!
K9! L7 " L$ G d,
unde L7, L$ sunt mediile populaiilor din care pro%in eantioanele disponibile,
iar d este diferena presupus sau cunoscut a mediilor.
Pentru a testa e'alitatea mediilor celor dou populaii se %a aplica procedura n
cazul particular d G 9.
Dele trei teste t sunt cazurile principale din punct de %edere practic!
" testul t pentru eantioane corelate6
" testul t pentru populaii cu dispersii e'ale6
" testul t pentru populaii cu dispersii nee'ale.
t$TEST+ PAIRED T%O SAMPE #OR MEANS
(unt considerate dou eantioane cu date perec*i (corelate, pro%enite e%entual
dintr-o cercetare pretest-posttest pe un acelai eantion, din care un eantion este
lotul experimental, cellat fiind lotul martor. Dompararea mediilor este
efectuat pentru a decide dac experimentul la care este supus lotul
experimental produce o abatere suficient de mare n media %ariabilei de control.
)n fi'ur se prezint dialo'ul de fixare a parametrilor procedurii.
Input
5ariable 7 2an'e, 5ariable $ 2an'e " conin referinele la zonele celor dou
eantioane, respecti%. /eoarece testul este pentru eantioane cu date perec*i,
este necesar ca zonele indicate s aib acelai numr de celule completate cu
date numerice, %alorile de pe aceleai poziii n cele dou serii fiind perec*i.
/omeniile pot fi selectate dinamic.
K=pot*esized Aean /ifference " conine %aloarea testat pentru diferena
mediilor. /ac se indic %aloarea 9 (zero, atunci se %erific ipoteza e'alitii
mediilor.
.abels " boxa de control se marc*eaz dac zonele de date indicate conin pe
primele locuri denumirile zonelor.
Input
5ariable 7 2an'e, 5ariable $ 2an'e " conin referinele la zonele celor dou
eantioane, respecti%. /eoarece testul este pentru eantioane cu date perec*i,
este necesar ca zonele indicate s aib acelai numr de celule completate cu
date numerice, %alorile de pe aceleai poziii n cele dou serii fiind perec*i.
/omeniile pot fi selectate dinamic.
K=pot*esized Aean /ifference " conine %aloarea testat pentru diferena
mediilor. /ac se indic %aloarea 9 (zero, atunci se %erific ipoteza e'alitii
mediilor.
.abels " boxa de control se marc*eaz dac zonele de date indicate conin pe
primele locuri denumirile zonelor.
+lp*a " conine %aloarea pra'ului de semnificaie utilizat de procedur pentru a
calcula %alorile critice ale statisticii (utilizate ca limite ale domeniului de
respin'ere a ipotezei nule.
Output options
-utput 2an'e, 3e: ;or<s*eet Pl=, 3e: ;or<boo< " potri%it descrierii de la
/escripti%e (tatistics. Precizeaz domeniul din foaia de calcul unde se %or
nscrie rezultatele.
2ezultatele sunt formatate ca un tabel pentru care se %a preciza poziia colului
din stn'a sus. (emnificaia rubricilor din tabel este explicat n exemplul
prezentat.
E(emplu
0n 'rup de $9 de persoane au fost e%aluate nainte i dup efectuarea unui
experiment, care a%ea scopul de a micora %aloarea unei caracteristici msurate.
/eoarece efectul experimentului trebuie e%aluat la ni%elul populaiei de unde s-
a selectat eantionul, un indicator statistic adec%at este media rezultatelor
nainte i dup. Dum datele sunt perec*i, situaia
descris fiind tipic, compararea mediilor s-a efectuat printr-un test t pentru date
perec*i (corelate. (eriile de date sunt numite /ate7 (datele pretest, /ate$
(datele posttest i s-a indicat n dialo'ul procedurii, un pra' de semnificaie C
G 9,9?.
2ezultatele produse de procedura Mt ,est!
Paired ,:o (ample for AeansN sunt descrise n fi'ura alturat!
Aean " mediile celor dou eantioane. (e obser% c media primului eantion
este mai mare (79,O fa de I,I, diferena fiind relati%e important, 9,1
reprezint o diminuare a mediei cu O,OP. Dompararea mediilor %rea s
arate dac aceast diferen poate fi acceptat pentru ntrea'a populaie, sau este
efectul sondaBului (ntmpltor n primul eantion sunt mai multe %alori mari.
5ariance " dispersiile celor dou eantioane. (e poate emite ipoteza c
dispersiile se modific semnificati%! se pare c experimentul are efectul unei
concentrri a rezultatelor n Burul mediei.
-bser%ations " numrul de obser%aii (G %olumul eantionului.
Pearson Dorrelation " coeficientul de corelaie Pearson. 5aloarea obinu este
relati% mare, apropiat de 9,?. /ei nu este nsoit de testul de semnificaie,
arat o bun corelaie ntre seriile de rezultate, cu interpretarea c scderea
%alorilor dup experiment are loc oarecum uniform! obser%aiile cu %alori mari
nainte rmn, n 'eneral, cu %alori mari i dup experiment (e%ident c
obser%aiile cu %alori mici nainte rmn, n 'eneral, cu %alori mici i dup
experiment.
K=pot*esized Aean /ifference " %aloarea cu care se compar diferena
mediilor populaiilor.
/eoarece ne-am propus s testm e'alitatea mediilor, aceasta re%ine la a
compara diferena mediilor cu zero.
df " numrul 'radelor de libertate al repartiiei t (a statisticii testului. Este
numrul de obser%aii mai puin unu.
t (tat " %aloarea calculat a statisticii testului. Pro%ine, teoretic, dintr-o repartiie
(tudent cu df (raportat anterior 'rade de libertate.
2ezultatele aplicrii testului t pentru date
P(,HGt one-tail " probabilitatea critic unidimensional, arat care este
probabilitatea ca o %ariabil (tudent cu df 'rade de libertate s depeasc
%aloarea calculat. /ac aceast %aloare este mai mic dect pra'ul de
semnificaie fixat, atunci se poate respin'e ipoteza nul n fa%oarea ipotezei
alternati%e. /eoarece, n situaia dat, prima medie este mai mare, ipoteze
alternati% ntr-un test unilateral este
K7 ! L7 " L$ Q 9 sau, ec*i%alent, K7 ! L7 Q L$.
5aloarea 9,7OI afiat este mai mare dect toate %alorile C uzuale, deci nu se
poate respin'e ipoteza nul. Prin urmare se pare c diferena dintre medii este
datorat mai mult ntmplrii, seleciei eantionului.
t Dritical one-tail " %aloarea critic unidimensional pentru pra'ul de
semnificaie C G 9,9? (precizat n dialo'ul procedurii. /ac %aloarea t
calculat este mai mare dect aceast %aloare critic, atunci se poate respin'e
K9 n fa%oarea ipotezei alternati%e K7 ! L7 Q L$.
Pentru exemplul prezentat acest fapt nu se ntmpl (9,IJ> H 7,1$I.
P(,HGt t:o-tail " probabilitatea critic bilateral, arat care este probabilitatea
ca o %ariabil (tudent cu df 'rade de libertate s depeasc, n %aloare
absolut, %aloarea calculat. Du alte cu%inte, probabilitatea ca diferena dintre
mediile populaiilor s fie mai deprtat de zero dect diferena obser%at.
/ac aceast %aloare este mai mic dect pra'ul de semnificaie fixat, atunci se
poate respin'e ipoteza nul n fa%oarea ipotezei alternati%e a unor medii
diferite! K7 ! L7 R L$.
5aloarea 9,881 afiat este mai mare dect toate %alorile C uzuale, deci nu se
poate respin'e ipoteza nul.
t Dritical t:o-tail " %aloarea critic bidimensional pentru pra'ul de
semnificaie C G 9,9?
(precizat n dialo'ul procedurii. /ac %aloarea t calculat este mai mare, n
%aloare
absolut, dect aceast %aloare critic, atunci se poate respin'e K9 n fa%oarea
ipotezei alternati%e K7 ! L7 R L$. Pentru exemplul prezentat, S t S G S9,IJ>S G
9,IJ> H $,9I8, deci nu se poate respin'e ipoteza nul.
z,TEST+ T%O SAMPE #OR MEANS
+ceast procedur ser%ete pentru compararea mediilor a dou populaii
atunci cnd se cunosc dispersiile acestora. ,estul utilizat este bazat pe
distribuia normal standard.
Input
5ariable 7 2an'e, 5ariable $ 2an'e " conin referinele la zonele celor dou
eantioane, respecti%. /omeniile indicate pot s aib numere diferite de celule,
dar completate cu date
numerice (cel mult prima celul n fiecare zon poate fi un titlu. /omeniile pot
fi selectate dinamic.
K=pot*esized Aean /ifference " conine %aloarea testat pentru diferena
mediilor. /ac se indic %aloarea 9 (zero, atunci se %erific ipoteza e'alitii
mediilor.
5ariable 7 5ariance (<no:n, 5ariable $ 5ariance (<no:n " dispersiile celor
dou populaii.
+cestea se presupun cunoscute. )n practic, pentru eantioane mari, se pot lua
%alorile dispersiilor de sondaB, dar n aceast situaie este preferabil s se aplice
un test t dect un test z.
.abels " boxa de control se marc*eaz dac zonele de date indicate conin pe
primele locuri denumirile zonelor.
+lp*a " conine %aloarea pra'ului de semnificaie utilizat de procedur pentru a
calcula %alorile critice ale statisticii (utilizate ca limite ale domeniului de
respin'ere a ipotezei nule. @mplicit se ia C G 9,9?.
Output options
-utput 2an'e, 3e: ;or<s*eet Pl=, 3e: ;or<boo< " potri%it descrierii de la
/escripti%e (tatistics. Precizeaz domeniul din foaia de calcul unde se %or
nscrie rezultatele.
2ezultatele sunt formatate ca un tabel pentru care se %a preciza poziia colului
din stn'a sus. (emnificaia rubricilor din tabel este explicat n exemplul
prezentat.
E(emplu
Pentru a compara mediile a dou populaii s-au extras dou eantioane de
%olume 8?, respecti% 8>. (e cunoate, din alte cercetri, c dispersiile
populaiilor sunt 7J i 7?, respecti%.
/ispersiile de sondaB concord cu aceste %alori.
Pentru a compara mediile populaiilor se aplic un test z. 2esultatele sunt
explicate n continuare.
Aean " mediile de sondaB ale celor dou eantioane.
Tno:n 5ariance " dispersiile cunoscute ale celor dou populaii.
-bser%ations " numrul de obser%aii (%olumul
eantionului.
K=pot*esized Aean /ifference " %aloarea cu care se compar diferena
mediilor populaiilor.
,estarea e'alitii mediilor re%ine la a compara diferena mediilor cu zero.
z " %aloarea calculat a statisticii testului. Pro%ine, teoretic, dintr-o repartiie
normal standard.
(er%ete pentru raportare sau pentru decizia n test la alte 'rade de semnificaie
dect %aloareafixat n dialo'ul procedurii.
P(FHGz one-tail " probabilitatea critic unidimensional, arat care este
probabilitatea ca o %ariabil normal redus s depeasc %aloarea calculat.
/ac aceast %aloare este mai mic dect pra'ul de semnificaie fixat, atunci se
poate respin'e ipoteza nul n fa%oarea ipotezei alternati%e. /eoarece, n situaia
dat, prima medie este mai mare, ipotez alternati% ntr-un test unilateral este
K7 ! L7 " L$ Q 9 sau, ec*i%alent, K7 ! L7 Q L$.
5aloarea 9,99J afiat este mai mic dect %alorile C uzuale (9,9? sau 9,97,
deci nu se poate respin'e ipoteza nul la aceste %alori ale lui C. Prin urmare se
poate respin'e ipoteza nul i accepta ipoteza alternati% c prima populaie are
o medie mai mare.
z Dritical one-tail " %aloarea critic unidimensional pentru pra'ul de
semnificaie C G 9,9?
(precizat n dialo'ul procedurii. /ac %aloarea z calculat este mai mare dect
aceast
%aloare critic, atunci se poate respin'e K9 n fa%oarea ipotezei alternati%e K7 !
L7 Q L$.
Pentru exemplul prezentat acest fapt nu se ntmpl ($,>9IO H 7,O>>I.
P(FHGz t:o-tail " probabilitatea critic bilateral, arat care este probabilitatea
ca o %ariabil normal standard s depeasc, n %aloare absolut, %aloarea
calculat. Du alte cu%inte, probabilitatea ca diferena dintre mediile populaiilor
s fie mai deprtat de zero dect diferena obser%at.
/ac aceast %aloare este mai mic dect pra'ul de semnificaie fixat, atunci se
poate respin'e ipoteza nul n fa%oarea ipotezei alternati%e a unor medii
diferite! K7 ! L7 R L$.
5aloarea 9,97O afiat este mai mic dect C G 9,9?, deci se poate respin'e
ipoteza nul. F
Dritical t:o-tail " %aloarea critic bidimensional pentru pra'ul de semnificaie
C G 9,9? (precizat n dialo'ul procedurii. /ac %aloarea z calculat este mai
mare, n %aloare absolut, dect aceast %aloare critic, atunci se poate respin'e
K9 n fa%oarea ipotezei alternati%e K7 ! L7 R L$. Pentru exemplul prezentat, S z S
G S$,>9IOS G $,>9IO Q 7,IO, deci se poate respin'e ipoteza nul.
!ntro,ucere 8n SPSS
A- Noiuni teoreti.e
.ucrarea are ca obiecti% introducerea n (P(( i realizarea prelucrrilor uzuale
de statistic descripti% i de testarea ipoteselor statistice, care au fcut obiectul
primelor dou lucrri realizate n Excel.
B- SPSS , prezentare /i operare
Pro'ramul (P(( (Statistical Pac-a9e 7or t1e Social Sciences este unul dintre
cele mai utilizate n analiza statistic a datelor. Prima %ersiune a aprut n anul
7IOJ, a e%oluat pn la %ersiunea 7? i aria de aplicabilitate s-a extins de la
%ersiune
la %ersiune, odat cu modul de operare i cu facilitile oferite. Pro'ramul este
utilizat astzi n mar<etin', cercetare experimental, educaie, sntate etc. )n
afar de analizele statistice posibile, pro'ramul are componente puternice pentru
mana'ementul datelor (selectare, reconfi'urare, creare de date noi i pentru
documentarea datelor (exist un dicionar metadata, care reine caracteristici ale
datelor. (e mai poate adu'a flexibilitatea pri%ind tipurile de date acceptate ca
i modulul de construire a rapoartelor.
+cest document se dorete a fi o introducere n operarea (P((!
- interfa,
- 'estionarea datelor,
- analiza statistic elementar.
%erestre SPSS
(unt enumerate tipurile de ferestre disponibile n mediul (P(( i se precizeaz
funcionalitatea lor.
Data E,itor
Este fereastra care se desc*ide automat la pornirea unei sesiuni i care permite
editarea datelor, crearea de noi nre'istrri, eliminarea unor nre'istrri etc.
/atele pot fi %zute n dou ipostaze!
- +cti%nd tab-ul Data Vie: se %or afia nre'istrrile fiierului de date ntr-o
'ril, coloanele reprezentnd %ariabilele, liniile fiind cazurile studiate
(termenul de cazuri pro%ine e%ident din practica sociolo'icUmedical, sunt
elementele eantionului studiat.
- +cti%nd tab-ul Varia/le Vie: se %or afia metadatele asociate %ariabilelor
(numele %ariabilei, tipul %ariabilei, indicaii de afiare etc..
Vie:er
Fereastra Vie:er este utilizat pentru afiarea rezultatelor! statistici, tabele,
dia'rame etc. /ac nu exist o fereastr Vie:er desc*is, se %a crea automat
una la prima comand care produce ieiri. 2ezultatele afiate pot fi editate,
deplasate, eliminate etc. ntr-un mediu similar cu cel din Aicrosoft Explorer.
Pi.ot Ta/le E,itor
Aulte dintre tabelele care conin rezultate sunt de fapt tabele pi%ot (cuburi
-.+P. +cestea pot fi modificate n fereastra Pi.ot Ta/le E,itor (editare
text, reconfi'urare tabel etc. acti%at prin dublu clic< pe un tabel. +par
meniurile corespunztoare care permit editarea.
C1art E,itor
/ia'ramele care pot fi construite, n 'eneral prin comenzile meniului Grap1s,
pot fi modificate, formatate etc. prin comenzile disponibile n C1art E,itor.
- asemenea fereastr este acti%at la dublu clic< pe o dia'ram dintr-un fiier
(P(( de ieire.
Text #utput E,itor
,extul simplu (neinclus ntr-un tabel pi%ot poate fi modificat, la dublu clic<
pe o intrare text din fiierul de ieire, n fereastra Text #utput E,itor2 (e pot
modifica n acest fel caracteristicile uzuale ale fontului.
Syntax E,itor
(P(( poate fi utilizat prin intermediul unei limbaB de comenzi proprii. +cesta
a fost modul iniial de operare, astfel nct o serie de prelucrri foarte
specializate au rmas disponibile, c*iar i n ultimele %ersiuni, doar prin
intermediul comenzilor.
- fereastr Syntax E,itor poate fi desc*is prin %ile "e:;#pen
Syntax2 Domenzile pot fi scrise direct n fereastra Syntax E,itor, dar exist i
posibilitatea de a nre'istra aciunile din interfaa utilizator sub form de
comenzi (similar nre'istrrii unui macro din Aicrosoft -ffice. Domenzile
pot fi sal%ate ca un fiier de comenzi, n %ederea reutilizrii.
Script E,itor
(P(( poate fi personalizatUautomatizat prin intermediul unui limbaB de
scriptare, Sax asic (compatibil Visual !asic for Applications. (e %a
desc*ide o fereastr Script E,itor prin %ile "e:;#pen Script.
Pot exista mai multe ferestre de ieire (Vie:er, ca i mai multe ferestre de
sintax (Syntax E,itor. Fereastra acti% dintr-un 'rup este indicat de semnul
MVN afiat pe bara de stare a ferestrei acti%e, acti%area poate fi modificat prin
acionarea uneltei din fereastra inacti%
Meniuri SPSS
Da n orice aplicaie ;indo:s, multe dintre prelucrrile (P(( pot fi executate
prin acionarea comenzilor din meniuri.Fiecare fereastr (P(( are propriile
meniuri i unelte corespunztoare.
Meniuri co6une
File
Este utilizat pentru creare, desc*idere, export de fiiere di%erse! date, rezultate,
comenzi etc.
Edit
Editrile uzuale pentru date numerice, text sau obiecte 'rafice! copieri, alipiri
etc. n aceeai aplicaie sau nu.
View
Dontroleaz modul de afiare a uneltelor, a liniaturii, a identificatorilor de
%alori (%alorile pot a%ea ataate denumiri explicite.
Anal"#e
Este meniul care d acces la procedurile statistice.
$rap%s
Permite crearea dia'ramelor. -rice dia'ram poate fi modificat (reamintim
prin D*art Editor, afiat la dublu clic< pe dia'ram.
Utilities
Permite afisarea informaiilor despre %ariabile, definirea unor mulimi de
%ariabile etc.
&indow
-peraii asupra ferestrelor.
'elp
/esc*ide o fereastr standard de aButor.
Data E,itor 6eniuri speci7ice
Data
(e pot realiza modificri 'lobale cum ar fi transpunerea %ariabilelor i
cazurilor, filtrarea cazurilor etc. Aodificrile sunt temporare dac nu sunt
sal%ate n fiierul iniial.
Transform
Permite transformarea unor %ariabile (cum ar fi recodificare i obinerea unor
noi %ariabile prin calcule efectuate asupra %ariabilelor existente. Aodificrile
sunt temporare pentru sesiunea curent, dac nu sunt sal%ate n fiierul iniial.
SPSS 0 #piuni
(e poate personaliza mediul (P(( prin selectarea comenzii E,it 0 #ptions
(e remarc, pe pa'ina $eneral, posibilitatea de a menine un Burnal al
aciunilor (Session (ournal, de a controla afiarea %ariabilelor i rezultatelor, de
a stabili folderul temporar. Delelalte pa'ini permit stabilirea atributelor implicite
pentru dia'rame, tablourile pi%otante, modul de calcul etc.
%iierul ,e rezultate
2ezultatele sunt afiate n fereastra Vie:er n ordinea n care sunt apelate
procedurile, fiecare apel producnd o intrare n arborele de na%i'are din stn'a
ferestrei. )n aceast fereastr se poate na%i'a la orice component prin operare
n arborele de na%i'are i se pot efectua editri care s conduc la o ieire clar,
uor de interpretat, potri%it necesitilor prelucrrii.
(e poate utiliza fereastra Vie:er pentru!
E Parcur'erea rezultatelor, %izualizarea sau ascunderea unor componente
(tabele, dia'rame,
E Aodificarea ordinii n care sunt afiate componentele,
E +ccesul la ferestrele Pi.ot Ta/le E,itor, Text #utput E,itor, C1art E,itor<
E DopiereaUmutarea elementelor ntre (P(( i alte aplicaii (;ord, Excel etc..
Panelul din stn'a al ferestrei conine arborele de structur a ieirii. (e pot
extinde sau restrn'e ramuri, se pot deplasa elementele prin dra'-and-drop, se
poate na%i'a la un element prin selectarea nodului asociat.
Pentru copiere ntre aplicaii se poate utiliza te*nica uzual E,it Copy urmat
de E,it Paste;Paste Special.
Exist ns i posibilitatea de export a ieirii prin
E (e acti%eaz fereastra Vie:er i se d comanda %ile Export.
E (e afieaz dialo'ul
E (e fixeaz n File T"pe tipul fiierului destinaie6 ultimele %ersiuni accept i
formate .xls, .doc.
E (e ale'e numele i calea fiierului destinaie i ce anume se export (ntre'
documentul cu sau fr dia'rame, ce obiecte.
#r9anizarea ,atelor
(P(( utilizeaz datele or'anizate n linii i coloane! liniile reprezint cazurile
(obser%aiile, coloanele reprezint %ariabilele cercetrii. +parent, 'rila seamn
cu o foaie Excel, dar funcionalitatea nu este aceeai. /eoarece prelucrrile
statistice se aplic %ariabilelor, acestea au n (P(( o serie de atribute memorate
n fiierul de date i artate n Data E,itor 0 Varia/le Vie:!
E )n (P((, %ariabilele sunt denumite, cel puin n %ersiunile mai %ec*i, cu
identificatori de maxim J caractere i care nu se pot termina cu punct (rezer%at
pentru comenzi de scriptare. @dentificatorii sunt formai dup re'ulile uzuale
(cele mai restricti%e sunt interzicerea spaiilor i a caracterelor speciale W, V, X,
Y, Z i nu sunt case sensitive.
E ,ipul unei %ariabile poate fi (semnificaia este e%ident numeric, comma, dot,
scientific notation, date, custom currenc= sau strin'. 5ariabilele numerice pot
a%ea cel mult >9 de caractere, dintre care 7O la partea zecimal. 5ariabilele
strin' se pot clasifica n s%ort string (pn la J caractere sau long string (pn
la $?O caractere. 5ariabilele s%ort string suport unele proceduri (P((.
E (e poate defini pentru fiecare %ariabil care este %aloarea lips (missing
value, cu alte cu%inte cum este codificat situaia c un caz nu conine o
%aloare pentru %ariabila respecti%. 5alorile lips pot fi separate n s"stem
missing (un spaiu n cazul datelor numerice sau nimic, irul %id, n toate
cazurile i user missing (cele specificate explicit ca %alori lips. 5ariabilele
long string nu permit %alori user-missing.
E Pe ln' denumire, care apare ca nume al coloanei, o %ariabil poate a%ea
ataat o etic*et, la)el, care este un text explicit pri%ind semnificaia
%ariabilei. /e exemplu, %ariabila 3ume poate a%ea ca la)el textul M3umele i
prenumele candidatuluiN. +ceste etic*ete %or fi utilizate n raportarea
rezultatelor.
E +tributul *i,t1 fixeaz numrul maxim de caractere al %alorilor strin',
Colu6ns precizeaz numrul de caractere afiate.
E /eoarece cazul frec%ent ntlnit n prelucrrile statistice este acela n care sunt
nscrise n fiierul de date codurile %alorilor (de exemplu, 7Gele%, $Gstudent
etc., (P(( permite definirea i memorarea codificrilor utilizate pentru
fiecare %ariabil. )n fereastra Data E,itor, pa'ina Varia/le Vie:, acti%area
celulei din coloana Values conduce la afiarea dialo'ului Value (a/els!
Fiecare perec*e Value Value (a/el este adu'at la lista de coduri prin
acti%area butonului A,, etc. Etic*etele de %alori, mpreun cu etic*etele de
%ariabile conduc la o form explicit a rezultatelor.
E 0ltimul atribut specific al unei %ariabile este scala de msur utilizat, atribut
reinut n coloana Measure din Varia/le Vie:. /enumirile (P(( utilizate
sunt scale pentru %ariabile de inter%al, ordinal pentru %ariabile ordinale,
nominal pentru %ariabile nominale. Fixarea msurii corecte este esenial
deoarece, reamintim, anumite prelucrri statistice se pot aplica doar unor
%ariabile ordinale, sau de inter%al etc.
%iltrarea cazurilor
+pare uneori necesitatea de a prelucra doar un subset de nre'istrri! pentru a
obine o ima'ine rapid a unei structuri, pentru a prelucra doar eantionul dintr-
o anumit subpopulaie etc. (P(( ofer n acest scop comanda Data Select
Cases
care produce afiarea dialo'ului urmtor.
Prin opiunile din 'rupul Select se fixeaz modalitatea de filtrare. Este de
remarcat c prin 'rupul Unselecte, Cases Are se poate opta pentru eliminarea
efecti% a cazurilor neselectate (opiune nerecomandat sau pentru filtrarea lor,
adic
eliminarea este doar lo'ic, o nou selectare cu opiunea All cases le %a
reacti%a.
)n continuare se prezint doar subdialo'ul obinut la opiunea !7 con,ition=
i acti%area butonului !7.
)n zona de formare a condiiei se pot utiliza denumiri de %ariabile (aduse din
lista din stn'a, operatori, funcii. 5or rmne %izibile doar nre'istrrile
pentru care condiia este ade%rat.
Generarea unei noi .aria/ile
/in diferite moti%e, de exemplu necesitatea unei recodificri sau cea a
calculrii unei %ariabile noi ca medie a altor %ariabile etc., este util posibilitatea
de a 'enera automat o nou %ariabil. (P(( are dou comenzi principale
destinate acestui
scop! Trans7or6 Co6pute i Trans7or6 Reco,e. Prima permite obinerea
unei %ariabile n urma unui calcul, a doua este pentru recodificare.
*omanda 'ompute
Prin Trans7or6 Co6pute se afieaz dialo'ul Co6pute Varia/le (n
%ersiuni mai noi dialo'ul este modificat ca aranBare a zonelor!
E )n zona Tar9et Varia/le se trece denumirea noii %ariabile pentru care se poate
preciza tipul i etic*eta n subdialo'ul afiat prin acionarea butonului Type >
(a/el2
E )n zona de formare a expresiei de calcul, "u6eric Expression< se formeaz
expresia de calcul prin utilizarea butoanelor existente pentru operatori i
funcii sau prin tastare direct. /enumirile %ariabilelor existente pot fi aduse n
expresie prin selectare n lista %ariabilelor, dublu clic< sau butonul [.
E (e poate efectua o filtrare a nre'istrrilor (cazurilor pentru care are loc
transformarea dac se acioneaz butonul !7. Dazurile neselectate %or a%ea
%aloarea s=stem-missin' pentru noua %ariabil.
*omanda Re.o"e
2ecodificarea unei %ariabile este util n dou situaii principale!
7. se transform o %ariabil de inter%al ntr-o %ariabil ordinal pentru a o
raporta ca date 'rupate sau pentru a studia asocierea cu alte %ariabile ordinale,
$. o %ariabil strin' trebuie recodificat cu coduri numerice necesare pentru a
putea aplica anumite proceduri (P((, care cer %ariabile codificate numeric.
2ecodificarea poate fi n aceeai %ariabil, sau ntr-o nou %ariabil, cazul
discutat aici.
Prin Trans7or6 Reco,e !nto Di77erent Varia/les se afieaz dialo'ul
n care se transfer %ariabila numerica pentru care se realizeaz recodificarea
din lista %ariabilelor n lista "u6eric Varia/le \ #utput Varia/le, se
completeaz numele i e%entual etic*eta noii %ariabile n #utput Varia/le dup
care se acioneaz
C1an9e.
(e pot selecta cazurile pentru care are loc recodificarea prin !7. Prin acionarea
#l, an, "e: Values se desc*ide dialo'ul
(e %a selecta n zona #l, Value opiunea dorit, se %a completa noua %aloare
n "e: Value i prin A,, se trece corespondena definit n lista #l,\"e:.
3oile coduri pot fi de tip strin' doar dac se acti%eaz c*ec<box-ul #utput
.aria/les are strin92
Prelucr3ri statistice
Prelucrrile statistice din (P(( se realizeaz prin comenzile din meniul
+nal=ze, sau prin executarea comenzilor scrise n fereastra (=ntax Editor.
/eoarece efectuarea unei prelucrri necesit operarea cu un numr de dialo'uri
specializate, pentru familiarizarea cu principalele dialo'uri care apar la
comenzile de prelucrri statistice se prezint n continuare modul n care se
obin statisticile descripti%e i o procedur de testare a e'alitii mediilor.
Analyze 0 %re?uencies
E (e selecteaz Analyze 0 Descripti.e Statistics 0 %re?uencies...
E +pare dialo'ul urmtor n care se trec %ariabilele dorite din lista din stn'a n
lista din dreapta (prin dublu clic< sau selectare i [.
E (e marc*eaz c*ec<box-ul Displa" frequenc" ta)les dac se doresc i tabelele
de frec%ene calculate. @n caz contrar trebuie s se opereze cu subdialo'urile
Statistics, C1arts pentru a obine rezultate.
E .a acionarea butonului Statistics, se afieaz dialo'ul %re?uencies@ Statistics
n care se pot acti%a opiunile corespunztoare indicatorilor de tendin
central, mprtiere sau de caracterizare a curbei distribuiei (e%ident c
anumite statistici se pot calcula doar pentru %ariabile de tipuri adec%ate!
inter%al, ordinal, nominal.
E (ubdialo'ul C1arts permite construirea unui 'rafic adec%at pentru un tabel de
frec%ene. -piunea 'istograms + wit% normal curve afieaz curba normal
suprapus peste *isto'ram, util pentru aprecierea deprtrii de la
normalitate.
E (ubdialo'ul %or6at 'estioneaz modul de afiare a intrrilor tabelului de
frec%ene n ,rder )". )n ultiple varia)les se poate opta ntre un format care
include toate %ariabilele selectate (pentru comparare trebuie ca %ariabilele s
fie de acelai tip i un format n care fiecare %ariabil este raportat separat.
E Prin -T n dialo'ul iniial se %a 'enera n fereastra Vie:er ieirea cerut.
Analyze Descripti.es
- comand sintetic pentru statisticile descripti%e ale %ariabilelor continue
este Analyze - Descripti.e Statistics 0 Descripti.es2 Parametrii prelucrrii se
fixeaz n urmtoarele dou dialo'uri.
Analyze Crossta/s
-binerea tabelelor de frec%ene ncruciate, utile la studiul asocierii dintre
%ariabile, este 'estionat de comanda Analyze Descripti.e Statistics
Crossta/s, care iniializeaz dialo'ul urmtor.
(e trec, prin acionarea butoanelor de trecere, %ariabilele dorite n lista -ows
(tabelele %or a%ea cte o linie pentru fiecare %aloare distinct a %ariabilelor din
aceast list i n lista *olumns (tabelele %or a%ea cte o coloan pentru fiecare
%aloare distinct a %ariabilelor din aceast list. (e %a calcula i afia cte un
tabel de frec%ene ncuciate pentru fiecare combinaie de %ariabile, cte una din
fiecare list.
)n cazul n care se doresc frec%ene ncruciate pentru trei sau mai multe
%ariabile, se utilizeaz controlul .a"er n care se %or trece %ariabilele de pe
poziia a treia, se trece la la=erul urmtor i se repet procedura.
(ubdialo'ul Statistics permite selectarea statisticilor calculate. Este e%ident
necesar cunoaterea tipului %ariabilelor, pentru a ale'e statisticile adec%ate.
(ubdialo'ul Cell permite selectarea statisticilor calculate pentru fiecare celul
a tabelului.
(e remarc n 'rupul Percentages posibilitatea de a calcula frec%ene
relati%e raportate la totalul de pe linie, de pe coloan sau 'eneral. /e asemenea,
prin *ount + E/pected se pot calcula frec%enele implicate n calculul statisticii
#$.
(ubdialo'ul %or6at 'estioneaz doar ordinea liniilor funcie de %alorile care
le 'enereaz.
Analyse 0 Co6pare 6eans
,estarea ipotezelor de e'alitate a mediilor se realizeaz prin intermediul
comenzilor 'rupate n Analyze 0 Co6pare 6eans. /intre procedurile existente
se prezint n continuare doar cele care conduc la aplicarea unor teste t..
Prin Analyze 0 Co6pare 6eans 0 !n,epen,ent Sa6ples T test se iniiaz
testul t de comparare n cazul eantioanelor independente (necorelate. (e
realizeaz calculele att pentru cazul dispersiilor e'ale, ct i a dispersiilor
nee'ale, utilizatorul fiind acela care ale'e situaia adec%at.
Domanda produce afiarea urmtorului dialo'.
(e %or selecta %ariabilele, dup care se compar cele dou 'rupuri, din lista
%ariabilelor (continue i se trec n lista %ariabilelor de test. Pentru a preciza
'rupurile care sunt comparate precizeaz %ariabila care identific 'rupurile
($rouping
Varia)le i se iniiaz dialo'ul De7ine Groups n care, pentru o %ariabil
discret, se precizeaz %alorile etic*ete ale celor dou 'rupuri sau, pentru o
%ariabil continu, %aloarea care separ cele dou 'rupuri.
Prin intermediul dialo'ului iniiat la #ptions, se poate fixa pra'ul de
semnificaie
i modul de tratare a %alorilor lips.
2ezultatele conin un tabel al statisticilor elementare pentru fiecare 'rup i
%ariabil de test
2ezultatele numerice utile n efectuarea testului t sunt coninute ntr-un tabel
precum cel care urmeaz.
,abelul conine dou linii de rezultate numerice! rndul superior pri%ete testul
t n situaia dispersiilor e'ale, rndul inferior se refer la cazul dispersiilor
nee'ale.
+le'erea este condus de testul .e%ene de e'alitate a dispersiilor, care este
realizat prin intermediul coloanelor aflate sub antetul .e%eneYs ,est. (tatistica
este F (G9,99> n cazul ilustrat iar probabilitatea critic este (i' (9,I>J n cazul
ilustrat. Prin urmare, la pra'ul de 9,9?, nu se respin'e ipoteza e'alitii
dispersiilor. @n acest caz se %or utiliza %alorile din rndul superior al tabelului i
se citete %aloarea statisticii
testului t G J,OO> i probabilitatea critic bilateral (i' H 9,997. /rept urmare se
%a respin'e ipoteza e'alitii mediilor celor dou 'rupuri.
0ltimele > coloane conin diferena dintre medii, eroarea standard a acestei
diferene i inter%alul de ncredere pentru diferena mediilor (faptul c inter%alul
nu conine %aloarea 9 este ec*i%alent cu respin'erea e'alitii mediilor.
+lte teste, neparametrice, pot fi aplicate indi%idual prin intermediul
comenzilor 'rupate n Analyze 0 "onpara6etric Tests.
,estele statistice specifice prelucrrilor di%erse de analiz a datelor sunt
aplicate automat sau la cerere la iniierea di%erselor prelucrri! analiza %arianei,
analiza re'resional etc.
Analiza ,ispersional3 uni.ariat3 0
Excel< SPSS
B- Instrumente E(.el0 SPSS
Excel
+naliza dispersional unifactorial poate fi efectuat n Excel prin Tools 0 Data
Analysis! - Anova: Single Factor0
/atele trebuie s fie structurate pe coloaneUlinii astfel nct fiecare coloanUlinie
s reprezinte eantionul dintr-o subpopulaie. 3u este necesar ca planul de
experiene s fie ec*ilibrat (eantioanele pot a%ea %olume diferite. )n exemplul
alturat,
E cele patru coloane etic*etate -ptiune7 - -ptiune> reprezint fiecare cte un
eantion6 etic*etele pot fi 'ndite ca %alori ale unei %ariabile discrete
(nominal n mod uzual, %alori care identific subpopulaiile comparate.
E or'anizarea datelor n zona care ncepe din celula +7 este ntmpltoare (din
moti%e de prezentare.
/ialo'ul analizei este prezentat n continuare i se poate remarca faptul c se
indic la @nput 2an'e ntre' domeniul ocupat de date, faptul c prezena
etic*etelor n prima linie este menionat n .abel in first ro: i c n zona
+lp*a se poate preciza %aloarea pra'ului de semnificaie (implicit este 9,9?.
+dresa -utput 2an'e se refer la un domeniu din caietul existent unde se %or
afia rezultatele, dar rezultatele pot fi scrise ntr-o nou foaie de calcul sau un
nou caiet.
2ezultatele conin un prim tabel sintetic cu statisticile uzuale!
,abelul +3-5+ este
unde!
E Source of Variation reprezint descompunerea n %ariaie explicat (!etween
$roups i %ariaie neexplicat (&it%in $roups
E SS este coloana sumelor de ptrate
E df este coloana 'radelor de libertate asociate sumelor de ptrate
E S conine mediile sumelor de ptrate
E F este %aloarea calculat a staticii F
E P-value1 F crit sunt, respecti%, probabilitatea critic i %aloarea critic care
permit decizia n testul statistic! ipoteza nul a 'rupurilor omo'ene se respin'e
dac p-value este mai mic sau e'al cu pra'ul a ales sau dac %aloarea F
calculat este mai mare sau e'al cu %aloarea critic..
SPSS
Pentru a realiza o analiz dispersional unifactorial se d comanda Analyze 0
Co6pare Means 0 #ne0*ay A"#VA222 Este afiat dialo'ul
(e %a trece n zona Factor %ariabila discret care realizeaz caracterizarea
'rupurilor de comparat iar n lista Dependent .ist %ariabilele continue pentru
care se compar 'rupurile. Fiecare %ariabil continu %a produce un tabel
+3-5+, deci se realizeaz attea analize cte %ariabile sunt n lista %ariabilelor
dependente.
Domanda Options (celelalte comenzi, 'ontrasts i Post 1o. %or fi utilizate n
lucrarea urmtoare afieaz dialo'ul cu acelai nume, care permite fixarea
statisticilor care se calculeaz!
E Descriptive " indicatorii statistici ai %ariabilei dependente, total i pe 'rupuri,
E Fi/ed and random effects " pentru a distin'e la interpretare modelul cu efecte
sistematice sau nu,
E 'omogeneit" of variance test " testul
.e%ene de e'alitate a dispersiilor,
E !rown-Fors"t%e i &elc% " teste de e'alitate a mediilor aplicabile n cazul
nee'alitii dispersiilor,
E eans plot " produce reprezentarea 'rafic a mediilor 'rupurilor
comparate (interpretarea este relati%, ca i orice interpretare a unui 'rafic, dar
poate constitui un spriBin intuiti%e pentru rezultatele testelor statistice.
@n arborele de structur a fiierului de ieire este de remarcat c intrarea
corespunztoare este un nod de tip -ne:a=, prezentat n continuare, n care sunt
prezente toate seciunile, %izibile sau ascunse.
/ac se %izualizeaz, prin dublu clic<, seciunea 3otes, se %a obine un tabel
cu parametrii prelucrrii! data prelucrrii, fiier de date, filtrare etc. (e poate
%edea, lucru util pentru crearea unor scripturi, sintaxa instruciunii care
realizeaz aceeai prelucrare.
,abelul de statistici descripti%e conine, pentru fiecare 'rup determinat de
%alorile %ariabilei factor, informaiile!
E numr de cazuri (2,
E media (ean,
E abaterea standard (Std0 Deviation,
E eroarea standard a mediei (Std0 Error,
E inter%alul de ncredere pentru medie (*onfidence 3nterval for ean
E %alorile extreme,
E statisticile specifice modelului de analiz solicitat (cu efecte sistematice sau cu
efecte ntmpltoare.
/ac s-a solicitat testarea omo'enitii dispersiilor, se %a aplica testul .e%ene,
rezultatele fiind sub forma! n care (i'. reprezint probabilitatea critic a
testului (rotunBit la trei zecimale.
,abelul +3-5+ este sub forma!
afindu-se doar probabilitatea critic 4p-value5 n coloana (i'.
/ac se solicit 'raficul mediilor, interpretarea este relati%, funcie de scalele
utilizate, culori etc. (e pot ns %edea 'rupurile relati% apropiate, %alorile
extreme.
Asocierea ,atelor 0 Excel< SPSS
B- Instrumente E(.el0 SPSS
Excel
Doeficientul de corelaie dintre dou %ariabile poate fi calculat prin funcia
D-22E.(+rra=7,+rra=$, unde +rra=7, +rra=$ sunt, respecti%, zonele care
conin
%alorile celor dou %ariabile (trebuie s aib, e%ident, acelai numr de %alori.
Pentru a calcula matricea de corelaie (deci sunt implicate mai mult de dou
%ariabile se utilizeaz procedura D-22E.+,@-3 din ,ools - /ata +nal=sis.
#/ser.aie. 3u sunt disponibile prelucrri specifice pentru asocierea
%ariabilelor nominale sau ordinale, acestea trebuind s fie realizate prin funciile
i operaiile posibile n Excel.
'ORREATION
Este procedura care calculeaz coeficienii de corelaie liniar, cunoscui i
drept coeficienii de corelaie Pearson. 5ariabilele implicate sunt %ariabile
continue (de inter%al. )n cazul cnd exist un numr suficient de mare de %alori
i de ran'uri posibile, procedura poate fi utilizat i pentru calculul
coeficienilor de corelaie a ran'urilor ((pearman.
/ialo'ul de iniiere a procedurii Dorrelation este prezentat n fi'ura alturat.
Input
@nput 2an'e " se precizeaz domeniul datelor de intrare. +cesta trebuie s
fie o zon compact dintr-o foaie de calcul.
4rouped ]= " se selecteaz butonul corespunztor modului de nscriere a
%alorilor unei %ariabile! *olumns pentru %ariabile pe coloane, -ows
pentru %ariabile pe linie.
.abels in First 2o: " se marc*eaz dac prima linie (cazul *olumns sau prima
coloan (cazul -ows conine denumirile %ariabilelor.
Output options
-utput 2an'e, 3e: ;or<s*eet Pl=, 3e: ;or<boo< " Precizeaz zona unde se
%or nscrie rezultatele. Fona de rezultate cuprinde un tabel ptratic cu
coeficienii de corelaie ntre toate perec*ile de %ariabile din domeniul de
intrare. /eoarece tabloul este simetric fa de prima dia'onal, se afieaz doar
partea inferioar (stn'a-Bos.
/in pcate, n Excel nu este raportat semnificatia acestor coeficieni de
corelaie, cu alte cu%inte nu se raporteaz informaiile necesare %erificrii
ipotezei de nulitate a
coeficienilor. ,estarea semnificaiei coeficienilor se poate efectua prin
apelarea, n foaia de calcul Excel, a funciilor necesare, dup modelul urmtor,
n care se %erific
K9! coeficientul de corelaie dintre %ariabile este e'al cu zero
K7! coeficientul de corelaie dintre %ariabile este diferit de zero
(e calculeaz transformata Fis*er a coeficientului de corelaie r calculat prin
utilizarea funciei 7is1er45 din Excel! ntr-o celul neutilizat se tasteaz
A7is1er4referin6a la celula unde este coeficientul de corela6ie5
(e obine rezultatul calculului!
#/ser.aie2 Dalculul unei limite, de ex, z7, se efectueaz cu formula Excel
G referin6a la celula unde este # " 7Us&rt(n-8Znormsin%(7-CU$
- metod alternati%, pentru ipoteza nul a unui coeficient e'al cu 9, este
utilizarea unui test t bazat pe statistica, dat direct ca o formul Excel!
G rUs&rt(7-r^$Zs&rt(n"$
unde r semnific %aloarea, sau referina la coeficientul de corelaie testat, iar n
este %aloarea sau referina la %olumul eantionului.
Pentru a obine, n Excel, probabilitatea critic bilateral se utilizeaz formula
Gtdist(abs(t,n-$,$
n care t poate fi nlocuit direct cu expresia de calcul corespunztoare!
Gtdist(abs(rUs&rt(7"r^$Zs&rt(n-$,n-$,$
unde r i n au semnificaiile precizate anterior.
RAN2 AND PER'ENTIE
+ceast procedur realizeaz atribuirea de ran'uri %alorilor unei %ariabile. (e
obin att ran'uri ordinale descresctoare ct i ran'uri centilice.
2an'urile ordinale sunt atribuie descresctor! %aloarea maxim are ran'ul 7,
urmtoarea mai mic are ran'ul $ etc. Dazurile de ex-ae&uo sunt tratate prin
atribuirea primului ran' disponibil tuturor cazurilor din aceeai cate'orie.
-eamintim c7 o procedur7 mai des utili#at7 este aceea a atri)uirii rangului
mediu tuturor valorilor egale0
2an'ul centilic al unei %alori este exprimat procentual dup formula
numr de %alori 2an' depite centilic G n-7 _ 799 P,
unde n este %olumul eantionului. .a baza acestei formule este presupunerea c
ran'urile sunt distribuite uniform (ceea ce nu este ade%rat pentru datele
ordinale unde ran'ul este o simpl con%enie, cele n ran'uri posibile (G
numrul de obser%aii
separ (n"7 inter%ale de lun'imi e'ale i se calculeaz atunci ct la sut din
aceste inter%ale (sau din domeniul ran'urilor este sub %aloarea pentru care se
calculeaz ran'ul centilic. /e remarcat c sunt utilizate i alte formule (cu
rezultate uor diferite pentru calculul ran'ului centilic, formule bazate pe
ran'ul mediu atribuit %alorilor e'ale. )n 'eneral, asemenea formule sunt utilizate
pentru eantioane relati% mici,
pentru care erorile estimaiilor sunt mari i deci utilizarea unei formule sau a
alteia nu ne scoate din limitele de si'uran acceptate.
Dalculele sunt efectuate pentru toate %ariabilele prezente n domeniul precizat
ca intrare, datele trebuind s fie or'anizate ntr-un domeniu dreptun'*iular
continuu.
)n fi'ur se prezint dialo'ul Ran- an, Percentile, parametrii care trebuie s
fie specificai sunt doar de localizare a intrrilor i ieirilor i sunt explicai n
continuare.
Input
@nput 2an'e, 4rouped ]=, .abels in First 2o: " (e specific domeniul de
intrare, modul de or'anizare a %ariabilelor (pe coloane sau pe linii i faptul
dac exist denumiri n domeniul indicat. Pentru o descriere mai pe lar' a
cmpurilor se %a %edea zona @nput de la
/escripti%e (tatistics.
Output options
-utput 2an'e, 3e: ;or<s*eet Pl=, 3e: ;or<boo< " Fixeaz zona unde se %or
nscrie rezultatele.
E(emplu
2ezultatele unui apel la procedura Ran- an, Percent, situaia ilustrat este pur
didactic, sunt structurate dup cum urmeaz.
Primele dou coloane conin datele de sondaB. +plicarea procedurii pentru
%ariabila
/ialo'ul 2an< and Percentile
Scoruri produce rezultatele din coloanele /"4. Prima coloan, Point, prezint
numerele de ordine iniiale ale %alorilor. Doloana a doua, Scoruri, este
ordonarea descresctoare a %alorilor. Doloana a treia conine ran'urile ordinale
atribuite %alorilor. (e obser% c %alorile e'ale cu 7?, care ar a%ea ran'urile > i
?, primesc ambele ran'ul > iar ran'ul ? nu mai este atribuit (urmtoarea %aloare
are ran'ul O.
Doloana a patra conine ran'urile centilice, calculate dup formula precizat.
+stfel %aloarea 7J, cu ran'ul 8, depete 8 %alori. Dum n G O se obine un ran'
centilic e'al cu 8U(O"7, adic de O9P. +ceasta %aloare poate fi neleas potri%it
fi'urii urmtoare!
(e %ede c %aloarea 7J are n dreapta ei, deci %alori mai mici " ordinea este
descresctoare ", trei se'mente din totalul de ?, adic O9P din distribuie.
+nalo', %aloarea 7? depete $ se'mente din ?, deci $9P etc.
SPSS
Pentru a calcula coeficienii de corelaie dintre %ariabile de inter%al sau ordinale
se d comanda Analyze B CorrelateBi.ariate
(e afieaz dialo'ul i.ariate Correlations n care se fixeaz %ariabilele care
suntanalizate i tipul de coeficient de corelaie calculat! Pearson1 Spearman
precum i testul de semnificaie dorit.
Prin dialo'ul #ptions se pot selecta anumite statistici elementare dorite n
rezultat ca i modul de tratare a obser%aiilor lips.
2an'uri %alori $1 $8 7J 7?7? 7$7 $ 8 > ? O O9P
Da rezultat se obine, n principal, matricea de corelaie ntre %ariabilele
selectatepentru analiz. - celul a tabelului conine %aloarea coeficientului de
corelaie, probabilitatea critic a testului de semnificaie i numrul de %alori
reinute pentru calcul (dup tratarea cazurilor lips.
Potri%it procedurii de decizie ntr-un test statistic, se respin'e ipoteza unei
corelaii nule dac probabilitatea critic este mai mic sau e'al cu pra'ul de
semnificaie ales.
Dorelaiile semnificati%e pot fi marcate automat cu Z (CG9,9? sau ZZ (CG9,97
prin selectarea opiunii Flag significant correlations din dialo'ul principal.
Pentru cazul %ariabilelor discrete, se poate consulta tabelul urmtor care conine
o sistematizare a coeficienilor de asociere definii (ei sunt calculai i de (P((,
table adaptat dup tabelul similar din
*ttp!UUdemo'rap*=.anu.edu.auUPublicationsU(/+-course-notesUsec98.*tm.
/enumirile statisticilor sunt pstrate pentru a fi recunoscute n dialo'urile
specializate.
Dazul %ariabilelor discrete, nominale n special, este analizat n dialo'ul afiat
de comanda Analyze B Descripti.e Statistics B Crossta/s. /in dialo'ul afiat,
care produce calculul frec%enelor ncruciate pentru dou %ariabile discrete, se
acioneaz butonul Statistics, afindu-se dialo'ul
din care se selecteaz indicatorii de asociere dorii. 2ezultatul afiat %a include
i testele de semnificaie adec%ate.
Pentru explicaii suplimentare pri%ind coeficienii de asociere considerai n
dialo', se poate studia urmtorul document pri%ind asocierea %ariabilelor
discrete!
Re9resia liniar3 si6pl3
0 Excel< SPSS 0
B- Instrumente E(.el0 SPSS
Excel
/in uneltele Excel se prezint doar cele care in de reprezentrile 'rafice.
Domponenta -egression (din Tools B Data Analysis %a fi prezentat n lucrarea
(tat;or<`J. Da rezultat se %a obine o dia'ram de tipul urmtor (formatrile
sunt orientati%e.
Gra7icul 7unciei
3 4 5055( 6 7089
R9 4 :0;5
<= )s.atter* )Diagrama "e >mpr/tiere0 "iagrama <,=0 gra?i. "e ?un.ie*
- dia'ram de mprtiere reprezint, ntr-un sistem orto'onal de axe de
coordonate, punctele determinate de perec*ile de %alori (ai,bBi, i G 7,c,n, B G
7,c,<. Du alte cu%inte, se reprezint < serii de numere bB, B G 7,c,<,
fiecare %aloare fiind considerat drept ordonata unui punct. +bscisele punctelor,
ai, i G 7,c,n, sunt date ca o serie separat, dar sunt aceleai pentru toate seriile
b.
Pentru a obine un asemenea 'rafic, n primul pas al utilitarului !nsert B C1art
(acti%at i din bara de unelte
Stan,ar,, se ale'e tipul 894Scatter50 )n fi'ura alturat sunt subtipurile
disponibile de dia'rame a-b.
/esenele din coloana + difer de cele din coloana ] prin aceea c sunt marcate
punctele reprezentate.
/esenele de pe linii difer dup modul de unire a punctelor care aparin
aceleeai serii de date. .inia a doua de desene unete punctele prin linii netezite
(curbe, n timp ce desenele de pe ultima linie are punctele unite prin
se'mente.
#/ser.aie2 Punctele sunt unite n ordinea n care apar n seria numeric. Prin
urmare, dac perec*ile de puncte nu sunt n ordinea cresctoare a absciselor (a,
ceea ce se obine la unirea punctelor este o linie *aotic, fr nimic din 'raficul
de funcie la care ne ateptm. Pentru aceasta se %or sorta mai
nti datele n ordinea cresctoare a %alorilor a.
/ia'rame a-b.
/ia'rama din primul subtip este utilizat pentru studiul asocierii dintre
%ariabila a i %ariabilab. /ispunerea ascendent sau descendent a norului de
puncte obinut ofer informaii asupra existenei i formei asocierii ntre
%ariabile.
@nterpretrile reprezentrilor a-b de forma puncte unite ntre ele sunt cele
uzuale pentru 'raficele de funcie! maxime, minime, ritm de cretere, ritm de
descretere, care serie are %alori mai mari, cine depete pe cine etc.
#/ser.aie. ,rebuie s se fac distincie ntre dia'ramele de tip linie i cele de
tip a-b. (e poate ns considera c, pentru %alori numerice, dia'ramele de tip
linie au o %ariabil a implicit! seria 7,$,c sau o serie temporal.
A"" Tren"line@ )meniul '!art*
Permite fi'urarea pe 'rafic a trendului %ariabilei selectate. Exist mai multe
tipuri de modele pentru calcularea tendinei datelor, dar opiunea nu este acti%
dect pentru anumite serii de date numerice. -piunea poate fi acti%at din
meniul C1art
(existent pe bara de meniuri doar dac este selectat o dia'ram sau din meniul
contextual asociat unei serii numerice. /ialo'ul iniiat este or'anizat pe dou
fie, reprezentate n fi'urile urmtoare.
Fia Add Trendline T"pe permite selectarea modelului utilizat pentru
determinarea tendinei 'enerale a seriei numerice. (unt disponibile principalele
modele utilizate n calculele economice sau te*nice.
.inear " modelul liniar (re'resia simpl, = G a d bx.
Pol"nomial " modelul polinomial de ordin $, 8, >, ?, sau O,
= G a9 d a7x7 d a$x$ d c d a<x<.
.ogarit%mic " modelul lo'aritmic! = G a d b ln x.
E/ponential " modelul exponenial! = G a ebx.
Power " modelul putere! = G a xb.
oving Average " modelul de tip A+ (medii 'lisante, n care se calculeaz o
serie nou cu %alori obinute ca medie aritmetic a %alorilor din seria iniial!
=n G (xn d xn-7 d c d xn-<d7U<, unde < este ordinul modelului. Este modelul
prin care se elimin influenele pe termen foarte scurt sau scurt.
Pentru o ale'ere corect se poate utiliza informaia cunoscut din cercetri
anterioare sau cea furnizat %izual de aspectul norului de puncte.
Fona ,rder este acti% pentru modelul polinomial (stabilete ordinul modelului,
maxim O, iar zona Period este acti% pentru modelul Ao%in' +%era'e
(stabilete ordinul modelului " cte elemente contribuie la calculul mediei
aritmetice.
)n zona !ased on series se indic seria (dintre cele reprezentate pentru care se
estimeaz prin metoda celor mai mici ptrate modelul selectat.
Da efect al procedurii de adu'are a liniei de trend, n 'rafic se %a afia, ca o
linie separat, seria ipotetic obinut prin calcularea trendului. +ceast linie
poate fi formatat ca orice alt obiect 'rafic (se selecteaz, se aplic meniul
%or6at etc..
Fia Add Trendline ,ptions este prezentat n fi'ura urmtoare i permite
definirea altor atribute ale liniei de trend0
)n 'rupul de opiuni Trendline name se poate ataa liniei o denumire proprie
(butonul radio *ustom i tastarea numelui n zona rezer%at sau se ale'e
denumirea implicit (butonul radio Automatic.
)n 'rupul de opiuni Forecast se poate indica numrul de perioade (%alori
pentru care se efectueaz pro'noze, att n %iitor (Forward, ct i n trecut
(!ac:ward. Este suficient s se nscrie o %aloare diferit de zero n zona
contor alocat i seria de trend se %a extinde corespunztor.
Set intercept ; " permite fixarea %alorii termenului liber al modelului la o
%aloare cunoscut (opiune util pentru anumite tipuri de re'resii. (e %a marca
boxa de control i se %a trece %aloarea termenului liber.
Displa" equation on c%art " marcarea boxei de control are efectul trecerii pe
'rafic a ecuaiei estimate.
Displa" --squared value on c%art + este util pentru afiarea coeficientului de
determinare 2$ (G ptratul coeficientului de corelaie multipl, interpretabil n
analiza de re'resie.
SPSS
S.atterplot
/ia'rama de mprtiere (scatterplot dup denumirea utilizat n (P((
presupune, uzual, c %ariabila dependent este pe axa %ertical (-= iar
%ariabila
independent este pe axa orizontal.
Pentru a obine o dia'ram de mprtiere se utilizeaz comanda Grap1s B
Scatter222 (e %a afia dialo'ul!
Pentru dia'rama de mprtiere (relaia dintre dou %ariabile se ale'e %arianta
Simple. /up acionarea butonului /efine se afieaz dialo'ul de fixare a
%ariabilelor i a opiunilor asociate.
(e %a trece %ariabila dependent n zona 9 A/is i %ariabila independent n
zona 8 A/is. (e pot diferenia (prin marcaBe diferite obser%aiile care aparin la
di%erse 'rupuri dac se trece %ariabila care face diferena n zona Set ar:ers
)".
,itlurile se pot adu'a prin desc*iderea dialo'ului ,itles. +cionarea butonului
-T %a produce trasarea 'raficului, obiect n fiierul de ieire.
+bia dup obinerea dia'ramei se pot fixa alte atribute de formatare prin
iniierea editrii dia'ramei. Prin urmare, dublu clic< pe dia'rama %a desc*ide
fereastra de editare!
)n aceast fereastr, prin dublu clic< pe un element se desc*id dialo'uri
specializate de formatare. Domanda C1art B #ptions conduce la afiarea
dialo'ului!
)n acest dialo', se pot marca casetele din 'rupul Fit .ine, care %or produce
trasarea dreptelor de re'resie pe total sauUi pe 'rupuri.-piunile disponibile
pentru trasarea dreptelor de re'resie se 'sesc n dialo'ul Fit -ptions!
Pentru trasarea dreptelor de re'resie se %a selecta opiunea .inear re'ression i
se poate cere includerea sau nu a constantei n re'resie, afiarea coeficientului
dedeterminare etc.
Dreapta "e regresie
Principalul dialo' pentru estimarea unui model liniar se obine prin Analyze
Re9ression (inear2
@n aceast lucrare se %or preciza doar acele elemente care sunt necesare pentru
estimarea dreptei de re'resie (ecuaia de re'resie simpl. .ucrarea urmtoare
%a conine explicaiile complete ale dialo'urilor (P(( implicate n estimarea i
analizarea modelului liniar.
)n Depen"ent se %a transfera %ariabila dependent. 5ariabila independent
(unic n cazul re'resiei simple se transfer n In"epen"ent4s5, n zona et%od
se fixeaz ca metod Enter0
]utonul Statistics desc*ide dialo'ul sinonim n care se pot preciza statisticile
calculate. 0nele opiuni sunt selectate i n mod implicit.
Estimates " coeficienii estimai, *onfidence intervals " inter%alele de
ncredere ale coeficienilor, odel fit " calcularea statisticilor 2, 2$ i a
tabelului +3-5+, - squared c%ange " modificrea coeficientului de
determinare i testarea semnificaiei sc*imbrii la adu'area fiecrui bloc de
%ariabile, Descriptive " statisticile eseniale pentru fiecare %ariabil, )n zona
Resi"uals se produce o analiza a
reziduurilor pentru a putea decide asupra normalitii acestora i a dia'nostica
%alorile aberante.
/intre tabelele de rezultate sunt prezentate n continuare doar cele importante
n cazul re'resiei simple!
,abelul odel Summar" conine informaiile care pri%esc coeficientul de
corelaie i eroarea standard a estimaiei. /e remarcat coeficientul de
determinare 2 care exprim ct la sut din %ariana %ariabilei dependente este
explicat de ecuaia de re'resie.
)n tabelul +3-5+, informaia important este statistica F cu aButorul creia se
testeaz semnificaia 'lobal a %ariabilelor independente (doar una n cazul
re'resiei simple, procedura capt substan n cazul re'resiei multiple. Pe
coloana Sig0 Este afiat probabilitatea crritic a testului, astfel c dac Sig H C
se respin'e ipoteza lipsei de semnificaie a %ariabilelor independente n fa%oarea
ipotezei c modelul re'resional este unul semnificati%. (e mai spune c testul
este un test de semnificaie asupra lui 2.
,abelul Doefficients conine informaiile pri%ind coeficienii! coloana B -
%aloarea coeficientului, St"- Error - eroarea standard a coeficientului (abaterea
standard n distribuia de sondaB a coeficientului, Beta - %aloarea coeficientului
standardizat (arat cu cte abateri standard se modific b dac a se modific cu
o abatere standard, t - statistica testului de semnificaie a coeficientului, Sig- -
probabilitatea critic a testului. Prin urmare, un coeficient este semnificati%
(diferit de zero n ecuaia de re'resie dac Sig H C.
Pentru exemplul din tabel se poate scrie ecuaia de re'resie simpl
b G - 9.7?1 a d 8I.J??, toi coeficienii fiind semnificati%i statistic.
Re9resia liniar3 6ultipl3
0 Excel< SPSS 0
B- Instrumente E(.el0 SPSS
Excel
REGRESSION
Estimarea coeficienilor unui model liniar prin metoda celor mai mici ptrate
i calculul statisticilor necesare testelor statistice asociate sunt efectuate de
procedura Re9ression, una dintre cele mai complexe din pac*etul de prelucrri
statistice din Excel. Procedura permite i construirea 'raficelor necesare pentru
aprecierea %izual a potri%irii modelului liniar. /ei acestea, din moti%e
e%idente, necesit prelucrri suplimentare de scalare nainte de interpretare,
existena lor este un real aButor pentru statistician.
Termeni
Aodelul liniar estimat de procedur
este
b G C9a9 d C7a7 d C$a$ d c d Cp-7ap-7 d e,
care exprim faptul c %ariabila b se
poate obine ca o combinaie liniar a %ariabilelor a9, a7,c, ap-7 la care se
adau' o feroaref e.
Pentru estimarea parametrilor modelului se consider disponibile n
obser%aii asupra tuturor %ariabilelor din model. 5alorile sunt structurate ca un
tablou dreptun'*iular, fiecare %ariabil ocupnd o
coloan (deci o linie este referit drept o obser%aie.
/ialo'ul procedurii Re9ression este prezentat n fi'ura urmtoare.
Input
3nput 9 -ange " se precizeaz domeniul (coloana pe care se afl %alorile
%ariabilei dependente.
3nput 8 -ange " se precizeaz domeniul pe care se afl %alorile tuturor
%ariabilelor independente. +cest domeniu trebuie s fie compact, fiecare
%ariabil ai ocupnd o coloan.
.a)els " se marc*eaz boxa de control n cazul n care prima linie din tabloul de
date este cu denumirile %ariabilelor (situaie recomandat.
*onstant 3s <ero " se marc*eaz boxa de control dac modelul care se
estimeaz este fr termen liber.
*onfidence .evel " se precizeaz, procentual, si'urana statistic dorit n
raportarea inter%alelor de ncredere deci %aloarea (7"C_799, unde C este pra'ul
de semnificaie.
@nter%alele obinute sunt suplimentare, ntotdeauna afindu-se cele pentru C G
9,9?. ]oxa se %a marca doar dac se dorete i un alt pra' de semnificaie.
Output options
,utput -ange1 2ew &or:s%eet Pl"1 2ew &or:)oo: " Precizeaz zona unde se
%or nscrie rezultatele. Fona de rezultate este foarte complex, cuprinde tabele
care depind de mrimea modelului, de numrul de obser%aii, de numrul
'raficelor dorite etc. Prin urmare se %a prefera o foaie de calcul nou sau o zon
liber n dreapta i n Bos.
Resi"uals
-esiduals " se marc*eaz boxa de control n cazul cnd se dorete calcularea
reziduurilor modelului estimat.
-esidual Plots " se marc*eaz boxa de control n cazul cnd se dorete
obinerea dia'ramelor
re#iduuri + varia)il7 independent71 adic %izualizarea punctelor de coordonate
(xiB, rB, B G 7,cn, a%nd ca abscis o %aloare a %ariabilei independente ai, iar
ca ordonat
reziduul corespunztor.
Standardi#ed -esiduals " aceast box de control se %a marca dac se dorete
calculul %alorilor standardizate ale reziduurilor. 5alorile astfel obinute pro%in,
teoretic, dintr-o distribuie normal standard, astfel nct o *isto'ram a acestor
%alori trebuie s se apropie de curba normal (clopotul lui 4auss.
.ine Fit Plots " se marc*eaz aceast box de control dac se dorete afiarea
dia'ramelor 9
+ varia)il7 independent71 prin care se %izualizeaz, pe un acelai 'rafic,
punctele de coordonate (xiB, =obs,i, (xiB, =est,i, B G 7,c,n, unde abscisele sunt
%alorile %ariabilei independente, iar ordonatele sunt %alorile obser%ate i cele
estimate ale %ariabilei dependente. Este desenat cte un 'rafic pentru fiecare
%ariabil independent.
@nterpretarea acestor dia'rame poate oferi indicaii asupra adec%anei modelului,
asupra %alorilor aberante.
Normal ProAaAilit3
2ormal Pro)a)ilit" Plots " se marc*eaz dac se dorete %izualizarea repartiiei
de sondaB a %ariabilei b ntr-o reea de probabilitate.
E(emplu
0n set de date cuprinde $? de obser%aii asupra a > %ariabile, notate b
(considerat
%ariabila dependent i a7, a$, a8 (considerate %ariabile independente.
5alorile i denumirile ocup n foaia de calcul un domeniu dreptun'*iular
continuu, ]$!E$1, %alorile b ocupnd prima coloan.
Pentru a estima modelul liniar
b G C9 d C7a7 d C$a$ d C8a8 d e,
cu termen constant, se apeleaz procedura Re9ression.
a5 0n prim tabel de rezultate, prezentat n fi'ura alturat, conine statisticile
'enerale ale ecuaiei de re'resie.
ultiple - " coeficientul multiplu de corelaie.
- Square " coeficientul de determinare (este e'al cu ptratul
coeficientului de corelaie multipl. Poate fi 'ndit, exprimat procentual, drept
proporia din %ariaia %ariabilei dependente explicat de %ariaia %ariabilelor
independente! O9,1P din %ariaia lui b este explicat de %ariabilele a.
Ad=usted - Square " %aloarea corectat a coeficientului de
determinare. Este introdus pentru a contracara (parial efectul creterii
mecanice a lui 2$ o dat cu numrul %ariabilelor independente.
Standard Error " eroarea standard a estimaiei. (e calculeaz ca abaterea
standard a reziduurilor (pentru numrul 'radelor de libertate utilizat se %a %edea
tabloul +3-5+, n continuare i este estimaia abaterii standard a erorilor e (n
ipoteza normalitii acestora.
,)servations " numrul de obser%aii din eantion.
/5 +l doilea tabel de rezultate cuprinde tabloul de analiz a %arianei asociat
re'resiei estimate.
Doloanele acestui tablou au semnificaiile uzuale ntr-un tablou +3-5+!
(ursa de %ariaie " arat descompunerea %ariaiei totale n %ariaia explicat de
re'resie i cea rezidual (neexplicat.
df " numrul 'radelor de libertate! 8 G p " 7, $7 G n " p, $> G n " 7, unde p G >
este numrul parametrilor modelului (trei %ariabile a plus termenul liber iar
nG $? este numrul de obser%aii.
(( " sumele de ptrate potri%it descompunerii
(uma 'lobal de ptrate G (uma de ptrate datorat re'resieid (uma de ptrate
rezidual
A( " media sumelor de ptrate! (( mprit la numrul respecti% de 'rade de
libertate.
5aloarea de pe linia a doua (-esidual este estimaia dispersiei pentru repartiia
erorilor i este ptratul erorii standard a estimaiei.
F " %aloarea statisticii F pentru testul caracterizat de
K9 ! C7 G C$ G C8 G 9
K7 ! exist cel puin un coeficient Ci diferit de zero.
+cest test se refer la ansamblul %ariabilelor independente (este de remarcat c
K9 nu se extinde i asupra termenului liber. /atorit nelesului ipotezei nule,
se consider c prin acest test se %erific semnificaia ntre'ii re'resii.
Significance F " este probabilitatea critic unilateral. /ac %aloarea afiat este
mai mic dect pra'ul de semnificaie fixat, atunci se respin'e ipoteza nul n
fa%oarea ipotezei alternati%e.
c5 +l treilea tablou de rezultate conine %alorile estimate pentru coeficienii
modelului, precum i statisticile necesare %erificrii ipotezelor uzuale asupra
coeficienilor. /e remarcat c, spre deosebire de testul F, testele asupra
coeficienilor sunt indi%iduale.
(iniile tabelului se refer la %ariabilele din model, incluznd i termenul liber.
Coloanele tabelului sunt urmtoarele!
(prima coloan " sunt afiate denumirile existente n tabloul de date sau create
automat pentru %ariabilele independente implicate. !ntercept este denumirea
pentru termenul liber (constant al modelului.
*oefficients " conine %alorile estimate ale coeficienilor. /in %alorile afiate
rezult c modelul estimat n exemplu este
b G 77,17J " 7,>>8Za7 d 8,78?Za$ " 9,8$>Za8.
)n ipotezele distribuionale ale modelului liniar, %alorile calculate ale
coeficienilor pro%in din repartiii normale, fiind astfel posibile %erificri
statistice ale coeficienilor.
Standard Error " eroarea standard a coeficientului (abaterea standard a
repartiiei coeficientului.
t Stat " statistica t pentru %erificarea ipotezei K9 ! Ci G 9 contra ipotezei
alternati%e K7 ! Ci R 9.
)n condiiile ipotezei nule se demonstreaz c raportul dintre coeficient i
eroarea standard a coeficientului urmeaz o repartiie (tudent cu (n " p 'rade
de libertate. +cest
raport este tocmai %aloarea raportat drept t (tat. +dic $,7O7 G 77,17JU?,>$7
etc.
0tilizarea statisticii este cea uzual.
P-value " probabilitatea critic bilateral a testului t cu ipotezele precizate la t
(tat. Pentru pra'ul de semnificaie C G 9,9? se poate respin'e ipoteza de nulitate
a termenului liber (9,9>$ H 9,9? i a coeficienilor C7 i C$ (9,99$ i 9,999 sunt
mai mici dect 9,9?. 3u se poate respin'e ipoteza nul pri%ind coeficientul C8
(9,9OI Q 9,9?.
.ower >?@1 Upper >?@ " limitele inferioar i superioar ale inter%alului de
ncredere pentru parametrul respecti%. .imitele la pra'ul 9,9? sunt calculate
automat, indiferent de iniializarea procedurii 2e'ression.
(e poate deci interpreta c, n populaie, parametrii modelului liniar sunt
cuprini n inter%alele urmtoare!
9,>>> H C9 H $$,II$
g$,$17 H C7 H g9,O7?
...
(e poate obser%a c ultimul inter%al cuprinde i %aloarea zero, prin urmare se
re'sete concluzia pri%ind nerespin'erea ipotezei nule K9 ! C8 G 9.
,5 (tudiul reziduurilor se poate face pe baza datelor raportate n tabelul alocat
reziduurilor, tabel a%nd structura urmtoare!
Pentru fiecare obser%aie (linie din tabelul de date iniial se afieaz!
,)servation " numrul de ordine al obser%aiei.
Predicted " " %aloarea = pro'nozat pentru obser%aia respecti%6 se obine
nlocuind %alorile a ale obser%aiei n modelul estimat.
-esiduals " %aloarea erorii de predicie (diferena dintre %aloarea obser%at i
%aloarea
pro'nozat.
Standard -e#iduals " %aloarea standardizat a erorii. Este obinut prin
mprirea reziduului la abaterea standard a reziduurilor (rezultatul nu este
susinut absolut ri'uros de teorie.
e5 +naliza calitii modelului este facilitat i de 'raficele construite automat de
procedura Re9ression. (unt produse dou tipuri de dia'rame!
" dia'rame reziduuri %s. %ariabile independente i
" dia'rame %ariabila dependent %s. %ariabile independente.
4raficele necesit, de obicei, prelucrri suplimentare pentru a fi interpretate sau
raportate.
)n fi'ur se d un exemplu de dia'ram reziduuri " %ariabil independent a.
Punctele din fi'ur se pot considera ntr-o re'iune de tip band orizontal ceea
ce nu contrazice ipotezele de normalitate a erorilor. Forma de band uniform
reflect
constana dispersiei reziduurilor pentru tot domeniul %ariabilei independente
a7. +lte forme de distribuire a reziduurilor duc la concluzii importante pentru
adec%ana modelului n pri%ina %ariabilei independente implicate!
Forma re'iunii @nterpretare (ituaia fbunf.
3u se contrazic ipotezele de normalitate fcute asupra erorilor.
/ispersia erorilor nu este constant (se modific dup %alorile a. (e poate ca
din model s fie omis o %ariabil de 'en f,impf.
Aodelul liniar nu este adec%at n pri%ina %ariabilei independente
respecti%e. (e poate ncerca un introducerea unui termen ptratic.
(ituaia poate s apar n urma unei erori de calcul. Practic ar nsemna c nu s-a
considerat componenta liniar, adic scopul modelului nu a fost atins.
)n mod asemntor se pot interpreta dia'ramele b " a.
/ia'rama reziduuri " %ariabil
2e'iunea reziduurilor
SPSS
Dreapta "e regresie
Principalul dialo' pentru estimarea unui model liniar se obine prin Analyze
Re9ression (inear2
)n Depen"ent se %a transfera
%ariabila dependent. 5ariabilele
independente, In"epen"ent4s5, pot fi 'rupate pe blocuri! 7. se transfer
%ariabilele dorite, $. se precizeaz n
et%od modul de introducere a acestor %ariabile n re'resie (Enter "
toate simultan, Forward, !ac:ward, Stepwise " metodele discutate la
ale'erea celei mai bune re'resii, 8. (e definete un nou bloc prin 2e/t.
(e pot selecta obser%aiile preciznd n Sele.tion &ariaAle
%ariabila i, prin Rule, re'ula de selectare a cazurilor n funcie de
%alorile %ariabilei de selecie.
)n 'ase aAels se poate preciza %ariabila care identific cazurile, etic*etele
fiind considerate la reprezentrile 'rafice. Prin %S %eig!t se poate preciza
%ariabila de ponderare pentru metoda celor mai mici ptrate ponderate
(nediscutat n curs.
]utonul Statistics desc*ide dialo'ul sinonim n care se pot preciza statisticile
calculate. 0nele opiuni sunt selectate i n mod implicit.
Estimates " coeficienii estimai,
*onfidence intervals " inter%alele de ncredere ale coeficienilor, odel fit "
calcularea statisticilor 2, 2$ i a tabelului +3-5+, - squared c%ange "
modificarea coeficientului de determinare i testarea
semnificaiei sc*imbrii la adu'area fiecrui bloc de %ariabile, Descriptive "
statisticile eseniale pentru fiecare %ariabil,
Dollinearit" diagnostics " calcularea toleranelor, a statisticilor 5@F i studiul
multicoliniaritii prin analiza n componente principale (a se %edea capitolul
urmtor al cursului. )n zona Resi"uals se produce o analiza a reziduurilor
pentru a putea decide asupra normalitii acestora i a dia'nostica %alorile
aberante.
Prin Plots se afieaz dialo'ul sinonim n care se pot indica reprezentrile
'rafice dorite.
)n lista %ariabilelor disponibile pentru dia'rame se afl /EPE3/3, " %ariabila
dependent " i %ariabile deri%ate din re'resie cum ar fi %alorile pro'nozate
standardizate (ZFP2E/, reziduurile standardizate (ZF2E(@/.
/ia'ramele indicate n Standardi#ed -esidual Plots sunt utile pentru %erificarea
normalitii reziduurilor.
/ialo'ul Sa.e permite calcularea i sal%area ca %ariabile noi a %alorilor
pro'nozate i a reziduurilor sub diferite forme, precum i sal%area altor statistici
de interes. Pre"i.te" &alues " %alorile pro'nozate prin model pentru fiecare
caz!
Unstandardi#ed, Standardi#ed pentru %alorile nestandardizate i standardizate,
Ad=usted %aloarea pro'nozat pentru un caz din ecuaia de re'resie estimat fr
a considera acel caz, S0E0 of mean predictions abaterile standard ale %alorilor
pro'nozate, utile pentru calcularea inter%alelor de ncredere ale acestor %alori.
Distan.es " distanele cazurilor de la punctul mediu, pentru identificarea
%alorilor aberante! a%alano)is este distana explicat n capitolul pri%ind
clasificarea, *oo:As este msura a ct de mult se modific reziduurile dac se
elimin cazul respecti% din estimarea modelului (o %aloare mare arat o
influen considerabil a cazului n estimarea coeficienilor, .everage values
msoar influena cazurilor n estimare.
Pre"i.tion InterBals sunt inter%alele de incredere pentru %alorile estimate, la
ni%elul de ncredere precizat n *onfidence 3nterval0 (unt 'enerate dou
%ariabile.
Resi"uals " reziduurile estimrii n diferite forme! standardizate,
nestandardizate, studentizate (reziduul este mprit la estimaia abaterii sale
standard, proprie fiecrui caz. Deleted, Studenti#ed deleted se
refer la reziduurile obinute din modelul la estimarea cruia cazul respecti% a
fost exclus.
In?luen.e Statisti.s sunt modificrile n coeficieni (inclusi% cei standardizai,
Df!eta4s5 i Standardi#ed Df!eta, i n %alorile pro'nozate, DfFit
i Standardi#ed DfFit, rezultate dup excluderea cazului din estimare.
)n sfrit, prin butonul #ptions se desc*ide dialo'ul sinonim n care se pot fixa
parametri ai estimrii! pra'urile de intrare i excludere la metodele pas cu pas
precum i modul de tratare a %alorilor lips dintr-o %ariabil implicat.
Multicoliniaritate< .alori a/erante<
re9resia polino6ial3 0 SPSS
B- Instrumente SPSS
SPSS
Dreapta "e regresie
2eamintim principalul dialo' pentru estimarea unui model liniar se obine prin
Analyze Re9ression (inear2
)n Depen"ent se %a transfera %ariabila dependent. 5ariabilele
independente, In"epen"ent4s5, pot fi 'rupate pe blocuri! 7. se transfer
%ariabilele dorite, $. se precizeaz n et%od modul de introducere a acestor
%ariabile n re'resie (Enter " toate simultan, Forward, !ac:ward, Stepwise "
metodele discutate la ale'erea celei mai bune re'resii, 8. se definete un nou
bloc prin 2e/t.
(e pot selecta obser%aiile
preciznd n Sele.tion &ariaAle %ariabila i, prin Rule, re'ula de selectare a
cazurilor n funcie de %alorile %ariabilei de selecie.
]utonul Statistics desc*ide dialo'ul sinonim n care se pot preciza
statisticile calculate. 0nele opiuni sunt selectate i n mod implicit.
Estimates " coeficienii estimai,
*onfidence intervals " inter%alele de ncredere ale coeficienilor, odel fit "
calcularea statisticilor 2, 2$ i a tabelului +3-5+, - squared c%ange "
modificrea coeficientului de determinare i testarea semnificaiei sc*imbrii
la adu'area fiecrui bloc de %ariabile, Descriptive " statisticile eseniale pentru
fiecare %ariabil
Pentru tema curent este important ale'erea Dollinearit" diagnostics "
calcularea toleranelor, a statisticilor 5@F i studiul multicoliniaritii prin
analiza n componente principale (a se %edea capitolul urmtor al cursului. )n
acest caz, tabelul pri%ind coeficienii modelului estimat %a conine nc dou
coloane cu statisticile pri%ind dia'nosticul coliniaritii.
+pare totodat n fiierul de ieire un tabel intitulat *ollinearit" Diagnostics
care conine informaii pri%ind analiza factorial (a se %edea capitolul urmtor
din curs a %ariabilelor independente. (e poate deocamdat interpreta (mecanic
faptul c existena mai multor %alori proprii situate n imediata %ecintate a lui 9
denot o posibil coliniaritate n %ariabilele independente.
@n ceea ce pri%ete %alorile aberante reamintim dialo'ul Plots (prezentat n
lucrarea trecut prin intermediul cruia se pot solicita dia'ramele asociate
reziduurilor.
/in dialo'ul Sa.e< care permite calcularea i sal%area unor %ariabile noi
(%alorile pro'nozate, reziduuri sub diferite forme etc. accentum elementele!
Distan.es " distanele cazurilor de la punctul mediu, pentru identificarea
%alorilor aberante! a%alano)is este distana explicat n capitolul pri%ind
clasificarea, *oo:As este distana Doo< explicat mai sus (o %aloare mare arat o
influen considerabil a cazului n estimarea coeficienilor, .everage values
msoar influena cazurilor n estimare.
In?luen.e Statisti.s sunt modificrile n coeficieni (inclusi% cei standardizai,
Df!eta4s5 i Standardi#ed Df!eta, i n %alorile pro'nozate, DfFit i
Standardi#ed DfFit, rezultate dup excluderea cazului din estimare.
@n ieirea (P((, %alorile aberante pot fi deci identificate prin
7 (td residual sau (tud 2esidual mai mari dect 8 n %aloare absolut.
$ Standardi#ed Df!eta mai mari de 7 (sau, dup ali autori, c*iar mai mari de
$U(&rt(3.
8 Doo<hs / mai mare dect >U3 pot indica obser%aii cu probleme..
(7 se %a studia influena %ariabilelor independente.
($ se %or analiza i trata %alorile aberante.
ii se %a reface analiza pentru fiecare cate'orie de Bob
Re9resia lo9istic3 0 SPSS
B- Instrumente SPSS
Domanda este Analyse 0 Re9ression 0 inary (o9istic.
(e afieaz dialo'ul de fixare a %ariabilelor i statisticilor.
(e mut %ariabila dependent (binar n Dependent. 5ariabila independent
sau %ariabilele independente (n cazul multi%ariat sunt mutate n lista
*ovariates.
Pentru a indica %ariabilele independente care este cate'oriale (discrete, se %a
aciona butonul *ategorical, afidu-se dialo'ul
Fiecare %ariabil trecut n lista *ategorical *ovariates poate fi caracterizat
prin selecii corespunztoare n 'rupul *%ange *ontrast
+cionnd butonul ,ptions din dialo'ul principal, se desc*ide dialo'ul
sinonim n care se precizeaz statisticile i dia'ramele dorite n ieire.
)n dialo'ul principal .ogistic -egression, se poate ale'e metoda utilizat
pentru introducerea %ariabilelor la estimarea re'resiei. /e reinut metoda Enter
n care %ariabilele sunt introduse n bloc (se estimeaz o sin'ur ecuaie sau
metode de selectare pas cu pas (ca la re'resia liniar multipl, cum ar fi
Forward: .-. +ceasta nseamn c modelul este construit ascendent, criteriul
de introducere a unei noi %ariabile fiind testul .2 (a raportului de
%erosimilitate.
Prin acionarea butonului Save n dialo'ul principal se pot preciza noile
%ariabile care pot fi create din ieirea procedurii, ca i la re'resia multipl.
@nformaiile care apar n fiierul de ieire (P(( sunt explicate n continuare.
0n prim tabel cu informaiile 'enerale (numr de obser%aii %alide etc..
0n tabel n care se precizeaz codificrile %ariabilelor cate'oriale (inclusi% cea
dependent. Pentru %ariabilele cate'oriale independente are loc o recodificare
cu considerarea cate'oriei de referin! aceasta este recodificat 9.
@eirea difer ca structur dup metoda de selectare a %ariabilelor, dar conine
un prim bloc de informaii care se refer la modelul simplu (doar cu termenul
constant. /e remarcat structura! clasificare, %ariabile n ecuaie, %ariabile
candidate.
,abelul de clasificare este construit prin considerarea probabilitii de
clasificare pro'nozate de modelul curent pentru fiecare obser%aie. dup
principiul c -2Q7 claseaz obser%aia n 'rupul codificat 7. 0n model bun
trebuie s numere cele mai multe obser%aii pe dia'onala principal a tabelului.
,abelul care urmeaz, referitor la model, este explicat i se interpreteaz
potri%it celor spuse la tabelul similar dintr-un pas intermediar afiat ce%a mai
departe n lucrare.
@nformaiile oferite pentru faza final sunt dup structura
(e obser% c n fiecare pas al estimrii modelului se testeaz dac trecerea de
la precedent este semnificati% (se respin'e ipoteza nulitii %ariabilei sau
%ariabilelor adu'ate.
@ndicatorii similari coeficientului de determinare din re'resia multipl sunt n
tabelul care urmeaz.
,estul Kosmer W .emes*o: este explicitat pentru fiecare pas prin raportarea
celor 79 frec%ene obser%ateUateptate (statistica i semnificaia sunt raportate n
tabelul precedent.
(e raporteaz de asemenea tabelul de clasificare pentru fiecare pas al
procedurii.
)n tabelul referitor la %ariabilele din model se raporteaz!
E coeficienii ]
E Exp (] cu interpretarea, dat n partea teoretic, c reprezint modificare -2
a %ariabilei dependente la modificarea cu o unitate a
%ariabilei independente, deci Exp (] i 7 pentru %ariabilele nesemnificati%e.
E informaii asociate testul ;ald de semnificaie a fiecrui coeficient.
)n tabelul urmtor (apare doar pentru anumite metode de selectare a
%ariabilelor se prezint informaiile necesare pentru a testa ce s-ar ntmpla
daca o %ariabil din model este exclus. Pentru un model care se construiete
ascendent, acestea pot su'era prezena unor %ariabile care au de%enit
nesemnificati%e prin includerea altor %ariabile.
Pentru %ariabilele care nu sunt n model, se prezint testele care decid
necesitatea prezenei lor. .a pasul urmtor, %a fi introdus n model %ariabila cu
scorul cel mai mare (scor calculat potri%it metodei selectate.
/ia'rama de clasificare (afiat n continuare este alctuit!
E +xa a este probabilitatea pro'nozat (de la 9 la 7 de a fi clasificat n
'rupul codat f7f. (ub ax sunt difereniate zonele de clasificare prin
simbolurile care codific 'rupul 7 (bes i 'rupul $ (3o. (e obser%
pra'ul de 9.? care sc*imb clasificarea.
E +xa b este frec%en (numr de cazuri.
E Doloanele care apar n dia'ram sunt alctuite din marcaBe (fiecare
reprezint un numr de cazuri pentru simplificare care reprezint
clasificarea obser%at a cazurilor.
E Examinarea dia'ramei const n analiza faptului dac marcaBele
corespund la acelai semn (besU3o situat sub axa a. Prin urmare
o semnele b care corespund la %alori b de pe axa -a (i semnele
3 care corespund la %alori 3 de pe axa -a reprezint
clasificri pro'nozate corect de model.
o celelalte marcaBe (semnele b care corespund la %alori 3 de pe
axa -a, precum i semnele 3 care corespund la %alori b de pe
axa -a reprezint cazuri clasate eronat, deci obser%aii pentru
care modelul estimat nu funcioneaz.

S-ar putea să vă placă și