Sunteți pe pagina 1din 68

UNIVERSITATEA TRANSILVANIA DIN BRAOV

FACULTATEA DE TIINE ECONOMICE


Nicoleta PETCU
ANALIZA DATELOR - aplicaii N SPSS
A!ali"a #i$i%e!&io!al'
Re()e&ie *i co)elaie
A!ali"a %+lti$i%e!&io!al'
Pe!t)+ &t+$e!ii p)o()a%elo) $e &t+$ii - %a&te)at
BRAOV, -../
ANALIZ0 BIDIMENSIONAL0
Pentru a realiza o distribuie bidimensional s-a luat n considerare un eantion
format din 150 de persoane ce au rspuns unor ntrebri dintr-un chestionar, printre care:
dac au vzut reclama la un produs nou lansat pe pia i dac au cumprat produsul
respectiv !ele dou ntrebri au devenit variabile statistice pentru fiierul creat n "P""
#abelele de contin$en se pot realiza astfel:
A!al1"e
De&c)ipti2e Stati&tic&
C)o&&ta#&3
%i$ 1 &ealizarea tabelelor de contin$en
!u a'utorul butonului Cell&3 obinem o nou caset de dialo$ cu a'utorul creia
putem obine tabelele menionate mai sus:
%i$ ( "electarea tipului de frecvene

)istribuia persoanelor dup cele dou caracteristici
(
!ount
*5 15 +0
(0 50 ,0
+5 *5 150
da
nu
&-!./0/
#otal
da nu
!10P/&/
#otal
&-!./0/ 2 !10P/&/ !rosstabulation
3n acest tabel s-a obinut distribuia celor 150 de persoane dup cele dou
caracteristici, sub forma frecvenelor absolute
)ac dorim s obinem profilele linii, adic pentru fiecare modalitate a variabilei
reclama, ponderea celor care cumpr n totalul liniei, bifm n caseta de dialo$
Pe)ce!ta(e& Ro4
Profile linii
*5 15 +0
+1,45 1+,+5 100,05
(0 50 ,0
(+,*5 ,1,65 100,05
+5 *5 150
5*,,5 64,45 100,05
!ount
5 7it hin
&-!./0/
!ount
5 7it hin
&-!./0/
!ount
5 7it hin
&-!./0/
da
nu
&-!./0/
#otal
da nu
!10P/&/
#otal
&-!./0/ 2 !10P/&/ !rosstabulation
)ac dorim s obinem profilele coloane, adic pentru fiecare modalitate a
variabilei cumpr, ponderea celor care au vzut reclama n totalul coloanei, bifm n
caseta de dialo$ Pe)ce!ta(e& Col+%!
Profile coloane
*5 15 +0
,*,55 (4,15 54,45
(0 50 ,0
(4,55 ,*,85 6*,,5
+5 *5 150
100,05 100,05 100,05
!ount
5 7ithin
!10P/&/
!ount
5 7ithin
!10P/&/
!ount
5 7ithin
!10P/&/
da
nu
&-!./0/
#otal
da nu
!10P/&/
#otal
&-!./0/ 2 !10P/&/ !rosstabulation
&eprezentarea $rafic a distribuiei celor 150 de persoane chestionate, dup cele
dou variabile se realizeaz bif9nd n caseta C)o&&ta#&, Di&pla1 cl+&te)e$ #a) c5a)t& i
obinem $raficul de mai 'os
4
%i$ 4 :rafic cluster
:raficul pune n eviden faptul c, decizia de cumprare a fost influenat de
reclama care s-a fcut la acel produs
Testarea independenei a dou variabile testul
2
!u a'utorul testului
2
se poate analiza dac dou variabile sunt dependente sau
independente, $arant9nd rezultatele cu o probabilitate dinainte stabilit Pentru a verifica
acest lucru pornim de la ipotezele:
H
0
: variabile independente ; ipoteza nul, cu alternativa
H
1
: variabile dependente
)ou variabile sunt independente dac sunt ndeplinite condiiile:
< = < > = < = < > =
1 1 1 1 1 1
y Y P x X y Y P i x X P y Y x X P
#estul se poate aplica at9t n cazul variabilelor dihotomice c9t i n cazul
variabilelor calitative cu mai multe modaliti &evenind la distribuia din tabelul de mai
sus , condiiile de independen se rezum la e$alitatea rapoartelor:
n
n
n
n
sau
n
n
n
n
j
i
ij
i
j
ij


)in aceste condiii de independen se determin distribuia teoretic =-?pected<
ij
nt
astfel:
n
n n
nt
i j
ij

6
RECLAMA
nu da
C
o
u
n
t
70
60
50
40
30
20
10
0
CUMPARA
da
nu
50
15
20
65
3n cazul e?emplului nostru, pentru a obine distribuia teoretic =cum ar fi trebuit
s se distribuie cele 150 de persoane dac variabilele reclama i cumpr ar fi
independente<, n caseta Cell&3 se selecteaz opiunea E6pecte$

%recvene teoretice
*5 15 +0
65,4 46,, +0,0
(0 50 ,0
48,, 40,4 ,0,0
+5 *5 150
+5,0 *5,0 150,0
!ount
-?pected
!ount
!ount
-?pected
!ount
!ount
-?pected
!ount
da
nu
&-!./0/
#otal
da nu
!10P/&/
#otal
&-!./0/ 2 !10P/&/ !rosstabulation
Pentru a verifica dac cele dou variabile sunt independente se calculeaz mrimea
(
calc
cu formula:

p
i
q
j ij
ij ij
calc
nt
nt n
1 1
(
(
< =

@aloarea
(
calc
se compar cu valoarea teoretic
(
t
, e?tras din tabelul funciei
(

, pentru nivelul de semnificaie ales i


< 1 = < 1 = q p
$rade de libertate
)ac valoarea
(
calc

>
(
t

, atunci, se respin$e ipoteza A


0
i se admite alternativa ei
A
1
, variabilele sunt dependente
0etodele de analiz ne permit i msurarea intensitii le$turii cu a'utorul
coeficienilor:
a< Coe7icie!t+l 8 Presupun9nd c B este variabila anterioar i C variabila posterioar
1
,
se urmrete s se analizeze n ce proporie cei ce posed B
1
posed i C
1
, iar cei ce
posed B( posed i C1, calcul9ndu-se diferenele:
( (1 1 11 (1 11
> > k k k k p p
)ac
vom considera C variabila anterioar i B variabila posterioar se calculeaz
diferenele ( 1( 1 11 1( 11
> > k k k k q q
-fectu9ndu-se media $eometric a celor dou
diferene, se obine coeficientul :
( 1 ( 1
1 1 11
k k k k
k k k n



D alt formul este cea obinut cu a'utorul mrimii
(

:
n
(

t
)ac acest coeficient are o valoare pozitiv ne indic o asociere pozitiv =indivizii se
concentreaz pe dia$onala principal, cei care rspund )/ la prima ntrebare ,
1 &otaru #, 0etode statistice aplicate n tiinele sociale, -d Polirom, (000
5
rspund )/ i la a doua< iar dac are o valoare ne$ativ ne indic o asociere
ne$ativ

b< Coe7icie!t+l 9 :al l+i ;+le<8 /cest coeficient are un interval fi? de variaie E-1,F1G, se
anuleaz n cazul n care variabilele sunt statistic independente i se obine cu
formula:
(1 1( (( 11
(1 1( (( 11
k k k k
k k k k

Pentru e?emplul ales, se testeaz e?istena le$turii dintre cele dou variabile cu
testul
(

, iar intensitatea le$turii o msurm cu a'utorul coeficienilor menionai mai


sus
%i$ 6 /le$erea opiunilor statistice
!oeficient
(

6(,181 1 ,000
150
Pearson
!hi-"Huare
I of @alid
!ases
@alue df
/sJmp
"i$
=(-sided<
!hi-"Huare #ests
!omputed onlJ for a (?( table a
*
!oeficieni Phi, !ramerKs @
,540 ,000
,540 ,000
,6*8 ,000
150
Phi
!ramerLs @
!ontin$encJ
!oefficient
Iominal bJ
Iominal
I of @alid !ases
@alue
/ppro?
"i$
"Jmmetric 0easures
@aloarea
(
calc

6(,18 i este mai mare dec9t


(
t

4,+6 pentru nivelul de


semnificaie de 0,05 i un $rad de libertate, ceea ce ne ndreptete s respin$em
ipotaza A
0
i s acceptm alternativa ei A
1
, adic e?ist le$tur ntre reclam i
atitudinea consumatorilor de a cumpra produsul respectiv !oeficienii care msoar
intensitatea le$turii ne arat o asociere pozitiv de intensitate medie ntre cele dou
variabile
!socierea variabilelor no"inale
!onsiderm variabile nominale, variabilele calitative cu mai mult de dou
modaliti =variante< 0surarea asocierii se realizeaz pornind tot de la tabelul de
contin$en, prin calculul coeficienilor de asociere
a< Coe7icie!t+l $e co!ti!(e!' :C<8 !u c9t valoarea acestui coeficient este mai apropiat
de 1 cu at9t le$tura este mai puternic i cu c9t valoarea este mai aproape de zero, cu
at9t le$tura este mai slab @aloarea acestui coeficient se determin cu relaia:
n
#
calc
calc
+

(
(

unde n este mrimea eantionului Pentru aprecierea corect a intensitii le$turii trebuie
luat n considerare relaia:
p
p
#
1
ma?

, unde p reprezint numrul de modaliti ale


variabilei independente Pentru un tabel (( valoarea ma?im a lui ! este 0,,0,, pentru
un tabel 44 este 0,+1* i aa mai departe
(

#< Coe7icie!t+l V al l+i C)a%e)8 @aloarea acestui coeficient se obine cu relaia:
t n
$
calc

( .efter !, &u !, !ercetri de marMetin$, Nraov (000, pa$ 15*


,
n caren este mrimea eantionului iar ( ) ( ) [ ] 1 , 1 min q p t , p reprezint numrul
liniilor, q reprezint numrul coloanelor
c< Coe7icie!t+l :al l+i =oo$%a! *i >)+&?al<8 !alculul acestui coeficient este bazat pe
reducerea erorilor de predicie 1na dintre variabile, considerat anterioar sau
independent se afl n postura de a ameliora predicia celeilalte, devenit posterioar
sau dependent
Coeficientul se definete ca proporia cu care se reduc erorile prin introducerea
variabilei independente /cest coeficient este cuprins ntre 0 i 1.@aloarea 0 indic
faptul c variabila independent nu are nici un rol n predicia variabilei dependente
iar valoarea 1 semnific faptul c variabila independent determin perfect
modalitile variabilei dependente
Plec9nd de la distribuia din tabelul de mai sus, se pot calcula coeficienii astfel:

)istribuie dup variabile nominale

6, 10 (4 +0
1+ 4( (0 ,0
*5 6( 64 150
da
nu
&-!./0/
#otal
da nu nu stiu
!10P
#otal
consider9nd variabila !10P =cu trei modaliti< pe poziia variabilei dependente
=cumpr dac a vzut reclama<, vom calcula coeficientul
1*5 , 0
*5 150
*5 < 4( 6, =

cu"para
, ceea ce nseamn (suma frecvenelor maxime pe linii -
frecvena maxim pe linia totalurilor!(n " frecvena maxim pe linia totalurilor
consider9nd variabila &-!./0/ pe poziia variabilei dependente =a vzut reclama
dac a cumprat< vom calcula coeficientul
( )
416 , 0
+0 150
+0 (4 4( 6,

+ +

recla"a

.a modul $eneral, pentru dou variabile B i C :


( ) ( )
( )
j
q j
p
i
j
q j
ij
q j
Y
n n
n n

1
1

1 1
ma?
ma? ma?

,
_

( ) ( )
( )

1
1

1 1
ma?
ma? ma?
i
p i
q
j
i
p i
ij
p i
X
n n
n n

,
_

Nif9nd n caseta de dialo$ La%#$a, vom obine rezultatele:


+
!oeficieni .ambda, tau
,(4( ,0,( (,8** ,004
,416 ,0,, 4,544 ,000
,1*5 ,0,* (,00* ,065
,1*1 ,05, ,000
c
,0+6 ,04( ,000
c
"Jmmetric
&-!./0/
)ependent
!10P
)ependent
&-!./0/
)ependent
!10P
)ependent
.ambda
:oodman
and OrusMal
tau
Iominal
bJ Iominal
@alue
/sJmp
"t d -rror
a
/ppro? #
b
/ppro? "i$
)irectional 0easures
Iot assumin$ the null hJpothesis
a
1sin$ the asJmptotic standard error assumin$ the null hJpothesis
b
Nased on chi-sHuare appro?imation
c
@alorile obinute su$ereaz e?istenei le$turii dintre cele dou variabile, iar
predicia de la !10P spre &-!./0/ este mai bun dec9t invers
$< I!$ice $e co!co)$a!' @ ?appa8 Permite compararea aprecierilor a doi observatori
asupra aceluiai $rup !onsiderm, de e?emplu =Nishop 18,5<, aprecierile a doi
inspectori colari asupra comportamentului peda$o$ic a ,( cadre didactice =autoritar,
indiferent, n$duitor< &ezultatele evalurilor sunt prezentate n tabelul de mai 'os
&ezultatele evalurilor
Pnspector 1 Pnspector (
autoritar indiferent n$duitor #otal
autoritar 1, 6 + (8
60,4%
indiferent 5 1( 1,
(4,*%
n$duitor 10 4 14 (*
4*,1%
#otal 4(
66,6%
18
(*,6%
(1
(8,(%
,(
!oncordana n aprecierile celor doi inspectori este

+ +
100
,(
14 1( 1,
5+,4%
Pnspectorul 1 a apreciat n proporie de 60,4% dintre cdrele didactice ca fiind autoritare,
n timp ce inspectorul ( n proporie de 66,6% )ac evalurile sunt independente, se
presupune c 1,,8% =60,4%66,6%< dintre cadrele didactice s fie evaluate autoritare de
cei doi inspectori /semntor, *,(% =(4,*%(*,6%< sunt evaluate ca fiind indiferente
iar 10,5% =4*,1%(8,(%< n$duitoare 3n acest caz 46,*% dintre cadrele didactice sunt
clasate n aceeai cate$orie prin simplul 'oc al hazardului Pndicele Mappa va avea
valoarea:
4*( , 0
46* , 0 1
46* , 0 5+4 , 0

kappa
3n utilizarea indicelui Mappa, cele dou variabile trebuie s aib acelai interval de
variaie
8

Prelucrarea variabilelor cantitative
)up modul de e?primare, caracteristicile statistice se separ n caracteristici
calitative =e?primate prin cuvinte< i caracteristici cantitative =e?primate numeric< )e
e?emplu, profesia i v9rsta
%antioane independente Testul &
!onsider9nd dou eantioane de volum n
1
i n
(
, se urmrete a se stabili
dac e?ist o diferen semnificativ, din punct de vedere statistic, ntre mediile celor
dou populaii
%xe"plul '( 1n mare productor de ambala'e
4
pentru bunuri de consum a testat n
mai multe ma$azine situaia v9nzrilor cu un nou tip de ambala' pentru produsul 0
&ezultatele au fost urmtoarele:
@9nzri n funcie de ambala' =mii lei<
0a$azinul @9nzri cu vechiul
ambala'
@9nzri cu noul
ambala'
1 (45 (55
( *,( *81
4 580 5,5
6 (0, 185
5 1+, (10
* 44, 45+
, 1,* 184
+ ((4 (6*
Pentru a rezolva aceast problem utiliz9nd produsul "P"", este nevoie s se
creeze o variabil de cod =@1<, n care valoarea 1 corespunde v9nzrilor cu vechiul
ambala', iar valoarea ( corespunde v9nzrilor cu noul ambala' /ceast variabil va fi
necesar $ruprii datelor corespunztor celor dou eantioane @alorile v9nzrilor se
indic ntr-o sin$ur variabil =/mbala' - valorile din primul eantion urmate de valorile
celui de-al doilea< "e selecteaz:
A!al1"e
Co%pa)e Mea!&
I!$epe!$e!t - Sa%ple& T Te&t3
4 .efter !, &u !, !ercetri de marMetin$, Nraov (000, pa$ 1(1
10
%i$ 5 !ompararea mediilor a dou eantioane independente
)up ale$erea metodei de analiz se recur$e la definirea $rupurilor conform
casetei de dialo$ din fi$ura *
%i$ * "electarea variabilelor
din lista variabilelor se selecteaz n Te&t Va)ia#le:&<A variabila potrivit creia se
compar mediile celor dou eantioane
variabila dup care se realizeaz $ruparea n cele dou eantioane se plaseaz n
caseta =)o+pi!( Va)ia#leA care activeaz De7i!e =)o+p&33n =)o+p BA se nscrie
codul 1 pentru valorile primului eantion iar n =)o+p -A codul ( pentru valorile celui
de-al doilea eantion
%i$ , )efinirea $rupurilor
C+t poi!tA - se utilizeaz dac dorim s specificm o valoare n funcie de care se vor
constitui $rupurile, primul va conine valorile mai mici dec9t cea specificat iar al
doilea valorile mai mari
&ezultatele oferite de produsul "P"" se prezint astfel:
11
Pndicatori statistici la nivel de eantioane
+ 4(+,4+ 186,44 *+,,1
+ 460,4+ 180,*( *,,48
@1
1 - vechi
( - nou
/mbala'
I 0ean
"td
)eviation
"td -rror
0ean
:roup "tatistics
,004 ,85+ -,1(5 16 ,804 -1(,00 8*,(6 -(1+,6( 186,6(
-,1(5 14,885 ,804 -1(,00 8*,(6 -(1+,64 186,64
-Hual
variances
assumed
-Hual
variances
not assumed
/0N/./Q
% "i$
.eveneLs #est for -HualitJ
of @ariances
t df
"i$
=(-tailed<
0ean
)ifference
"t d -rror
)ifference .o7er 1pper
855 !onfidence Pnt erval
of the 0ean
t-test for -HualitJ of 0eans
Pndependent "amples #est
-antioanele fiind de volum < 40 se aplic testul "tudent @aloarea
1(5 0
calc
t

@aloarea teoretic pentru nivelul de semnificaie 05 0 i 16 $rade de libertate,
e?tras din tabelul funciei "tudent 165 ( t
&e$ula de decizie este urmtoarea:
- se accept ipoteza A
0
dac
165 ( 165 (
calc
t
- se respin$e ipoteza A
0
i se accept alternativa ei A
1
dac
-8BCD &a+ --8BCD > <
calc calc
t t
3n cazul nostru se accept ipoteza A
0
, nu e?ist diferene semnificative ntre
mediile celor dou eantioane
%xe"plul 2( Printr-o anchet selectiv, s-a urmrit aprecierea $radului de
atractivitate a ambala'ului unui produs 3ntrebarea este dac e?ist diferene semnificative
ntre media aprecierilor femeilor i media aprecierilor brbailor
)istribuia persoanelor dup aprecieri
/preciere ambala'
=puncte<
Ir respondeni
%emei Nrbai
1 =foarte atractiv< 5 10
( =atractiv< 10 40
4 =nici > nici< 15 40
6 =neatractiv< +0 (0
5 =foarte neatractiv< 10 10
%emeile au primit codul 1, iar brbaii codul (
1(
Pndicatori statistici la nivel de eantioane
1(0 4,*, ,80 +,(4--0(
100 (,80 1,16 ,11
%N
1
(
/P&-!P-&
I 0ean
"td
)eviation
"td -rror
0ean
:roup "tatistics
&ezultatele testului e$alitii mediilor
+,,0( ,006 5,5*5 (1+ ,000 ,,, ,16 ,50 1,06
5,668 1+*,**8 ,000 ,,, ,16 ,68 1,06
-Hual
variances
assumed
-Hual
variances
not assumed
/P&-!P-&
% "i$
.eveneLs #est for -HualitJ
of @ariances
t df
"i$
=(-tailed<
0ean
)ifference
"td -rror
)ifference .o7er 1pper
855 !onfidence Pnterval
of the 0ean
t-t est for -HualitJ of 0eans
Pndependent "amples #est
%iind eantioane de volum suficient de mare, valoarea teoretic ce corespunde
nivelului de semnificaie 05 0 este 1,8* /plic9nd aceeai re$ul de decizie ca mai
sus, valoarea calculat fiind 5,5*5 suntem ndreptii s respin$em ipoteza A
0
i s
acceptm ipoteza A
1
, e?ist diferene ntre aprecierile femeilor i aprecierile brbailor
%antioane perec)i
Problema eantioanelor perechi poate fi pus, de e?emplu, atunci c9nd studiem
rezultatele obinute de membrii unui $rup nainte de efectuarea unui curs i dup
efectuarea acelui curs, din punct de vedere al testrii e$alitii mediilor
1
i
(

%xe"plu: 1n $rup de (0 de studeni au fost verificai la disciplina de
0icroeconomie dup cunotinele obinute la curs &ezultatele au fost nre$istrate n
fiierul es*perec)i n variabila P+!cteB )up iniierea ntr-un produs informatic
specializat n nvarea disciplinei de 0icroeconomie, acelai $rup a fost testat,
rezultatele nre$istr9ndu-se n variabila P+!cte- Pentru un nivel de semnificaie R0,05
se poate verifica dac efectul cursului a fost pozitiv
&ezultate obinute
Puncte1 Puncte( di
80 84 -4
14
81 81 0
84 85 -(
+8 ++ F1
+5 ++ -4
+8 +, F(
+4 +6 -1
++ 8( -6
+6 +4 F1
+( +5 -4
+4 +( F1
+1 +4 -(
,( ,6 -(
,0 ,0 0
,1 ,, -*
+1 +5 -6
+5 +, -(
+, +, 0
,6 ,* -(
,4 ,( F1


n
i
i
d d
1
6 , 1 (+
Ppotezele sunt:
A
0
: R 0 nu e?ist diferene ntre rezultatele dinainte i dup iniierea pe
calculator =
( 1
<
A
1
: < 0 e?ist diferene ntre rezultate
Pentru a efectua acest test selectm:
A!al1"e
Co%pa)e Mea!&
Pai)e$ - Sa%ple& T Te&t3
16
%i$ + !ompararea mediilor a dou eantioane perechi
din lista de variabile se selecteaz variabila P+!cteB ce va fi plasat n lista C+))e!t
Selectio!& n Va)ia#le BA, precum i variabila P+!cte- ce va apare n Va)ia#le-: iar
cu sunt transferate n lista Pai)e$ Va)ia#le&A
Optio!&3 permite ale$erea intervalului de ncredere
butonul O> declaneaz modelul de analiz i obinerea rezultatelor
Pndicatori statistici
+(,55 (0 ,,08 1,58
+4,85 (0 ,,01 1,5,
P1I!#-1
P1I!#-(
Pair 1
0ean I
"t d
)eviat ion
"t d -rror
0ean
Paired "amples "t atist ics
&ezultatele testului e$alitii mediilor
-1,60 (,11 ,6, -(,48 -,61 -(,8* 18 ,00+
P1I!#-1 -
P1I!#-(
0ean
"td
)eviation
"t d -rror
0ean .o7er 1pper
855 !onfidence
Pnterval of the
)ifference
Paired )ifferences
t df
"i$
=(-tailed<
Paired "amples #est
)eoarece volumul eantionului este n R (0, folosim repartiia "udent cu 18 $rade
de libertate i, pentru nivelul de semnificaie R 0,05, obinem valoarea t R -1,,*1 =test
unilateral<
&e$ula de decizie va fi urmtoarea:
dac
,( , 1 +#
se accept A
0
S
dac
,( , 1 < +#
se respin$e ipoteza A
0
se accept alternativa ei A
1
"e observ din tabelul cu rezltate c valoarea este ;(,8* Putem afirma c
rezultatele iniierii n produsul informatic au fost pozitive, e?ist9nd diferene
semnificative statistic ntre puncta'ul mediu de dinainte i de dup curs
Testul ,icoxon
/ceeai decizie putem s o lum i dac folosim testul Tilco?on
A!al1"e
15
No!pa)a%et)ic Te&t&
- Relate$ Sa%ple&
%i$ 8 "electarea testelor neparametrice
%i$ 10 )efinirea variabilelor perechi
)iferene ne$ative, pozitive, e$ale
1*
5
a
6,10 (0,50
1(
b
11,06 14(,50
4
c
(0
Ie$ative
&anMs
Positive &anMs
#ies
#otal
P1I!#-( -
P1I!#-1
I 0ean &anM "um of &anMs
&anMs
P1I!#-( U P1I!#-1
a
P1I!#-( V P1I!#-1
b
P1I!#-1 R P1I!#-(
c
#est Tilco?on
-(,*,4
,00+
W
/sJmp "i$
=(-tailed<
P1I!#-( -
P1I!#-1
Iivelul de semnificaie indicat de test este de 0,00+ mai mic dec9t 0,05, ceea ce ne
ndreptete s respin$em ipoteza A
0
i s acceptm ipoteza A
1

!nali- dispersional cu un factor .!/0$!1
!olectivitile cu care operm n statistica social-economic dei au un caracter
finit sunt formate de cele mai multe ori dintr-un numr foarte mare de uniti purttoare a
unor variabile cu un $rad mare de variaie )in aceast cauz unitile la care s-a fcut
observarea trebuie mprite n $rupe, n funcie de variaia factorilor determinani
3n cazul n care s-a aplicat n prealabil metoda $ruprii se pot calcula at9t medii c9t
i indicatori de variaie =dispersii< pe $rupe i pe total colectivitate 0edia i dispersia pe
ntrea$a colectivitate se pot calcula fie fc9nd abstracie de faptul c ea este compus din
mai multe $rupe, fie lu9nd n calcul indicatorii corespunztori calculai la nivelul
$rupelor
%xe"plu: 50 de a$eni economici au fost $rupai dup numrul mediu de salariai
i mrimea profitului Pentru nivelul de semnificaie R 0,05 ne propunem s verificm
dac factorul de $rupare este semnificativ, altfel spus dac numrul an$a'ailor
influeneaz variaia profitului
&epartiia a$enilor economici din sectorul de activitate /
dup numrul mediu de salariai i profitul obinut
/$eni economici dup
numrul mediu de salariai /$eni economici dup mrimea profitului =milioane lei<
Total
1( - 1* 1* - (0 (0 - (6 peste (6
sub 10 5 15 5 - -D
10 - 50 - 10 10 - -.
peste 50 - - - 5 D
Total D -D BD D D.
1,
Pentru a reliza n "P"" acest lucru ale$em calea:
A!al1"e
Co%pa)e Mea!&
O!e - Ea1 ANOVA 3
%i$ 11 "electarea variabilelor
3n fiierul creat n "P"" au fost definite variabilele profit2 nr*an3 Pentru a se realiza
$ruparea dup numrul an$a'ailor a fost necesar codificarea a$enilor economici dup variabila
nr*an3, prin $enerarea unei noi variabile codan3( 3n fi$ura 11 se observ selectarea variabilelor:
Depe!$e!t Li&tA a fost selectat variabila profit
F acto)A a fost selectat variabila dup care se face $ruparea codan3
O>
&ezultatele prelucrrilor se prezint astfel:
(81,560 ( 165,,,0 (1,*4, ,000
41*,*60 6, *,,4,
*0+,1+0 68
Net7een
:roups
Tithin :roups
#otal
P&D%P#
"um of
"Huares df 0ean "Huare % "i$
/ID@/
@arianele i valoarea %calc
@aloarea calculat pentru criteriul % este (1,*4 iar nivelul de semnificaie este 0,000 mai
mic dec9t 0,05 , ceea ce ne ndreptete s respin$em ipoteza A
0
i acceptm A
1
, factorul de
$rupare, numrul an$a'ailor, este semnificativ pentru variaia profitului
D analiz mai detaliat o obinem ale$9nd calea:
A!al1"e
Co%pa)e Mea!&
Mea!& 3
1+
P&D%P#
1,,8(
(5
4,00
(0,00
(0
(,(,
(*,(0
5
,+6
18,5+
50
4,5(
0ean
I
"td )eviation
0ean
I
"td )eviation
0ean
I
"td )eviation
0ean
I
"td )eviation
sub 10
10 - 50
peste 50
#otal
&eport
0ediile de $rp
(81,560 ( 165,,,0 (1,*4, ,000
41*,*60 6, *,,4,
*0+,1+0 68
=!ombined< Net7een :roups
Tithin :roups
#otal
P&D%P# 2
!D)/I:
"um of
"Huares df 0ean "Huare % "i$
/ID@/ #able
@arianele i valoarea %calc
,*8( ,6,8
P&D%P# 2
!D)/I:
-ta -ta "Huared
0easures of /ssociation
RE=RESIE I CORELAIE
18
"tatistica social-economic studiaz fenomenele de mas n interdepen unele cu altele 3n
acest scop datele sunt sistematizate sub form de serii de repartiie multidimensionale /naliza lor
se realizeaz prin metodele de corelaie statistic
1tilizarea din ce n ce mai frecvent a metodei corelaiei n statistic este 'ustificat de
necesitatea crec9nd a reflectrii ntr-o form numeric adecvat a interdependenei obiective
dintre fenomenele social-economice n ceea ce privete natura, direcia i $radul de intensitate a
le$turilor care se manifest ntr-o anumit perioad de timp sau n dinamic
%xe"plu: referitor la valoarea ncasrilor =mil lei< i cheltuielile publicitare =sute mii lei<
efectuate de o societate comercial n decursul a cinci luni s-au nre$istrat datele:
/naliza le$turii dintre cheltuielile publicitare i valoarea ncasrilor
Ir
crt
!heltuieli
publicitare
=sute mii lei<
i
x
@aloarea
ncasrilor
=mil lei<
i
#
(
i
x
i i
# x
(
i
#
x #
i
4 10 X +
1
(
4
6
5
5
*
8
1(
1+
(5
40
45
65
*5
(5
4*
+1
166
4(6
1(5
1+0
415
560
11,0
*(5
800
1((5
(0(5
6((5
(5
(+
4,
6*
*6
#ota
l

5
1
50
i
i
x

5
1
(00
i
i
#

5
1
(
*10
i
i
x

5
1
(440
i
i i
# x

5
1
(
8000
i
i
#

5
1
(00 X
i
i
#
"e cere:
a< s se caracterizeze i s se msoare le$tura dintre variabileS
b< s se testeze semnificaia coeficienilor pentru un nivel de semnificaie
05 , 0 q

"istemul de ecuaii normale devine:

'

+
+
(440 *10 50
(00 50 5
b a
b a
)in rezolvarea sistemului rezult coeficienii: 10 a i 4 b
!oeficientul de re$resie b fiind pozitiv ne arat e?istena unei le$turi directe ntre cele
dou variabile i anume, pe msur ce cheltuielile publicitare cresc cu o sut mii lei, valoarea
ncasrilor crete cu trei milioane lei
!oeficientul de corelaie:
885 , 0
G < (00 = 8000 5 E G < 50 = *10 5 E
(00 50 (440 5
( (



r
arat c ntre cele dou caracteristici e?ist o le$tur puternic
#estarea semnificaiei coeficienilor pentru nivelul de semnificaie de 0,05 i 5-( $rade de
libertate, pentru care valoarea tabelar a variabilei t este (,454, conduce la rezultatele:
1,61 , 0
b
$

(4 , 1,
1,61 , 0
4 0

b
c
$
b
t
"e observ c valoarea variabilei t calculat este mai mare dec9t valoarea teoretic 1,,(4 V
(,454 ceea ce ne ndreptete s tra$em concluzia c acest coeficient de re$resie este semnificativ
(0
diferit de zero Pntervalul de ncredere pentru coeficientul este:
1,61 , 0 454 , ( 4 1,61 , 0 454 , ( 4 + < <
6 , 4 58 , ( < <
#estarea termenului liber:
8((+ , 1
a
$

(0 , 5
8((+ , 1
10 0

a
c
$
a
t
"e observ c valoarea variabilei t calculat este mai mare dec9t valoarea teoretic 5,(0 V
(,454 ceea ce ne ndreptete s tra$em concluzia c termenul liber este semnificativ diferit de
zero Pntervalul de ncredere pentru coeficientul este:
8((+ , 1 454 , ( 10 8((+ , 1 454 , ( 10 + < <
5( , 16 6, , 5 < <
#estarea coeficientului de corelaie:
005 , 0
r
$
(4 , 1, ( 5
885 , 0 1
885 , 0
(

c
t
)esprindem concluzia c i coeficientul de corelaie este semnificativ diferit de zero
q c
t t >
, n care
14 , (
q
t
i corespunde nivelului de semnificaie 0,05 i 5-1 $rade de libertate
Pntervalul de ncredere pentru coeficientul va fi:
005 , 0 14 , ( 885 , 0 005 , 0 14 , ( 885 , 0 + < <
1 8+6 , 0 < <
Pentru a rezolva n "P"" aceast problem se selecteaz:
A!al1"e
Re()e&&io!
Li!ea)3
%i$ 1 "electarea variabilelor
D epe!$e!t ; din lista variabilelor se ale$e variabila dependentS
I !$epe!$e!t:&< ; din lista variabilelor se selecteaz variabilele independente =factorii de
influen<S
M et5o$: - se ale$e metoda de analiz:
E!te) ; se analizeaz variabilele $lobal, ntr-un sin$ur pasS
Fo)4a)$ ; re$resie pas cu pas ascendentS
Bac?4a)$ ; re$resie pas cu pas descendentS
Step4i&e ; la fiecare pas sunt indicate variabilele incluse i e?cluse din modelul iniialS
Re%o2e ; sunt indicate variabilele eliminate din modelS
S tati&tic&3 - conduce la ecranul:
(1
%i$ ( "electarea parametrilor pentru coeficienii de re$resie i analiza reziduurilor
E &ti%ate& ; calculul coeficienilor de re$resieS
Co!7i$e!ce i!te)2al& ; stabilirea intervalului de ncredere pentru coeficienii de
re$resie pentru probabilitatea de 855S
Co2a)ia!ce %at)i6 ; matricea de varian-covarian pentru coeficienii de re$resieS
M o$el 7it @ determin raportul de corelaie &, coeficientul de determinaie &
(
, &
(
a'ustat, eroarea standard, analiz /ID@/S
D e&c)ipti2e& ; afieaz pentru fiecare variabil media, abaterea standard, matricea
corelaiilorS
P a)t a!$ pa)tial co))elatio!& ; corelaii parialeS
Colli!ea)it1 $ia(!o&tic& ; analiza colinearitii
Plot&3- reprezentri $rafice
Sa2e3 - conduce la ecranul:
%i$ 4 "electarea parametrilor pentru obinerea valorilor a'ustate i a valorilor
reziduale
P)e$icte$ Val+e&
U !&ta!$a)$i"e$ ; se obin valorile variabilei dependente
i
#X
, calculate cu a'utorul
coeficienilor de re$resie =valorile a'ustate<S
Sta!$a)$i"e$ ; pentru valorile a'ustate se calculeaz media i abaterea standard
"tandardizarea const n mprirea abaterilor fa de medie la eroarea standard
@alorile standardizate au media 0 i abaterea standard 1S
A$F+&te$ ; valorile variabilei dependente ce corespund fiecrei observaii, dar
calculate cu coeficienii de re$resie ce au rezultat din modelul de re$resie din care
((
observaia respectiv a fost ndeprtat
< = X i #
S
Re&i$+al&
U!&ta$a)$i"e$ ; valorile
i i i
# # e X
S
Sta!$a)$i"e$ ; valorile
i
e
standardizateS
S t+$e!ti"e$ ; valorile studentizateS
Di&ta!ce&
Ma5ala!o#i& ; msoar distana fiecrei valori a variabilei independente fa de
media variabilei D distan mare indic o valoare e?tremS
Coo?G& ;
Le2e)a(e 2al+e& ; contribuia unei observaii dat de valoarea
i
%
=levierul<S
I!7l+e!ce &tati&tic&
D7Fit ; calculeaz valorile )%P#"S
O ptio!&3 conduce la ecranul:
%i$6 "tabilirea criteriului de selectare a variabilelor
Steppi!( Met5o$ C)ite)ia
U&e p)o#a#ilit1 o7 F ; o variabil este introdus n model dac nivelul de semnificaie
pentru valoarea calculat % este mai mic dec9t valoarea specificat n E!t)1 i este
scoas din model dac nivelul de semnificaie pentru valoarea calculat % este mai
mare dec9t valoarea specificat n Re%o2alS
U&e F 2al+e - o variabil este introdus n model dac valoarea calculat % este mai
mare dec9t valoarea specificat n E!t)1 i este scoas din model dac valoarea
calculat % este mai mic dec9t valoarea specificat n Re%o2alS
Pentru e?emplul de mai sus s-au obinut rezultatele:
(4
60,0000 15,+116 5
10,0000 5,(660 5
PI!/"
P1N
0ean
"td
)eviation I
)escriptive "tatistics
1,000 ,995
,995 1,000
, ,000
,000 ,
5 5
5 5
INCAS
PUB
INCAS
PUB
INCAS
PUB
Pearson
Correat!on
S!"#
$1%ta!ed&
N
INCAS PUB
Correlations
PUB
a
, Enter
Mode
1
'ar!a(es
Entered
'ar!a(es
Re)o*ed Met+od
Variables Entered/Removed
b
A re-uested *ar!a(es entered#
a#
.e/endent 'ar!a(e0 INCAS
(#
,995
a
,990 ,917 1,1257
Mode
1
R R S-uare
Ad2usted
R S-uare
Std# Error
o3 t+e
Est!)ate
Model Summary
b
Pred!4tors0 $Constant&, PUB
a#
.e/endent 'ar!a(e0 INCAS
(#
990,000 1 990,000 297,000 ,000
a
10,000 3 3,333
1000,000 4
Re"ress!on
Res!dua
5ota
Mode
1
Su) o3
S-uares d3
Mean
S-uare 6 S!"#
ANOVA
b
Pred!4tors0 $Constant&, PUB
a#
.e/endent 'ar!a(e0 INCAS
(#
(6
10,000 1,923 5,201 ,014 3,111 16,119
3,000 ,174 ,995 17,234 ,000 2,446 3,554
$Constant&
PUB
Mode
1
B Std# Error
Unstandard!7ed
Coe33!4!ents
Beta
Standard!
7ed
Coe33!4!en
ts
t S!"#
Lo8er
Bound
U//er
Bound
959 Con3!den4e
Inter*a 3or B
Coefficients
a
.e/endent 'ar!a(e0 INCAS
a#
Co)elaia &i%pl' c+)#ili!ie
3n practica statistic se nt9lnesc i le$turi care nu se realizeaz de form liniar 3n acest
caz se pot nt9lni forme variate de le$turi curbilinii specifice relaiilor de dependen dintre
caracteristica factorial aleas i cea rezultativ
/ceste le$turi neliniare se nt9lnesc mai frecvent sub forma unei parabole de $radul (, a
hiperbolei i a funciei e?poneniale 3n cazul le$turii neliniare este necesar ca, pe baza $raficului,
s se alea$ acea funcie care, tratat vizual, s prezinte abateri minime de la linia valorilor
empirice nscrise n c9mpul de corelaie !9nd nu se poate desprinde cu claritate forma de
realizare a le$turii dintre ? i J este necesar s se calculeze mai multe ecuaii de estimare, cu care
s se a'usteze datele i s se alea$ apoi aceea care d o dispersie minim fat de valorile
teoretice ale caracteristicii rezultative n funcie de factorul ales
%xe"plu: n zece uniti comerciale s-au cules date cu privire la valoarea v9nzrilor de
tricota'e i nivelul relativ al cheltuielilor de circulaie:
@aloarea v9nzrilor
=mil lei<
Iivelul relativ al
cheltuielilor de circulaie =5<
? J
5,1
5,5
*,0
*,5
*,,
,,0
,,0
+,5
11,0
14,0
+
,,(
*,+
*,6
*
5,*
5
6,*
6,(
6,(
Pentru a rezolva n "P"" problemele de re$resie neliniar se apeleaz:
A!al1"e
Re()e&&io!
C+)2e E&ti%atio!3
(5
%i$ 5 "electarea opiunilor pentru re$resia neliniar
Pentru a vizualiza le$tura dintre cele dou variabile s-a utilizat:
=)ap5&
Scatte)3
'IN:ARI
14 12 10 1 6 4
C
;
E
L
5
9
1
7
6
5
4
%i$ * .e$tura dintre cheltuieli i v9nzri
:raficul su$ereaz o le$tur invers ntre cele dou variabile Pentru a putea face
comparaie ntre modelul liniar i modelul hiperbolic au fost selectate ambele metode de analiz,
obin9ndu-se rezultatele:
Depe!$e!t 2a)ia#le88 CHELT Met5o$88 LINEAR
(*
0ultiple & ,+5485
& "Huare ,,(8(4
/nalJsis of @ariance:
)% "um of "Huares 0ean "Huare
&e$ression 1 11,(58(*1 11,(58(*1
&esiduals + 6,1+0,48 ,5((58(
% R (1,5650( "i$nif % R ,001,
-------------------- @ariables in the -Huation --------------------
@ariable N "- N Neta # "i$ #
@PIW/&P -,66(5+1 ,085450 -,+5486+ -6,*6( ,001,
=!onstant< 8,1,*+84 ,,*(5+8 1(,046 ,0000
Depe!$e!t 2a)ia#le88 CHELT Met5o$88 INVERSE
0ultiple & ,8516+
& "Huare ,80541
/nalJsis of @ariance:
)% "um of "Huares 0ean "Huare
&e$ression 1 14,8,+011 14,8,+011
&esiduals + 1,6*18+8 ,1+(,68
% R ,*,6+,*( "i$nif % R ,0000
-------------------- @ariables in the -Huation --------------------
@ariable N "- N Neta # "i$ #
@PIW/&P 44,108(+0 4,,+5,*8 ,8516,8 +,,6* ,0000
=!onstant< 1,10((*+ ,554+8* 1,880 ,0+1+

#he follo7in$ ne7 variables are bein$ created:
Iame .abel
%P#Y4 %it for !A-.# 7ith @PIW/&P from !1&@-%P#, 0D)Y( .PI-/&
%P#Y6 %it for !A-.# 7ith @PIW/&P from !1&@-%P#, 0D)Y( PI@-&"-
(,
C;EL5
'IN:ARI
14 12 10 1 6 4
9
1
7
6
5
4
3
<(ser*ed
L!near
In*erse
%i$ , @alorile observate comparate cu liniile de re$resie
0odelul liniar a condus la funcia
x # 66( , 0 1,* , 8 X
=coficientul b fiind ne$ativ arat
le$tur invers ntre cele dou variabile<, raportul de corelaie & de 0,+548 indic o le$tur
puternic iar valoarea % R (1,56 pentru care nivelul de semnificaie este 0,001, =mai mic dec9t
0,05 ales pentru testarea modelului< arat c modelul este semnificativ

1+ , 6
(
i
e
0odelul hiperbolic a condus la funcia
x
#
1
1 , 44 1 , 1 X + , raportul de corelaie & este
0,8516, valoarea % R ,*,6+ pentru care nivelul de semnificaie este 0,0000

6* , 1
(
i
e )in
aceste rezultate deducem c modelul hiperbolic estimeaz mai bine le$tura dintre cele dou
variabile
Re()e&ia pa& c+ pa&
)ac numrul variabilelor e?plicative este important, apare necesitatea aplicrii metodelor
de selectare automat a variabilelor 0etodele cele mai utilizate sunt re$resia pas cu pas
ascendent =for&ard step&ise re'ression<, re$resia pas cu pas descendent =bac(&ard step&ise
re'ression<, sau o combinaie a celor dou
Re()e&ia pa& c+ pa& a&ce!$e!t'
&e$resia pas cu pas ascendent este o metod iterativ const9nd n selecionarea la fiecare
etap a variabilei e?plicative ce ma?imizeaz coeficientul de determinaie &
(
al lui C cu toate
variabilele selecionate n etapele precedente i noua variabil $sit, astfel nc9t aportul mar$inal
al celei din urm s fie semnificativ
3n prima etap se construiete tabelul )
*
(+,-
.
:
@ariabile &
(
=C,B
'
< %
'
Iivel de
semnificaie
(+
B
1

B
p
&
(
=C,B
1
<

&
(
=C,B
p
<
%
1

%
p
Z
1

Z
p
"e selecioneaz variabila e?plicativ pentru care criteriul / este cel mai mare i nivelul de
semnificaie este cel mai mic =mai mic dec9t nivelul de semnificie 0 ales<
3n etapa a doua se construiete tabelul )
*
(+, -s
t-1
,-
.
, n care -s
t-1
este variabila e?plicativ
selecionat la pasul anterior "e selecioneaz o nou variabil, aplic9nd acelai principiu
Procedura se oprete atunci c9nd variabilele rmase au toate nivelul de semnificaie mai
mare dec9t nivelul 0
!riteriul utilizat pentru selecionarea variabilelor const n ale$erea la fiecare etap a
variabilei care va avea cel mai mare / parial Presupunem c la momentul t variabilele -
1
... -
t
au
fost selecionate:
n care statistica: $(-
1
,...,-
(
reprezint suma ptratelor
+ -
+x
(
*
i
n
11 i

e?plicat de
variabilele B
1
,,B
M

Putem nele$e astfel problema multicoliniaritii n re$resia multipl -?ist variabile puternic
corelate cu celelalte variabile e?plicative, ceea ce face ca aportul lor la e?plicarea variabilei C
s fie foarte mic Prin aplicarea acestor modele de selecie variabilele nesemnificative sunt
eliminate
@alorile variabilelor nre$istrate la 4( uniti turistice
Ir turiti
=mii pers<
Wile - turiti Pre mediu>zi
=zeci mii lei<
@al investiiilor
=zeci mil lei<
!lelt publicit
=sute mii lei<
@al ncas
=mil lei<
-1 -* -2 -3 -4 +
48+
4*8
(*+
6+6
486
44(
44*
4+4
(+5
(,,
65*
455
4*6
4(0
411
4*(
60+
644
10+0
11+0
1(80
1110
16*0
1600
14*0
1060
1050
1450
1(+0
1410
1(00
16,0
1640
1650
1410
1(60
5*
58
5*
5,
58
*0
58
*0
*4
*(
*6
*6
*4
*5
*,
**
**
*,
1(
8
(+
1(
14
11
(6
(0
+
10
(1
(4
14
16
((
(4
14
+
,*
++
51
48
51
(0
60
41
1(
*+
5(
,*
8*
6,
(,
,(
*(
(6
5550
5648
6(80
550(
6+,1
6,0+
6*(,
6110
61((
6+6(
5,60
5086
54+4
6+++
6044
6861
541(
5148
* - t - (n !
-
,
-
,...,
-
$( - # - # ( (

-
,...,
-
$( -
-
,
-
,...,
-
$(
1
/
. t 1
*
i
t 1 . t 1
.

(8
458
6,*
615
6(0
54*
64(
64*
615
6*(
6(8
51,
4(+
61+
515
10*0
14+0
16+0
14*0
1110
15(0
1(40
1180
11(0
1(50
16(0
1(40
1450
1(00
*+
,1
*8
*8
,4
,4
,4
,6
,4
,6
,6
5(
*+
,+
(,
1+
,
10
(,
15
4(
18
16
11
(*
18
46
(4
,4
*4
(+
81
,6
1*
6(
61
8(
+4
,6
+,
,6
(1
548,
5168
5650
68+8
58(*
6,04
54*5
6*40
5,11
5085
*16(
6,+,
5045
5(++
0odelul estimat prin metoda celor mai mici ptrate este:
5 5( , + 6 88 , 6 4 1+ , + ( 1** , 0 1 5( , 5 8 , (+,8 - - - - - + + + +
%uncionarea procedurii se realizeaz astfel:
5as 1 "e calculeaz
n . - + )
.
, 1 <, , =
(

precum i valorile .
/
pariale mpreun cu nivelul
de semnificaie
@ariabile &
(
=C,B
'
< %
'
Iivel de semnificaie
B
1
B
(
B
4
B
6
B
5
0500
001,
010(
0004
0((,
400(6
0515
4600
00+4
++01
0000
06,+
00,5
0,,*
000*
@ariabila selecionat este B
1

5as * "e calculeaz


< , , =
1
(
.
- - + )
:
@ariabile &
(
=C,B
1
,B
'
< %
'
Iivel de semnificaie
B
(
B
4
B
6
B
5
050(
05(1
0504
0*,*
16*65
15,+,
16*,,
40(04
0,,1,
0,(*+
0,*+,
0,000
@ariabila selecionat este B
5

0bs@aloarea /
.
corespunde modelului n ansamblu iar nivelul de semnificaie corespunde
variabilei analizate =de e?emplu, n modelul < , , =
6 1
- - + 0,*+, este nivelul de semnificaie
pentru variabila B
6
)eoarece valoarea nivelului de semnificaie este mai mare de 0,05,
variabila nu este reprezentativ pentru model<
5as 2 "e construiete tabelul:
@ariabile &
(
=C,B
1
, B
5
,B
'
< %
'
Iivel de semnificaie
B
(
B
4
B
6
0*,*
0*+4
0*+4
1865(
(0111
(0084
081,
06(*
064(
40
"e observ dup valorile nivelului de semnificaie c nici o variabil nu va mai fi inclus n
model )in cei cinci factori de influen considerai iniial au fost reinui doar doi, numrul
turitilor i cheltuielile publicitare
%i$ + /le$erea metodei de selectare a variabilelor
&ezultatele oferite de produsul "P"" se pot urmri n tabelele de mai 'os:
,,0,
a
,500 ,6+6 4,0,6,
,+((
b
,*,* ,*54 404,5*
0odel
1
(
& & "Huare
/d'usted
& "Huare
"td -rror
of the
-stimate
0odel "ummarJ
c
Predictors: =!onstant<, Irturisti =mii pers<
a
Predictors: =!onstant<, Irturisti =mii pers<, chelt publ=sute
mii lei<
b
)ependent @ariable: valoarea incas =mil lei<
c
61(0+4+,0 1 61(0+4+,0 40,0(6 ,000
a
611,541,8 40 14,(51,0*6
+(4+4*8,8 41
55**140,, ( (,+40*5,4 40,(04 ,000
b
(*,((48,( (8 8(16*,1+0
+(4+4*8,8 41
&e$ression
&esidual
#otal
&e$ression
&esidual
#otal
0odel
1
(
"um of
"Huares df
0ean
"Huare % "i$
/ID@/
c
Predictors: =!onstant<, Irturisti =mii pers<
a
Predictors: =!onstant<, Irturisti =mii pers<, chelt publ=sute mii lei<
b
)ependent @ariable: valoarea incas =mil lei<
c
41
4005,+,( 4+(,65, ,,+58 ,000 (((6,,80 4,+*,854
5,(05 ,850 ,,0, 5,6,8 ,000 4,(*5 ,,165
(*(+,6*4 4(,,564 +,0(5 ,000 185+,5*( 4(8+,4*5
6,86+ ,,+1 ,*,( *,446 ,000 4,450 *,565
+,5*+ (,1*4 ,6(0 4,8*0 ,000 6,164 1(,884
=!onstant<
Irturisti
=mii pers<
=!onstant<
Irturisti
=mii pers<
chelt
publ=sute
mii lei<
0odel
1
(
N "td -rror
1nstandardized
!oefficients
Neta
"tandardiz
ed
!oefficients
t "i$
.o7er
Nound
1pper
Nound
855 !onfidence Pnterval
for N
!oefficients
a
)ependent @ariable: valoarea incas =mil lei<
a
-,06+
a
-,4*5 ,,1, -,0*+ ,8+*
-,1+6
a
-1,1(8 ,(*+ -,(05 ,*(6
-,056
a
-,60, ,*+, -,0,5 ,8,+
,6(0
a
4,8*0 ,000 ,58( ,884
,01(
b
,105 ,81, ,0(0 ,8*,
-,110
b
-,+0, ,6(* -,151 ,*11
-,0+*
b
-,,8, ,64( -,168 ,8,(
zile-turisti
pret mediu >
zi =zeci mii
lei<
val invest
=zeci mil lei<
chelt
publ=sute
mii lei<
zile-turisti
pret mediu >
zi =zeci mii
lei<
val invest
=zeci mil lei<
0odel
1
(
Neta Pn t "i$
Partial
!orrelation #olerance
!ollinearitJ
"tatistics
-?cluded @ariables
c
Predictors in the 0odel: =!onstant<, Irturisti =mii pers<
a
Predictors in the 0odel: =!onstant<, Irturisti =mii pers<, chelt publ=sute mii lei<
b
)ependent @ariable: valoarea incas =mil lei<
c
4(
ANALIZE MULTIDIMENSIONALE
ANALIZA COMPONENTELOR PRINCIPALE :ACP<
"tudiul unui eantion sau al unei populaii poate fi considerat complet, de re$ul,
doar dac au fost msurate sau evaluate foarte multe variabile, pentru fiecare individ
=sper9ndu-se ca msurtorile fcute s acopere domeniul de investi$aie< .a prima
vedere, fiecare dintre variabilele msurate ar putea prea a fi de aceeai importanS
ns in9nd seama de faptul c ntre unele ar putea e?ista le$turi de dependen =i
deci unele ar putea fi redundante<, am putea s descoperim c un numr mic de
variabile, independente ntre ele, e?plic suficient =cea mai mare parte din < abaterile
constatate asupra indivizilor
4o"enii de aplicare
a< e?tra$erea i interpretarea factorilor, permi9nd structurarea variabilelor
iniiale, oferind un rezumat al informaiei aduse de ansamblul variabilelorS
b< selecionarea dintr-un ansamblu important de variabile a celor care
intervin mai mult n descrierea fenomenului studiat -ste posibil de conservat pentru
analize ulterioare numai a acelora puternic corelate cu factorii considerai cei mai
importaniS
c< /!P poate fi considerat ca o faz intermediar pentru aplicarea altor
metode asupra fie a indivizilor, fie a variabilelor
44
%xe"plu: #rei mrci ale aceluiai tip de produs sunt notate de la 0 la 10 de *
consumatori:
/precierile consumatorilor
0rci
!onsumatori
P PP PPP
1
(
4
6
5
*
6
*
+
0
10
+
5
,
0
*
,
5
*
+
1
4
6
(
PB8 Re$+ce)ea $atelo)
Pndicatori statistici
P PP PPP
0edii
/bateri medii
ptratice
*
4,(,
5
(,4+
6
(,4+
)eoarece datele sunt omo$ene este suficient centrarea lor, astfel nc9t se
obine tabelul #
0

!entrarea datelor
#
0
P PP PPP
1
(
4
6
5
*
-(
0
(
-*
6
(
0
(
-5
1
(
0
(
6
-4
-1
0
-(
P-8 Calc+l+l coo)$o!atelo) p+!ctelo) pe a6e
Ela#o)a)ea %at)icei $e 2a)ia!' @ co2a)ia!'A
< = < =
0
L
0
6 6 7
n care: 0
6
este matricea datelor centrate, iar
L
0
6
este transpusa matricei 0
6

,
_

,
_

( 0 (
0 ( 6
1 1 *
4 5 (
6 ( 0
( 0 (
( 0 1
0 ( 1
( 6 *
4 6 (
5 ( 0
( 0 (
$
46

,
_

46 (( +
(( 46 +
+ + *6
7
1rma matricei @ este e$al cu suma elementelor de pe dia$onal: *6F46F46 R
14(
&an$ul matricei 0
6
este e$al cu 4 =ran$ul unei matrice cu m linii i n coloane r
min=m,n<
Dia(o!ali"a)ea %at)icei $e 2a)ia!' @ co2a)ia!'A
- calculul valorilor proprii i

:
0
1 0 0
0 1 0
0 0 1
46 (( +
(( 46 +
+ + *6

1
1
1
]
1

,
_

,
_


8et
Iumrul soluiilor este e$al cu ran$ul matricei de date "e obin n acest caz
trei soluii:

,
_

4
1
4
(
1
14(
1(
1( 0 0
0 6+ 0
0 0 ,(
6+
,(
i
i
8

%iecrei valori proprii i corespunde un vector propriu care definete direcia


unei a?e factoriale @aloarea proprie msoar ineria norului ce va fi proiectat pe
acea a? factorial
/stfel:
5 55
14(
,(
,(
1

din ineria total proiectat pe a?a 1

6+
(
5 4*
14(
6+

din ineria total proiectat pe a?a (


O#&8 n /!P normat suma valorilor proprii este e$al cu numrul de
variabile
- determinarea vectorilor proprii:
"e utilizeaz urmtoarele relaii:
@alorii proprii
,(
1

vectorul propriu
1
u
astfel nc9t
1 1
,( u u 7
@alorii proprii
6+
(

vectorul propriu
(
u
astfel nc9t
( (
6+ u u 7
@alorii proprii
1(
4

vectorul propriu 4
u
astfel nc9t 4 4
1( u u 7
"e obin vectorii proprii:
45

,
_

,
_

,
_


1
1
0
1
1
1
1
1
(
4 ( 1
u u u
- determinarea vectorilor proprii normai:
/mintim c norma sau lun$imea unui vector
( ( (
c b a u este
c
b
a
u + +

,
_

i c normarea unui vector const n divizarea acestuia prin norma sa:

,
_

,
_

,
_


( > 1
( > 1
0
4 > 1
4 > 1
4 > 1
* > 1
* > 1
* > (
4 ( 1
u u u
Calc+l+l coo)$o!atelo) p+!ctelo) pe a6ele 7acto)ialeA
- calculul coordonatelor punctelor indivi9i:
indivizi
*
5
6
4
(
1
61 1 0 65 (
61 1 6* 4 65 (
61 1 6* 4 80 6
61 1 6* 4 80 6
61 1 6* 4 65 (
61 1 0 65 (
( > 1 4 > 1 * > 1
( > 1 4 > 1 * > 1
0 4 > 1 * > (
( 0 (
0 ( 6
1 1 *
4 5 (
6 ( 0
( 0 (

,
_

,
_

,
_

u
1
u
(
u
4
a?a1 a?a( a?a4
#
0
coordonate puncte - indivizi
- calculul coordonatelor punctelor " variabile:
"e nmulete fiecare vector propriu normat cu abaterea medie ptratic a
norului proiectat pe a?a corespunztoare
variabile
:::
::
:

,
_

,
_




65 ( 6 6* 4
65 ( 6 6* 4
0 6 84 *
1( ( > 1 6+ 4 > 1 ,( * > 1
1( ( > 1 6+ 4 > 1 ,( * > 1
0 6+ 4 > 1 ,( * > (
a?a1 a?a( a?a4
coordonate puncte ; variabile
4*
:raficul punctelor indivizi i variabile
PI8 I!te)p)eta)ea )e"+ltatelo)
0arca P este opus mrcilor PP i PPP
Pndivizii 5 i * sunt destul de apropiai prin preferinele lor pentru marca P, n
timp ce indivizii 1 i ( prefer mrcile PP i PPP
Pndividul 1 i mai ales individul 6 consider defavorabil marca P
Pndividul * i mai ales individul 4 consider defavorabile mrcile PP i PPP
Pndividul ( pare a fi indiferent fa de marca P, n timp ce individul 5 nu pare
deloc interesat de marca PP i PPP
%xe"plul 'A in9nd cont de faptul c potenialii cumprtori apreciaz
automobilele dup caracteristicile prezentate n tabelul de mai 'os, ne propunem
efectuarea unei analize n componente principale utiliz9nd produsul "P""
6
8
)atele au fost introduse prin meniul Data Di7i!e Va)ia#le
Pentru apelarea analizei n componente principale se ale$e calea:
A!al1"e
Data Re$+ctio!
6 "pircu ., !alciu 0, "pircu #, /naliza datelor de marMetin$, -d /ll, Nucureti 1886, pa$ +8
4,
'AR00001
6 4 2 0 %2 %4 %6
'
A
R
0
0
0
0
2
4
3
2
1
0
%1
%2
%3
%4
6
5
4 3
2
1
Facto) 3
!aracteristici ale automobilelor
Co$ Mo$el P)e Cap8cil Vite"a Co!& Cap85a# L+!(8 =)8J
P8
/ /ustin 0etro "pecial 1(000 88+ 160 *,( 855 460 (4,(
! !itroen /B 14(,5 856 165 5,* 11,0 450 18,6
) )aihatsu 16*(5 884 165 *,, 1151 4*1 (0,+
%1 %iat 1no 65 146,5 888 165 *,( 8*+ 4*6 (1,5
%( %iat 1no #urbo (5005 1401 (00 +,8 8*+ 4*6 11,0
%4 %iat 1no ,0 1,+65 140( 1*5 ,,, 8*+ 4*6 1*,0
%6 %ord %iesta Qunior 14050 111, 14, ,,0 800 4*6 ((,,
%5 %ord %iesta B& (1,64 158, 1+0 8,4 8,4 4*6 1(,0
I Iissan 1(600 8++ 160 *,6 4,5 4*6 1,,0
D Dpel !orsa 14050 884 164 ,,( +65 4*( ((,6
P1 Peu$eot (05 B- 14(*0 856 146 *,+ 1(00 4,0 (4,+
P( Peu$eot (05 :. 15,+0 11(6 16( 5,+ 1(00 4,0 (1,6
P4 Peu$eot (05 :# 1+8*5 14*0 1,0 8,( 1(00 4,0 14,8
P6 Peu$eot (05 :#P (51,5 15+0 180 +,, 1(00 4,0 11,(
&1 &enault 6 #. 1(8+1 85* 115 *,4 850 4*, 44,1
&( &enault 6 :#. 14+0* 110+ 1(0 *,4 850 4*, (+,6
&4 &enault 5 ". 1615* 110+ 164 5,+ 815 458 (0,*
&6 &enault 5 :#" 1,(50 148, 1*, ,,8 815 458 14,+
&5 &enault :# #urbo (5418 148, (00 +,, 815 458 10,(
"1 "eat :.B 18(+4 16*1 1,5 +,+ 1(00 4*6 16,,
"( "eat :. 108,0 804 141 ,,4 10++ 46, (4,6
"4 "uzuMi :/ 1(115 884 165 *,6 600 45+ 1+,6
"6 "uzuMi :. 16*55 14(6 1*4 *,5 600 45+ 16,0
#1 #oJota . 16000 888 150 *,1 (0( 4,0 18,5
#( #oJota B. 1*+50 1(85 1,0 *,+ (0( 4,0 15,0
@ @olMs7a$en 1+065 1(,( 1,0 +,0 1060 4*5 16,0
4+
%i$ 1 "electarea variabilelor
)in lista iniial de variabile se plaseaz cu s$eat dreapta variabilele ce vor
intra n analiz, cu condiia s fie numai variabile numerice
D e&c)ipti2e& 3 permite obinerea unei analize univariate conin9nd indicatorii:
medie, abaterea medie ptratic, precum i matricea de corelaie dintre variabileS
E 6t)actio! 3 se selecteaz metoda, se ale$e numrul de factori, se marcheaz
apariia $raficului valorilor proprii Sc)ee plotS
%i$ ( %unciile modulului -?traction
Rotatio! 3 permite aplicarea metodei fr rotirea sau cu rotirea a?elor, precum
i reprezentarea $raficului variabilelor prin opiunea Loa$i!( plot:&<S

48
%i$ 4 %unciile modulului &otation
Sco)e& 3 creeaz variabile noi ce conin coordonatele punctelor indiviziS
Pentru e?emplul de mai sus s-au obinut rezultatele:
Stati&tic' $e&c)ipti2'
Va)ia#ile Mea! St$8 De2iatio! A!al1&i& N
!/P!P. 11,(,06 (08,66 (*
!/PYA/N +86,(4 411,18 (*
!DI"10 ,,1,, 1,15* (*
:&YP 1+,5156 5,*08+ (*
.1I:P0- 4*(,41 ,,64 (*
P&-# 1*11+,4+ 6((8,8, (*
@P#-W/ 156,+1 ((,*1 (*
1,000 ,135 ,792 %,775 ,305 ,149 ,129
,135 1,000 ,320 ,011 %,072 ,247 ,031
,792 ,320 1,000 %,610 ,211 ,109 ,771
%,775 ,011 %,610 1,000 %,104 %,765 %,937
,305 %,072 ,211 %,104 1,000 ,327 ,163
,149 ,247 ,109 %,765 ,327 1,000 ,914
,129 ,031 ,771 %,937 ,163 ,914 1,000
CAP#CIL
CAP=;AB
C<NSUM
>R=P
LUN>IME
PRE5
'I5E:A
Correat!on
CAP#CIL CAP=;AB C<NSUM >R=P LUN>IME PRE5 'I5E:A
Correlation Matrix
a
.eter)!nant ? 3,179E%04
a#
60
4,354 62,197 62,197 4,354 62,197 62,197
1,133 16,192 71,311 1,133 16,192 71,311
,965 13,717 92,175
,229 3,277 95,452
,176 2,516 97,961
,129 1,150 99,111
1,276E%02 ,112 100,000
Co)/onent
1
2
3
4
5
6
7
5ota
9 o3
'ar!an4e
Cu)uat!*e
9 5ota
9 o3
'ar!an4e
Cu)uat!*e
9
In!t!a E!"en*aues E@tra4t!on Su)s o3 S-uared Load!n"s
Total Variance Explained
E@tra4t!on Met+od0 Pr!n4!/a Co)/onent AnaAs!s#
@alorile proprii sunt:
.,.B-/K L .,B-M L .,B/K L .,--M L .,MKD L B,BII L C,IDC L
/ K D C I - B

Primii doi factori e?prim ,+,6% din variana total, ceea ce nseamn c i
putem utiliza pentru a reprezenta norul de puncte n planul principal
S4ree Pot
Co)/onent Nu)(er
7 6 5 4 3 2 1
E
!
"
e
n
*
a

u
e
5
4
3
2
1
0
%i$ 6 :raficul valorilor proprii
Pnformaia coninut n ultimii factori este ne$li'abil comparativ cu cea
coninut n primii, ceea ce permite o reducere a numrului factorilor ce descriu un
fenomen
61
,924 %2,41E%02
,173 ,949
,114 ,224
%,112 ,230
,305 %,335
,951 7,321E%02
,956 %,101
CAP#CIL
CAP=;AB
C<NSUM
>R=P
LUN>IME
PRE5
'I5E:A
1 2
Co)/onent
Component Matrix
a
E@tra4t!on Met+od0 Pr!n4!/a
Co)/onent AnaAs!s#
2 4o)/onents e@tra4ted#
a#
!oeficienii de corelaie prezentai n tabelul de mai sus servesc drept
coordonate ale variabilelor n planul celor doi factori
Co)/onent Pot
Co)/onent 1
1,0 ,5 0,0 %,5 %1,0
C
o
)
/
o
n
e
n
t

2
1,0
,5
0,0
%,5
%1,0
*!te7a
/ret
un"!)e
"r=/ 4onsu)
4a/=+a(
4a/#4!
%i$ 5 &eprezentarea variabilelor n planul celor doi factori
Privind $raficul, devine evident faptul c factorul 1 este apropiat de
variabilele vite9, pre, capacitate cilindric i consum, adic performane tehnice,
pe c9nd factorul ( este apropiat de confortul intern
Pentru a reprezenta punctele indivizi pe harta indivizilor se folosesc
coordonatele acestora aflate n variabilele fac1;1 i fac*;1
6(
!oordonatele punctelor indivizi
!od fac1;1 fac*;1 !od fac1;1 fac*;1
/ -1,0,* 1,0,( P6 1,+** ,6581
! -,+54 1,015 &1 -1,48, ,6+6(
) -,500 ,,+16 &( -,8+( ,(+8*
%1 -,**1 ,081* &4 -,*(* ,0565
%( 1,*(+ ,0+51 &6 ,*,6 ,0+(5
%4 ,5(+ ,088( &5 1,*+1 ,0,41
%6 -,554 ,1046 "1 1,140 ,+(,(
%5 1,*00 ,(0*4 "( -1,066 1,4,+
I -,*56 -1,*4 "4 -,,18 -1,40
D -,*00 ,06*0 "6 ,088 -1,51
P1 -,,1* ,,104 #1 -,5,( -(,41
P( -,6(5 ,6488 #( ,455 -(,64
P4 1,11+ ,*566 @ ,,00 ,(1*8
Pentru realizarea $raficului se apeleaz :
=)ap5&
Scatte) 38
%i$ * /le$erea parametrilor pentru reprezentarea $rafic
3n $raficul de mai 'os au fost reprezentai indivizii =mrcile< n planul
principal, conform coordonatelor punctelor indivizi
64
RE>R 3a4tor s4ore 1 3or anaAs!s 1
2,0 1,5 1,0 ,5 0,0 %,5 %1,0 %1,5
R
E
>
R

3
a
4
t
o
r

s
4
o
r
e



2

3
o
r

a
n
a

A
s
!
s




1
2
1
0
%1
%2
%3
'
52
51
S4
S3
S2
S1
R5 R4
R3
R2
R1 P4
P3
P2
P1
<
N
65
64 63 62 61
.
C
A
%i$ , Punctele indivizi
1n cumprtor i poate face acum o idee mai e?act asupra clasamentului
acestor mrci, poate ale$e mai clar, n funcie de ceea ce l intereseaz:
pre>performane tehnice, sau confortul intern al autoturismului
%xe"plul 2: )intr-o cercetare pe baz de sonda', asupra unui eantion
format din 110 turiti au fost selecionate c9teva variabile din chestionarele
nre$istrate =modul de cazare, dac a sosit cu un $rup sau individual, motivaia
turistic, profesia, se?ul, ce tip de sport practic, sursele de informare, ara, v9rsta,
mi'locul de transport utilizat<, n vederea efecturii unei analize n componente
principale
"-au obinut rezultatele:
0atricea coeficienilor de corelaie:
CAZARE =RUP MOTIV PROFESIE SEN SPORT
SURSEOIN
!/W/&- 100000
:&1P 54555 100000
0D#P@ -(((,, 08((( 100000
P&D%-"P- (6+,, 1+(58 -1455+ 100000
"-B 56+66 6(888 -06601 44(+6 100000
"PD&# 458(1 -04*50 -1*+(( (5818 18060 100000
"1&"-YPI -(0,,5 -4*548 -061,4 5+16, -01141 460+( 100000
[/&/ -(+61, -46884 -1(6,+ *0,06 0*+(5 1,510 *5,65
#&/I"P 46(,* 10455 -(0(8+ **64* 48*(5 6*18( *01*4
66
@\&"#/ ,,(+* 5++(8 -188,+ 44(10 54111 (18,, -080(8
[/&/ #&/I"P @\&"#/
[/&/ 100000
#&/I"P 58+,4 100000
@\&"#/ -(0(56 481*( 100000
)eterminarea valorilor proprii:
Va)ia#ile Facto)i Valo)i p)op)ii P P
c+%+late
!/W/&- 1 46+6+5 46+ 46+
:&1P ( (+((+8 (+( *41
0D#P@ 4 108+81 110 ,61
P&D%-"P- 6 +4+4* +6 +(5
"-B 5 55508 5* ++0
"PD&# * 4,,44 4+ 81+
"1&"-YPI , (+8*, (8 86,
[/&/ + (**46 (, 8,4
#&/I"P 8 1+51+ 18 88(
@\&"#/ 10 0+14+ + 1000
6a4tor S4ree Pot
6a4tor Nu)(er
10 9 1 7 6 5 4 3 2 1
E
!
"
e
n
*
a

u
e
4
3
2
1
0
Primii doi factori principali e?prim *4,15 din variana =mprtierea<
total, ceea ce nseamn c i putem utiliza pentru a reprezenta norul de puncte n
planul principal, fr a pierde prea mult informaie
)e re$ul, informaia coninut n ultimii factori ai secvenei este ne$li'abil,
comparativ cu cea coninut n primii )e aceea, analiza componentelor principale
ofer o baz pentru reducerea numrului factorilor ce descriu un fenomen
65
%actorii principali 5actor ' i 5actor 2 sunt abstraci Pentru interpretarea
lor se calculeaz coeficienii de corelaie ntre variabilele concrete i cele dou
componente principale !oeficienii de corelaie vor servi drept coordonate ale
variabilelor n planul celor doi factori !oeficienii de corelaie a variabilelor cu cei
doi factori:

Facto) B Facto) -
!/W/&- *56+, -*(1+1
:&1P 4,14+ -,0,+1
0D#P@ -(+*5* -04+(5
P&D%-"P- ,*,04 4484+
"-B *6865 -46(,,
"PD&# 5644( 16*55
"1&"-YPI 6400+ ,,+*(
[/&/ 48(1, +0(5(
#&/I"P +6*(0 44(,6
@\&"#/ *+8+0 -5*668
6a4tor Pot !n Rotated 6a4tor S/a4e
6a4tor 1
1#0 #5 0#0 %#5 %1#0
6
a
4
t
o
r

2
1#0
#5
0#0
%#5
%1#0
*!rsta
trans/
tara
surse=!n3
s/ort
se@
/ro3es!a
)ot!*at!a
)od 4aator!e
4a7are
%i$ + &eprezentarea $rafic a variabilelor n planul celor doi factori
)in reprezentarea $rafic desprindem concluziile:
variabile independente, dac un$hiul format de vectorii variabilelor
este drept, =de e?emplu: mod cltorie, care se refer la cltoria individual sau n
$rup, formeaz un un$hi apro?imativ drept cu profesia<S
variabilele sunt ]apropiate^ ntre ele dac un$hiul format este ascuit,
= de e?emplu: practicarea sporturilor de iarn cu profesia, v9rsta cu cazarea, sursele
de informare cu ara<S
6*
variabile sunt opuse =]repulsie^< dac un$hiul format este obtuz,=de
e?emplu: cltoria n $rup sau individual cu sursele de informare<S
cu c9t punctul este mai ndeprtat fa de centru n direcia unei a?e, cu
at9t mai mari sunt coordonatele punctului i cu at9t mai mult contribuie la formarea
a?ei =transportul, sursele de informare pentru primul factor, cazarea, v9rsta, modul
de cltorie pentru al doilea factor<
)in reprezentarea $rafic rezult c factorul 1 este ]apropiat^ de variabilele:
profesia, transportul, sursele de informare, practicarea sporturilor de iarn, ara, deci
de variabilele care privesc motivaia i mi'loacele prin care se poate practica
turismul n Poiana Nraov, factorul ( este ]apropiat^ de variabilele: cazare, v9rst,
cltorie n $rup sau individual, se?, care sunt le$ate mai mult de confort i datele
personale ale indivizilor
D alt interpretare ar fi: factorul 1 concentreaz n 'urul su variabilele cel
mai bine percepute de indivizii chestionai =sunt activi fa de aceste variabile i
pasivi fa de variabilele ce contribuie la formarea celui de-al doilea factor<
Prin aplicarea metodelor de analiz factorial s-a realizat o reducere a
datelor, nlocuind norul de puncte iniial cu un nor de dimensiuni mai restr9nse,
pentru o reprezentare $rafic comod i pentru a pune n eviden ceea ce este tipic
n opiniile turitilor
ANALIZA FACTORIAL0 A CORESPONDENELOR :AFC<
/naliza factorial a corespondenelor este o $eneralizare a analizei
componentelor principale, adaptat tratrii $atelo) calitati2e, prezentate sub forma
unui tabel de contin$en sau a unui tabel format din indivizi descrii prin
caracteristici calitative, studiind le$turile dintre dou ansambluri de variabile =sau
ntre modalitile a dou variabile de clasificare<
#a-ul a dou caracteristici
#abel de contin$en
C
B
!ate$oria de v9rst
1*-(0 ani (1-40 ani 41-60 ani 61-50 ani peste 50
!
r
i
t
e
r
i
u
l

h
o
t

r
9
t
o
r
preul
performanele
tehnice
desi$nul
1,
(*
*
15
(+
(+
45
18
1+
44
41
15
6(
46
4
"e apeleaz:
A!al1"e
Data Re$+ctio!
6,
Co))e&po!$e!ce A!al1&i& 3

%i$ 8 "electarea variabilelor analizei n componente principale
!odificarea variantelor caracteristicii B s-a realizat astfel:
B ; pre<
- ; performane te%niceS
I ; desi'n
!odificarea variantelor caracteristicii C:
B ; 1= " *0 aniS
- ; *1 " 20 aniS
I ; 21 " 30 aniS
C ; 31 " 40 ani<
D ; peste 40 ani.
@ariabila #riteriu se indic pe linii iar n De7i!e Ra!(e se completeaz
valoarea minim i valoarea ma?im =1 i 4<
@ariabila $6rsta se indic pe coloane iar n De7i!e Ra!(e se completeaz
valoarea minim i valoarea ma?im =1 i 5<
6+
%i$ 10 "electarea opiunilor analizei n componente principale
!u a'utorul produsului "P"", prelucrarea datelor din tabelul 610 a condus la
urmtoarele rezultate:
@alorile proprii sunt
,.QMK-
1
,.-IIK
(

Primul factor principal e?plic ,8,4% din mprtierea datelor


,84 , 0
( 1
1

iar al doilea factor principal restul de (0,,%


Ro8 S4ores 3or 4r!ter!u
Canon!4a nor)a!7at!on
.!)ens!on 1
,4 ,2 0,0 %,2 %,4 %,6 %,1 %1,0 %1,2
.
!
)
e
n
s
!
o
n

2
,6
,4
,2
0,0
%,2
%,4
des!"n
/er3#te+n
/ret
68
Cou)n S4ores 3or *!rsta
.!)ens!on 1
1,0 ,5 0,0 %,5 %1,0
.!
)e
ns!
on
2
,1
,6
,4
,2
0,0
%,2
%,4
%,6
%,1
/este 50 an!
41%50 an!
31%40 an!
21%30 an!
16%20 an!
"e observ din $raficele de mai sus c prima a? =factorul 1< se e?plic prin
oponena ntre cate$oria de v9rst ]peste 50 de ani^ i cate$oria de v9rst ](1 ; 40
ani^, celelalte modaliti ocup9nd poziii intermediare #ot a?a 1 opune ]preul^
]desi$nului^
/ doua a? =factorul (< ar putea fi e?plicat prin oponena dintre modalitile
]performane tehnice^ i ]pre^, sau prin oponena cate$oria de v9rst ]1* ; (0 ani^
cu cea cuprins ntre ]41 ; 60 ani^
"e poate tra$e concluzia c tinerii ar prefera performanele tehnice iar cei de
v9rst mi'locie nclin spre desi$nul i preul produsului
50
.!)ens!on 1
1,0 ,5 0,0 %,5 %1,0 %1,5
.!)
ens
!on
2
,1
,6
,4
,2
0,0
%,2
%,4
%,6
%,1
*!rsta
4r!ter!u
/este 50 an!
41%50 an!
31%40 an!
21%30 an!
16%20 an!
des!"n
/er3#te+n
/ret
ANALIZA DISCRIMINANT0
D populaie este divizat n M clase cu a'utorul unui criteriu calitati2 C
%iecare individ al populaiei este descris prin p variabile numerice p
X X ,
1
/naliza discriminant utilizeaz mai multe metode ce permit studierea le$turii
dintre criteriul C i variabilele p
X X ,
1 , plec9nd de la un eantion /naliza
factorial discriminant permite punerea n eviden a diferenelor dintre clase la
nivelul variabilelor p
X X ,
1 i vizualizarea datelor Pentru aceasta este nevoie
de utilizarea procedurilor automate pentru selectarea variabilelor discriminante
%xe"plul ': o firm de soft
5
este interesat s-i e?tind v9nzrile de soft de aplicaie de
marMetin$ Pentru aceasta efectueaz o cercetare n vederea depistrii caracteristicilor ce ar putea
influena decizia de achiziionare a unui asemenea soft /naliza este realizat la nivelul a 1( firme
la care s-au nre$istrat caracteristicile: dotare cu soft de specialitate, numrul salariailor, cifra de
afaceri
@alorile variabilelor
%xe"plul 2 1, studeni au fost apreciai dup notele obinute la e?amenele
de matematic, statistic, informatic i marMetin$ Primul $rup este format din *
studeni, considerai foarte buni =codul 1< dup notele la cele patru discipline /l
doilea $rup este format din + studeni, considerai buni =codul (< iar al treilea $rup
este format din 4 studeni, considerai slabi =codul 4< 1tiliz9nd analiza
discriminant se vor constitui noi $rupuri, dup notele obinute la cele patru
discipline
Iotele pe discipline
Ir !rt /preciere
Iota
matematic
Iota
statistic
Iota
informatic
Iota
marMetin$
1 1 + + 5 8
( 1 5 10 * 8
4 1 , 8 * 10
6 1 , 8 + 10
5 1 + 10 8 +
* 1 + 5 8 8
, ( * , , 5
+ ( * , 5 ,
8 ( , * 5 +
10 ( 5 + * +
11 ( 5 + * 5
1( ( , 8 , +
14 ( 10 10 10 10
16 ( 8 5 + +
15 4 5 , , 5
1* 4 , * * *
5 "pircu ., !alciu 0, "pircu #, /naliza datelor de marMetin$, -d /ll, Nucureti 1886, pa$1**
51
1, 4 5 5 5 5
,,1, 1,,(
8,1, ,,5
,,1, 1,1,
+,50 1,+,
*,,5 1,*,
,,4+ 1,*8
*,++ 1,+1
,,50 1,*0
*,00 1,00
5,44 ,5+
5,*, 1,15
*,00 1,00
*,,* 1,5*
,,*5 1,+6
*,,* 1,5(
,,58 1,,,
IPI%D
I0/&O
I0/#-
I"#/#
IPI%D
I0/&O
I0/#-
I"#/#
IPI%D
I0/&O
I0/#-
I"#/#
IPI%D
I0/&O
I0/#-
I"#/#
/P&-!P-&
fbun
bun
slab
#otal
0ean
"td
)eviation
:roup "tatistics
(,585 ,56( 1,6,0 ,484
,56( 1,*,0 1,110 ,45,
1,6,0 1,110 (,414 -,(+*
,484 ,45, -,(+* (,*,8
1,000 ,(*0 ,*00 ,168
,(*0 1,000 ,5*5 ,1*8
,*00 ,5*5 1,000 -,115
,168 ,1*8 -,115 1,000
IPI%D
I0/&O
I0/#-
I"#/#
IPI%D
I0/&O
I0/#-
I"#/#
!ovariance
!orrelation
IPI%D I0/&O I0/#- I"#/#
,374 12,304 1 ,131
,950 ,639 3 ,117
5est o3
6un4t!on$s&
1 t+rou"+ 2
2
B!CsD
La)(da C+!%s-uare d3 S!"#
il!s" #ambda
5(
,0+1 -,4,5
,+1+ -,508
-,(66 ,8+1
,14* ,6(0
-*,180 -4,486
IPI%D
I0/&O
I0/#-
I"#/#
=!onstant<
1 (
%unction
!anonical )iscriminant %unction
!oefficients
1nstandardized coefficients
1 2EE ,711 1,351
1 1 1,103 %1,119
1 1 1,991 %,017
1 1 2,160 %,137
1 2EE ,491 1,207
1 1 ,635 %1,403
2 3EE %2,040 ,262
2 2 %,566 %,006
2 2 %,121 ,046
2 1EE ,713 %1,451
2 3EE %1,742 ,076
2 2 ,443 ,556
2 1EE 1,721 1,776
2 2 %,501 ,462
3 3 %1,796 %,719
3 2EE %1,613 ,619
3 3 %2,231 %,109
1
2
3
4
5
6
7
1
9
10
11
12
13
14
15
16
17
Case
Nu)(er
<r!"!na
A4tua >rou/
Pred!4ted
>rou/
6un4t!on 1 6un4t!on 2
.!s4r!)!nant S4ores
Stat!st!4s
Case$ise Statistics
M!s4ass!3!ed 4ase
EE#
54
Canon!4a .!s4r!)!nant 6un4t!ons
6un4t!on 1
3 2 1 0 %1 %2 %3
6
u
n
4
t
!
o
n

2
2,0
1,5
1,0
,5
0,0
%,5
%1,0
%1,5
APRECIER
>rou/ Centro!ds
sa(
(un
3 #(un
17
16
15
14
13
12
11
10
9
1
7
6
5
4
3
2
1
"e observ din tabelul de mai sus c s-au produs schimbri n ceea ce privete
costituirea $rupurilor dup notele obinute la cele patru discipline
ANALIZ0 CLUSTER
3n multe domenii e?ist un mare interes pentru dezvoltarea metodelor de
clasificare a obiectelor %oarte adesea obiectele de clasificat sunt clienii Dbiectivul
urmrit este $ruparea clienilor poteniali n $rupe omo$ene destul de mari pentru a
putea fi analizai, utiliz9nd modaliti de clasificare cum ar fi se$mentarea i
tipolo$ia
%xe"plul ': se consider un set de + uniti caracterizate prin valori
nre$istrate pentru trei variabile /plicarea metodei cluster se realizeaz select9nd:
A!al1"e
Cla&&i71
Hie)a)c5ical Cl+&te) 8 8 8
56

%i$ 16 "electarea variabilelor
V a)ia#le:&< ; permite selectarea variabilelor asupra crora se aplic
metodaS
La#el Ca&e& #1: - implicit cazurile sunt afiate prin numrul curent
Dpional se poate ale$e pentru identificare o variabil de tip ir de
caractereS
Cl+&te) Ca&e& ; aplic metoda prin calcularea distanelor dintre indiviziS
Cl+&te) Va)ia#le& ; aplic metoda prin calcularea distanelor dintre
variabileS
A!al1"e ne conduce la ecranul:
%i$ 15 "electarea parametrilor opiunii /nalJze _
55
A ((lo%e)atio! &c5e$+le ; conduce la obinerea unei liste a clusterelor
formate de-a lun$ul a mai multor paiS
P )o6i%it1 %at)i6 ; conduce la afiarea matricei similaritilor sau
disimilaritilorS
Cl+&te) Me%#e)&5ip No!e ; suprim afiarea membrilor $rupurilorS
Cl+&te) Me%#e)&5ip Si!(le &ol+tio! @ afieaz membrii $rupurilor
pentru numrul clusterelor specificate n caseta cl+&te)&8 )e e?emplu,
dac se specific 6, colectivitatea va fi mprit n 6 clustereS
Cl+&te) Me%#e)&5ip Ra!(e o7 &ol+tio!&A - afieaz membrii $rupurilor
tuturor situaiilor clusterelor specificate n casetele F)o%, t)o+(5
cl+&te)& )e e?emplu, dac se specific de la ( la 6, este prezentat
soluia pentru mprirea colectivitii n ( clustere, 4 clustere i 6 clustere
Plot& 8 8 8 ne conduce la ecranul:
%i$ 1* "electarea parametrilor opiunii Plots_
D e!$)o()a% ; permite reprezentarea $rafic a coeziunii clusterelor
formateS
Icicle ; pentru toate sau o parte din clustere, permite afiarea informaiilor
referitoare la fiecare caz ce este combinat ntr-un cluster, la fiecare
iteraie"e poate selecta orientare vertical sau orizontal
Met5o$ 8 8 8 permite ale$erea tipului de distan utilizat n constituirea
clusterelor, precum i transformarea valorilor sau a msurilor
Sa2e 8 8 8 permite salvarea noilor variabile
Pentru e?emplul ales, cu ?1, ?(, ?4 au fost notate variabilele iniiale, iar cu
z?1, z?(, z?4 valorile normalizate cu scor W
5*
Pornind de la matricea cu date normalizate, se determin distanele euclidiene
medii pentru fiecare pereche de elemente
P)o6i%it1 Mat)i6 SR+a)e$ E+cli$ea! Di&ta!ce
Ca&e B - I C D K / Q
B 1,(51 (,6*1 1(,6+8 (,80( (,++( ,4,( 1*,561
- 1,(51 1,106 ,,+++ 1,851 1,*4, ,480 8,(51
I (,6*1 1,106 5,100 ,+6+ 1,058 1,815 1(,160
C 1(,6+8 ,,+++ 5,100 8,(80 8,,85 8,884 15,*,,
D (,80( 1,851 ,+6+ 8,(80 0,0818+ (,808 1(,1**
K (,++( 1,*4, 1,058 8,,85 0,0818+ (,*81 10,65(
/ ,4,( ,480 1,815 8,884 (,808 (,*81 1(,,56
Q 1*,561 8,(51 1(,160 15,*,, 1(,1** 10,65( 1(,,56
/l$oritmul de $rupare a unitilor pornete de la aceast matrice, oper9nd
astfel:
1 "e caut n matricea distanelor perechea reciproc de valoare minim 3n
e?emplu, aceasta este perechea =5,*< pentru care distana d
5*
R 0,0818+
( "e atribuie aceleiai $rupri =5,*< unitile din perechea reciproc respectiv
4 "e reface matricea distanelor cu =5,*<, considerat ca o sin$ur unitate
)istana dintre orice cluster B i =5,*< este dat de valoarea distanei minime
dintre uniti ale lui B i ale lui =5,*< )e e?emplu, de la 1 la 5 distana este
(,80( iar de la 1 la * distana este (,++(, se ale$e (,++( /plic9nd acest
principiu, rezult urmtoarea matrice a distanelor:
Ca&e B - I C :D,K< / Q
B 1,(51 (,6*1 1(,6+8 (,++( ,4,( 1*,561
- 1,(51 1,106 ,,+++ 1,*4, ,480 8,(51
I (,6*1 1,106 5,100 ,+6+ 1,815 1(,160
C 1(,6+8 ,,+++ 5,100 8,(80 8,884 15,*,,
:D,K< (,++( 1,*4, ,+6+ 8,(80 (,*81 10,65(
/ ,4,( ,480 1,815 8,884 (,*81 1(,,56
Q 1*,561 8,(51 1(,160 15,*,, 10,65( 1(,,56
6 "e reia procesul de $rupare de la pasul 1, cut9nd perechea reciproc ma?im
n noua matrice, n cazul nostru =1,,< -le vor forma nucleul unei $rupe noi
Ca&e :B,/< - I C :D,K< Q
:B,/< ,480 1,815 8,884 (,*81 1(,,56
- ,480 1,106 ,,+++ 1,*4, 8,(51
5,
I 1,815 1,106 5,100 ,+6+ 1(,160
C 8,884 ,,+++ 5,100 8,(80 15,*,,
:D,K< (,*81 1,*4, ,+6+ 8,(80 10,65(
Q 1(,,56 8,(51 1(,160 15,*,, 10,65(
Ca&e BS/S- I C :D,K< Q
BS/S- 1,106 ,,+++ 1,*4, 8,(51
I 1,106 5,100 ,+6+ 1(,160
C ,,+++ 5,100 8,(80 15,*,,
:D,K< 1,*4, ,+6+ 8,(80 10,65(
Q 8,(51 1(,160 15,*,, 10,65(
Ca&e BS/S- C :D,K<SI Q
BS/S- ,,+++ 1,106 8,(51
C ,,+++ 5,100 15,*,,
:D,K<SI 1,106 5,100 10,65(
Q 8,(51 15,*,, 10,65(
Ca&e B,/,-SD,K,I C Q
B,/,-SD,K,I 5,100 8,(51
C 5,100 15,*,,
Q 8,(51 15,*,,
Pentru a reprezenta $rafic procesul de $rupri, se construiete o
dendro3ra", adic un $rafic de tip arbore Iivelul la care se unesc dou clustere
sau dou uniti este marcat printr-o linie vertical care unete liniile orizontale,
denumite ramuri, corespunztoare $ruprilor unite &amurile care pornesc de la baza
fi$urii corespund situaiei iniiale, n care un cluster era echivalent cu o unitate
3n final rezult dendro$rama de mai 'os i lista ciclurilor de 'rupare
=a$lomeration schedule< )e e?emplu unitatea ( se unete cu $rupul =1,,< la nivelul
0,48 n decursul celui de-al treilea ciclu de $rupare
5+
5 6 9,191E%02 0 0 4
1 7 ,372 0 0 3
1 2 ,390 2 0 5
3 5 ,141 0 1 5
1 3 1,104 3 4 6
1 4 5,100 5 0 7
1 1 9,251 6 0 0
Sta"e
1
2
3
4
5
6
7
Custer 1 Custer 2
Custer Co)(!ned
Coe33!4!ents Custer 1 Custer 2
Sta"e Custer 6!rst
A//ears
Ne@t Sta"e
A%%lomeration Sc&edule
'endro%ram
2 2 2 2 2 2 A P - & / & ! A P ! / . ! . 1 " # - & / I / . C " P " 2 2 2 2 2 2

&escaled )istance !luster !ombine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
5 -+---+
6 -+ I
3 -----+---------------------+
1 -+ I I
7 -+---+ +---------------------+
2 -+ I I
4 ---------------------------+ I
8 -------------------------------------------------+
5 Dbinerea $ruprilor propriu-zise se realizeaz prin tierea dendo$ramei la un
anumit nivel Iu e?ist o re$ul unanim admis, dar 'ocul liniilor orizontale
de unire a diferitelor ramuri poate su$era nivelul de tiere Wona n care liniile
orizontale ncep s se distaneze considerabil ntre ele este cea n care poate fi
adecvat tierea D alt metod ar fi producerea unei rupturi considerabile n
seria coeficienilor care e?prim nivelul de contopire a $rupelor
3n concluzie, din e?emplul prezentat, rezult dou $rupuri relativ compacte
=1,,,(< i =5,*,4< i dou uniti izolate 6 i +
%xe"plul 2: utilizarea analizei cluster n studiul pro?imitilor salariilor medii
nominale pe activiti ale economiei naionale "e consider c9ti$ul salarial nominal
58
mediu net lunar, pe activiti ale economiei naionale, anul (000, zona !entru,
format din 'udeele /lba, Nraov, !ovasna, Aar$hita, 0ure, "ibiu "e urmrete
constituirea $rupurilor ce scot n eviden asemnrile dintre salariile pe activiti
ale economiei naionale
!9ti$ul salarial nominal mediu net lunar, pe activiti ale economiei naionale,
anul (000, zona !entru
T+$ee
AB BV CV HR MS SB
Co%e) 118,14* 160,**0 1(06(4( 141+(81 1680*54 14,*8,1
Hotel )e&8 1(6++(0 1*6+14* 1(1,815 1(8*8(( 1(*456* 1(+4+65
T)a!&po)t 188041* (50+160 1,*8,(+ 1,118*1 1+*(8(5 (8,1,81
Po*t' 40+0*** 44,1+10 4(,++66 (8854(5 (848**+ (**(141
B'!ci 66(,4,+ 50+6*0, 64*0(+* 6505*56 6,15685 6181++8
T)a!"8i%8 1644(,8 (6*86*4 1+5(+(1 1(8*1+, 1+(854( 160*4,0
A$%i!i&t)8 (,*,6(5 440081+ (681+(1 (5,068, (,54104 (88,85,
!2''%8 18*,60* (568+5+ 1,,,5+( 1,(54*8 18054+5 (0,4,(8
S'!'tate 160881+ 1,51658 1*01(*8 156851+ 1,05+46 1+6+1*+
$ursa datelor: >nuarul $tatistic al )om?niei *001

%i$ 1, !9ti$ul salarial nominal mediu net lunar, pe activiti ale economiei naionale

0etoda utilizat a fost clasificare ierarhic cu opiunea cel mai apropiat
vecin
Pornind de la matricea de date se determin distanele euclidiene medii pentru
*0
0
1000000
(000000
4000000
6000000
5000000
*000000
/lba Nrasov !ovasna Aar$hita 0ures "ibiu
comer hotel rest transport
posta banci tranz
administr nvm sntate
fiecare pereche de elemente
4 6 1,(148-F11 0 0 (
4 , *,6(81-F11 1 0 6
5 + +,10+(-F11 0 0 5
4 8 +,560(-F11 ( 0 5
4 5 8,4(,4-F11 6 4 ,
1 * 1,050*-F1( 0 0 ,
1 4 4,(+60-F1( * 5 +
1 ( 1,4*8(-F14 , 0 0
"ta$e
1
(
4
6
5
*
,
+
!luster 1 !luster (
!luster !ombined
!oefficients !luster 1 !luster (
"ta$e !luster %irst
/ppears
Ie?t "ta$e
/$$lomeration "chedule
* * * * * * H I E R A R C H I C A L C L U S T E R A
N A L Y S I S * * * * * *
e!"#$%#am u&'!% S'!%le L'!(a%e
Re&)ale" '&*a!)e Clu&*e# C$mb'!e
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+------+
C+,ERT 3 -+
HR 4 -+-+
SANATATE 7 -+ I
TRAN- . ---+-------+
IN/ 5 ---+ +----------------------------------+
TRANS0 8 ---+ I I
A, 1 ---+-------+ I
0+STA 6 ---+ I
1ANCI 2 ----------------------------------------------+
)in dendro$ram rezult c9teva $rupe: salariile medii nominale lunare sunt
apropiate pentru activitile =comer, hoteluri i restaurante, sntate<, =tranzacii
imobiliare, nvm9nt<, =transporturi, administraie public, pot < i distinct
sectorul bancar
)in punct de vedere al unitilor teritoriale, situaia se prezint astfel:
*1
1 6 4,*5+ 0 0 (
1 4 6,568 1 0 4
1 5 8,5+4 ( 0 6
1 * 1,,(*8 4 0 5
1 ( 41,++6 6 0 0
"ta$e
1
(
4
6
5
!luster 1 !luster (
!luster !ombined
!oefficient
s !luster 1 !luster (
"ta$e !luster %irst
/ppears
Ie?t "ta$e
/$$lomeration "chedule
Re&)ale" '&*a!)e Clu&*e# C$mb'!e
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+------+
Alba 1 -+
Ha#%2'*a 4 -+---------+
C$3a&!a 3 -+ +-------------+
,u#e& 5 -----------+ +--------------------+
S'b'u 6 -------------------------+ I
1#a&$3 2 ----------------------------------------------+
)in dendro$rama de mai sus rezult un $rup relativ compact format din
'udeele =/lba, Aar$hita, !ovasna< i trei uniti izolate 0ure, "ibiu, Nraov
-ste dotat
cu soft
Irsalariai
B1
!/ =millei<
B(
da 44 6800
da 5* *000
da (5 6000
da 61 *800
da 40 5,00
da 5, ,600
nu 4+ 5100
nu 40 (,00
nu (0 4650
nu 10 (+00
nu 8 1500
nu 60 6000
Pentru rezolvarea n "P"" a acestei metode se apeleaz:
A!al1"e
*(
Cla&&i71
Di&c)i%i!a!t 8 8 8
%i$ 11 "electarea variabilelor
A!al1"e ne conduce la ecranul:
Mea!& - permite calcularea mediilor pe sub$rupuri pentru fiecare variabil
e?plicativS
U!i2a)iate ANOVA& - se selecteaz dac se dorete analiz /ID@/
pentru fiecare factorS
Fi&5e)U& - se selecteaz dac se doresc coeficienii %isher ai funcieiS
U!&ta!$a)$i"e$ - se selecteaz dac se doresc coeficienii nestandardizai
ai funcieiS
Eit5i!-()o+p& co))elatio! - coeficienii de corelaie n interiorul
$rupurilorS
Eit5i!-()o+p& co2a)ia!ce - covariana n interiorul $rupurilorS
Total co2a)ia!ce - covariana dintre variabile pe total
C la&&i71 ne conduce la ecranul:
*4
%i$ 1( "electarea parametrilor clasificrii
All ()o+p& eR+al - se selecteaz pentru $rupuri de volume e$aleS
Co%p+te 7)o% ()o+p &i"e& - se selecteaz pentru $rupuri de volume
nee$aleS
Ca&&e4i&e )e&+lt& - afieaz $rupul actual, $rupul rezultat, scorurile de
discriminareS
Eit5i!-()o+p& - utilizeaz pentru clasificare matricea de covarian din
interiorul $rupurilor S
Plot& - se obin reprezentri $rafice pe $rupuri combinate sau pe $rupuri
separate
Sa2e ne conduce la ecranul:
%i$ 14 "alvarea noilor variabile
7nterpretarea re-ultatelor
!ele 1( firme au fost mprite n dou $rupuri de volume e$ale 3n urma aplicrii
metodei discriminante va rezulta o alt clasificare i se vor $si funciile care au
avut o importan mare n obinerea unor $rupuri distincte
*6
40,33 13,56 6 6,000
5116,67 1254,46 6 6,000
24,50 13,59 6 6,000
3251,33 1232,24 6 6,000
32,42 15,36 12 12,000
4537,50 1716,20 12 12,000
F1
F2
F1
F2
F1
F2
S<65
da
nu
5ota
Mean
Std#
.e*! at!on Un8e! "+ted Be!"+ted
'a ! d N $ ! st8! se&
(roup Statistics
:rupul firmelor dotate cu soft are centroidul format din mediile celor dou
caracteristici =6044, 5+1*,<, iar $rupul firmelor ce nu sunt dotate cu soft are
centroidul =(65, 4(5+,4<
114,213 13209,167
13209,167 1546041,7
1,000 ,713
,713 1,000
F1
F2
F1
F2
Co*ar! an4e
Correat!on
F1 F2
)ooled it&in*(roups Matrices
a
5+e 4o*ar!an4e )atr! @ +as 10 de"rees o3
3reedo)#
a#
3n tabelul de mai sus este afiat matricea de covarian din interiorul claselor
,
1,422
a
100,0 100,0 ,766
6un4t! on
1
E! "en*a ue
9 o3
'ar! an4e
Cu)u at! *e
9
Canon! 4a
Corre at! on
Ei%envalues
6! rst 1 4anon! 4a d! s4r! )! nant 3un4t! ons 8ere used ! n t+e
ana As! s#
a#
)eoarece variabila de e?plicat are doar dou modaliti, rezult o sin$ur
funcie de discriminare
*5
,413 7,963 2 ,019
5est o3
6un4t! on$s&
1
B! CsD
La)(da C+!%s-uare d3 S!"#
il!s" #ambda
Pndicatorul calitii discriminrii al lui TilMs are valoarea 0614 cu un nivel de
semnificaie de 0018, mai mic dec9t 005, ceea ce indic n ansamblu o
discriminare acceptabil
%,039
,001
%3,694
F1
F2
$Constant&
1
6un4t! on
Canonical 'iscriminant
+unction Coefficients
Unstandard! 7ed 4oe33!4!ents
3n tabelul de mai sus sunt prezentai coeficienii nestandardizai ai funciei
discriminante
Re"+lt' 7+!cia $i&c)i%i!a!t'
( 1
001 0 048 0 *86 4 X X Y +
Prin standardizare =mprire la abaterea standard din interiorul $rupelor
( ) 5, 14 ( > 58 14 5* 14
1
+
,
s i ( ) 45 1(64 ( > ( 1(4( 5 1(56
(
+
,
s < se obin coeficienii
standardizai:
%,526
1,356
F1
F2
1
6un4t! on
Standardi,ed Canonical
'iscriminant +unction
Coefficients
!u funcia discriminant se calculeaz scorurile pentru fiecare firm 8iscriminant
$cores.
**
1 1 ,4*+
1 1 ,,++
1 (22 -,(84
1 1 (,1((
1 1 1,(51
1 1 (,151
( 122 ,6(0
( ( -1,,41
( ( -,*84
( ( -1,06,
( ( -(,*04
( ( -,,4(
!ase
Iumber
1
(
4
6
5
*
,
+
8
10
11
1(
Dri$inal
/ctual
:roup
Predicted
:roup
Ai$hest
:roup
%unction 1
)iscrimina
nt "cores
!ase7ise "tatistics
0isclassified case
22
!u a'utorul distanelor @a%alanobis sunt calculate ptratele distanelor fa de
proieciile centroizilor pe a?a de discriminare = 0+8 1
1
c , media scorurilor firmelor
dotate cu soft i 0+8 1
(
c , media scorurilor firmelor fr soft<
1,019
%1,019
S<65
da
nu
1
6un4t! on
+unctions at (roup
Centroids
Unstandard! 7ed 4anon! 4a
d! s4r! )! nant 3un4t! ons
e*a uated at "rou/ )eans
!lasificarea firmelor se face n funcie de scorul de separare - c+tti!( &co)e, care
are valoarea 0, conform criteriului:
dac scorul firmei V 0 firma va aparine primului $rup
dac scorul firmei 0 firma va aparine celui de-al doilea $rup
*,
5 1 6
1 5 6
13,3 16,7 100,0
16,7 13,3 100,0
5 1 6
1 5 6
13,3 16,7 100,0
16,7 13,3 100,0
S<65
da
nu
da
nu
da
nu
da
nu
Count
9
Count
9
<r!"! na
Cross%*a ! dated
a
da nu
Pred! 4ted >rou/
Me)(ers+! /
5ota
Classification Results
b-c
Cross *a ! dat! on ! s done on A 3or t+ose 4ases ! n t+e ana As! s# In 4ross *a ! dat! on,
ea4+ 4ase ! s 4 ass! 3! ed (A t+e 3un4t! ons der! *ed 3ro) a 4ases ot+er t+an t+at 4ase#
a#
13,39 o3 or! "! na "rou/ed 4ases 4orre4t A 4 ass! 3! ed#
(#
13,39 o3 4ross%*a !dated "rou/ed 4ases 4orre4t A 4ass! 3! ed#
4#
"e obine o rat a succesului de +4,4 5
,710 4,011 1 10 ,071
,441 12,700 1 10 ,005
F1
F2
B! CsD
La)(da 6 d31 d32 S! "#
Tests of E.uality of (roup Means
@ariabila cu puterea cea mai mare de discriminare este B( - cifra de afaceri, acest
lucru este pus n eviden de cele dou statistici i %
3n tabelul de mai 'os sunt prezentai coeficienii de corelaie ntre variabile i
vectorul scorurilor
,945
,536
F2
F1
1
6un4t! on
Structure Matrix
*+

S-ar putea să vă placă și