Documente Academic
Documente Profesional
Documente Cultură
)in aceste condiii de independen se determin distribuia teoretic =-?pected<
ij
nt
astfel:
n
n n
nt
i j
ij
6
RECLAMA
nu da
C
o
u
n
t
70
60
50
40
30
20
10
0
CUMPARA
da
nu
50
15
20
65
3n cazul e?emplului nostru, pentru a obine distribuia teoretic =cum ar fi trebuit
s se distribuie cele 150 de persoane dac variabilele reclama i cumpr ar fi
independente<, n caseta Cell&3 se selecteaz opiunea E6pecte$
%recvene teoretice
*5 15 +0
65,4 46,, +0,0
(0 50 ,0
48,, 40,4 ,0,0
+5 *5 150
+5,0 *5,0 150,0
!ount
-?pected
!ount
!ount
-?pected
!ount
!ount
-?pected
!ount
da
nu
&-!./0/
#otal
da nu
!10P/&/
#otal
&-!./0/ 2 !10P/&/ !rosstabulation
Pentru a verifica dac cele dou variabile sunt independente se calculeaz mrimea
(
calc
cu formula:
p
i
q
j ij
ij ij
calc
nt
nt n
1 1
(
(
< =
@aloarea
(
calc
se compar cu valoarea teoretic
(
t
, e?tras din tabelul funciei
(
>
(
t
:
n
(
t
)ac acest coeficient are o valoare pozitiv ne indic o asociere pozitiv =indivizii se
concentreaz pe dia$onala principal, cei care rspund )/ la prima ntrebare ,
1 &otaru #, 0etode statistice aplicate n tiinele sociale, -d Polirom, (000
5
rspund )/ i la a doua< iar dac are o valoare ne$ativ ne indic o asociere
ne$ativ
b< Coe7icie!t+l 9 :al l+i ;+le<8 /cest coeficient are un interval fi? de variaie E-1,F1G, se
anuleaz n cazul n care variabilele sunt statistic independente i se obine cu
formula:
(1 1( (( 11
(1 1( (( 11
k k k k
k k k k
Pentru e?emplul ales, se testeaz e?istena le$turii dintre cele dou variabile cu
testul
(
6(,181 1 ,000
150
Pearson
!hi-"Huare
I of @alid
!ases
@alue df
/sJmp
"i$
=(-sided<
!hi-"Huare #ests
!omputed onlJ for a (?( table a
*
!oeficieni Phi, !ramerKs @
,540 ,000
,540 ,000
,6*8 ,000
150
Phi
!ramerLs @
!ontin$encJ
!oefficient
Iominal bJ
Iominal
I of @alid !ases
@alue
/ppro?
"i$
"Jmmetric 0easures
@aloarea
(
calc
(
(
unde n este mrimea eantionului Pentru aprecierea corect a intensitii le$turii trebuie
luat n considerare relaia:
p
p
#
1
ma?
cu"para
, ceea ce nseamn (suma frecvenelor maxime pe linii -
frecvena maxim pe linia totalurilor!(n " frecvena maxim pe linia totalurilor
consider9nd variabila &-!./0/ pe poziia variabilei dependente =a vzut reclama
dac a cumprat< vom calcula coeficientul
( )
416 , 0
+0 150
+0 (4 4( 6,
+ +
recla"a
1
1
1 1
ma?
ma? ma?
,
_
( ) ( )
( )
1
1
1 1
ma?
ma? ma?
i
p i
q
j
i
p i
ij
p i
X
n n
n n
,
_
kappa
3n utilizarea indicelui Mappa, cele dou variabile trebuie s aib acelai interval de
variaie
8
Prelucrarea variabilelor cantitative
)up modul de e?primare, caracteristicile statistice se separ n caracteristici
calitative =e?primate prin cuvinte< i caracteristici cantitative =e?primate numeric< )e
e?emplu, profesia i v9rsta
%antioane independente Testul &
!onsider9nd dou eantioane de volum n
1
i n
(
, se urmrete a se stabili
dac e?ist o diferen semnificativ, din punct de vedere statistic, ntre mediile celor
dou populaii
%xe"plul '( 1n mare productor de ambala'e
4
pentru bunuri de consum a testat n
mai multe ma$azine situaia v9nzrilor cu un nou tip de ambala' pentru produsul 0
&ezultatele au fost urmtoarele:
@9nzri n funcie de ambala' =mii lei<
0a$azinul @9nzri cu vechiul
ambala'
@9nzri cu noul
ambala'
1 (45 (55
( *,( *81
4 580 5,5
6 (0, 185
5 1+, (10
* 44, 45+
, 1,* 184
+ ((4 (6*
Pentru a rezolva aceast problem utiliz9nd produsul "P"", este nevoie s se
creeze o variabil de cod =@1<, n care valoarea 1 corespunde v9nzrilor cu vechiul
ambala', iar valoarea ( corespunde v9nzrilor cu noul ambala' /ceast variabil va fi
necesar $ruprii datelor corespunztor celor dou eantioane @alorile v9nzrilor se
indic ntr-o sin$ur variabil =/mbala' - valorile din primul eantion urmate de valorile
celui de-al doilea< "e selecteaz:
A!al1"e
Co%pa)e Mea!&
I!$epe!$e!t - Sa%ple& T Te&t3
4 .efter !, &u !, !ercetri de marMetin$, Nraov (000, pa$ 1(1
10
%i$ 5 !ompararea mediilor a dou eantioane independente
)up ale$erea metodei de analiz se recur$e la definirea $rupurilor conform
casetei de dialo$ din fi$ura *
%i$ * "electarea variabilelor
din lista variabilelor se selecteaz n Te&t Va)ia#le:&<A variabila potrivit creia se
compar mediile celor dou eantioane
variabila dup care se realizeaz $ruparea n cele dou eantioane se plaseaz n
caseta =)o+pi!( Va)ia#leA care activeaz De7i!e =)o+p&33n =)o+p BA se nscrie
codul 1 pentru valorile primului eantion iar n =)o+p -A codul ( pentru valorile celui
de-al doilea eantion
%i$ , )efinirea $rupurilor
C+t poi!tA - se utilizeaz dac dorim s specificm o valoare n funcie de care se vor
constitui $rupurile, primul va conine valorile mai mici dec9t cea specificat iar al
doilea valorile mai mari
&ezultatele oferite de produsul "P"" se prezint astfel:
11
Pndicatori statistici la nivel de eantioane
+ 4(+,4+ 186,44 *+,,1
+ 460,4+ 180,*( *,,48
@1
1 - vechi
( - nou
/mbala'
I 0ean
"td
)eviation
"td -rror
0ean
:roup "tatistics
,004 ,85+ -,1(5 16 ,804 -1(,00 8*,(6 -(1+,6( 186,6(
-,1(5 14,885 ,804 -1(,00 8*,(6 -(1+,64 186,64
-Hual
variances
assumed
-Hual
variances
not assumed
/0N/./Q
% "i$
.eveneLs #est for -HualitJ
of @ariances
t df
"i$
=(-tailed<
0ean
)ifference
"t d -rror
)ifference .o7er 1pper
855 !onfidence Pnt erval
of the 0ean
t-test for -HualitJ of 0eans
Pndependent "amples #est
-antioanele fiind de volum < 40 se aplic testul "tudent @aloarea
1(5 0
calc
t
@aloarea teoretic pentru nivelul de semnificaie 05 0 i 16 $rade de libertate,
e?tras din tabelul funciei "tudent 165 ( t
&e$ula de decizie este urmtoarea:
- se accept ipoteza A
0
dac
165 ( 165 (
calc
t
- se respin$e ipoteza A
0
i se accept alternativa ei A
1
dac
-8BCD &a+ --8BCD > <
calc calc
t t
3n cazul nostru se accept ipoteza A
0
, nu e?ist diferene semnificative ntre
mediile celor dou eantioane
%xe"plul 2( Printr-o anchet selectiv, s-a urmrit aprecierea $radului de
atractivitate a ambala'ului unui produs 3ntrebarea este dac e?ist diferene semnificative
ntre media aprecierilor femeilor i media aprecierilor brbailor
)istribuia persoanelor dup aprecieri
/preciere ambala'
=puncte<
Ir respondeni
%emei Nrbai
1 =foarte atractiv< 5 10
( =atractiv< 10 40
4 =nici > nici< 15 40
6 =neatractiv< +0 (0
5 =foarte neatractiv< 10 10
%emeile au primit codul 1, iar brbaii codul (
1(
Pndicatori statistici la nivel de eantioane
1(0 4,*, ,80 +,(4--0(
100 (,80 1,16 ,11
%N
1
(
/P&-!P-&
I 0ean
"td
)eviation
"td -rror
0ean
:roup "tatistics
&ezultatele testului e$alitii mediilor
+,,0( ,006 5,5*5 (1+ ,000 ,,, ,16 ,50 1,06
5,668 1+*,**8 ,000 ,,, ,16 ,68 1,06
-Hual
variances
assumed
-Hual
variances
not assumed
/P&-!P-&
% "i$
.eveneLs #est for -HualitJ
of @ariances
t df
"i$
=(-tailed<
0ean
)ifference
"td -rror
)ifference .o7er 1pper
855 !onfidence Pnterval
of the 0ean
t-t est for -HualitJ of 0eans
Pndependent "amples #est
%iind eantioane de volum suficient de mare, valoarea teoretic ce corespunde
nivelului de semnificaie 05 0 este 1,8* /plic9nd aceeai re$ul de decizie ca mai
sus, valoarea calculat fiind 5,5*5 suntem ndreptii s respin$em ipoteza A
0
i s
acceptm ipoteza A
1
, e?ist diferene ntre aprecierile femeilor i aprecierile brbailor
%antioane perec)i
Problema eantioanelor perechi poate fi pus, de e?emplu, atunci c9nd studiem
rezultatele obinute de membrii unui $rup nainte de efectuarea unui curs i dup
efectuarea acelui curs, din punct de vedere al testrii e$alitii mediilor
1
i
(
%xe"plu: 1n $rup de (0 de studeni au fost verificai la disciplina de
0icroeconomie dup cunotinele obinute la curs &ezultatele au fost nre$istrate n
fiierul es*perec)i n variabila P+!cteB )up iniierea ntr-un produs informatic
specializat n nvarea disciplinei de 0icroeconomie, acelai $rup a fost testat,
rezultatele nre$istr9ndu-se n variabila P+!cte- Pentru un nivel de semnificaie R0,05
se poate verifica dac efectul cursului a fost pozitiv
&ezultate obinute
Puncte1 Puncte( di
80 84 -4
14
81 81 0
84 85 -(
+8 ++ F1
+5 ++ -4
+8 +, F(
+4 +6 -1
++ 8( -6
+6 +4 F1
+( +5 -4
+4 +( F1
+1 +4 -(
,( ,6 -(
,0 ,0 0
,1 ,, -*
+1 +5 -6
+5 +, -(
+, +, 0
,6 ,* -(
,4 ,( F1
n
i
i
d d
1
6 , 1 (+
Ppotezele sunt:
A
0
: R 0 nu e?ist diferene ntre rezultatele dinainte i dup iniierea pe
calculator =
( 1
<
A
1
: < 0 e?ist diferene ntre rezultate
Pentru a efectua acest test selectm:
A!al1"e
Co%pa)e Mea!&
Pai)e$ - Sa%ple& T Te&t3
16
%i$ + !ompararea mediilor a dou eantioane perechi
din lista de variabile se selecteaz variabila P+!cteB ce va fi plasat n lista C+))e!t
Selectio!& n Va)ia#le BA, precum i variabila P+!cte- ce va apare n Va)ia#le-: iar
cu sunt transferate n lista Pai)e$ Va)ia#le&A
Optio!&3 permite ale$erea intervalului de ncredere
butonul O> declaneaz modelul de analiz i obinerea rezultatelor
Pndicatori statistici
+(,55 (0 ,,08 1,58
+4,85 (0 ,,01 1,5,
P1I!#-1
P1I!#-(
Pair 1
0ean I
"t d
)eviat ion
"t d -rror
0ean
Paired "amples "t atist ics
&ezultatele testului e$alitii mediilor
-1,60 (,11 ,6, -(,48 -,61 -(,8* 18 ,00+
P1I!#-1 -
P1I!#-(
0ean
"td
)eviation
"t d -rror
0ean .o7er 1pper
855 !onfidence
Pnterval of the
)ifference
Paired )ifferences
t df
"i$
=(-tailed<
Paired "amples #est
)eoarece volumul eantionului este n R (0, folosim repartiia "udent cu 18 $rade
de libertate i, pentru nivelul de semnificaie R 0,05, obinem valoarea t R -1,,*1 =test
unilateral<
&e$ula de decizie va fi urmtoarea:
dac
,( , 1 +#
se accept A
0
S
dac
,( , 1 < +#
se respin$e ipoteza A
0
se accept alternativa ei A
1
"e observ din tabelul cu rezltate c valoarea este ;(,8* Putem afirma c
rezultatele iniierii n produsul informatic au fost pozitive, e?ist9nd diferene
semnificative statistic ntre puncta'ul mediu de dinainte i de dup curs
Testul ,icoxon
/ceeai decizie putem s o lum i dac folosim testul Tilco?on
A!al1"e
15
No!pa)a%et)ic Te&t&
- Relate$ Sa%ple&
%i$ 8 "electarea testelor neparametrice
%i$ 10 )efinirea variabilelor perechi
)iferene ne$ative, pozitive, e$ale
1*
5
a
6,10 (0,50
1(
b
11,06 14(,50
4
c
(0
Ie$ative
&anMs
Positive &anMs
#ies
#otal
P1I!#-( -
P1I!#-1
I 0ean &anM "um of &anMs
&anMs
P1I!#-( U P1I!#-1
a
P1I!#-( V P1I!#-1
b
P1I!#-1 R P1I!#-(
c
#est Tilco?on
-(,*,4
,00+
W
/sJmp "i$
=(-tailed<
P1I!#-( -
P1I!#-1
Iivelul de semnificaie indicat de test este de 0,00+ mai mic dec9t 0,05, ceea ce ne
ndreptete s respin$em ipoteza A
0
i s acceptm ipoteza A
1
!nali- dispersional cu un factor .!/0$!1
!olectivitile cu care operm n statistica social-economic dei au un caracter
finit sunt formate de cele mai multe ori dintr-un numr foarte mare de uniti purttoare a
unor variabile cu un $rad mare de variaie )in aceast cauz unitile la care s-a fcut
observarea trebuie mprite n $rupe, n funcie de variaia factorilor determinani
3n cazul n care s-a aplicat n prealabil metoda $ruprii se pot calcula at9t medii c9t
i indicatori de variaie =dispersii< pe $rupe i pe total colectivitate 0edia i dispersia pe
ntrea$a colectivitate se pot calcula fie fc9nd abstracie de faptul c ea este compus din
mai multe $rupe, fie lu9nd n calcul indicatorii corespunztori calculai la nivelul
$rupelor
%xe"plu: 50 de a$eni economici au fost $rupai dup numrul mediu de salariai
i mrimea profitului Pentru nivelul de semnificaie R 0,05 ne propunem s verificm
dac factorul de $rupare este semnificativ, altfel spus dac numrul an$a'ailor
influeneaz variaia profitului
&epartiia a$enilor economici din sectorul de activitate /
dup numrul mediu de salariai i profitul obinut
/$eni economici dup
numrul mediu de salariai /$eni economici dup mrimea profitului =milioane lei<
Total
1( - 1* 1* - (0 (0 - (6 peste (6
sub 10 5 15 5 - -D
10 - 50 - 10 10 - -.
peste 50 - - - 5 D
Total D -D BD D D.
1,
Pentru a reliza n "P"" acest lucru ale$em calea:
A!al1"e
Co%pa)e Mea!&
O!e - Ea1 ANOVA 3
%i$ 11 "electarea variabilelor
3n fiierul creat n "P"" au fost definite variabilele profit2 nr*an3 Pentru a se realiza
$ruparea dup numrul an$a'ailor a fost necesar codificarea a$enilor economici dup variabila
nr*an3, prin $enerarea unei noi variabile codan3( 3n fi$ura 11 se observ selectarea variabilelor:
Depe!$e!t Li&tA a fost selectat variabila profit
F acto)A a fost selectat variabila dup care se face $ruparea codan3
O>
&ezultatele prelucrrilor se prezint astfel:
(81,560 ( 165,,,0 (1,*4, ,000
41*,*60 6, *,,4,
*0+,1+0 68
Net7een
:roups
Tithin :roups
#otal
P&D%P#
"um of
"Huares df 0ean "Huare % "i$
/ID@/
@arianele i valoarea %calc
@aloarea calculat pentru criteriul % este (1,*4 iar nivelul de semnificaie este 0,000 mai
mic dec9t 0,05 , ceea ce ne ndreptete s respin$em ipoteza A
0
i acceptm A
1
, factorul de
$rupare, numrul an$a'ailor, este semnificativ pentru variaia profitului
D analiz mai detaliat o obinem ale$9nd calea:
A!al1"e
Co%pa)e Mea!&
Mea!& 3
1+
P&D%P#
1,,8(
(5
4,00
(0,00
(0
(,(,
(*,(0
5
,+6
18,5+
50
4,5(
0ean
I
"td )eviation
0ean
I
"td )eviation
0ean
I
"td )eviation
0ean
I
"td )eviation
sub 10
10 - 50
peste 50
#otal
&eport
0ediile de $rp
(81,560 ( 165,,,0 (1,*4, ,000
41*,*60 6, *,,4,
*0+,1+0 68
=!ombined< Net7een :roups
Tithin :roups
#otal
P&D%P# 2
!D)/I:
"um of
"Huares df 0ean "Huare % "i$
/ID@/ #able
@arianele i valoarea %calc
,*8( ,6,8
P&D%P# 2
!D)/I:
-ta -ta "Huared
0easures of /ssociation
RE=RESIE I CORELAIE
18
"tatistica social-economic studiaz fenomenele de mas n interdepen unele cu altele 3n
acest scop datele sunt sistematizate sub form de serii de repartiie multidimensionale /naliza lor
se realizeaz prin metodele de corelaie statistic
1tilizarea din ce n ce mai frecvent a metodei corelaiei n statistic este 'ustificat de
necesitatea crec9nd a reflectrii ntr-o form numeric adecvat a interdependenei obiective
dintre fenomenele social-economice n ceea ce privete natura, direcia i $radul de intensitate a
le$turilor care se manifest ntr-o anumit perioad de timp sau n dinamic
%xe"plu: referitor la valoarea ncasrilor =mil lei< i cheltuielile publicitare =sute mii lei<
efectuate de o societate comercial n decursul a cinci luni s-au nre$istrat datele:
/naliza le$turii dintre cheltuielile publicitare i valoarea ncasrilor
Ir
crt
!heltuieli
publicitare
=sute mii lei<
i
x
@aloarea
ncasrilor
=mil lei<
i
#
(
i
x
i i
# x
(
i
#
x #
i
4 10 X +
1
(
4
6
5
5
*
8
1(
1+
(5
40
45
65
*5
(5
4*
+1
166
4(6
1(5
1+0
415
560
11,0
*(5
800
1((5
(0(5
6((5
(5
(+
4,
6*
*6
#ota
l
5
1
50
i
i
x
5
1
(00
i
i
#
5
1
(
*10
i
i
x
5
1
(440
i
i i
# x
5
1
(
8000
i
i
#
5
1
(00 X
i
i
#
"e cere:
a< s se caracterizeze i s se msoare le$tura dintre variabileS
b< s se testeze semnificaia coeficienilor pentru un nivel de semnificaie
05 , 0 q
'
+
+
(440 *10 50
(00 50 5
b a
b a
)in rezolvarea sistemului rezult coeficienii: 10 a i 4 b
!oeficientul de re$resie b fiind pozitiv ne arat e?istena unei le$turi directe ntre cele
dou variabile i anume, pe msur ce cheltuielile publicitare cresc cu o sut mii lei, valoarea
ncasrilor crete cu trei milioane lei
!oeficientul de corelaie:
885 , 0
G < (00 = 8000 5 E G < 50 = *10 5 E
(00 50 (440 5
( (
r
arat c ntre cele dou caracteristici e?ist o le$tur puternic
#estarea semnificaiei coeficienilor pentru nivelul de semnificaie de 0,05 i 5-( $rade de
libertate, pentru care valoarea tabelar a variabilei t este (,454, conduce la rezultatele:
1,61 , 0
b
$
(4 , 1,
1,61 , 0
4 0
b
c
$
b
t
"e observ c valoarea variabilei t calculat este mai mare dec9t valoarea teoretic 1,,(4 V
(,454 ceea ce ne ndreptete s tra$em concluzia c acest coeficient de re$resie este semnificativ
(0
diferit de zero Pntervalul de ncredere pentru coeficientul este:
1,61 , 0 454 , ( 4 1,61 , 0 454 , ( 4 + < <
6 , 4 58 , ( < <
#estarea termenului liber:
8((+ , 1
a
$
(0 , 5
8((+ , 1
10 0
a
c
$
a
t
"e observ c valoarea variabilei t calculat este mai mare dec9t valoarea teoretic 5,(0 V
(,454 ceea ce ne ndreptete s tra$em concluzia c termenul liber este semnificativ diferit de
zero Pntervalul de ncredere pentru coeficientul este:
8((+ , 1 454 , ( 10 8((+ , 1 454 , ( 10 + < <
5( , 16 6, , 5 < <
#estarea coeficientului de corelaie:
005 , 0
r
$
(4 , 1, ( 5
885 , 0 1
885 , 0
(
c
t
)esprindem concluzia c i coeficientul de corelaie este semnificativ diferit de zero
q c
t t >
, n care
14 , (
q
t
i corespunde nivelului de semnificaie 0,05 i 5-1 $rade de libertate
Pntervalul de ncredere pentru coeficientul va fi:
005 , 0 14 , ( 885 , 0 005 , 0 14 , ( 885 , 0 + < <
1 8+6 , 0 < <
Pentru a rezolva n "P"" aceast problem se selecteaz:
A!al1"e
Re()e&&io!
Li!ea)3
%i$ 1 "electarea variabilelor
D epe!$e!t ; din lista variabilelor se ale$e variabila dependentS
I !$epe!$e!t:&< ; din lista variabilelor se selecteaz variabilele independente =factorii de
influen<S
M et5o$: - se ale$e metoda de analiz:
E!te) ; se analizeaz variabilele $lobal, ntr-un sin$ur pasS
Fo)4a)$ ; re$resie pas cu pas ascendentS
Bac?4a)$ ; re$resie pas cu pas descendentS
Step4i&e ; la fiecare pas sunt indicate variabilele incluse i e?cluse din modelul iniialS
Re%o2e ; sunt indicate variabilele eliminate din modelS
S tati&tic&3 - conduce la ecranul:
(1
%i$ ( "electarea parametrilor pentru coeficienii de re$resie i analiza reziduurilor
E &ti%ate& ; calculul coeficienilor de re$resieS
Co!7i$e!ce i!te)2al& ; stabilirea intervalului de ncredere pentru coeficienii de
re$resie pentru probabilitatea de 855S
Co2a)ia!ce %at)i6 ; matricea de varian-covarian pentru coeficienii de re$resieS
M o$el 7it @ determin raportul de corelaie &, coeficientul de determinaie &
(
, &
(
a'ustat, eroarea standard, analiz /ID@/S
D e&c)ipti2e& ; afieaz pentru fiecare variabil media, abaterea standard, matricea
corelaiilorS
P a)t a!$ pa)tial co))elatio!& ; corelaii parialeS
Colli!ea)it1 $ia(!o&tic& ; analiza colinearitii
Plot&3- reprezentri $rafice
Sa2e3 - conduce la ecranul:
%i$ 4 "electarea parametrilor pentru obinerea valorilor a'ustate i a valorilor
reziduale
P)e$icte$ Val+e&
U !&ta!$a)$i"e$ ; se obin valorile variabilei dependente
i
#X
, calculate cu a'utorul
coeficienilor de re$resie =valorile a'ustate<S
Sta!$a)$i"e$ ; pentru valorile a'ustate se calculeaz media i abaterea standard
"tandardizarea const n mprirea abaterilor fa de medie la eroarea standard
@alorile standardizate au media 0 i abaterea standard 1S
A$F+&te$ ; valorile variabilei dependente ce corespund fiecrei observaii, dar
calculate cu coeficienii de re$resie ce au rezultat din modelul de re$resie din care
((
observaia respectiv a fost ndeprtat
< = X i #
S
Re&i$+al&
U!&ta$a)$i"e$ ; valorile
i i i
# # e X
S
Sta!$a)$i"e$ ; valorile
i
e
standardizateS
S t+$e!ti"e$ ; valorile studentizateS
Di&ta!ce&
Ma5ala!o#i& ; msoar distana fiecrei valori a variabilei independente fa de
media variabilei D distan mare indic o valoare e?tremS
Coo?G& ;
Le2e)a(e 2al+e& ; contribuia unei observaii dat de valoarea
i
%
=levierul<S
I!7l+e!ce &tati&tic&
D7Fit ; calculeaz valorile )%P#"S
O ptio!&3 conduce la ecranul:
%i$6 "tabilirea criteriului de selectare a variabilelor
Steppi!( Met5o$ C)ite)ia
U&e p)o#a#ilit1 o7 F ; o variabil este introdus n model dac nivelul de semnificaie
pentru valoarea calculat % este mai mic dec9t valoarea specificat n E!t)1 i este
scoas din model dac nivelul de semnificaie pentru valoarea calculat % este mai
mare dec9t valoarea specificat n Re%o2alS
U&e F 2al+e - o variabil este introdus n model dac valoarea calculat % este mai
mare dec9t valoarea specificat n E!t)1 i este scoas din model dac valoarea
calculat % este mai mic dec9t valoarea specificat n Re%o2alS
Pentru e?emplul de mai sus s-au obinut rezultatele:
(4
60,0000 15,+116 5
10,0000 5,(660 5
PI!/"
P1N
0ean
"td
)eviation I
)escriptive "tatistics
1,000 ,995
,995 1,000
, ,000
,000 ,
5 5
5 5
INCAS
PUB
INCAS
PUB
INCAS
PUB
Pearson
Correat!on
S!"#
$1%ta!ed&
N
INCAS PUB
Correlations
PUB
a
, Enter
Mode
1
'ar!a(es
Entered
'ar!a(es
Re)o*ed Met+od
Variables Entered/Removed
b
A re-uested *ar!a(es entered#
a#
.e/endent 'ar!a(e0 INCAS
(#
,995
a
,990 ,917 1,1257
Mode
1
R R S-uare
Ad2usted
R S-uare
Std# Error
o3 t+e
Est!)ate
Model Summary
b
Pred!4tors0 $Constant&, PUB
a#
.e/endent 'ar!a(e0 INCAS
(#
990,000 1 990,000 297,000 ,000
a
10,000 3 3,333
1000,000 4
Re"ress!on
Res!dua
5ota
Mode
1
Su) o3
S-uares d3
Mean
S-uare 6 S!"#
ANOVA
b
Pred!4tors0 $Constant&, PUB
a#
.e/endent 'ar!a(e0 INCAS
(#
(6
10,000 1,923 5,201 ,014 3,111 16,119
3,000 ,174 ,995 17,234 ,000 2,446 3,554
$Constant&
PUB
Mode
1
B Std# Error
Unstandard!7ed
Coe33!4!ents
Beta
Standard!
7ed
Coe33!4!en
ts
t S!"#
Lo8er
Bound
U//er
Bound
959 Con3!den4e
Inter*a 3or B
Coefficients
a
.e/endent 'ar!a(e0 INCAS
a#
Co)elaia &i%pl' c+)#ili!ie
3n practica statistic se nt9lnesc i le$turi care nu se realizeaz de form liniar 3n acest
caz se pot nt9lni forme variate de le$turi curbilinii specifice relaiilor de dependen dintre
caracteristica factorial aleas i cea rezultativ
/ceste le$turi neliniare se nt9lnesc mai frecvent sub forma unei parabole de $radul (, a
hiperbolei i a funciei e?poneniale 3n cazul le$turii neliniare este necesar ca, pe baza $raficului,
s se alea$ acea funcie care, tratat vizual, s prezinte abateri minime de la linia valorilor
empirice nscrise n c9mpul de corelaie !9nd nu se poate desprinde cu claritate forma de
realizare a le$turii dintre ? i J este necesar s se calculeze mai multe ecuaii de estimare, cu care
s se a'usteze datele i s se alea$ apoi aceea care d o dispersie minim fat de valorile
teoretice ale caracteristicii rezultative n funcie de factorul ales
%xe"plu: n zece uniti comerciale s-au cules date cu privire la valoarea v9nzrilor de
tricota'e i nivelul relativ al cheltuielilor de circulaie:
@aloarea v9nzrilor
=mil lei<
Iivelul relativ al
cheltuielilor de circulaie =5<
? J
5,1
5,5
*,0
*,5
*,,
,,0
,,0
+,5
11,0
14,0
+
,,(
*,+
*,6
*
5,*
5
6,*
6,(
6,(
Pentru a rezolva n "P"" problemele de re$resie neliniar se apeleaz:
A!al1"e
Re()e&&io!
C+)2e E&ti%atio!3
(5
%i$ 5 "electarea opiunilor pentru re$resia neliniar
Pentru a vizualiza le$tura dintre cele dou variabile s-a utilizat:
=)ap5&
Scatte)3
'IN:ARI
14 12 10 1 6 4
C
;
E
L
5
9
1
7
6
5
4
%i$ * .e$tura dintre cheltuieli i v9nzri
:raficul su$ereaz o le$tur invers ntre cele dou variabile Pentru a putea face
comparaie ntre modelul liniar i modelul hiperbolic au fost selectate ambele metode de analiz,
obin9ndu-se rezultatele:
Depe!$e!t 2a)ia#le88 CHELT Met5o$88 LINEAR
(*
0ultiple & ,+5485
& "Huare ,,(8(4
/nalJsis of @ariance:
)% "um of "Huares 0ean "Huare
&e$ression 1 11,(58(*1 11,(58(*1
&esiduals + 6,1+0,48 ,5((58(
% R (1,5650( "i$nif % R ,001,
-------------------- @ariables in the -Huation --------------------
@ariable N "- N Neta # "i$ #
@PIW/&P -,66(5+1 ,085450 -,+5486+ -6,*6( ,001,
=!onstant< 8,1,*+84 ,,*(5+8 1(,046 ,0000
Depe!$e!t 2a)ia#le88 CHELT Met5o$88 INVERSE
0ultiple & ,8516+
& "Huare ,80541
/nalJsis of @ariance:
)% "um of "Huares 0ean "Huare
&e$ression 1 14,8,+011 14,8,+011
&esiduals + 1,6*18+8 ,1+(,68
% R ,*,6+,*( "i$nif % R ,0000
-------------------- @ariables in the -Huation --------------------
@ariable N "- N Neta # "i$ #
@PIW/&P 44,108(+0 4,,+5,*8 ,8516,8 +,,6* ,0000
=!onstant< 1,10((*+ ,554+8* 1,880 ,0+1+
#he follo7in$ ne7 variables are bein$ created:
Iame .abel
%P#Y4 %it for !A-.# 7ith @PIW/&P from !1&@-%P#, 0D)Y( .PI-/&
%P#Y6 %it for !A-.# 7ith @PIW/&P from !1&@-%P#, 0D)Y( PI@-&"-
(,
C;EL5
'IN:ARI
14 12 10 1 6 4
9
1
7
6
5
4
3
<(ser*ed
L!near
In*erse
%i$ , @alorile observate comparate cu liniile de re$resie
0odelul liniar a condus la funcia
x # 66( , 0 1,* , 8 X
=coficientul b fiind ne$ativ arat
le$tur invers ntre cele dou variabile<, raportul de corelaie & de 0,+548 indic o le$tur
puternic iar valoarea % R (1,56 pentru care nivelul de semnificaie este 0,001, =mai mic dec9t
0,05 ales pentru testarea modelului< arat c modelul este semnificativ
1+ , 6
(
i
e
0odelul hiperbolic a condus la funcia
x
#
1
1 , 44 1 , 1 X + , raportul de corelaie & este
0,8516, valoarea % R ,*,6+ pentru care nivelul de semnificaie este 0,0000
6* , 1
(
i
e )in
aceste rezultate deducem c modelul hiperbolic estimeaz mai bine le$tura dintre cele dou
variabile
Re()e&ia pa& c+ pa&
)ac numrul variabilelor e?plicative este important, apare necesitatea aplicrii metodelor
de selectare automat a variabilelor 0etodele cele mai utilizate sunt re$resia pas cu pas
ascendent =for&ard step&ise re'ression<, re$resia pas cu pas descendent =bac(&ard step&ise
re'ression<, sau o combinaie a celor dou
Re()e&ia pa& c+ pa& a&ce!$e!t'
&e$resia pas cu pas ascendent este o metod iterativ const9nd n selecionarea la fiecare
etap a variabilei e?plicative ce ma?imizeaz coeficientul de determinaie &
(
al lui C cu toate
variabilele selecionate n etapele precedente i noua variabil $sit, astfel nc9t aportul mar$inal
al celei din urm s fie semnificativ
3n prima etap se construiete tabelul )
*
(+,-
.
:
@ariabile &
(
=C,B
'
< %
'
Iivel de
semnificaie
(+
B
1
B
p
&
(
=C,B
1
<
&
(
=C,B
p
<
%
1
%
p
Z
1
Z
p
"e selecioneaz variabila e?plicativ pentru care criteriul / este cel mai mare i nivelul de
semnificaie este cel mai mic =mai mic dec9t nivelul de semnificie 0 ales<
3n etapa a doua se construiete tabelul )
*
(+, -s
t-1
,-
.
, n care -s
t-1
este variabila e?plicativ
selecionat la pasul anterior "e selecioneaz o nou variabil, aplic9nd acelai principiu
Procedura se oprete atunci c9nd variabilele rmase au toate nivelul de semnificaie mai
mare dec9t nivelul 0
!riteriul utilizat pentru selecionarea variabilelor const n ale$erea la fiecare etap a
variabilei care va avea cel mai mare / parial Presupunem c la momentul t variabilele -
1
... -
t
au
fost selecionate:
n care statistica: $(-
1
,...,-
(
reprezint suma ptratelor
+ -
+x
(
*
i
n
11 i
e?plicat de
variabilele B
1
,,B
M
Putem nele$e astfel problema multicoliniaritii n re$resia multipl -?ist variabile puternic
corelate cu celelalte variabile e?plicative, ceea ce face ca aportul lor la e?plicarea variabilei C
s fie foarte mic Prin aplicarea acestor modele de selecie variabilele nesemnificative sunt
eliminate
@alorile variabilelor nre$istrate la 4( uniti turistice
Ir turiti
=mii pers<
Wile - turiti Pre mediu>zi
=zeci mii lei<
@al investiiilor
=zeci mil lei<
!lelt publicit
=sute mii lei<
@al ncas
=mil lei<
-1 -* -2 -3 -4 +
48+
4*8
(*+
6+6
486
44(
44*
4+4
(+5
(,,
65*
455
4*6
4(0
411
4*(
60+
644
10+0
11+0
1(80
1110
16*0
1600
14*0
1060
1050
1450
1(+0
1410
1(00
16,0
1640
1650
1410
1(60
5*
58
5*
5,
58
*0
58
*0
*4
*(
*6
*6
*4
*5
*,
**
**
*,
1(
8
(+
1(
14
11
(6
(0
+
10
(1
(4
14
16
((
(4
14
+
,*
++
51
48
51
(0
60
41
1(
*+
5(
,*
8*
6,
(,
,(
*(
(6
5550
5648
6(80
550(
6+,1
6,0+
6*(,
6110
61((
6+6(
5,60
5086
54+4
6+++
6044
6861
541(
5148
* - t - (n !
-
,
-
,...,
-
$( - # - # ( (
-
,...,
-
$( -
-
,
-
,...,
-
$(
1
/
. t 1
*
i
t 1 . t 1
.
(8
458
6,*
615
6(0
54*
64(
64*
615
6*(
6(8
51,
4(+
61+
515
10*0
14+0
16+0
14*0
1110
15(0
1(40
1180
11(0
1(50
16(0
1(40
1450
1(00
*+
,1
*8
*8
,4
,4
,4
,6
,4
,6
,6
5(
*+
,+
(,
1+
,
10
(,
15
4(
18
16
11
(*
18
46
(4
,4
*4
(+
81
,6
1*
6(
61
8(
+4
,6
+,
,6
(1
548,
5168
5650
68+8
58(*
6,04
54*5
6*40
5,11
5085
*16(
6,+,
5045
5(++
0odelul estimat prin metoda celor mai mici ptrate este:
5 5( , + 6 88 , 6 4 1+ , + ( 1** , 0 1 5( , 5 8 , (+,8 - - - - - + + + +
%uncionarea procedurii se realizeaz astfel:
5as 1 "e calculeaz
n . - + )
.
, 1 <, , =
(
precum i valorile .
/
pariale mpreun cu nivelul
de semnificaie
@ariabile &
(
=C,B
'
< %
'
Iivel de semnificaie
B
1
B
(
B
4
B
6
B
5
0500
001,
010(
0004
0((,
400(6
0515
4600
00+4
++01
0000
06,+
00,5
0,,*
000*
@ariabila selecionat este B
1
!entrarea datelor
#
0
P PP PPP
1
(
4
6
5
*
-(
0
(
-*
6
(
0
(
-5
1
(
0
(
6
-4
-1
0
-(
P-8 Calc+l+l coo)$o!atelo) p+!ctelo) pe a6e
Ela#o)a)ea %at)icei $e 2a)ia!' @ co2a)ia!'A
< = < =
0
L
0
6 6 7
n care: 0
6
este matricea datelor centrate, iar
L
0
6
este transpusa matricei 0
6
,
_
,
_
( 0 (
0 ( 6
1 1 *
4 5 (
6 ( 0
( 0 (
( 0 1
0 ( 1
( 6 *
4 6 (
5 ( 0
( 0 (
$
46
,
_
46 (( +
(( 46 +
+ + *6
7
1rma matricei @ este e$al cu suma elementelor de pe dia$onal: *6F46F46 R
14(
&an$ul matricei 0
6
este e$al cu 4 =ran$ul unei matrice cu m linii i n coloane r
min=m,n<
Dia(o!ali"a)ea %at)icei $e 2a)ia!' @ co2a)ia!'A
- calculul valorilor proprii i
:
0
1 0 0
0 1 0
0 0 1
46 (( +
(( 46 +
+ + *6
1
1
1
]
1
,
_
,
_
8et
Iumrul soluiilor este e$al cu ran$ul matricei de date "e obin n acest caz
trei soluii:
,
_
4
1
4
(
1
14(
1(
1( 0 0
0 6+ 0
0 0 ,(
6+
,(
i
i
8
vectorul propriu
1
u
astfel nc9t
1 1
,( u u 7
@alorii proprii
6+
(
vectorul propriu
(
u
astfel nc9t
( (
6+ u u 7
@alorii proprii
1(
4
vectorul propriu 4
u
astfel nc9t 4 4
1( u u 7
"e obin vectorii proprii:
45
,
_
,
_
,
_
1
1
0
1
1
1
1
1
(
4 ( 1
u u u
- determinarea vectorilor proprii normai:
/mintim c norma sau lun$imea unui vector
( ( (
c b a u este
c
b
a
u + +
,
_
,
_
,
_
,
_
( > 1
( > 1
0
4 > 1
4 > 1
4 > 1
* > 1
* > 1
* > (
4 ( 1
u u u
Calc+l+l coo)$o!atelo) p+!ctelo) pe a6ele 7acto)ialeA
- calculul coordonatelor punctelor indivi9i:
indivizi
*
5
6
4
(
1
61 1 0 65 (
61 1 6* 4 65 (
61 1 6* 4 80 6
61 1 6* 4 80 6
61 1 6* 4 65 (
61 1 0 65 (
( > 1 4 > 1 * > 1
( > 1 4 > 1 * > 1
0 4 > 1 * > (
( 0 (
0 ( 6
1 1 *
4 5 (
6 ( 0
( 0 (
,
_
,
_
,
_
u
1
u
(
u
4
a?a1 a?a( a?a4
#
0
coordonate puncte - indivizi
- calculul coordonatelor punctelor " variabile:
"e nmulete fiecare vector propriu normat cu abaterea medie ptratic a
norului proiectat pe a?a corespunztoare
variabile
:::
::
:
,
_
,
_
65 ( 6 6* 4
65 ( 6 6* 4
0 6 84 *
1( ( > 1 6+ 4 > 1 ,( * > 1
1( ( > 1 6+ 4 > 1 ,( * > 1
0 6+ 4 > 1 ,( * > (
a?a1 a?a( a?a4
coordonate puncte ; variabile
4*
:raficul punctelor indivizi i variabile
PI8 I!te)p)eta)ea )e"+ltatelo)
0arca P este opus mrcilor PP i PPP
Pndivizii 5 i * sunt destul de apropiai prin preferinele lor pentru marca P, n
timp ce indivizii 1 i ( prefer mrcile PP i PPP
Pndividul 1 i mai ales individul 6 consider defavorabil marca P
Pndividul * i mai ales individul 4 consider defavorabile mrcile PP i PPP
Pndividul ( pare a fi indiferent fa de marca P, n timp ce individul 5 nu pare
deloc interesat de marca PP i PPP
%xe"plul 'A in9nd cont de faptul c potenialii cumprtori apreciaz
automobilele dup caracteristicile prezentate n tabelul de mai 'os, ne propunem
efectuarea unei analize n componente principale utiliz9nd produsul "P""
6
8
)atele au fost introduse prin meniul Data Di7i!e Va)ia#le
Pentru apelarea analizei n componente principale se ale$e calea:
A!al1"e
Data Re$+ctio!
6 "pircu ., !alciu 0, "pircu #, /naliza datelor de marMetin$, -d /ll, Nucureti 1886, pa$ +8
4,
'AR00001
6 4 2 0 %2 %4 %6
'
A
R
0
0
0
0
2
4
3
2
1
0
%1
%2
%3
%4
6
5
4 3
2
1
Facto) 3
!aracteristici ale automobilelor
Co$ Mo$el P)e Cap8cil Vite"a Co!& Cap85a# L+!(8 =)8J
P8
/ /ustin 0etro "pecial 1(000 88+ 160 *,( 855 460 (4,(
! !itroen /B 14(,5 856 165 5,* 11,0 450 18,6
) )aihatsu 16*(5 884 165 *,, 1151 4*1 (0,+
%1 %iat 1no 65 146,5 888 165 *,( 8*+ 4*6 (1,5
%( %iat 1no #urbo (5005 1401 (00 +,8 8*+ 4*6 11,0
%4 %iat 1no ,0 1,+65 140( 1*5 ,,, 8*+ 4*6 1*,0
%6 %ord %iesta Qunior 14050 111, 14, ,,0 800 4*6 ((,,
%5 %ord %iesta B& (1,64 158, 1+0 8,4 8,4 4*6 1(,0
I Iissan 1(600 8++ 160 *,6 4,5 4*6 1,,0
D Dpel !orsa 14050 884 164 ,,( +65 4*( ((,6
P1 Peu$eot (05 B- 14(*0 856 146 *,+ 1(00 4,0 (4,+
P( Peu$eot (05 :. 15,+0 11(6 16( 5,+ 1(00 4,0 (1,6
P4 Peu$eot (05 :# 1+8*5 14*0 1,0 8,( 1(00 4,0 14,8
P6 Peu$eot (05 :#P (51,5 15+0 180 +,, 1(00 4,0 11,(
&1 &enault 6 #. 1(8+1 85* 115 *,4 850 4*, 44,1
&( &enault 6 :#. 14+0* 110+ 1(0 *,4 850 4*, (+,6
&4 &enault 5 ". 1615* 110+ 164 5,+ 815 458 (0,*
&6 &enault 5 :#" 1,(50 148, 1*, ,,8 815 458 14,+
&5 &enault :# #urbo (5418 148, (00 +,, 815 458 10,(
"1 "eat :.B 18(+4 16*1 1,5 +,+ 1(00 4*6 16,,
"( "eat :. 108,0 804 141 ,,4 10++ 46, (4,6
"4 "uzuMi :/ 1(115 884 165 *,6 600 45+ 1+,6
"6 "uzuMi :. 16*55 14(6 1*4 *,5 600 45+ 16,0
#1 #oJota . 16000 888 150 *,1 (0( 4,0 18,5
#( #oJota B. 1*+50 1(85 1,0 *,+ (0( 4,0 15,0
@ @olMs7a$en 1+065 1(,( 1,0 +,0 1060 4*5 16,0
4+
%i$ 1 "electarea variabilelor
)in lista iniial de variabile se plaseaz cu s$eat dreapta variabilele ce vor
intra n analiz, cu condiia s fie numai variabile numerice
D e&c)ipti2e& 3 permite obinerea unei analize univariate conin9nd indicatorii:
medie, abaterea medie ptratic, precum i matricea de corelaie dintre variabileS
E 6t)actio! 3 se selecteaz metoda, se ale$e numrul de factori, se marcheaz
apariia $raficului valorilor proprii Sc)ee plotS
%i$ ( %unciile modulului -?traction
Rotatio! 3 permite aplicarea metodei fr rotirea sau cu rotirea a?elor, precum
i reprezentarea $raficului variabilelor prin opiunea Loa$i!( plot:&<S
48
%i$ 4 %unciile modulului &otation
Sco)e& 3 creeaz variabile noi ce conin coordonatele punctelor indiviziS
Pentru e?emplul de mai sus s-au obinut rezultatele:
Stati&tic' $e&c)ipti2'
Va)ia#ile Mea! St$8 De2iatio! A!al1&i& N
!/P!P. 11,(,06 (08,66 (*
!/PYA/N +86,(4 411,18 (*
!DI"10 ,,1,, 1,15* (*
:&YP 1+,5156 5,*08+ (*
.1I:P0- 4*(,41 ,,64 (*
P&-# 1*11+,4+ 6((8,8, (*
@P#-W/ 156,+1 ((,*1 (*
1,000 ,135 ,792 %,775 ,305 ,149 ,129
,135 1,000 ,320 ,011 %,072 ,247 ,031
,792 ,320 1,000 %,610 ,211 ,109 ,771
%,775 ,011 %,610 1,000 %,104 %,765 %,937
,305 %,072 ,211 %,104 1,000 ,327 ,163
,149 ,247 ,109 %,765 ,327 1,000 ,914
,129 ,031 ,771 %,937 ,163 ,914 1,000
CAP#CIL
CAP=;AB
C<NSUM
>R=P
LUN>IME
PRE5
'I5E:A
Correat!on
CAP#CIL CAP=;AB C<NSUM >R=P LUN>IME PRE5 'I5E:A
Correlation Matrix
a
.eter)!nant ? 3,179E%04
a#
60
4,354 62,197 62,197 4,354 62,197 62,197
1,133 16,192 71,311 1,133 16,192 71,311
,965 13,717 92,175
,229 3,277 95,452
,176 2,516 97,961
,129 1,150 99,111
1,276E%02 ,112 100,000
Co)/onent
1
2
3
4
5
6
7
5ota
9 o3
'ar!an4e
Cu)uat!*e
9 5ota
9 o3
'ar!an4e
Cu)uat!*e
9
In!t!a E!"en*aues E@tra4t!on Su)s o3 S-uared Load!n"s
Total Variance Explained
E@tra4t!on Met+od0 Pr!n4!/a Co)/onent AnaAs!s#
@alorile proprii sunt:
.,.B-/K L .,B-M L .,B/K L .,--M L .,MKD L B,BII L C,IDC L
/ K D C I - B
Primii doi factori e?prim ,+,6% din variana total, ceea ce nseamn c i
putem utiliza pentru a reprezenta norul de puncte n planul principal
S4ree Pot
Co)/onent Nu)(er
7 6 5 4 3 2 1
E
!
"
e
n
*
a
u
e
5
4
3
2
1
0
%i$ 6 :raficul valorilor proprii
Pnformaia coninut n ultimii factori este ne$li'abil comparativ cu cea
coninut n primii, ceea ce permite o reducere a numrului factorilor ce descriu un
fenomen
61
,924 %2,41E%02
,173 ,949
,114 ,224
%,112 ,230
,305 %,335
,951 7,321E%02
,956 %,101
CAP#CIL
CAP=;AB
C<NSUM
>R=P
LUN>IME
PRE5
'I5E:A
1 2
Co)/onent
Component Matrix
a
E@tra4t!on Met+od0 Pr!n4!/a
Co)/onent AnaAs!s#
2 4o)/onents e@tra4ted#
a#
!oeficienii de corelaie prezentai n tabelul de mai sus servesc drept
coordonate ale variabilelor n planul celor doi factori
Co)/onent Pot
Co)/onent 1
1,0 ,5 0,0 %,5 %1,0
C
o
)
/
o
n
e
n
t
2
1,0
,5
0,0
%,5
%1,0
*!te7a
/ret
un"!)e
"r=/ 4onsu)
4a/=+a(
4a/#4!
%i$ 5 &eprezentarea variabilelor n planul celor doi factori
Privind $raficul, devine evident faptul c factorul 1 este apropiat de
variabilele vite9, pre, capacitate cilindric i consum, adic performane tehnice,
pe c9nd factorul ( este apropiat de confortul intern
Pentru a reprezenta punctele indivizi pe harta indivizilor se folosesc
coordonatele acestora aflate n variabilele fac1;1 i fac*;1
6(
!oordonatele punctelor indivizi
!od fac1;1 fac*;1 !od fac1;1 fac*;1
/ -1,0,* 1,0,( P6 1,+** ,6581
! -,+54 1,015 &1 -1,48, ,6+6(
) -,500 ,,+16 &( -,8+( ,(+8*
%1 -,**1 ,081* &4 -,*(* ,0565
%( 1,*(+ ,0+51 &6 ,*,6 ,0+(5
%4 ,5(+ ,088( &5 1,*+1 ,0,41
%6 -,554 ,1046 "1 1,140 ,+(,(
%5 1,*00 ,(0*4 "( -1,066 1,4,+
I -,*56 -1,*4 "4 -,,18 -1,40
D -,*00 ,06*0 "6 ,088 -1,51
P1 -,,1* ,,104 #1 -,5,( -(,41
P( -,6(5 ,6488 #( ,455 -(,64
P4 1,11+ ,*566 @ ,,00 ,(1*8
Pentru realizarea $raficului se apeleaz :
=)ap5&
Scatte) 38
%i$ * /le$erea parametrilor pentru reprezentarea $rafic
3n $raficul de mai 'os au fost reprezentai indivizii =mrcile< n planul
principal, conform coordonatelor punctelor indivizi
64
RE>R 3a4tor s4ore 1 3or anaAs!s 1
2,0 1,5 1,0 ,5 0,0 %,5 %1,0 %1,5
R
E
>
R
3
a
4
t
o
r
s
4
o
r
e
2
3
o
r
a
n
a
A
s
!
s
1
2
1
0
%1
%2
%3
'
52
51
S4
S3
S2
S1
R5 R4
R3
R2
R1 P4
P3
P2
P1
<
N
65
64 63 62 61
.
C
A
%i$ , Punctele indivizi
1n cumprtor i poate face acum o idee mai e?act asupra clasamentului
acestor mrci, poate ale$e mai clar, n funcie de ceea ce l intereseaz:
pre>performane tehnice, sau confortul intern al autoturismului
%xe"plul 2: )intr-o cercetare pe baz de sonda', asupra unui eantion
format din 110 turiti au fost selecionate c9teva variabile din chestionarele
nre$istrate =modul de cazare, dac a sosit cu un $rup sau individual, motivaia
turistic, profesia, se?ul, ce tip de sport practic, sursele de informare, ara, v9rsta,
mi'locul de transport utilizat<, n vederea efecturii unei analize n componente
principale
"-au obinut rezultatele:
0atricea coeficienilor de corelaie:
CAZARE =RUP MOTIV PROFESIE SEN SPORT
SURSEOIN
!/W/&- 100000
:&1P 54555 100000
0D#P@ -(((,, 08((( 100000
P&D%-"P- (6+,, 1+(58 -1455+ 100000
"-B 56+66 6(888 -06601 44(+6 100000
"PD&# 458(1 -04*50 -1*+(( (5818 18060 100000
"1&"-YPI -(0,,5 -4*548 -061,4 5+16, -01141 460+( 100000
[/&/ -(+61, -46884 -1(6,+ *0,06 0*+(5 1,510 *5,65
#&/I"P 46(,* 10455 -(0(8+ **64* 48*(5 6*18( *01*4
66
@\&"#/ ,,(+* 5++(8 -188,+ 44(10 54111 (18,, -080(8
[/&/ #&/I"P @\&"#/
[/&/ 100000
#&/I"P 58+,4 100000
@\&"#/ -(0(56 481*( 100000
)eterminarea valorilor proprii:
Va)ia#ile Facto)i Valo)i p)op)ii P P
c+%+late
!/W/&- 1 46+6+5 46+ 46+
:&1P ( (+((+8 (+( *41
0D#P@ 4 108+81 110 ,61
P&D%-"P- 6 +4+4* +6 +(5
"-B 5 55508 5* ++0
"PD&# * 4,,44 4+ 81+
"1&"-YPI , (+8*, (8 86,
[/&/ + (**46 (, 8,4
#&/I"P 8 1+51+ 18 88(
@\&"#/ 10 0+14+ + 1000
6a4tor S4ree Pot
6a4tor Nu)(er
10 9 1 7 6 5 4 3 2 1
E
!
"
e
n
*
a
u
e
4
3
2
1
0
Primii doi factori principali e?prim *4,15 din variana =mprtierea<
total, ceea ce nseamn c i putem utiliza pentru a reprezenta norul de puncte n
planul principal, fr a pierde prea mult informaie
)e re$ul, informaia coninut n ultimii factori ai secvenei este ne$li'abil,
comparativ cu cea coninut n primii )e aceea, analiza componentelor principale
ofer o baz pentru reducerea numrului factorilor ce descriu un fenomen
65
%actorii principali 5actor ' i 5actor 2 sunt abstraci Pentru interpretarea
lor se calculeaz coeficienii de corelaie ntre variabilele concrete i cele dou
componente principale !oeficienii de corelaie vor servi drept coordonate ale
variabilelor n planul celor doi factori !oeficienii de corelaie a variabilelor cu cei
doi factori:
Facto) B Facto) -
!/W/&- *56+, -*(1+1
:&1P 4,14+ -,0,+1
0D#P@ -(+*5* -04+(5
P&D%-"P- ,*,04 4484+
"-B *6865 -46(,,
"PD&# 5644( 16*55
"1&"-YPI 6400+ ,,+*(
[/&/ 48(1, +0(5(
#&/I"P +6*(0 44(,6
@\&"#/ *+8+0 -5*668
6a4tor Pot !n Rotated 6a4tor S/a4e
6a4tor 1
1#0 #5 0#0 %#5 %1#0
6
a
4
t
o
r
2
1#0
#5
0#0
%#5
%1#0
*!rsta
trans/
tara
surse=!n3
s/ort
se@
/ro3es!a
)ot!*at!a
)od 4aator!e
4a7are
%i$ + &eprezentarea $rafic a variabilelor n planul celor doi factori
)in reprezentarea $rafic desprindem concluziile:
variabile independente, dac un$hiul format de vectorii variabilelor
este drept, =de e?emplu: mod cltorie, care se refer la cltoria individual sau n
$rup, formeaz un un$hi apro?imativ drept cu profesia<S
variabilele sunt ]apropiate^ ntre ele dac un$hiul format este ascuit,
= de e?emplu: practicarea sporturilor de iarn cu profesia, v9rsta cu cazarea, sursele
de informare cu ara<S
6*
variabile sunt opuse =]repulsie^< dac un$hiul format este obtuz,=de
e?emplu: cltoria n $rup sau individual cu sursele de informare<S
cu c9t punctul este mai ndeprtat fa de centru n direcia unei a?e, cu
at9t mai mari sunt coordonatele punctului i cu at9t mai mult contribuie la formarea
a?ei =transportul, sursele de informare pentru primul factor, cazarea, v9rsta, modul
de cltorie pentru al doilea factor<
)in reprezentarea $rafic rezult c factorul 1 este ]apropiat^ de variabilele:
profesia, transportul, sursele de informare, practicarea sporturilor de iarn, ara, deci
de variabilele care privesc motivaia i mi'loacele prin care se poate practica
turismul n Poiana Nraov, factorul ( este ]apropiat^ de variabilele: cazare, v9rst,
cltorie n $rup sau individual, se?, care sunt le$ate mai mult de confort i datele
personale ale indivizilor
D alt interpretare ar fi: factorul 1 concentreaz n 'urul su variabilele cel
mai bine percepute de indivizii chestionai =sunt activi fa de aceste variabile i
pasivi fa de variabilele ce contribuie la formarea celui de-al doilea factor<
Prin aplicarea metodelor de analiz factorial s-a realizat o reducere a
datelor, nlocuind norul de puncte iniial cu un nor de dimensiuni mai restr9nse,
pentru o reprezentare $rafic comod i pentru a pune n eviden ceea ce este tipic
n opiniile turitilor
ANALIZA FACTORIAL0 A CORESPONDENELOR :AFC<
/naliza factorial a corespondenelor este o $eneralizare a analizei
componentelor principale, adaptat tratrii $atelo) calitati2e, prezentate sub forma
unui tabel de contin$en sau a unui tabel format din indivizi descrii prin
caracteristici calitative, studiind le$turile dintre dou ansambluri de variabile =sau
ntre modalitile a dou variabile de clasificare<
#a-ul a dou caracteristici
#abel de contin$en
C
B
!ate$oria de v9rst
1*-(0 ani (1-40 ani 41-60 ani 61-50 ani peste 50
!
r
i
t
e
r
i
u
l
h
o
t
r
9
t
o
r
preul
performanele
tehnice
desi$nul
1,
(*
*
15
(+
(+
45
18
1+
44
41
15
6(
46
4
"e apeleaz:
A!al1"e
Data Re$+ctio!
6,
Co))e&po!$e!ce A!al1&i& 3
%i$ 8 "electarea variabilelor analizei n componente principale
!odificarea variantelor caracteristicii B s-a realizat astfel:
B ; pre<
- ; performane te%niceS
I ; desi'n
!odificarea variantelor caracteristicii C:
B ; 1= " *0 aniS
- ; *1 " 20 aniS
I ; 21 " 30 aniS
C ; 31 " 40 ani<
D ; peste 40 ani.
@ariabila #riteriu se indic pe linii iar n De7i!e Ra!(e se completeaz
valoarea minim i valoarea ma?im =1 i 4<
@ariabila $6rsta se indic pe coloane iar n De7i!e Ra!(e se completeaz
valoarea minim i valoarea ma?im =1 i 5<
6+
%i$ 10 "electarea opiunilor analizei n componente principale
!u a'utorul produsului "P"", prelucrarea datelor din tabelul 610 a condus la
urmtoarele rezultate:
@alorile proprii sunt
,.QMK-
1
,.-IIK
(