Sunteți pe pagina 1din 11

Aplicatia 1

O banc vrea s-i evalueaze clienii n funcie de zona n care locuiesc i


n funcie de volumul creditelor solicitate i acordate. Astfel efectueaz un sondaj
pe 120 de persoane i obine urmtoarele rezulatate:

Tabelul 1

Grupe de
ageni
economici dup
zon
( xi )
Zona rural

Subgrupe de ageni economici dup volumul


creditelor ( y j )
Sub
40

40-80

80120

120160

160200

Peste
200

10

2( nij )

30

Zona urban

10

20

29

16

90

Total ( N j )

14

14

20

23

31

18

120

Total
( Ni )

Rezolvare:

Rezolvarea acestei probleme presupune parcurgerea a dou etape:


1. Prima etap se refer la acceptarea sau respingerea ipotezei de dependen dintre
cele dou variabile: X, variabila cauzal - grupe de ageni economici dup zon
i Y, variabila efect - subgrupe de ageni economici dup volumul creditelor.
2. A doua etap se aplic numai n cazul acceptrii ipotezei de dependen ntre
variabile i necesit stabilirea zonei cu cel mai mare volum al creditelor. n cazul
independenei dintre cele 2 variabile, volumul creditelor nu depinde de zona din
care agentul economic provine.
Aceast problem se rezolv cu ajutorul analizei variaiei. Metoda analizei
variaiei se fundamenteaz pe discuia urmtoarelor distribuii:

yj
distribuia marginal a variabilei Y: , j = 1, m ;
N
j

distribuiile condiionate ale variabilei Y n funcie de variantele

yj
variabilei factoriale X: Y xi : , i = 1, k , j = 1, m .
n
ij
Pe baza acestor distribuii se calculeaz trei mrimi:
- variana total V 02 ( sau dispersia total 02

V02
), calculat pe baza
N

distribuiei marginale a lui Y cu ajutorul relatiei:


k

V02 y j y 0 nij y j y 0 N j
2

i 1 j 1

unde:

y n
j

y0

n
i

Nj

ij

y N
i

reprezint media distribiiei marginale i:

y n
j

yi

ij

ij

y n
j

Ni

ij

ij

y xi reprezint media condiionat a variabilei Y n funcie

de variantele variabilei factoriale X.


-variana dintre grupe V x2 , exprim variaia lui Y generat de variaia lui X

Vx2 y i y 0 nij y i y 0 N i
i

-variana rezidual Vu2 , care exprim variaia caracteristicii Y generat de


factorii considerai aleatori, exceptnd influena factorului X

Vu2 yi y i nij
i

ntre cele trei mrimi exist urmtoarea relaie:

V02 Vx2 Vu2

Raportnd relaia la V02 se obine contribuia relativ a factorului esenial X

V x2
2
V0

0
i a factorilor ntmpltori u

100

Vu2
2
V0

Vx2
Vu2

100

100
V02
V02
2

la explicarea variaiei totale.

Indicatorul R, raport de corelaie, R

V x2
Vu2
, exprim intensitatea

V02
V02

legturii dintre cele dou variabile.

0 var iabile independen te

corelatie slaba

R [0,1]. Dac R 0,5


corelatie puternica

1 var iabile strict dependente


nainte de a explica variaia lui Y i a interpreta valoare raportului de corelaie
empiric este nevoie s se verifice semnificaia rezultatelor cu ajutorul testului F,
testul Fisher-Snedecor. Rezultatele se consider semnificative dac exist inegalitatea:

Fc F ,v1 ,v2 , unde:


V x2
Fc k 21 reprezint valoarea empiric a variabilei Fisher-Snedecor
Vu
N k

F ,v1 ,v2 , v1 k 1, v2 N k este valoarea teoretic preluat din tabela distribuiei


Fisher-Snedecor.
Pe baza datelor din tabel i a formulelor se trece la calcularea indicatorilor
necesari aplicrii metodei analizei variaiei:
calculul volumului mediu al creditelor ( y A ) i a dispersiei ( A2 ) pentru zona

rural

Tabelul 2
Subgrupe
de
ageni
economici dup
volumul
creditelor
0-40
40-80
80-120
120-160
160-200
200-240

20
60
100
140
180
220

Total

yj

yj a
k

yj a

n1 j
k

y j a

n1 j
k

6
7
10
3
2
2

-2
-1
0
1
2
3

-12
-7
0
3
4
6

24
7
0
3
8
18

30

-6

60

n1 j

Fie k=40, mrimea intervalului de grupare


a=100, mrimea centrului de interval cu frecvena maxim
3

yA

yj a
n1 j
k

ka

1j

6
40 100 92
30

yj a
k n1 j

A2
k2 yA a
n
1j
2

60
2
40 2 92 100 3200 64 3136
30

calculul volumului mediu al creditelor ( y B ) i al dispersiei ( B2 ) pentru zona

urban

Tabelul 3
Subgrupe
de
ageni
economici dup
volumul
creditelor
0-40
40-80
80-120
120-160
160-200
200-240

20
60
100
140
180
220

Total

yj a
k

yj a

n2 j
k

y j a

n2 j
k

8
7
10
20
29
16

-4
-3
-2
-1
0
1

-32
-21
-20
-20
0
16

128
63
40
20
0
16

90

-77

267

n2 j

yj

Fie k=40
a=180

yB

yj a
n2 j
k

k a

2j

77
40 180 145,78
90

yj a
k n2 j

B2
k2 yB a
n2 j
2

267
2
1600 145,78 180 4746,67 1171,01 3575,66
90

calculul volumului mediu al creditelor ( y 0 ) i al dispersiei ( 02 ) pe cele dou

zone

Tabelul 4
Subgrupe
de
ageni
economici dup
volumul
creditelor
0-40
40-80
80-120
120-160
160-200
200-240

20
60
100
140
180
220

Total

yj a
k

yj a

N j
k

y j a

N j
k

14
14
20
23
31
18

-4
-3
-2
-1
0
1

-56
-42
-40
-23
0
18

224
126
80
23
0
18

120

-143

60

Nj

yj

Fie k=40
a=180

y0

yj a
N j
k

k a

143
40 180 132,3
120

yj a
k N j

02
k 2 y0 a
Nj
2

471
2
1600 132.3 180 6280 2275,29 4004,71
120

calculul varianelor
Variana total:

V02 y j y 0 nij y j y 0 N j N 02
i

V 120 4004,71 480565,2


2
0

Variana dintre grupe:

Vx2 y i y 0 N i
2

V 92 132,3 30 145,78 132.3 90 48722,7 16353,936 65076,636


2

2
x

Variana rezidual:

Vu2 y j y i nij i2 N i
i

i 1

Vu2 3136 30 3575,66 90 415889,4

Interpretarea rezultatelor se realizeaz utiliznd tabelul analizei variaiei:

Tabelul 5
Sursa de
variaie

Msura variaiei

Variana
dintre
grupe

Vx2 y i y 0 N i

Variana
rezidual

65046,636

Variana
total

Vu2 y j y i nij

V02 y j y 0 nij
i

sy

Fc

V x2

k 1

Fc

F ,v1 ,v2

s y2
x

2
u

18,45

F0,05;1;118 3,92
F0,01;1;118 6,85

65046,636

415889,4

k 1 1

Valoarea testului F

Dispersia
corectat

Nr.
gradelor de
libertate

N k 118

Vu2
s
N k

2
u

3524,49

N 1 119

480565,2

Deoarece testul Fisher-Snedecor arata c rezultatele obinute nu sunt


ntmpltoare, cu un prag de semnificaie de 1% Fc 18,45 > F0,01;1;118 6,85 , ci
sistematice , se vor calcula contribuia relativ a factorului X-grupe de ageni

V 2
economici dup zon,la explicarea variaiei variabilei Y x2
V0

i raportul de

corelaie empiric R:

Vx2
65046,636
100
100 13,535 0 0
2
480565,2
V0
R

Vx2

V02

65046,636
0,13535 0,368
480565,2

ntruct zona din care provin explic n mic msur variaia total a creditelor
solicitate si acordate, respectiv numai 13,535%, iar raportul de corelaie are de
asemenea o valoare mic, 0,368, rezult c zona nu reprezint un factor important al
volumului de credite solicitate i acordate i, prin urmare, ierarhizarea nu se poate
face n funcie de acest factor. Din acest punct de vedere, banca poate acorda credite
att agenilor economici din zona rural ct i celor din zona urban.

Aplicatia 2
O societate folosete pnze de bomfaier de la doi furnizori. Dup ultima aprovizionare
constat c:
de la furnizorul A a primit 300 de buci din care 40 s-au rupt din prima
sptmn;
de la furnizorul B a primit 700 de buci din care 80 s-au rupt din prima
sptmn.
Denumirea
furnizorului

Calitatea pieselor ( y j )

Total

Stricate

Bune

( Ni )

40

260

300

80

620 ( nij )

700

Total ( N j )

120

880

1000

( xi )

Conducerea societii vrea s tie dac este corect s renune la furnizorul B pe


motivul unei slabe caliti a pieselor.

Rezolvare:
Fundamentarea statistic a deciziilor corecte se poate realiza

prin

sistematizarea datelor din tabel:


unde:

X {xi }, i 1, k variabil independent,


x1 = furnizorul A,

x2 = furnizorul B,
Y { y j }, j 1, m variabil dependent,

y1 = piese stricate,

y2 = piese bune,

nij = frecvenele condiionate ale variabilei Y.


n urma acestei sistematizri a rezultat o serie statistic bidimensional, cu
dou variabile binare X i Y, rezultnd dou distribuii marginale:

x 1
X : 1
300

x2 0
,
700

y 1
Y : 1
120

y2 0

880

si dou distribuii condiionate ale variabilei Y (calitatea pieselor) n funcie de


furnizori:

y 1
y A : 1
40

y2 0
,
260

y 1
y B : 1
80

y2 0
,
620

N i frecvenele marginale ale variabilei X,

N j = frecvenele marginale ale variabilei Y,


N N i N j nij numrul total al observaiilor.
i

Dependena dintre variabilele x i y i luarea deciziei de a renuna la unul


dintre furnizori se face dup analiza atent a distribuiei frecvenelor nij . Se poate
constata unul din urmtoarele trei cazuri:
1. o independen total

nij

Nj
m

ntre cele dou variabile dac nij

Ni
ct i
k

ct ;

2. o dependen strict ntre cele dou variabile, dac nij se distribuie numai pe
diagonala principal a tabelului, realizndu-se o corelare pozitiv ( x1 cu y1 sau x 2
cu y 2 ), sau numai pe diagonala secundar a tabelului, avnd loc o corelare negativ
( x1 cu y 2 sau x 2 cu y1 ), celelalte nij fiind egale cu 0.
3. o dependen statistic dac frecvenele condiionate nij se distribuie n mod
diferit fa de cazurile a) si b).
Observnd datele din tabel, rezult c distribuia frecvenelor condiionate nij
se ncadreaz n cazul c). Aadar, decizia corect poate fi luat pe baza a cel puin trei
procedee statistice.

1. Testul diferenei dintre dou medii

x1 x 2

Dac t c

x2

n1 1

x2

t ,

n2 1

cele 2 medii x 1 i x 2 sunt semnificativ diferite de 0. Dac t c

x1 x 2

2
x1

n1 1

2
x2

t ,

n2 1

atunci x 1 = x 2 .

t = argumentul distribuiei normale pt n 30 sau argumentul distribuiei Student


pentru n 30 .

= pragul de semnificaie cu ajutorul cruia se alege decizia corect. De regul,


0,01 sau 0,05 .
Aplicarea acestui test const n efectuarea urmtoarelor calcule:

calculul procentului mediu al pieselor stricate pe fiecare furnizor:

fA

n11
40

0,1333 13,33 0 0
N1 300

fB

n21
80

0,1143 11,43 0 0
N 2 700

calculul dispersiilor:

A2 f A (1 f A ) 0,1333 (1 0,1333) 0,1155


B2 f B (1 f B ) 0,1143 (1 0,1143) 0,1012

alegerea pragului de semnificaie i preluarea valorii acestuia din tabelul

distribuiei respective
pt 0,05 t 0,05 1,96

comparararea valorii empirice a variabilei t c cu valoarea sa teoretic t 0, 05 :

tc

fA fB

2
A

N1 1

2
B

N2 1

0,1333 0,1143
0,1155 0,1012

299
699

0,019
0,8260
0,023

interpretarea testului:
Deoarece t c =0,83 < t 0,05 1,96 , rezult c ntre calitatea pieselor livrate de

cei doi furnizori, cu o probabilitate de 95%, nu se poate accepta o diferen


semnificativ i deci, nu este corect decizia de a se renuna la furnizorul B pe
motivul unei slabe caliti a pieselor.
9

2. Testul 2
Testul 2 const n compararea unei valori empirice c2 cu o valoare
teoretic 2 ,v , unde:

= pragul de semnificaie
v =(k-1)(m-1)=numrul gradelor de libertate, preluat din tabela distribuiei 2 .
m=numrul de grupe n funcie de Y ( y j , j 1, m )
k=numrul de grupe n funcie de X ( xi , i 1, k )
Pentru =0,05 i v (2 1)(2 1) =1 02,05;1 3,84
Valoarea empiric a c2 se calculeaz folosind relaia:


2
c

ij

nij*
nij*

, unde:

nij =frecvenele reale

nij* =frecvenele teoretice n cazul independenei totale a celor dou variabile xi i


yj

nij*

Ni N j
N

calculul frecvenelor teoretice:

*
n11

N1 N1 300 120

36
N
1000

*
n12

N1 N 2 300 880

264
N
1000

N 2 N1 700 120

84
N
1000
N N
700 880
*
n22
2 2
616
N
1000
*
n21

calculul valorii empirice c2 :


2
c

ij

nij*
nij*

40 36 260 264 80 84 620 616


2

36

264

84

616

Utilizarea testului 2 se bazeaz pe urmtoarele reguli de decizie:


-dac c2 < 2 ,v , rezult c cele dou variabile X i Y sunt independente
-dac c2 2 ,v , rezult c cele dou variabile X i Y nu sunt independente
10

0,7213

interpretarea testului:
Deoarece c2 =0,7213< 2 ,v =3,84, rezult c cele dou variabile sunt

independente, adic calitatea pieselor nu depinde de tipul furnizorului i, decizia de


renunare la furnizorul B nu este justificat.
3. Testul bazat pe coeficientul de asociere al lui Yulle
Acest test se folosete n cazul unei grupri combinate de 2 2 , adic 2
variabile care au 2 variante.
Coeficientul lui Yulle se calculeaz dup relaia:

n11 n22 n12 n21


n11 n22 n12 n21

cu abaterea medie ptratic:

1 2
2

1
1
1
1

n11 n12 n21 n22

Acest coeficient este definit n intervalul 1,1 avnd urmtoarea


semnificaie:

1 corelaie strict negativ,


0 independen ntre variabile,

1 corelaie pozitiv.

calculul coeficientului:

40 620 260 80
0,088
40 620 260 80

1 0,088 2
1
1
1
1

0,496 0,2073 0,1028


2
40 260 80 620
tiind c este o variabil aleatoare, exist dou situaii:

c
t ntre cele dou variabile exist o legtur;

c
t cele dou variabile sunt independente;

c
0,088

0,8560
c
0,1012
, rezult c
t , cele dou variabile sunt independente,

t 0, 05 1,96

iar renunarea la furnizorul B pe motivul unei slabe caliti nu este justificat.


Prin calcularea celor trei tipuri de teste se ajunge la concluzia c renunarea la
produsele oferite de furnizorul B nu este justificat.
11

S-ar putea să vă placă și