Sunteți pe pagina 1din 59

EstadsticaDescriptiva

FacultadCienciasEconmicasyEmpresariales
DepartamentodeEconomaAplicada
Profesor:SantiagodelaFuenteFernndez

1. Seharealizadounestudiosobreelconsumodegas(enm3)enlasviviendasdeunaurbanizacin
duranteelmesdeenero,obtenindoselosdatosquesemuestranenlatabla.
Consumodegas(m3)
50100
100200
200400
400500

Viviendas
10
40
60
10

a) Representeelhistogramadeestadistribucin.
b) Calculeelconsumomediodegasdelasviviendas.Elvalorhalladoesrepresentativodela
distribucin?
c) Calculeelconsumomsfrecuente.
d) Averigeelvalordeltercercuartildeladistribucindelconsumodegasyexpliquesusignificado
e) Silafacturadelgasconsisteenunacantidadfijade20ms0,5porcadam3consumido,calcule
lafacturamediadelasviviendasydeterminesilafacturaesmsdispersaqueelconsumo.
Solucin:
a)
Consumogas

amplitud
ci

densidad
ni

hi

ni
ci

Ni

xi

xi ni

x2i ni

50100

50

10

0,2

10

75

750

56250

100200

100

40

0,4

150

6000

900000

200400

200

60

0,3

300

18000

5400000

400500

100

10

0,1

50
90
110
120

450

4500

2025000

29250

8381250

xi ni

b)Elconsumomediodegasdelasviviendas: a1 x i1

29250
243,75 m3
120

x2i ni

a2 i1

8381250
69843,75 s2 a2 a12 69843,75 (243,75) 2 10429,6875
120

sX 10429,6875 102,1258 m3 C.V

sX 102,1258

0,42 (42%)
x
243,75

Elconsumomediodegasdelasviviendasesde243,75m3,conunadispersindel42%.Conlocual,
elconsumomediodegasnoesmuyrepresentativo.

c)Elconsumomsfrecuenteseencuentraenelintervalomodal[100200),puestoqueesenelque
sealcanzalamximadensidaddefrecuencia.
Md Li

hi hi 1
(hi hi 1 ) (hi hi 1 )

ci 100

0,4 0,2
3
100 166,67 m
(0,4 0,2) (0,4 0,3)

Advirtasequesilaamplituddelosintervalosfueraconstante: Md Li

ni ni 1
(ni ni 1 ) (ni ni 1 )

ci

3. N
Ni1
3. 120
4
d)Eltercercuartil:
90 ,observandoenlacolumna Ni , Q 3 P75 Li
ci ,dedonde:
4
Ni Ni1

Q 3 P75 200

90 50
3
200 333,33 m
110 50

El75%delasviviendasqueconsumenmenos,consumencomomximo333,33m3degas.
e)Segnelenunciadodelapartado,lafacturadelgasvienedadaporlarelacin Y 20 0,5. X ,por
tanto,hayuncambiodeorigenydeescala:
Lafacturamedia: Y 20 0,5. X 20 0,5. 243,75 141,875
s2Y Var(20 0,5.X) 0,52 .s2X s Y 0,5.sX 0,5.102,1258 51,063
C.V

S Y 51,063

0,36 (36%)
y 141,875

Lafacturadelgasestmenosdispersaqueelconsumo.
CAMBIODEORIGENYDEESCALADELAMEDIAYVARIANZA: y a bx
k

yi .ni
i1

(a bxi ). ni
i1

i1

i1

a ni b x i .ni
N

ni
i1

N
2

x .n
i1

abx

E(y) E(a bx) y a b x

Lamediaseveafectadaporelmismocambiodeorigenydeescalaefectuadasobrelavariable.
k

s2y

(yi y) 2 .ni
i 1

(a b xi (a b x) 2 . ni
i1

(b xi b x)2 . ni
i1

b2

(x x) . n
i1

b2 s2x

Var(a b x) b2 . s2x
Lavarianzanoseveafectadaporelcambiodeorigenperosiporelcambiodeescalaefectuadosobre
lavariable.
2. Deunadistribucinbidimensional(X,Y)sesabequealaumentarlosvaloresdeXaumentanlosde
Y.SehaobtenidolarectaderegresinlinealmnimocuadrticadeYsobreXysehacomprobado
quelavarianzaresidual,Sry2valecero.Setienenademslosvaloresdelossiguientesmomentos
respectoalorigen:

a10 2

a20 40

a01 10

a02 125

a) DeterminelavarianzadebidaalaregresinenlarectadeY/Xyelvalordelacovarianza.
b) SehaceuncambiodevariabledelaformaX=2X.Siseobtienelanuevarectaderegresinde
Y/X,serbuenoelajuste?Razonesurespuesta.
c) SedecidecambiarlafuncindeajustedeYsobreXporunaconstante,Y=c.Utilizandoelmtodo
demnimoscuadrados,determineelvalordeestaconstanteparanuestrocaso.
Solucin:
2
2
2
s a a 40 2 36
a)LasvarianzasdelasvariablesXeY,respectivamente,son: 2x 20 210
2
s y a02 a01 125 10 25

Siendo sry2 s2y (1 R2 ) 0 1 R2 0 R2 1 ,existeunadependenciafuncional,elajustees


perfecto.
Paracalcularlacovarianza sxy tenemosencuentaque

R2 b . b'

sxy sxy
.
1 s2xy s2x . s2y 36 . 25 900 s xy 900 30
s2x s2y

b)Elcoeficientededeterminacin R2 esinvarianteanteuncambiodeorigenydeescala,conloque
labondaddelajusteseridntico.
c) E(y) E(c) y c

INVARIABILIDADDELCOEFICIENTEDECORRELACINLINEALR2: X' k X

CAMBIODEORIGEN:

CAMBIODEESCALA:

a'10 x ' E(X') E(k X) kE(X) k x

a'10 x ' E(X') E(m X) m E(X) m x

a'11 E(X'Y) E (m X)Y E(mY) E(X Y) m y a11

a'11 E(X'Y) E(k X Y) kE(X Y) ka11

s x'y a'11 x 'y m y a11 (m x) y a11 x y s xy

sx'y a'11 x 'y ka11 k x y k(a11 x y) ksxy

a'20 s Var (m X) s

a'20 s2x' Var (k X) k 2 Var(X) k2 s2x

2
x'

s x'y
s

2
x'

s xy
s

2
x

R'2 c . c'

c'

2
x

s x'y
s

2
y

s xy
s

2
y

s xy sxy
s2xy
.

R2
2
2
2
2
sx s y sx . s y

s x'y
s

2
x'

ksxy
2 2
x

k s

R'2 c . c'

c'

s x'y
s

2
y

ks xy
s2y

ksxy ksxy
s2xy
.

R2
2 2
2
2
2
k sx s y
sx . sy

ElcoeficientededeterminacinR2esinvarianteanteuncambiodeorigenydeescala
3. AbelGrandesPistadopreguntasus31compaerosdeclasequcalificacinobtuvieronenel
ltimoexamendeestadstica.Slorecuerdaquelaprobconlanotamedianade5,6667ysu
tocayoEscasiLopasatuvoun4,6(unadelasnotasmsfrecuenteshabidas).Y,haciendomemoria,
hapodidocompletarlossiguientesdatos:

Notade
estadstica
04
45
57
79
910

Nmerode
alumnos
8
n2
n3
6
6

Calcule:
a) Quproporcindealumnoshaobtenidounanotasuperiora5?Cmoesladistribucin
respectoalamoda?
b) EstudieladispersinrelativadelasnotasapartirdelcoeficientedevariacindePearson.
Interpretelosresultados.
c) Cmoafectaalahomogeneidaddeladistribucinqueesteexamenseaun60porcientodela
calificacinfinal?
d) Comente,conbaseestadstica,elgradodeconcentracindelasnotasdeesteexamen.
Solucin:

a)
ni
ci

Ni

4
1

2
8
n2 6 h2 6

8
14

2
2
1

n3 6 h3 3
3
6
6
6
32

20
26
32

L i L i1

amplitud

04
45
57
79
910

ci

ni

hi

Ni
%
N
25
43,75
62,50
81,25
100
212,5

Ui
% pi qi %
UN

xi

xi .ni

Ui x i . ni

x2i .ni

2
4,5

16
27

16
43

32
121,5

8,70
23,37

16,30
20,38

6
8
9,5

36
48
57
184

79
127
184

216
384
541,5
1295

42,93
69,02
100

19,57
12,23
000
68,48

pi

i 1

qi

Sabemosque, Me 5,6667 y Md 4 ,6
Parahallar n2 y n3 ,podemosrecurriralamodaoalamediana,asaber.
Lamodaaproximadacuandoexistendistintasamplitudes: Md Li
4,60 4

hi 1
hi 1 hi 1

ci

h3
1,2
1 h3
3 n3 h3 .c3 3.2 6
2 h3
0,4

siendo, N 32 8 n2 6 6 6 n2 32 26 6
N
Ni1
Lamediana Me Li 2
ci
Ni Ni1

32
(8 n2 )
8 n2
2
2 n2 6
5,6667 5
2 0,6
n3
(8 n2 n3 ) (8 n2 )

12n2

N 32 20 n2 n3 n3 32 26 6

Laproporcindealumnosqueobtienenunanotasuperiora5.Ladistribucinrespectoalamoda.
p

xi 5
666
n n n
. 100 3 4 5 .100
.100 56,25 %

32
32
N

Ladistribucinesbimodal,puestoque h2 h5 6
b)DispersinrelativadelasnotasapartirdelcoeficientedevariacindePearson.Interpretarlos
resultados.
5

a1 x

xi ni
i 1

184
5,75 a2
32

x2i ni
i 1

1295
40,46875
32

s2x a2 a12 40,46875 5,752 7,40625 sx 7,40625 2,72


C.V

sx 2,72

0,4730 (47,30%) ,ladispersinesdel47,30%,esdecir,unadispersinmedia.


x 5,75

c)Lahomogeneidaddeladistribucin,cuandoelexamenesun60%delacalificacinfinal.
5

CAMBIODEESCALADELCOEFICIENTEDEVARIACINDEPEARSONC.V: y k . x
E(y) E(k . x) k . E(x) k . x
Var (y) Var (k . x) k .Var(x) k . s
2

2
x

s y k . s k . sx
2

2
x

C.Vy

k . sx sx
C.VX
k.x
x

ElCoeficientedeVariacindePearsonesinvarianteanteuncambiodeescala.

C.Vfinal

s final 2. s x

0,4730 (47,30%)
xfinal 2 . x

d)Gradodeconcentracindelasnotasdeesteexamen.
5 1

ElndicedeconcentracindeGini: IG

(pi qi )
i 1
5 1

pi

68,48
0,32 (32 %)
212,5

i 1

Laconcentracinesmediobaja.

4. Sehanobtenidolassiguientesexpresionesparalasrectasderegresinmnimocuadrticasdeuna
variablebidimensional(X,Y),dondeXeselgastomensualenocioeYelgastomensualen
transportedeungrupodeamigos:
Y 4X 2

Y 2X 10

Sabiendoademsquelacovarianzaentreambasvariables sxy 60 .Sepide:


a)IdentifiqueculeslarectaderegresindeY/XydeX/Y.
b)Interpreteloscoeficientesdelasrectasderegresin.
c)Porcentajedevariabilidadexplicadaynoexplicadaporlarecta.
d)CalculelavarianzaresidualenlaregresinY/X.Coincidirconlavarianzaresidualenlaregresin
X/Y?Justifiquesurespuesta.
Solucin:
a) RectaderegresinY/X: Y 2X 10 ,pendiente b 2

RectaderegresinX/Y: Y 4 X 2 4 X Y 2 X

1
1
1
Y ,pendiente b'
4
2
4

Laotraopcinnopuedeocurrir:
RectaderegresinY/X: Y 4 X 2
RectaderegresinX/Y: Y 2X 10 2X Y 10 X

1
Y5
2

puestoque R2 b . b' 4 .

1
2 cuandosesabeque 0 R2 1
2

b) Comolasdospendientessonpositivas(2y1/4),larectaderegresindeY/Xtienemayor

pendienteenvalorabsolutoqueladeX/Y
c) Elcoeficientededeterminacinlineal R2 b . b' 2 .

1 1
0,5
4 2

LarectaderegresindeYsobreXexplicael50%delavariabilidaddelavariabledependienteyel
otro50%esnoexplicado.
s xy

60
2
b s2 2 s2 sx 30

x
x
d)
b' s xy 1 60 s2 240
y

s2y
4 s2y

sry2 s2x .(1 R2 ) sry2 30 . (1 0,5) 15


Lasvarianzasresiduales: 2
2
2
2
srx s y .(1 R ) srx 240 . (1 0,5) 120

5. Sabiendoque x 3 , s2x 6 , s2y 8 yquelarectaderegresindeYsobreXes y 4 0,667. x

ObtenerlarectaderegresindeXsobreY.
Solucin:
y 4 0,667. x 4 0,667. 3 2

s xy s xy
Y/X: y 4 0,667. x
b 0,667 s2 6 s xy 0,667 . 6 4

x
sxy 4

0,5
b' 2
sy
8
X/Y: x a' b'y
x a' b' y 3 a' 0,5 . 2 a' 4

x 4 0,5 . y

6. HallarlarectaderegresindeYsobreXsabiendoque x 4,1 , y 2,3 ylarectapasaporel


punto (5,9 , 3,5)
Solucin:
y a b x 2,3 a 4,1 . b
Y/X: y a b x
por pasar por (5,9 , 3,5) 3,5 a 5,9 . b

a 4,1 . b 2,3

a 5,9 . b 3,5

1,2

0,667
b
1,8

a 2,3 4,1 . 0,667 0,435

y 0,435 0,667. x

7. Latablamuestralacomprensinlectora(X)dedosgruposdeindividuoseducadosenniveles
socioculturalesaltos(A)ybajos(B).

Intervalos
06
713
1420
2127
2834

nA
4
6
9
12
9

nB
4
7
9
8
2

Siapartirdelapuntuacin X 19 seconsideraunacomprensinlectorabuena.Sepide:
a)Porcentajedepersonasencadagrupoconunabuenacomprensinlectora.
b)EntrequvaloresdecomprensinlectoraestarlaquintapartecentraldelGrupoA?
c)EntrequvaloresdecomprensindelGrupoBseencuentranlos12centrales?
d)Culdelosdosgrupospresentamayorvariabilidad?
Solucin:

a)Advirtasequelosintervalossoncerrados,sedebenexpresarabiertosaladerechaconextremos
reales:
Intervalos

ci

nA

NA

x.nA

0,56,5
6,513,5
13,520,5
20,527,5
27,534,5

3
10
17
24
31

7
7
7
7
7

4
6
9
12
9

4
10
19
31
40

12
60
153
288
279
792

x 2 .nA
36
600
2601
6912
8649
18798

nB

NB

x.nB

4
7
9
8
2

4
11
20
28
30

12
70
153
192
62
489

x 2 .nB
36
700
2601
4608
1922
9867

Secalculaelordenkdelpercentilqueesiguala19.
Estedaelporcentajedelaspersonasquetienenmenosde19puntos.Larespuestasersudiferencia
hasta100.

EnelGrupoA:
k . 40
10
7 . (0,4 . k 10)
100
Pk 19 13,5
. 7 19 13,5
19 10
9

49,5 2,8 . k 70
k 119,5 / 2,8 42,68

El57,32% 100 42,68 57,32 tieneunabuenacomprensinlectoraenelGrupoA.

EnelGrupoB:
k . 30
11
7 . (0,3 . k 11)
Pk 19 13,5 100
. 7 19 13,5
20 11
9

49,5 2,1 . k 77
k 126,5 / 2,1 60,24

El39,76% 100 60,24 39,76 tieneunabuenacomprensinlectoraenelGrupoB.


Enconsecuencia,elGrupoAtieneunamejorcomprensinlectora.
b)Laquintaparterepresentael20%.Conrelacinalcentro(50%),cubrirndesdeel40%al60%,se
tendrquecalcularelPercentil40yelPercentil60deladistribucindecomprensinlectoradel
GrupoA.

P40

P60

40 . 40
10
16 10
100
13,5
. 7 13,5
. 7 18,17
19 10
19 10
60 . 40
19
24 19
100
20,5
. 7 20,5
. 7 23,42
31 19
31 19

LaquintapartecentraldelGrupoAseencuentraentrelosvalores[18,1723,42]
c)Los12valoresrepresentael(12 / 30 40%) .Conrelacinalcentro(50%),cubrirndesdeel30%al
70%,teniendoquecalcularelPercentil30yelPercentil70deladistribucindecomprensin
lectoradelGrupoB.

P30

P70

30 . 30
4
94
6,5 100
. 7 6,5
. 7 11,5
11 4
11 4
70 . 30
20
21 20
20,5 100
. 7 20,5
. 7 21,375
28 20
28 20

Los12centralesvalorescentralesdecomprensindelGrupoBseencuentranentre
[11,521,375]
d)Mayorvariabilidadtendraquelgrupoqueposeamayordispersinentresusvalores,esdecir,si
lamediaaritmticaesrepresentativadelasobservaciones(noexistenvaloresextremos
exageradamentedistanciadosdelamayora).
ElestadsticomsadecuadoparamedirlavariabilidadrelativaentredosserieseselCoeficientede
VariacindePearson,entendiendoqueunvalormayorindicamenorhomogeneidad,unvalor
menorreflejamenordispersinovariabilidad.
xA

792
19,8
40

s2A

18798
19,82 77,91
40

sA
9

77,91 8,83

xB

489
16,3
30

CVA

sB2

9867
16,32 63,21
30

8,83
. 100 44,59%
19,8

CVB

sB

63,21 7,95

7,95
. 100 48,77%
16,3

ElGrupoBpresentamayorvariabilidadrelativa,encontradeloobtenidocomparandola
desviacintpica.
8. Apartirdelatablaadjunta,dondeN 11 , Y 0

X\Y
0
1

2
0
3

0
1
n22
1

1
0
n23
0

a)Sonindependienteslasvariablesestadsticamente?
b)RectasderegresindeY/XeX/Y
c)QupartedelavarianzacalculadaYesexplicadaporlaregresin?Quparteesdebidaa
causasajenas?.
Solucin:

a)
X\Y

ni

0
1

0
3
0

0
n23
0
n23

2
n j

1
n22
1
2 n22

Deotraparte, Y

3 n22 n23
1
5 n22 n23 11

2 . 3 0 n23
0 n23 6
11

5 n22 6 11 n22 0
X\Y

ni

0
1
2
n j

0
3
0

1
0
1

0
6
0

1
9
1

11

LasvariablesXeYsonindependientes
n n n
cuandoseverifica ij i j i, j
N N N

Nosonindependientesporquenoseverificalarelacin:

10

n
1
1
2
n n2
x

12 1

11 11 11 N N N

b)
3 3

x i y j nij

a11 i1 j1

1
2 . 1. 3 1 . 1. 6 0
11

x i ni

x i ni
2

1.9 0 2.1
a10 x i1

1 a20 i1
N
11
N
13
2
2
2
s2x a20 a10
1
sx
0,43
11
11
11
3

a01 y

y j n j
j1

s2y a02 a201

0 a02

18
18
0
sy
11
11

y j n j

1 2
13
1 . 9 22 . 1
11
11

j1

1
18
(2)2 . 3 12 . 6
11
11

18
1,28
11

covarianza: sxy a11 a10 . a01 0 1 . 0 0

ElcoeficientederegresindeYsobreX(pendientedelarecta): b

sxy
s

2
x

0
0
2 / 11

Y a b X 0 a 0 . 1 a 0
Y / X : Y 0

ElcoeficientederegresindeXsobreY(pendientedelarecta): b'

sxy
s

2
Y

0
0
18 / 11

X a' b' Y 1 a' 0 . 0 a' 1


X / Y : X 1
COEFICIENTEDETERMINACIN: r2 b . b' 0 Lasrectassonperpendiculares,yen
consecuencia,lasvariables(X,Y)sonINCORRELADAS
VARIANZARESIDUALDEY: sry2 s2y (1 r2 ) sry2
s2y s2Y explicada sr2Y

18
18
s2Y explicada

11
11

18
18
(1 0)
11
11

s2Y explicada 0

11

9. Lavariable X tiene x 4 y s2x 1 .DeterminarelcoeficientedevariacindePearsondelas


variables:

(X 3)
2

(X 2)
3

Solucin:

3 1
1
1
3 1 3
E(W) E 2 2 X 2 2 . E(X) w 2 2 . x 2

2
Var (W) Var 3 1 X 1 . Var(X) 1 . s2 s 1 . s 1
x
W
x
2 2 2

4
2
2

C.Vw

sw 1 / 2

1
w 1/2

2 1
1
2
2 1 2
E(Z) E 3 3 X 3 3 . E(X) z 3 3 . x 3

2
Var (Z) Var 2 1 X 1 . Var(X) 1 . s2 s 1 . s 1
x
z
x
3 3 3
9
3
3

C.Vz

sz 1 / 3 1

z 2/3 2

COEFICIENTEDEVARIACINDEPEARSON:CAMBIODEORIGENYDEESCALA
E(Y) E (a b . X) a b . E(X) a b . X

Var (Y) Var a b . X b2 . Var(X) b2 . s2x s y b . s x

C.Vy

b . sx
sx

a
a b.X
X
b

ElCoeficientedeVariacindePearsonseencuentraafectadoanteuncambiodeorigen.

12

10. Si s y sx yr 0 LarectaderegresinY/XtienemayorpendientequeladeX/Y?
Solucin:

RELACINENTRELOSCOEFICIENTESDEREGRESINYCORRELACIN
b

sxy

b'
r

sxy b . s2x

2
x

s
s xy
s

s xy b . s2y

2
y

s xy
sx . sy

s xy r. sx . s y

Si s y sx , r 0 r.

sy
sx

r.

sx
sy

b . s2x r. sx . s y b r. y

sx

s

b' . s2y r. s x . s y b' r. x

sy

b b'

11. SeandosvariablesXeY,tipificadaseincorreladas.EscribirlarectaderegresindeYsobreX
Solucin:
x 0 sx 1
Porser(X,Y)variablestipificadas:
y 0 sy 1
b 0
Porser(X,Y)variablesincorreladas: sxy 0
r2 0
b'
0

y a b. x a y 0
Y/X: y a b . x
b0

Y/X: y 0
12. Enunaregresinlineallasvarianzaexplicadaporlaregresinyresidualsoniguales.Cunto
valeelcoeficientededeterminacin?.
Solucin:
2
s2y sry2 sRy
2sry2

r 1
2

sry2
s

2
y

r 1
2

sry2

1 1
1
2sry
2 2

13

Sea y i elvalortericoquecorresponderaalarectaderegresindeYsobreX y i a b . x i ,
elevandoalcuadradoladescomposicin (y i y) (yi y i ) (y i y) :
(yi y)2 (yi y i ) (y i y) (yi y i )2 (y i y)2 2 (yi y i ) (y i y)

seobservaque,
(y i y i ).(y i y ) (yi a bx i ).(a bx i y )
a (yi a bx i ) b x i (y i a bx i ) y (y i a bx i )

suma
cuadrados total

(yi y )

suma cuadrados
residual

DividiendoporN:

(yi y i)

suma cuadrados
explicada

2
(y i y )

2
2
2
(yi y )
(yi y i )
(y i y )

N
N
N

2
2
2
sy
sry
sRy

2
s2y sry2 sRy

2
por s2y :
Dividiendolaexpresin s2y sry2 sRy

2
s2y sry2 sRy

r2

sry2 s2y (1 r2 )
2
s s

1 Ry2 2
sry2
s s

r
1

y
s2y

2
ry
2
y

2
s2y . r2
sRy

13. Determinarsisoncoherenteslosdatos:

a) N 100 , x 5 , y 8 , s2x 12,5 , s2y 70 , r2 0,9


b)Lasumaderesiduosalcuadradocorrespondientesaunadelasposiblesrectasderegresin
vale100
Solucin:

Solosontiles: N 100 , s2x 12,5 , s2y 70 , r2 0,9 , (yi y i )2 100


sry2

2
2
(yi y i ) 100
(x i x i ) 100

1 srx2

1
N
100
N
100

Deotraparte,
Y/X: sry2 s2y (1 r2 ) sry2 70 (1 0,9) 7 1

Nosoncoherentes.

X/Y: srx2 s2x (1 r2 ) srx2 12,5 (1 0,9) 1,25 1


14

Nosoncoherentes.

14. Dadalasiguientedistribucin:

xi

10

15

20

25

ni

a)Calcularlamediaarmnica,geomtricayaritmtica
b)Calcularlavarianza,desviacintpicaycoeficientedevariacindePearson
c)HallarlamediaaritmticayladesviacintpicadelavariableXtipificada
d)Mediantelatransformacin y

x 15
,hallarlamedia,varianzaydesviacintpica
5

Solucin:

a)
xi

10

15

20

25

ni

23

x i ni

15

70

75

60

125

345

ni

xi

125

10000000

759375

8000

9765625

7,415771484.1025

ni
xi

0,6

0,7

0,3333

0,15

0,2

1,9833

x 2i ni

75

700

1125

1200

3125

6225

xA

N
N
23

11,597
5 n
n1 n2 n3 n4 n5 1,9833
i

i1 x i
x1 x 2 x 3 x 4 x 5
5

xG 23 xni i 23 xn11 . xn22 . xn33 . xn44 . xn55 23 7,415771484.1025 13,329


i 1

x i ni

a1 x i1

345
15
23

Larelacinentrelasdiferentesmediases: xA xG x
5

2
x i ni

6225
270,652 s2x a2 a12 270,652 152 45,652
N
23
sx 45,652 6,76

b) a2 i1

CVx

s x 6,76

0,45 [45%dedispersindelosdatos]
x
15

15

c)LavariableXtipifica: zi
xi

10

15

20

25

ni

1,479

0,740

0,740

1,479

4,438

5,178

2,219

7,396

z ni

6,565

3,830

1,641

10,941

23

yi

yi ni

10

y 2i ni

12

20

42

xi x
sx

zi

zi ni
2
i

xi x
sx

zi ni

i1

zi ni
Toda variable tipificada tiene
0
23
0 s2z i1
(z)2 0 1
23
N
23
media 0 y varianza 1

d)Conlatransformacin y
5

yi ni

y i1

23

x 15
5
5

y i ni
2

0
0 s2y i1
23
N

(y)2

42
42
0
1,826 s y
23
23

Nosonnecesarioslosclculos,seconoce:
1
15

x 15 1
y E 5 5 E x 3 3 5 x 3 5 0

x 15 1
1
45,652
s2y Var
2 Var x s2x
1,826

25
25

5 5

16

42
1,35
23

15. Anaacudeconsuhijoalaconsultadeunodontlogoparacuatrorestauracionesdentarais,
observandoqueeldoctoraplicabacantidadesdecementodeionmerosdevidrioconflory
composite(Y,engramos)conformealosdimetrosdeperforacindecadapiezadental(X,en
milmetros)comosereflejaacontinuacin:

X\Y
03
35
510

01

13
1

36

610

1
1

Sepide:
a)Sonindependientesestadsticamenteambasvariables?.Razonelarespuesta.
b)CalculelasrectasderegresindeY/XeX/Y.Interpretarlosresultados.
c)Qupartedelavarianzadelasperforacioneshabidas(X)esexplicadaporlacantidadde
ionmerosdevidrioconsumida(Y)?Qupartenoesexplicada?.
Solucin:

a)LasvariablesXeYsonindependientescuandoseverifica

X\Y

0,5

4,5

ni

x i ni

x 2i ni

1
2
1

1,5
8
7,5

2,25
32
56,25

17

90,5

1,5
4
7,5
n j

y j n j

0,50

4,50

15

0,25

20,25

64

88,5

2
j

y n j

Lasvariablesnosonindependientes:

n12
N

n n
i j i, j
N N N

nij

1 n1 n2 1 1



4 N N 44

3 4

x i y j nij

b) a11 i1 j1

1
1,5 . 2 . 1 4 . 0,5 . 1 4 . 4,5 . 1 7,5 . 8 . 1 20,75
4

x i ni

a10 x i1

2
x i ni

17
4,25 a20 i1
4
N

2
s2x a20 a10
22,625 4,252 4,5625 sx

a01 y

y j n j
j1

15
3,75 a02
4

y j n j

90,5
22,625
4

4,5625 2,136

j1

17

88,5
22,125
4

s2y a02 a201 22,125 3,752 8,0625 s y

8,0625 2,84

covarianza: sxy a11 a10 . a01 20,75 4,25 . 3,75 4,8125

ElcoeficientederegresindeYsobreX(pendientedelarecta): b

sxy
s

2
x

4,8125
1,055
4,5625

Y a b X 3,75 a 1,055 . 4,25 a 0,734


Y / X : Y 0,734 1,055 X

ElcoeficientederegresindeXsobreY(pendientedelarecta): b'

sxy
s

2
Y

4,8125
0,597
8,0625

X a' b' Y 4,25 a' 0,597 . 3,75 a' 2,011


X / Y : X 2,011 0,597 Y
c)COEFICIENTEDETERMINACIN: r2 b . b' 1,055 . 0,597 0,6298
VARIANZARESIDUALDEX: srx2 s2x (1 r2 ) srx2 4,5625 (1 0,6298) 1,689 NOEXPLICADA
s2x

srx2

varianza residual
no explicada

2
sRx

sRx s x srx
2

varianza regresin
explicada

18

2
sRx
8,0625 1,689 6,3735 EXPLICADA

16. Elsalariomediomensualencientosdeeurosde160obrerossedistribuyedelasiguienteforma:

Intervalos
ni

48
3

812
12

1216
40

1620
47

2024
32

2428
13

2832
9

3236
4

a)Mediaaritmtica,mediana,modaypercentil75.
b)CoeficientedeasimetradeFisher.
c)Realizarunaredistribucinenlaquelosintervalostenganunaamplitudde8,yconestosnuevos
intervaloscalcularlamediaaritmticayelcoeficientedevariacindePearson.Compararlos
resultadosobtenidosenelapartado(a)
Solucin:

a)
Intervalos
xi

48

812

1216

1620

2024

2428

2832

3236

10

14

18

22

26

30

34

ni

12

40

47

32

13

Ni

15

55

102

134

147

156

160

hi ni / ci

0,75

10

11,75

3,25

2,25

40

x i . ni

18

120

560

846

704

338

270

136

2992

(x i x)

12,7

8,7

4,7

0,7

3,3

7,3

11,3

15,3

(x i x) ni

38,1

104,4

188

32,9

105,6

94,9

101,7

61,2

(x i x)2 ni

483,87

908,28

883,6

23,03

348,48

692,77

1149,21

936,36

5425,60

(x i x)3 ni

6145,149

x i . ni

a1 x i1

Md L i

7902,036 4152,92 16,121 1149,984 5057,221 12986,073

160

14326,308 15303,36

N
Ni1
80 55
2992

18,7 Me L i 2
ci Me 16
. 4 18,13
160
Ni Ni1
102 55
hi hi 1

(hi hi 1 ) (hi hi 1 )

ci Md 16

Severificalarelacin x Me Md

11,75 10
. 4 17,27
(11,75 10) (11,75 8)

Distribucinasimtricaaladerechaopositiva

Advirtasequeparacalcularlamoda,cuandolaamplituddelosintervalosesigual,paratrabajarcon
unaescalamspequea,sepuedeemplearlaexpresin:
Md L i

ni ni 1
(ni ni 1 ) (ni ni 1 )

ci Md 16

47 40
. 4 17,27
(47 40) (47 32)

75 N
Ni1
120 102
P75 Li 100
ci Q 3 P75 20
. 4 22,25
Ni Ni1
134 102
19

g1 0 Asimetra a la derecha o positiva


m3
b)CoeficientedeasimetradeFisher: g1 3 g1 0 Simetra
s
g1 0 Asimetra ala izquierda o negativa
8

2
(x i x) .ni

m2 s2 i1

5425,60
33,91 (varianza) s
160

33,91 5,82 (desviacin tpica)

3
(x i x) . ni

m3 i1

g1

15303,36
95,65
160

m3 95,65

0,485 0
s3 5,823

Distribucinasimtricaaladerechaopositiva.

c)
Intervalos
xi

412
8

1220
16

2028
24

2836
32

ni

15

87

45

13

160

x i . ni

120

1392

1080

416

3008

960

22272

25920

13312

62464

2
i

x . ni
4

x i . ni

a1 x i1

CV

2
x i . ni

3008
18,8 a2 i1
160
N

62464
390,4 s2x a2 a12 390,4 18,82 36,96
160

36,96
sx

0,32 (32%dedispersindelosdatos)
x
18,8

Lamediaaritmticacambia,sehatransformadoladistribucindedatos.

20

17. Ladistribucindesalariosdeunaempresaeslasiguiente:

Salario(euros)
30005000
10002000
50009000
20003000

Empleados
25
100
5
50

a)Estudiarlaconcentracindesalarios
b)Quporcentajedeempleadospercibeel50%delossalarios?
c)Laempresacomopolticacomercialanalizasubirlossalariosatodoslosempleados,conun
incrementodel10%,obienconunaumentode200eurosporempleado.Culdelasdos
opcionesseramsequitativa?
d)Culeslaconcentracindesalariossielnmerodeempleadoshubierasidoeldoble?
Solucin:

a)LaconcentracindesalariosseanalizamedianteelndicedeGini,quenovaramediante
cambiosdeescala(subidaporcentualdel10%alosempleados)mientrasquequedamodificado
concambiosdeorigen(subidalinealde200eurosacadaempleado).
Ordenandolossalariosenformacreciente:
Salarios

xi

ni

Ni

x i ni

10002000
20003000
30005000
50009000

1500
2500
4000
7000

100
50
25
5

100
150
175
180

150000
125000
100000
35000
410000

ui xi n i
acumulada
150000
275000
375000
410000

Ni
.100
N
55,56
x
83,33
97,22
100
236,11

% pi

% qi

ui
.100
uk

36,59
50
67,07
91,46
100
195,12

qi

195,12
IG 1 i31 1
0,174 (concentracindesalariosdel17,4%)
236,11
pi
i1

b)Enlatablaseobservaqueel55,56%delosempleadospercibeel36,59%delossalarios,yel
83,33%delosempleadospercibeel67,07%delossalarios.Enconsecuencia,el50%delossalarios
estardistribuidoentreunconjuntodeempleadossituadoentreel55,56yel83,33%.
Bajolahiptesisdelinealidad,seestablecelarelacindeporcentajes:
27,77 . 13,41
67,07 36,59 50 36,59
30,48
13,41

x 55,56

x 67,78%
83,33 55,56 x 55,56
27,77 x 55,56
30,48

21

c)
SUBIDADESALARIOSDEL10%Cambiodeescalaenlossalarios
x'i 1,1. xi

ni

Ni

x'i ni

1650
2750
4400
7700

100
50
25
5

100
150
175
180

165000
137500
110000
38500
451000

u'i x'i n i
acumulada
165000
302500
412500
451000

% pi

Ni
.100
N

% q'i

55,56
83,33
97,22
100
236,11

u'i
.100
uk'

36,59
67,07
91,46
100
195,12

qi

195,12
0,174 (concentracindesalariosdel17,4%)
IG 1 i31 1
236,11
pi
i1

Advirtaseque: q'i

ui .1,1 ui
qi
uk .1,1 uk

Conunasubidadel10%acadaempleado,laequidistribucinnovara.
ElcambiodeescalaenlossalariosnoafectaalndicedeGini,propiedadconocidacomoPrincipio
delaRentarelativa.
SUBIDALINEALDESALARIOSDE200EUROSCambiodeorigenenlossalarios
x 'i 200 x i

ni

Ni

x'i ni

1700
2700
4200
7200

100
50
25
5

100
150
175
180

170000
135000
105000
36000
446000

u'i x'i n i
acumulada
170000
305000
410000
446000

% pi

Ni
.100
N

55,56
83,33
97,22
100
236,11

% q'i

u'i
.100
uk'

38,12
68,39
91,93
100
198,43

qi

IG 1 i31

pi

198,43
0,16 (concentracindesalariosdel16%)
236,11

i1

Conunasubidalinealde200eurosacadaempleado,laequidistribucindesalariosesms
equitativa.
Siporelcontrariolaempresahubierarebajado50eurosacadaempleado,laequidistribucinde
salariosseramenosequitativa.
ElcambiodeorigenenlossalariosafectaalndicedeGini,propiedadconocidacomoPrincipiode
Dalton.

22

d)Concentracinsalariossielnmerodeempleadoshubierasidoeldoble:
SUBIDALINEALDEEMPLEADOSCambiodeescalaenlaPoblacin
n'i

xi
1500
2500
4000
7000

2 ni

200
100
50
10
360

N'i

xi n'i

200
300
350
360

300000
250000
200000
70000
820000

u'i xi n'i
acumulada
300000
550000
750000
820000

%p'i

N'
i .100
N

% q'i

55,56
83,33
97,22
100,00
236,11

u'i
.100
uk'

36,59
67,07
91,46
100,00
195,12

qi

195,12
IG 1 i31 1
0,174 (concentracindesalariosdel17,4%)
236,11
p
i
i1

ElcambiodeescalaenlapoblacinnoafectaalndicedeGini,propiedadconocidacomo
PrincipiodelaPoblacin.Esdecir,eltamaodelapoblacinnoimporta,loqueinteresasonlas
proporcionesdeindividuosdelapoblacinquepercibendiferentesnivelesdesalario.
18. Dadalatabladecorrelacin:

X\Y
1
0
1

1
2
2
1

0
1
4
0

1
2
2
1

Estudiarlaindependenciaestadstica,calcularlasrectasderegresinylacorrelacinentreambas
variables.
Solucin:

a)
X\Y

ni

x i .ni

x 2i . ni

1
0
1
n j

2
2
1

1
4
0

2
2
1

5
8
2

5
0
2

5
0
2

N 15

y j . n j

10

2
j

y . n j

LasvariablesXeYsonindependientescuandoseverifica

n n
i j i, j
N N N

nij

Sialgunadelasfrecuenciasabsolutasesiguala0nosonindependientesestadsticamente:

23

n32 n3 n2
0
2 5

.
.
N
N N
15 15 15

3 3

x i . y j .nij

a11 i1 j1

N
3

x i ni

a10 x

i1

1
1.(1). 2 1. 1. 2 1. (1). 1 1. 1. 1 0
15
3

x i ni 7
3
7
6
1
1
2

a20 i1

s2x a20 a10


15
5
N
15
15 5 25

a01 y

y j n j
j1

0 a02

y j n j

j1

10
10
10
s2Y a02 a201
0
15
15
15

b 0
Rectas regresin perpendiculares
1
sxy a11 a10 . a01 0 . 0 0
r2 0
5
b' 0
variables INCORRELADAS

Rectasderegresin:
y a b. x a y 0
Y/X: y a b . x
y0
b0

0,2
x a' b' . y a' x
X/Y: x a' b' . y
5
b' 0

x 0,2

19. LavariableestadsticaXtiene x 2 , s x 1 .Determinarlamediaaritmtica,lavarianzayel


X 1
coeficientedevariacindePearsonde Y
2
Solucin:

1 1
1
1
1 1 1
E(Y) E 2 2 X 2 2 . E(X) y 2 2 . x 2

2
Var (Y) Var 1 1 X 1 . Var(X) 1 . s2 s 1 . s 1
x
Y
x
2 2 2
4
2
2

C.VY

sY 1 / 2

1
y 1/2

24

20. Lavarianzaexplicadaporunaregresinlinealsimpleeseldobledelavarianzaresidual,Cunto
valeelcoeficientededeterminacin?
Solucin:
2
sRy
2sry2

2
s2y sry2 sRy
3 sry2

s s (1 r ) r 1
2
ry

2
y

sry2
s

2
y

sry2

1 2
1
3s
3 3
2
ry

21. Dadaladistribucin:

xi

10

ni

a)CalculaloscoeficientesdeasimetradePearsonydeFisher,coeficientedecurtosis.
b)Siendolavariable X

Y 1
,hallaloscoeficientesdeasimetradePearsonyFisherdelavariableY
2

c)TienenelmismocoeficientedeVariacindePearsonlasdosvariables?
c)CalculaelcoeficientedecurtosisdelasvariablesXeY
Solucin:

a)
xi

ni

Ni

x i .ni

xi x

(x i x)2

(x i x)2 . ni

(x i x)3 . ni

(x i x)4 . ni

2
4
8
10

3
4
1
2
10

3
7
8
10

6
16
8
20
50

3
1
3
5

9
1
9
25

27
4
9
50
90

81
4
27
250
192

243
4
81
1250
1578

x i . ni

x i1

2
(x i x) . ni

50
5 Mex 4 Mdx 4 s2x i1
10

CoeficienteasimetradePearson: APx

90
9 sx 9 3
10

x Mdx 5 4

0,33 0 asimetra a la derecha o positiva


sx
3
4

3
(x i x) . ni

CoeficientedeasimetradeFisher: m3x i1
g1x

192
19,2 s3x 33 27
10

m3x 19,2

0,71 0 asimetra a la derecha o positiva


s3x
27
25

4
(x i x) . ni

Coeficientedecurtosis: m4x i1
g2x

1578
157,8 s4x 34 81
10

m4x
157,8
3
3 1,05 0 menor apuntamiento que la normal (PLATICRTICA)
4
sx
81

b) Y 1 2X
LoscoeficientesdeasimetradePearsonydeFishersoninvariantesanteuncambiodeorigenyde
escalay,enconsecuencia,ladistribucinYpresenta:
APy 0,33 0 asimetra a la derecha o positiva
g1y 0,71 0 asimetra a la derecha o positiva
Haciendolasoperaciones:
yi

ni

Ni

y i .ni

yi y

(y i y)2

(y i y)2 . ni

(yi y)3 . ni

(yi y)4 . ni

5
9
17
21

3
4
1
2
10

3
7
8
10

15
36
17
42
110

6
2
6
10

36
4
36
100

108
16
36
200
360

648
32
216
2000
1536

3888
64
1296
20000
25248

yi . ni

y i1

2
(y i y) . ni

110
11 Mey 9 Mdy 9 s2y i1
10

CoeficienteasimetradePearson: APy

y Mdy
sy

360
36 s y 36 6
10

11 9
0,33 0 asimetra a la derecha o positiva
6

3
(yi y) . ni

CoeficientedeasimetradeFisher: m3y i1

g1y

m3y
s

3
y

1536
153,6 s3y 63 216
10

153,6
0,71 0 asimetra a la derecha o positiva
216

c)ElcoeficientedevariacindePearsonesinvarianteanteuncambiodeescala (Y 2X) perono


2sx
anteuncambiodeorigen (Y 1 2X) .Enestecaso: CVy
.Notienen,portanto,elmismo
12x
coeficientedevariacin.
CoeficientedevariacindePearsondeX: CVx

sx 3
0,6 (60% de dispersin de los datos)
x 5

26

CoeficientedevariacindePearsondeY: CVy

2.sx
6
0,54 (54% de dispersin de los datos)
1 x 11

d)Elcoeficientedecurtosisoapuntamientoesinvarianteanteuncambiodeorigenydeescala
(Y 1 2X) y,enconsecuencia:
g2y 1,05 0 menor apuntamiento que la normal (PLATICRTICA)
4

4
(y i y) . ni 25248
i1

2524,8 s4y 64 1296


Haciendooperaciones: m4y
N
10

g2y

m4y
s

4
y

2524,8
3 1,05 0 menor apuntamiento que la normal (PLATICRTICA)
1296

27

PARCIALILLO22DEFEBRERO2013
1.Seharealizadounestudioentre100mujeresmayoresde25aos,observndoseelnmerode
hijosdelasmismas.Elresultadohasido:

Nmerodehijos (x i )
0
1
2
3
4
5
6

Nmerodemujeres (ni )
13
20
25
20
11
7
4

a)Calcularelnmeromediodehijos,lamediana,lamodayeltercercuartil
b)Culeselnmeromximodehijosquetieneel70%delasmujeresquemenoshijostienen?
c)CalcularelcoeficientedevariacindePearson
d)CalcularelcoeficientedeasimetradeFisheryelcoeficientedecurtosis
Solucin:

a)
xi

ni

Ni

0
1
2
3
4
5
6

13
20
25
20
11
7
4
100

13
33
58
78
89
96
100

7550

fi =

ni
N

Fi =

0,13
0,20
0,25
0,20
0,11
0,07
0,04
1,0

Ni
N

0,13
0,33
0,58
0,78
0,89
0,96
1

x i ni

(x i x)

(x i x) 2

(x i x) 2 ni

(x i x) 3 ni

(x i x) 4 ni

0
20
50
60
44
35
24
233

2,33
1,33
0,33
0,67
1,67
2,67
3,67

5,43
1,77
0,11
0,45
2,79
7,13
13,47

70,58
35,38
2,72
8,98
30,68
49,90
53,88
252,11

164,44
47,05
0,90
6,02
51,23
133,24
197,72
175,82

383,15
62,58
0,30
4,03
85,56
355,75
725,65
1617,01

Mediaaritmtica: x

xi ni
i1

233
2,33
100

Mediana: Me 2 (pasadelamitad50%) Md 2 (n3 25, el ms grande)

100. 3

75 : Q 3 3 hijos (F4 pasa del 75%)


3Cuartil
4

28

b)Elnmeromximodehijosquetieneel70%delasmujeresquemenoshijostieneneselDecil7
(Percentil70)
Decil7Percentil70:3hijos (F4 pasa de 0,7)
7

c)Varianza: m2 s 2

x x 2 ni
i1

Desviacintpica: s

252,11
2,5211 hijos 2
100

2,5211 1,59 hijos

CoeficientedeVariacindePearson: C.V

S 1,59

0,6824 una dispersin del 68,24%


x 2,33

d)CoeficientedeasimetradeFisher:
1 7
(x i x) 3 ni 1,76
m3 N i1

0,4378 0 Asimetra a la derecha o positiva


g 1 3
s
s3
1,59 3

Coeficientedecurtosis:

g 2

m4
3
s4

1
N

(x i x) 4 ni
i1

16,17
3 0,47 0 PLATICRTICA
1,59 4

2.Lossalariosdelosempleadosdelacadenadeproduccindeunaempresasedistribuyensegnla
tablaadjunta:
Salarios
Nempleados

1020
12000

2040
6000

4050
1000

50100
800

100200
200

Quporcentajedeempleadosquepercibeel50%delossalarios?Esequilibradaladistribucinde
salarios?

Solucin:
Salarios
[L i L i+1 )

xi

ni

Ni

x i ni

1020

15

12000

12000

180000

acumulada
180000

2040
4050
50100
100200

30
45
75
150

6000
1000
800
200

18000
19000
19800
20000

180000
45000
60000
30000

360000
405000
465000
495000

ni 20000
i1

ui = x i n i

Ni
.100
N
60
x
90
95
99
100

%pi =

x i ni 495000

pi 344

i1

i1

29

% qi =

ui
.100
uk

36,36
50
72,73
81,82
93,94
100
4

qi 284,85
i1

Enlatablaseobservaqueel60%delosempleadospercibeel36,36%delossalariosyqueel90%
delosempleadospercibeel72,73%delossalarios.Paraestimarelporcentaje(x)deempleadosque
percibeel50%delossalariossenecesitarealizarunainterpolacinlineal:
x 60
90 60

50 36,36
72,73 36,36

x 60
90 60

13,64
36,37

x 71,25%

qi

IG 1 i41

pi

284,85
0,17
344

i1

Laconcentracinespequea,pudiendoconcluirqueladistribucindesalariosesequilibrada.

3.Sealadistribucinbidimensional,dondelasvariablesXeYsonestadsticamenteindependientes.
X\Y
1
2
Sepide:

3
3
2

4
c
6

a)Calcularlasmediasyvarianzasmarginales.
b)Hallarlacovarianzaylasrectasderegresin.

Solucin:
X\Y
1
2
nj

ni

3
3
2

4
c
6

3c
8

6c

11 c

Porserindependientes:

c
c
c
18
x

(3 c).(6 c) c.(11 c) c 9
11 c 3 c 6 c
2

30

nij
N

ni n j
.
i, j
N N

MEDIASYVARIANZASMARGINALES:

X\Y
1
2
nj

3
3
2

4
9
6

ni

15

20

12
8

MARGINALDELAVARIABLEX:
2

a10 x

xi ni
i1

x 2i ni

1
1
1 . 12 2 . 8 1,4 a20 i1
12 . 12 22 . 8 2,2
20
N
20

2
s2x a20 a10
2,2 1,42 0,24

MARGINALDELAVARIABLEY:
2

a01 y

y n
j

j1

1
3 . 5 4 . 15 3,75 a02
20

y
j1

2
j

nj

1 2
3 . 5 42 . 15 14,25
20

s2y a02 a201 14,25 3,752 0,1875

b)covarianza: sxy a11 a10 a01

a11

X\Y
1
2
nj

X\Y
1
2
n j

3
3
2

4
9
6

ni

15

20

12
8

x y n
i1 j1

ij

1.3.3 1.4.9 2.3.2 2.4.6 105

5,25
20
30

sxy a11 a10 a01 5,25 1,4 . 3,75 0


Sincalcularlacovarianza,seconocaquelacovarianza sxy 0 porser(X,Y)variablesindependientes.
Si (X,Y) independientes
Si sxy 0

s XY 0
(X,Y) No son independientes

Porotraparte,seconocequeenlasrectasderegresin:

Y/X: Y a bX
X/Y: X a' b'Y

Loscoeficientesderegresinrespectivos(b,b')dependendelacovarianza sxy ,dadoquevienen


expresados: b

sxy
s

2
x

, b'

sxy
s2y

31

Si sxy 0 b 0 , b' 0
Y /X: Y a
Conlocual,lasrectasderegresinsolicitadasson:
X / Y : X a'

Loscoeficientesrespectivos(a,a')secalculanteniendoencuenta:
recta regresin Y/X

Y / X : Y a bX Y a bX 3,75 a 0 x 1,4 a 3,75


Y 3,75
recta regresin X/Y

X / Y : X a' b'Y X a' b'Y 1,4 a' 0 x 3,75 a' 1,4


X 1,4
Advirtasequecuandolasvariables(X,Y)sonindependientes,lacovarianza sxy 0
Enconsecuencia:

Lascoeficientesderegresin b 0 , b' 0
LarectaderegresindeY/X: Y Y 3,75
LarectaderegresindeX/Y: X X 1,4
Elcoeficientededeterminacin r2 b . b' 0 ,esdecir,lasdosrectassonperpendicularesylas
variablessonINCORRELADADAS.

Si (X,Y) independientes

s XY 0

4.Enunadistribucinbidimensionalseconoce:
r 0,7
Obtener:

sx 1,2

y 4

X / Y : X 0,6 0,44 Y

a)RectaderegresindeY/X
b)VarianzadeY

Solucin:
a) RectaderegresindeXsobreY:
a' 0,6 , b' 0,44
X 0,6 0,44 Y
X 0,6 0,44 Y X 0,6 0,44. 4 2,36

Deotraparte,elcoeficientededeterminacinr2:
r2 b . b' 0,72 b . 0,44 b

0,72
1,114
0,44

32

b0

b' 0

r2 0

LarectaderegresindeYsobreX: Y a bX Y a bX 4 a 1,114 . 2,36 a 1,37


Y/X: Y 1,37 1,114 X
b)VarianzadelaY:Sabemosque, sx 1,2
b

sxy
s

2
x

1,114

sxy
1,22

b' 0,44

b 1,114

sxy 1,114 . 1,22 1,604

33

EXAMENDEESTADSTICADESCRIPTIVA

GRADOENECONOMA14deMayo2013
1. Unainstitucinpblicadecidiestudiarelgastomensualenalimentacinenunaciudad,paralo
cualseseleccionundistritoysetommuestrascuyoresultadofueelquesigue:
Distrito1
Gasto($)
NFamilias
100200
24
200300
36
300400
20
400500
20
5001000
50
a) Halleelgastomedioyelmedianoenalimentacindeldistrito
b) Siexisteunsegundodistritode120familiasconungastomediode419,4$yunadesviacin
tpicade242,701$,culdelosdostieneungastomediomsrepresentativo?
c) Halleelgastomedioyladesviacintpicadelconjuntodelosdosdistritos.
d) Culeselniveldegastorealizadoporunmayornmerodefamiliaseneldistrito1?
e) Culeselmximogastorealizadoentrelas50familiasconmenorgastodeldistrito1?
f) UnndicedeGinide0,10enestadistribucinqunosindicara?

Solucin:
a)
[L i L i1 )

xi

ni

100200
200300
300400
400500
5001000

150
250
350
450
750

24
36
20
20
50
150

x i .ni

x2i .ni

3600
540000
9000 2250000
7000 2450000
9000 4050000
37500 28125000
66100 37415000

Ni
24
60
80
100
150

ni
N
0,16
0,24
0,13
0,13
0,33

fi

Ni
N
0,16
0,40
0,53
0,66
1

Fi

ci

di

100
100
100
100
500

x n
i

66100
440,67$
N
150
ElGastomedianoseencuentraenelintervalo 300 400
Gastomedio: x

i1

N
150
Ni1
60
75 60
150

Mediana
ci 300 2
100 300
100 375 $
75 : Me L i 2
Ni Ni1
80 60
80 60
2

ni

34

ni
ci

0,24
0,36
0,2
0,2
0,1

b)ElcoeficientedevariacindePearsonmideelgradodehomogeneidaddeunadistribucin
5

x 2i ni

37415000
s2x a2 x 2 i1
x2
440,672 55243,28
N
150

Distrito1
s x 55243,28 235,04

s x 235,04
0,5334 (55,34%)
CVx
x 440,67

s y 242,701
y 419,4

Distrito2
s y 242,701
CV

0,5787 (57,87%)
x

y
419,4

AltenerelDistrito1unCoeficientedeVariacindePearsonmspequeo(menordispersindel
gastomedio)indicaquetieneunamediamsrepresentativaqueelDistrito2.
c) Elgastomedioydesviacintpicaconjuntadelosdosdistritos:
Distrito2:
(Y ; n2 120 , y 419,4 , s y 242,701)

Distrito1:
(X ; n1 150 , x 440,67 , sx 235,04)
N n1 n2 150 120 270
_______

xy

n1 x n2 y 150 . 440,67 120 . 419,4

431,22 mediaponderada
n1 n2
150 120
media ponderada
de las
varianzas
parciales

varianza ponderada
de las
medias parciales

varianza
total

s2x1 x2

s2i ni
i1

intragrupos

(x x) n
2

i1

entregrupos

media ponderada
de las
varianzas
parciales

s n
2
i

i1

n1 s2x n2 s2y
n1 n2

150 . 235,042 120 . 242,7012


56870,45
150 120

varianza ponderada
de las
medias parciales

(x x) n
i1

(440,67 431,22)2 . 150 (419,4 431,22)2 . 120


111,71
270

35

varianza total

s2x y

56870,45 111,71 56982,16

sx y

56982,16 238,71

d) Elintervalomodales 200 300 portenermayordensidaddefrecuencia d2 0,36


Md L i

(d i d i1 )
(d i d i1 ) (d i d i1 )

c i Modaaproximada: Md L i

Intervalo 200 300 : Md 200

Modaaproximada: Md L i

d i1
d i1 d i1

ci

(0,36 0,24)
100 242,86 $
(0,36 0,24) (0,36 0,2)

d i 1
d i1 d i1

c i 200

0,2
100 245,45 $
0,24 0,2

e) Mximogastorealizadoentrelas50familiasconmenorgastodeldistrito1
33,33 . N
Ni1
50

100
ci
150 0,33 (33,33%) P33,33 Li
Ni Ni1

ni

33,33 . 150
Ni1
50 24
100
P33,33 L i
ci 200
100 272,22 $
Ni Ni1
60 24

ni

f) UnndicedeGinide0,10,alserprximoacero,indicaqueelgastoseencuentrabastantebien
repartidoentrelasfamilias.

2. Seharealizadounestudioparadeterminarlarectaderegresinqueexpliqueelgastodiariode
losclientesdelhotel(Y,medidaen)enfuncindelaedaddelosmismos(X,medidaenaos).
TrasanalizarlosdatossehaobtenidolasiguienterectaderegresinY/X:
Y 25 2,9 X
a) Interpretelosresultadosdelarectaderegresin.
b) Sisesabeque sx 10 yque s y 30 ,determinelabondaddelajustedeestarectade
regresinapartirdelcoeficientedecorrelacinlinealeinterprtela.
c) CalculelosparmetrosdelaregresindeXsobreYsabiendoquelamediadeedaddelos
clientesesde30aos.
d) Culseralaedadesperadaparaunhuspedquehagastadodiariamente100euros?La
prediccinserfiable?.Razonelarespuesta.

Solucin:
a) 29eselcoeficientederegresinlineal.AlserpositivocuandoXcrece,Ycreceeindicaelaumento
degastodeunclientecuandosuedadaumentaenunaunidad.
36

25euroseselvalordeYparaX=0aos.Enestecasonotienesentido.
b) Labondaddelajustevienedadoporelcoeficientededeterminacin:
s
a 25
b xy2 sxy b . s2x s xy 2,9 . 102 290
Y/X: Y 25 2,9 X
sx
b 2,9
Coeficientedeterminacin: r2 b . b'

s2xy
s2x . s2y

2902
0,934
102 . 302

Larelacinlinealesbastantebuenayaqueel93,4%delavariabilidaddeYseexplicaapartirdesu
dependenciaconlavariableX.
c) x 30 y 25 2,9 . x y 25 2,9 . 30 112 Y 25 2,9 X

r2
0,934
b'
0,322
b'
X a' b' Y
b
2,9
x a' b' y
30 a' 0,322 . 112 a' 6,064

RectaderegresindeX/Y: X a' b' Y X 6,064 0,322 . Y


d)Edadesperadaparaunhuspedconungastodiariode100euros
X / Y : para Y 100 X 6,064 0,322 . 100 26,136 euros

Laprediccinesconunafiabilidaddel93,4% (r2 0,934)

3. Unsectordelaeconomanacionaldisponedelvalordeproduccinaprecioscorrientesdecada
ao(milesdeeuros)ylosndicesdepreciosdeLaspeyresyFisher.

Ao
2007
2008
2009
2010
2011
2012

Produccin
(precioscorrientes)
78.147
91.357
88.854
92.892
101.336
102.578

Lp(%)

Fp(%)

100
104,22
107,25
109,05
114,87
126,35

100
105,34
108,94
111,36
117,67
130,18

Utilizandoeldeflactormsidneo,calcularlaproduccinanualenpreciosconstantesde2007.

Solucin:
Paracalcularelvalorreal(preciosconstantes)deunamagnitudserequieredeflactarelvalornominal
(precioscorrientes),eliminandolainfluenciaquehanexperimentadolosprecios.Paraello,sedeflacta
laseriedividiendoelvalornominalentreunndicedeprecios.
37

(precios corrientes)

VtN
Valor Nominal
R
Valor Real
Vt = t . 100
ndice Precios
Ip,0
(precios constantes)

EldeflactormsadecuadoeseldePaasche,yaqueconstendicedepreciosseobtieneunarelacin
entrevaloresmonetarioscorrientesyvaloresmonetariosconstantes.
n

ndicedePaasche: Pp

pit . qit
i 1
n

pi0 . qit

VtR

i 1

VtN

Pp

pit .qit
i1
n

pit .qit

pi0 .qit
i1

i1
n

pi0 .qit
i1

ElndicedepreciosdeFisher Fp Lp .Pp Pp

(Fp )2
Lp

Ao

Produccin
(precioscorrientes)
VtN

%Lp

%Fp

2007
2008
2009
2010
2011
2012

78.147
91.357
88.854
92.892
101.336
102.578

100
104,22
107,25
109,05
114,87
126,35

100
105,34
108,94
111,36
117,67
130,18

38

%Pp

(Fp )
Lp

100
106,47
110,66
113,72
120,54
134,13

Produccin
(preciosconstantes2007)
VtN
R
Vt
Pp
78147
85803,75
80297,04
81685,61
84069,58
76478,78

4. Enlatablaadjuntasereflejanlasventastrimestralesdeunaempresaenmillonesdeeuros.Halle
laseriedesestacionalizadaporelmtododelasmediasmviles.
Trimestres\Aos
Primero
Segundo
Tercero
Cuarto

2008
2
2
3
3

2009
3
4
5
4

2010
2
4
5
4

2011
4
5
7
3

2012
5
6
8
5

Solucin:
Seobtienenlasmediasmvilesdetamao4(perododelasvariacionesestacionales),quealserun
nmeropar,serndescentradasycorrespondernalosperodosintermediosentrecadados
trimestresconsecutivos:
Y1 Y2 Y3 Y4 2 2 3 3

2,5
4
4
Y Y4 Y5 Y6 3 3 3 4
Y4 ,5 3

3,25
4
4

Y Y Y Y
3568
Y17,5 16 17 18 19
5,5
4
4

Y2 Y3 Y4 Y5 2 3 3 3

2,75
4
4
Y Y Y Y
334 5
Y5,5 4 5 6 7
3,75
4
4

Y Y Y Y
5685
Y18,5 17 18 19 20
6
4
4

Y2,5

SERIEDESCENTRADA
Trimestres\Aos
PrimeroSegundo
SegundoTercero
TerceroCuarto
CuartoPrimero

2008

2,5
2,75
3,25

Y3,5

2009
3,75
4
3,75
3,75

2010
3,75
3,75
4,25
4,5

2011
5
4,75
5
5,25

2012
5,5
6

Paracorregirlanuevaseriedemvilesdescentrada,apartirdeellasecalculalamediaaritmticade
cadadosvaloressucesivos,asignandoestenuevovaloralinstantecentraldelosdosperiodos
considerados,esdecir:
Y2,5 Y3,5

2,5 2,75
2,625
2
2

Y Y
5,25 5,5
5,375
Y17 16,5 17,5
2
2
Y3

Y3,5 Y4,5

2,75 3,25
3
2
2

Y Y
5,5 6
5,75
Y18 17,,5 18,5
2
2
Y4

SERIECENTRADA:COMPONENTESTENDENCIAYCCLICA
Trimestres\Aos
2008
2009
2010
Primero

3,5
3,750
Segundo

3,875
3,750
Tercero
2,625
3,875
4
Cuarto
3
3,750
4,375

2011
4,750
4,875
4,875
5,125

Lalneaqueunelospuntos Y3 , Y4 , , Y18 setomacomolneadetendencia.


39

2012
5,375
5,750

Elinconvenientequepresentaelmtododelasmediasmvilesesquenopermiteefectuar
predicciones,puestoqueconlnoseobtienelaexpresindeunafrmulamatemticaquefacilite
obtenerelvalordelatendenciaparauninstantefuturo.
Estemotivohacequeelmtodoseutilicepocoparadeterminarlatendencia,aunquesseutilizaen
elclculodelosndicesdevariacinestacional(IVE).
Alaplicarelmtododelasmediasmviles,enelesquemamultiplicativo Yit = Tit .Eit .Cit .A it ,loque
realmenteseobtieneesunaaproximacinde Tit .Cit (componentestendenciaycclica),quedandosin
analizarlascomponentesestacional( Eit )yaccidental (Ait ).
Latendencia Tit ylacomponentecclica Cit seeliminarndividiendocadadatodelaserieoriginal Yit
porlacorrespondientemediamvil:

Yit
Tit .Cit

Trimestres\Aos
Primero
Segundo
Tercero
Cuarto

Tit .Eit .Cit .A it


Tit .Cit

2008

3/2,625
3/3

= Eit .A it quedandolacomponenteestacionalyaccidental

2009
3/3,5
4/3,875
5/3,875
4/3,75

COMPONENTESESTACIONALYACCIDENTAL
Trimestres\Aos
2008
2009
Primero

0,857
Segundo

1,032
Tercero
1,143
1,290
Cuarto
1
1,067

2010
2/3,75
4/3,75
5/4
4/4,375

2011
4/4,75
5/4,875
7/4,875
3/5,125

2012
5/5,375
6/5,75

2010
0,533
1,067
1,250
0,914

2011
0,842
1,026
1,436
0,585

2012
0,930
1,043

ElndiceBrutodeVariacinEstacional(IBVE)secalculaeliminandolacomponenteaccidental A i t .
Paraello,sehaceelclculodelasmediasaritmticastrimestrales,esdecir,lamediaaritmticade
cadafiladelatablaanterior(dondesoloaparecaelproductode Ei t . A i t ):
0,857 0,533 0,842 0,930
0,791
4
1,143 + 1,290 + 1,250 + 1,436
= 1,280
4

Trim\Aos
Primero
Segundo
Tercero
Cuarto

1,032 + 1,067 + 1,026 + 1,043


= 1,042
4
1 + 1,067 + 0,914 + 0,585
= 0,892
4

COMP.ESTACIONALYACCIDENTAL
2008
2009
2010
2011
2012

0,857 0,533 0,842 0,930

1,032 1,067 1,026 1,043


1,143 1,290 1,250 1,436

1
1,067 0,914 0,585

COMPONENTEESTACIONAL
IBVE
%IVE
(0,791 / 1,001) . 100 78,990
0,791
(1,042 / 1,001) . 100 104,095
1,042
(1,280 / 1,001) . 100 127,847
1,280
(0,892 / 1,001) . 100 89,067
0,892
1,001

40

400

IBVE

4,004
1,001
4

Advirtasequelosndicesdevariacinestacional(IVE)tienenquesumar4(400%)
Sobreunnivelmediodeventas,lainfluenciadelavariacinestacional (% IVE 100) produce:
1Trimestre:
2Trimestre:
3Trimestre:
4Trimestre:

(78,990 100) 21,01%


(104,095 100) 4,095 %
(127,847 100) 27,847 %
(89,067 100) 10,933 %

descensodeventasdel21,01%
aumentodeventasdel4,095%
aumentodeventasdel27,847%
descensodeventasdel10,933%

LaDESESTACIONALIZACIN(aplicandoelmtodoalaraznalamediamvil)consisteendividircada
valordelaserieoriginalporcadandicedeVariacinEstacionalcorrespondiente,enporcentaje
Yit
.100
% IVEt

Trimestres\Aos
2008
2009
2010
2011
2012
(3/78,99).100
(2/78,99).100
(4/78,99).100
(5/78,99).100
Primero
(2/78,99).100
(2/104,095).100 (4/104,095).100 (4/104,095).100 (5/104,095).100 (6/104,095).100
Segundo
(3/127,847).100 (5/127,847).100 (5/127,847).100 (7/127,847).100 (8/127,847).100
Tercero
(3/89,067).100 (4/89,067).100 (4/89,067).100 (3/89,067).100 (5/89,067).100
Cuarto
SERIEDESESTACIONALIZADA
Trimestres\Aos
2008
Primero
2,532
Segundo
1,921
Tercero
2,347
Cuarto
3,368

2009
3,798
3,843
3,911
4,491

2010
2,532
3,843
3,911
4,491

41

2011
5,064
4,803
5,475
3,368

2012
6,330
5,764
6,257
5,614

EXAMENDEESTADSTICADESCRIPTIVA

GRADOENECONOMA21deJunio2013

1.Enunafbricatrabajan20.000personasenlacadenadeproduccin,cuyossalarios,enmilesde
euros,sedistribuyensegnlatablaadjunta:
Salarios
Ntrabajadores

1020
12.000

4050
1.000

2040
6.000

50100
800

100200
200

a) Determineelgradodeconcentracindelossalarios
b) Qupartedelanminapercibeel5%delpersonalmejorpagado?
c) Quporcentajedelostrabajadorespercibeel50%delossalarios?
d) Silaempresahaceunareestructuracindel60%deplantillaencadaunodelostramosdelos
salarios,culseraelndicedeGini?

Solucin:
a) Ordenandolosdatosdeformacreciente:

Salarios

xi

ni

Ni

xi ni

1020

15

12000

12000

180000

2040
4050
50100
100200

30
45
75
150

6000
1000
800
200

18000
19000
19800
20000

180000
45000
60000
30000

%pi

Ni
.100
N

60
x
90
95
99

344

Ui x i n i
acumulada
180000
360000
405000
465000
495000

%qi

Ui
.100
Uk

36,36
50
72,73
81,82
93,94

284,85

ndicedeGini: IG 1

q
i 1
5

p
i 1

284,85
0,1719 (17,19%)
344

b) Comenzandoporlossalariosmsbajos,seobservaqueel81,82%delossalarios,espercibidopor
el95%delaplantilla.Enconsecuencia,el5%delpersonalmejorpagadopercibeel18,18%
c) Seobservaqueel60%delostrabajadorespercibeel36,36%delossalarios,mientrasqueel90%
delostrabajadorespercibeel72,73%delossalarios.Paraestimarelporcentajexde
trabajadoresquepercibeel50%delossalarios,serealizaunainterpolacinlineal:
42

90 60
x 60

x 71,25 %
72,73 36,36 50 36,36

d) ElndicedeGinitienequesercoherenteconelPrincipiodelaPoblacin,esdecir,elndicedeGini
novariacuandoelconjuntodeindividuosconlamismarentasemultiplicanporunescalar.
Enconsecuencia,silaempresahaceunamodificacindelaplantilladel60%entodoslostramos
desalarioselndicedeGinitienequeserelmismo: IG 0,1719

2. Dadalatabladecorrelacin:
X\Y
1
2

0
1
4

3
5
4

6
2
1

a) Hallarlasrectasderegresinmnimocuadrticasasociadas.
b) HallarlavarianzaexplicadaporlaregresinylavarianzaresidualdelarectaY/X,explicandolos
resultados.

Solucin:
a) Seefectanlosclculosnecesariosparaobtenerlosmomentosrespectoalorigen:
X\Y

ni

x i ni

x 2i ni

1
2

1
4

5
4

2
1

8
9

8
18

8
36

n j

17

26

44

y j n j

27

18

45

y 2j n j

81

108

189

a10 x

xi ni

26

1,53
17

i1

a20

a01 y
2

a11

j1

i1

45

2,65
17

a02

2
i

ni

N
3

y n
j

y
j1

2
i

n j

x i y j nij

44
2,59
17

189

11,12
17

0
0

15
24

63

2
s2x a20 a10
2,59 1,532 0,25

s2y a02 a201 11,12 2,652 4,1

x y n
i1 j1

ij

63
3,71
17

sxy a11 a10 . a01 3,71 1,53 . 2,65 0,34

43

12
12

sxy 0,34

1,36
b 2
RectaregresinY/X: Y a b X
sx
0,25
y a b x a y b x 2,65 1,36 . 1,53 4,73

Y/X: Y 4,73 1,36 X


s xy 0,34

0,083
b' 2
sy
4,1
RectaregresinX/Y: X a' b' Y
x a' b' y a' x b' y 1,53 0,083 . 2,65 1,75

X/Y: X 1,75 0,083 Y


b) Coeficientededeterminacin: r2 b . b' ( 1,36). ( 0,083) 0,1129
VarianzaresidualdeY: sr2y s2y (1 r2 ) 4,1 (1 0,1129) 3,637
s2y sR2 y sr2y sR2 y s2y sr2y 4,1 3,637 0,463
Varianzaexplicadaporlaregresin:
sR2 y s2y . r2 4,1 . 0,1129 0,463

LamayorpartedelavariabledependienteYresultaserresidual,un

3,637
. 100 88,7% .
4,1

Enconsecuencia,unapequeapartequedaexplicadaporlaregresin:
r2 . 100 0,1129 . 100 11,29%

(0,463 / 4,1) . 100 11,29%

Alserlavarianzaexplicadamuypequea,elajustenoesbuenoylasrectasderegresinnopueden
utilizarsedemanerafiableparahacerpredicciones.

44

3.Untrabajadorharecibidolossiguientessalariosenlosaos2005y2006:
Salario2005=18.565eurosSalario2006=19.005euros
Estapersonaquieresabersisupoderadquisitivohaaumentadoenelao2006respectoal2005.Para
ellodisponedelasiguienteinformacinrelativaalndicedePreciosdeConsumoconbaseelao2002
2006
IPC2005
2002 109,93 %e IPC2002 113,63 %

a) Interpreteelvalordelosnmerosndiceproporcionados
b) Determineeinterpretelatasadevariacinquehasufridoelpoderadquisitivodeesteasalariado
entrelosaos2005y2006,entrminosnominalesyentrminosreales(constantesdel2002)

c) Sielsalariodeltrabajadorenelao2002fuede16.000euros,culfuelatasamediaanual
acumulativaentrminosnominalesyreales(constantesdel2002)enelperiodo20022006?
Solucin:
a)

IPC2005
2002 = 109,93% Enelao 2005losprecios se hanincrementado un9,93% respecto alao 2002
IPC2006
2002 = 113,63% Enelao 2006 losprecios se hanincrementado un13,63% respecto alao 2002
b)Paracalcularelsalarioreal(preciosconstantes)serequieredeflactarelsalarionominal(precios
corrientes),eliminandolainfluenciaquehanexperimentadolosprecios.Paraello,sedeflactalaserie
dividiendoelvalornominalentreelIPC
corriente
cons tante SN2005
18565
precios corrientes

16888,02 euros
precios constantes
SR2005
2005

IPC2002
1,0993
Salario nominal

Salario real =

t
corriente
IPC2002
SRcons tante SN2006 19005 16725,34 euros
6
2006
1,1363
IPC200
2002

19005
2006
Nominal: TV2005 18665 1 . 100 2,37%

Tasasdevariacin
16725,34
2006
Real:

1 . 100 0,963%
TV2005

16888,02
Entrminosnominaleselsalariohacrecidoun2,37%,aunqueentrminosreales(eliminadoelefecto
delainflacin),elsalariohadisminuidoun0,963%.
c) Latasamediaanualacumulativaentrminosnominalesyreales(constantesdel2002)enel
periodo20022006
corriente

SN2006
19005
I

1,1878
salario nominal
SN2002
16000


cons tante
SR2006
16725,34
I

1,0453
salario real

SR2002
16000

45

Tasadevariacinmediaanualentrminosnominales:

TM nominal

I salario nominal 1

1,1878 1 1,04396 1 0,4396 (4,396%)

Tasadevariacinmediaanualentrminosreales:

TM real 4 I salario real 1

1,0453 1 1,0111 1 0,111 (1,11%)

4. Tras analizar los datos referentes a un ao y medio (desde 2004.1 hasta 2005.2) de una
determinada serie temporal (Y), de periodicidad trimestral, se han obtenido los siguientes
resultadoscont=0,1,,5:
t = 15

= 55

ty

= 71.950

= 19.073

2
t

= 97.199.705

Losndicesdevariacinestacionaleshansido:
IVE1 = 1,033

IVE2 = 0,87

IVE3 = 0,97

IVE4 = 1,127

a) Realiceunajustelinealdelatendenciadelaserie.Determineapartirdelcoeficientede
determinacinlinealsielajusteesbuenoomalo,ypredigaelvalordelaserieparaeltercery
cuartotrimestredelao2005.
b) InterpreteestadsticamentelosIVEs

Solucin:
s ty

b 2
a)RectaderegresindeYsobret: Y a b.t
st
a y b t

yt

15
2,5
t
N
6

19073

3178,83
y
N
6
t 1

i1

a11

ty
t 1

N
6

s ty a11 t . y 11991,67 2,5 . 3178,83 4044,59 s2t

t
i1

71950
11991,67
6

t2

55
2,52 2,92
6

4044,59

1385,13
b
conloque, Y = 283,99 + 1385,13.t
2,92
a 3178,83 1385,13 . 2,5 283,99

ElCoeficientededeterminacinlineal: R2 b . b'
6

b'

s ty
s

2
y

s2y

y
t 1

2
t

y2

97199705
3178,832 6094990,66
6
46

b'

4044,59
0,00066
6094990,66

R2 b . b' 1385,13 . 0,00066 0,914


Elmodeloesbuenoporqueexplicael91,4%( R2 = 0,914 )delavariabilidaddeYtenfuncindet.
Parapredecireltercer(t 6) ycuartotrimestre(t 7) de2005: Y = 283,99 + 1385,13.t
2005.3: Y = 283,99 + 1385,13 . 6 = 8026,79
2005.4: Y = 283,99 + 1385,13 . 7 = 9411,92
Enelesquemamultiplicativo Yit = Tit . Eit . Cit . A it Yit = Tit . IVEh (h t)
= T2005.3 . IVE3 = 8026,79 . 0,97 = 7785,99
Y
Yit = Tit . IVEh 2005.3
Y2005.4 = T2005.4 . IVE4 = 9411,92 . 1,127 = 10607,23

b) Losndicesdevariacinestacionalmuestranelcomponenteestacionalenelesquema
multiplicativo.Elcomponenteestacional Eit sonlasoscilacionesquesufreunaserietemporalen
periodosinferioresoigualesaunao.
IVE1 = 1,033

IVE2 = 0,87

IVE3 = 0,97

IVE4 = 1,127

IVE1 = 1,033 significaqueporelhechodeestarenelprimertrimestre,lavariable Yit esun3,3%


mayorqueelcomportamientohabitualotendenciadelaserie.
IVE2 = 0,87 significaqueporelhechodeestarenelsegundotrimestre,lavariable Yit esun13%
menorqueelcomportamientohabitualotendenciadelaserie.

47

.4

EXAMENDEESTADSTICADESCRIPTIVA

EXAMENDEESTADSTICADESCRIPTIVA28DEJUNIO2013
1.Sequierenanalizarlosaccidentesdetrficoenlasprovinciasespaolas.Sedisponendelos
siguientesdatos:
AccidentesdeTrfico(miles)
015
1535
3550

NdeProvinciasespaolas
25
15
10

a) Obtengaelnmeromediodeaccidentesporprovinciaysuvalormediano.
b) Lamediaobtenidaenelapartadoanterior,esrepresentativa?
c) SeproducenenEspaalosaccidentesdeformaconcentradasegnprovincias?Justifiqueelindicador
empleadoparamedirlaconcentracindelosaccidenteseinterpretelosresultados.

d) EnAlemaniaseharealizadounestudiosimilaralespaol.SehaobtenidounndicedeGinidel
0,70.DibujelascurvasdeLorenztericasquerepresentaranlosindicadoresdeconcentracinde
ambospasesyexpliquelaposicindecadaunadeellas.

Solucin:
a)
[L i L i1 )

xi

ni

ci

Ni

xi n i

x 2i n i

015
1535
3550

7,5
25
42,5

25
15
10

15
20
15

15
40
50

187,5
375
425
987,5

1406,25
9375
18062,5
28843,75

Nmeromedioaccidentes: x

x n
i1

987,5
19,75
50

N
50
Ni1
15
25 15
ci 15 2
20 15
20 23
Valormediano: Me L i 2
Ni Ni1
40 15
40 15

ni

b)ParasabersilamediaobtenidaesrepresentativasecalculaelCoeficientedeVariacinde
Pearson:
48

a2

x
i1

2
i

ni

28843,75
576,875
50

s2 a2 a12 576,875 19,752 186,8125 s 186,8125 13,67


CV

s 13,67

0,6911 (69,11%)
x 19,75

ElCoeficientedeVariacindePearsoncuantificaelgradodedispersin(69,11%),queresueltaser
alto,porloquelamediaaritmticanoesrepresentativa.

c)
Rentas
[L i L i1 )

xi

ni

Ni

xi n i

015
1535
3550

7,5
25
42,5

25
15
10

15
40
50

187,5
375
425

Ui x i n i
acumulada
187,5
562,5
987,5

%pi

Ni
N

100

%qi

50
80
100

987,5

Ui
100
Uk

18,99
56,96
100
75,95

130

% (pi qi )
31,01
23,04
0
54,05

ElgradodeconcentracindeaccidentesvienereflejadoporelndicedeGini:
2

IG 1

qi
i1
2

p
i1

75,95
1
0,4158 (41,58%) obien IG i1
130

(pi qi )
2

i1

54,05
0,4158
130

CuantomsprximoaceroseencuentreelndicedeGinisermsequitativoelgradode
concentracindeaccidentes,siendode41,58%,sepuedeconcluirqueexisteconcentracinde
accidentes.

d)

IG (Alemania) 0,70 IG (Espaa) 0,4158


concluyendoqueenAlemaniaestnms
concentradoslosaccidentes,estoes,al
dibujarlascurvastericas,lacurvade
LorenzdeEspaaseencontrarams
prximaaladiagonalprincipal.

49

2.Apartirdelatablaadjunta,siendoN 11 , Y 0
X\Y
0
1

2
0
3

0
1
n22
1

1
0
n23
0

a) Sonindependienteslasvariablesestadsticamente?
b) RectasderegresindeY/XeX/Y
c) QupartedelavarianzacalculadaYesexplicadaporlaregresin?Quparteesdebidaa

causasajenas?

Solucin:
a)
X\Y

ni

0
1

0
3
0

0
n23
0
n23

2
n j

1
n22
1
2 n22

Deotraparte, Y

3 n22 n23
1
5 n22 n23 11

2 . 3 0 n23
0 n23 6
11

5 n22 6 11 n22 0
X\Y

ni

0
1
2
n j

0
3
0

1
0
1

0
6
0

1
9
1

11

LasvariablesXeYsonindependientes
n n n
cuandoseverifica ij i j i, j
N N N

Nosonindependientesporquenoseverificalarelacin:

n
1
1
2
n n2

x
12 1

11 11 11 N N N

b)
3 3

x i y j nij

a11 i1 j1

1
2 . 1. 3 1 . 1. 6 0
11

a10 x

x i ni

i1

x i ni
2

1.9 0 2.1

1 a20 i1
11
N
50

1 2
13
1 . 9 22 . 1
11
11

s2x a20 a10

13
2
1
sx
11
11

2
0,43
11

a01 y

y j n j
j1

s2y a02 a201

0 a02

18
18
0
sy
11
11

y j n j
2

j1

1
18
(2)2 . 3 12 . 6
11
11

18
1,28
11

covarianza: sxy a11 a10 . a01 0 1 . 0 0

ElcoeficientederegresindeYsobreX(pendientedelarecta): b

sxy
s

2
x

0
0
2 / 11

Y a b X 0 a 0 . 1 a 0
Y / X : Y 0

ElcoeficientederegresindeXsobreY(pendientedelarecta): b'

sxy
s

2
Y

0
0
18 / 11

X a' b' Y 1 a' 0 . 0 a' 1


X / Y : X 1
COEFICIENTEDETERMINACIN: r2 b . b' 0 Lasrectassonperpendiculares,yen
consecuencia,lasvariables(X,Y)sonINCORRELADAS
VARIANZARESIDUALDEY: sry2 s2y (1 r2 ) sry2
s2y s2Y explicada sr2Y

18
18
s2Y explicada

11
11

18
18
(1 0)
11
11

s2Y explicada 0

51

3.Enlatablasepresentaelvalordeimportacionesdeunpasdurantelosaos2009y2010.
Importaciones
Alimentos
Otrosbienesdeconsumo
Bienesdecapital
Bienesintermedios
TOTAL

2009
1010
7450
2400
4755
15615

2010
1200
7955
2210
6256
17621

Sesabequelasimportacionestantodealimentoscomodeotrosbienesdeconsumosepagaronun
3%mscarasen2010queen2009.
Lasimportacionesdebienesdecapitalsubieronsuspreciosun1,2%ylasdebienesintermedios
bajaronun0,5%.
Sepide:
a)Calcularelndicedepreciostotaldelasimportacionesen2010conbase2009,utilizandoLaspeyres
yPaasche.
b)Cuntocrecieronlasimportacionesencantidaden2009conrespectoa2010?

Solucin:
a)
UtilizandoelndicedepreciosdeLaspeyres:

Laspeyres
pi,09 . qi,09
Importaciones
Alimentos
1010
Otrosbienesdeconsumo
7450
Bienesdecapital
2400
Bienesintermedios
4755
TOTAL
15615

pi,10 . qi,09

pi,10 . qi,10

1200
7955
2210
6256
17621

1,03x1010=1040,3
1,03x7450=7673,5
1,012x2400=2428,8
0,995x4755=4731,23

15873,83

Lp

pi,10 .qi,09
i1
4

pi,09 .qi,09

. 100

15873,83
. 100 101,66 %
15615

i1

UtilizandoelndicedepreciosdePaasche:

Paasche
Importaciones
Alimentos
Otrosbienesdeconsumo
Bienesdecapital
Bienesintermedios
TOTAL

pi,09 . qi,09

pi,10 . qi,10

1010
7450
2400
4755
15615

1200
7955
2210
6256
17621
52

pi,09 . qi,10
1200/1,03=1165,05
7955/1,03=7723,30
2210/1,012=2183,79
6256/0,995=6287,44

17359,58

Pp

pit .qit
i1
4

pi0 .qit

. 100

17621
. 100 101,51%
17359,58

i1

b)ParacalcularlosndicescunticosdeLaspeyresyPaascheserequierehallarpreviamenteelndice
devalordelasimportacionesentre2009conbase2010.
4

10
IV09

V
10
V09

pi,10 . qi,10
i1
4

pi,09 . qi,09

17621
1,1285 (112,85%)
15615

i1

Siendo, IV0t LP 0t . PQ 0t

10
10 IV09
112,85
. 100 111,01%
PQ 09 10 . 100
101,66
LP 09

PP 0t . L Q 0t
10
10 IV09
112,85
. 100 111,17 %
L Q 09 10 . 100
101,51
PP 09

53

4.Enlatablaadjuntasereflejanlasventastrimestralesdeunaempresaenmillonesdeeuros.
Trimestres\Aos
Primero
Segundo
Tercero
Cuarto

2006
1
2
4
3

2007
2
3
5
4

2008
2
4
5
3

2009
3
4
7
6

2010
5
7
8
7

Suponiendounesquemadeagregacinmultiplicativoenlaserietemporal:
a) Desestacionalicelaseriedeventasporelmtododelasmediasmviles.
b) CalculelosndicesdeVariacinEstacional(IVEs)porelmtododelatendencia.

Solucin:
a)Paracalcularlatendenciaseculardelaserieporelmtododelasmediasmviles,seobtienen
primeromediasmvilesdetamao4(perododelasvariacionesestacionales),quealserunnmero
par,sepierden4datos,resultaunaseriedescentradaycorrespondernalosperodosintermedios
entrecadadostrimestresconsecutivos.
Clculodelasmediasmviles:
12 4 3
2,5 entresegundoytercertrimestrede2006
4
2 4 32

2,75 entretercerycuartotrimestrede2006
4
4 323

3 entrecuartotrimestrede2006yprimertrimestrede2007
4
323 5

3,25 entreprimerysegundotrimestrede2007
4
23 5 4

3,5 entresegundoytercertrimestrede2007
4

SERIEDESCENTRADAdemediasmviles
Trimestres\Aos
2006
2007
PrimeroSegundo

3,25
SegundoTercero
2,5
3,5
TerceroCuarto
2,75
3,5
CuartoPrimero
3
3,75

2008
3,75
3,5
3,75
3,75

2009
4,25
5
5,5
6,25

2010
6,5
6,75

Paracentrarlaseriehayquecalcularlamediaaritmticadecadadosobservacionessucesivas,deeste
modo,lasmediasqueirnapareciendo,respectivamente,sern:
2,5 2,75
2,625
2

2,75 3
2,875
2

3 3,25
3,125
2

3,25 3,5
3,375
2

3,5 3,5
3,5
2

3,5 3,75
3,625
2

3,75 3,75
3,75
2

3,75 3,5
3,625
2

3,5 3,75
3,625
2

3,75 3,75
3,75
2

54

3,75 4 ,25
4
2

4 ,25 5
4 ,625
2

5 5,5
5,25
2

5,5 6,25
5,875
2

6,25 6,5
6,375
2

6,5 6,75
6,625
2

SERIECENTRADAdelasmediasmviles:
Trimestres\Aos
2006
2007
Primero

3,125
Segundo

3,375
Tercero
2,625
3,5
Cuarto
2,875
3,625

2008
3,75
3,625
3,625
3,75

2009
4
4,625
5,25
5,875

2010
6,375
6,625

Lalneaqueseobtienealrepresentar
grficamentelaseriedelatabla (t , yit ) serla
lneadetendencia,quecomienzaeneltercer
trimestrede2006yfinalizaenelsegundo
trimestrede2010.

Alaplicarelmtododelasmediasmviles,enelesquemamultiplicativo Yi t Ti t .Ei t . Ci t . Ai t ,loque


realmenteseobtieneenlaseriecronolgicaesunaaproximacinde Ti t . Ci t ,quedandosinanalizarlas
componentesestacional( Eit )yaccidental (Ait ).
Latendenciaylacomponentecclicaseeliminarndividiendocadadatodelaserieoriginalporla
correspondientemediamvil:

Yi t
Ti t . Ci t

Ti t . Ei t . Ci t . Ai t
Ti t . Ci t

Trimestres\Aos
Primero
Segundo
Tercero
Cuarto

Ei t . Ai t quedandolacomponenteestacionalyaccidental

2006

4/2,625
3/2,875

2007
2/3,125
3/3,375
5/3,5
4/3,625

2008
2/3,75
4/3,625
5/3,625
3/3,75

SERIEconlascomponentesestacionalyaccidental
Trimestres\Aos
2006
2007
2008
Primero

0,640
0,533
Segundo

0,889
1,103
Tercero
1,524
1,429
1,379
Cuarto
1,043
1,103
0,8
55

2009
3/4
4/4,625
7/5,25
6/5,875

2010
5/6,375
7/6,625

2009
0,750
0,865
1,333
1,021

2010
0,784
1,057

Seeliminalacomponenteaccidental Ai t conelclculodelasmediasaritmticastrimestrales,es
decir,lamediaaritmticadecadafiladelatablaanterior(dondesoloaparecaelproductode Ei t . Ai t ):

0,640 0,533 0,750 0,784


0,889 1,103 0,865 1,057
0,677
0,978
4
4

1,524 1,429 1,379 1,333


1,043 1,103 0,8 1,021
1,416
0,992
4
4

Trimestres\Aos
Primero
Segundo
Tercero
Cuarto

2006

1,524
1,043

2007
0,640
0,889
1,429
1,103

Secalculalamediaaritmticadelos
cuatrovaloresobtenidosanteriormente

2008
0,533
1,103
1,379
0,8

2009
0,750
0,865
1,333
1,021

IVBE
0,677
0,978
1,416
0,992
1,016

2010
0,784
1,057

0,677 0,978 1,416 0,992


1,016
4

SecalculanlosndicesdeVariacinEstacional,expresandoparaellocadaunodelosvalores
anterioresenformadeporcentajesobrelamediaanual,obteniendo:
Trimestres\Aos
Primero
Segundo
Tercero
Cuarto

IVE(%)
(0,677/1,016).100=66,63
(0,978/1,016).100=96,31
(1,416/1,016).100=139,41
(0,992/1,016).100=97,65
400%

DESESTACIONALIZACIN(aplicandoelmtodoalaraznalamediamvil).Elprocesoconsisteen
dividircadavalordelaserieoriginalporcadandicedeVariacinEstacionalcorrespondiente:
Trimestres\Aos
Primero
Segundo
Tercero
Cuarto

2006
1/0,6663
2/0,9631
4/1,3941
3/0,9765

2007
2/0,6663
3/0,9631
5/1,3941
4/0,9765

2008
2/0,6663
4/0,9631
5/1,3941
3/0,9765

Seriedesestacionalizada,mtodoalaraznalamediamvil
Trimestres\Aos
2006
2007
2008
Primero
1,501
3,002
3,002
Segundo
2,077
3,115
4,153
Tercero
2,869
3,587
3,587
Cuarto
3,072
4,096
3,072

56

2009
3/0,6663
4/0,9631
7/1,3941
6/0,9765

2010
5/0,6663
7/0,9631
8/1,3941
7/0,9765

2009
4,502
4,153
5,021
6,144

2010
7,504
7,268
5,738
7,168

b)LosndicesdeVariacinEstacional(IVEs)porelmtododelatendencia.
Secalculanlasmediasanuales y t (mediasparacadaaodek=4subperiodos)
Trimestres\Aos
Primero
Segundo
Tercero
Cuarto

2006
1
2
4
3

2007
2
3
5
4

2008
2
4
5
3

2009
3
4
7
6

2010
5
7
8
7

y 2006 2,5

y 2007 3,5

y 2008 3,5

y 2009 5

y 2010 6,75

yi t

y t i1

t (2006 , 2007 , ,2010) mediasanuales

Latendenciamediaanual T t seobtieneajustandounarectaderegresinalosaos (t1 , t2 , , tn ) ya


lasmediasanuales y t , donde t (t1 , t2 , , tn ) : T t y t a b . t
(t2006 , t2007 , , t2010 )

2006

2007

2008

2009

2010

y t mediasanuales

2,50

3,50

3,50

5,00

6,75

Porelmtododelosmnimoscuadrados,resulta: a 2003,75 y b 1
conloque, T t y t 2003,75 t t (t2006 , t2007 , , t2010 ) ,resultapues:
Tendenciamediaanual
(t2006 , t2007 , , t2010 )

2006

2007

2008

2009

2010

T t

2,25

3,25

4,25

5,25

6,25

Apartirdelatendenciamediaanual T t seobtieneelvalordelatendenciaparalosdistintos
subperodos,segnlaexpresingeneral:

Ti t T t i

k 1 b
. tendenciamediaanualparalossubperodosksimos
2 k

donde,
t Ao(2006,2007,...,2010)
Subperododondesecalculalatendencia(trimestrali=1,2,
i
3,4)
k Nmerototaldesubperodos(datostrimestralesk=4)
b Pendientedelarectaderegresin=1
4 1 1
. 1,875
2 4

4 1 1
TrimestreSegundo2006: Ti2006 2,25 2
. 2,125
2 4

TrimestrePrimero2006: Ti2006 2,25 1

57

4 1 1
. 2,375
2 4

4 1 1
TrimestrePrimero2007: Ti2007 3,25 1
. 2,875
2 4

4 1 1
TrimestrePrimero2008: Ti2008 4 ,25 1
. 3,875
2 4

4 1 1
TrimestrePrimero2009: Ti2009 4 ,25 1
. 4 ,875
2 4

4 1 1
TrimestrePrimero2010: Ti2010 5,25 1
. 5,875
2 4

TrimestreTercero2006: Ti2006 2,25 3

SERIEDELATENDENCIA
(k=4trimestres)
i
Primero
1
Segundo
2
Tercero
3
Cuarto
4

2006
1,875
2,125
2,375
2,625

2007
2,875
3,125
3,375
3,625

2008
3,875
4,125
4,375
4,625

2009
4,875
5,125
5,375
5,625

2010
5,875
6,125
6,375
6,625

Representacingrficadelaserieconlos
datosoriginalesylaseriesuavizadade
tendencia

Paraeliminarlatendenciaylacomponentecclicasedividecadatrminodelaserieoriginalentreel
correspondientetrminodelaserietericadetendencia.
SEELIMINALATENDENCIAYLACOMPONENTECCLICADELASERIE
Trimestres\Aos
2006
2007
2008
2009
Primero
1/1,875
2/2,875
2/3,875
3/4,875
Segundo
2/2,125
3/3,125
4/4,125
4/5,125
Tercero
4/2,375
5/3,375
5/4,375
7/5,375
Cuarto
3/2,625
4/3,625
3/4,625
6/5,625

2010
5/5,875
7/6,125
8/6,375
7/6,625

Sealarque,enelesquemamultiplicativo,alaplicarelmtododelosmnimoscuadrados,loquese
obtieneesunaaproximacin,yaqueenelperodoqueseconsidera(unao)essuficientemente
pequeo,pudiendosuponerquelacomponentecclicaestincluidaenlatendenciasecular,puesto
queenunperodotancortonodalugaraquesemanifiestesplenamentelasvariacionescclicas.

58

SerieconlasCOMPONENTESESTACIONALyACCIDENTAL
Trimestres\Aos
2006
2007
2008
Primero
0,533
0,696
0,516
Segundo
0,941
0,960
0,970
Tercero
1,684
1,481
1,143
Cuarto
1,143
1,103
0,649

2009
0,615
0,780
1,302
1,067

2010
0,851
1,143
1,255
1,057

Paraeliminarlacomponenteaccidental,calculamosparacadatrimestrelamediaaritmticadelos
valoresobtenidosportrimestres(filas)enlaserieanteriorconlascomponentesestacionaly
accidental.
0,533 0,696 0,516 0,615 0,851
0,941 0,96 0,97 0,78 1,143
0,642
0,959
5
5
1,684 1,481 1,143 1,302 1,255
1,143 1,103 0,649 1,067 1,057
1,373
1,004
5
5

Trimestres\Aos
Primero
Segundo
Tercero
Cuarto

2006
0,533
0,941
1,684
1,143

2007
0,696
0,960
1,481
1,103

2008
0,516
0,970
1,143
0,649

Elpromedioanualdelascuatromediasaritmticas:

2009
0,615
0,780
1,302
1,067

2010
0,851
1,143
1,255
1,057

IBVE
0,642
0,959
1,373
1,004
0,994

0,642 0,959 1,373 1,004


0,994
4

SecalculanlosndicesdeVariacinEstacional,expresandoparaellocadaunodelasvaloresobtenidos
(mediasaritmticasportrimestres)enformadeporcentajesobrelamediaanual,obteniendo:
Trimestres\Aos
Primero
Segundo
Tercero
Cuarto

IBVE
0,642
0,959
1,373
1,004

IVE(%)
(0,642/0,944).100=64,59
(0,959/0,944).100=96,48
(1,373/0,944).100=138,13
(1,004/0,944).100=101,01

Endefinitiva,sobreunnivelmediodeventas,lainfluenciadelavariacinestacionalproduce:
1Trimestre:(64,59100=35,41)undescensodeventasdel35,41%
2Trimestre:(96,48100=3,52)undescensodeventasdel3,42%
3Trimestre:(138,13100=38,13)unaumentodeventasdel38,13%
4Trimestre:(101,01100=1,01)unaumentodeventasdel1,01%

59