Sunteți pe pagina 1din 18

Anlisis exploratorio y

ajuste de modelo al
comportamiento de una
variable de estudio.

Estadstica aplicada.

Identificacin, sobre un caso real, de una variable de


C u a t r i m e s t r e 2 d e 2 0 1 1estudio y realizacin de un anlisis exploratorio sobre
L u n e s n o c h e d e 1 8 . 3 0 a 1 0 . 3 0 cul sera el mejor modelo estadstico que se adecua al
comportamiento de dicha variable.
-

Bondad de Ajuste.
Ajuste
a
Distribuciones
Probabilidad.

Univariantes

Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de


18.30 a 10.30
p. 0 de 18

de

NDICE DE CONTENIDOS
1. INTRODUCCIN
1.1. Importancia y Objetivos
1.2. Marco terico

2. DESARROLLO
2.1. Bondad de ajuste
2.1.1.
2.1.2.
2.1.3.
2.1.4.
2.1.5.
2.1.6.
2.1.7.
2.1.8.
2.1.9.

MODELO NORMAL
MODELO LOGNORMAL
MODELO EXPONENCIAL
MODELO de WEIBULL
MODELO GUMBEL del MNIMO
MODELO GUMBEL del MXIMO
MODELO de PARETO
MODELO GAMMA
TABLA DE CONTRASTES

2.2. Distribuciones univariantes de probabilidad


2.2.1. Histograma
2.2.2. Regresin y anlisis de correlacin

3. CONCLUSIONES
FUENTES

Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de


18.30 a 10.30
p. 1 de 18

1. INTRODUCCIN
En el presente trabajo se identifica, sobre un caso real, una variable de estudio y se realiza un
anlisis exploratorio sobre cul sera el mejor modelo estadstico que se adecua al
comportamiento de dicha variable.
1.1. Importancia y Objetivos
Se pretende determinar, mediante el anlisis de bondad de ajuste y ajuste a distribuciones
univariantes, la distribucin de probabilidad que mejor responde a una variable aleatoria
continua de una problemtica real.
La variable aleatoria X definida en nuestro estudio es la venta mensual (en millones
de pesos) durante enero de 2003 hasta septiembre de 2011 correspondiente a una
Planta de Alimentos Balanceados radicada en Salto |Bs As| Argentina1.
Para establecer las relaciones entre el comportamiento de la variable de estudio y los modelos
continuos, se emplearn procedimientos estadsticos. Se exhibirn algunas tablas y grficos
que permitan comprimir la informacin de modo tal que faciliten el entendimiento.
La importancia del problema radica en la cantidad de inconvenientes que podra representar el
incorrecto ajuste de una variable a un modelo determinado.
1.2. Marco terico
En la seccin 2 se procede al desarrollo. En primer lugar, se realiza Bondad de Ajuste a cada
uno de los modelos desarrollados y estudiados en Estadstica general; se comparan las
frecuencias observadas (FOi) con las frecuencias esperadas (FE i) que debera tomar la variable
si siguiera el modelo estudiado en cada caso. Este contraste es luego comparado con 2(1-; )
(siendo la probabilidad mxima de equivocarnos del 5%) que nos permite calcular el mximo
de variabilidad admisible que tendra la variable si siguiera el modelo. Dependiendo de ambos
valores, se concluye en rechazar o no la hiptesis nula planteada.
La variable elegida se contrasta con los siguientes modelos continuos:

MODELO
MODELO
MODELO
MODELO
MODELO
MODELO
MODELO

NORMAL
LOGNORMAL
de WEIBULL
GUMBEL del MNIMO
GUMBEL del MXIMO
de PARETO
GAMMA

Luego de realizados los contrastes, se recurre el software MOVAC para hallar los coeficientes
de correlacin corregidos, que indican el modelo que mejor se ajusta a la variable de estudio.
Con el anlisis de Bondad de Ajuste y los datos del software, se rechazarn los modelos que no
sigue la variable y, de no poder asegurar que sigue un nico modelo, cules de estos es el que
mejor se ajusta a la variable.
En la seccin 3 se resumen las conclusiones y finalmente se enumeran las fuentes utilizadas
para producir este trabajo prctico.

METRIVE SA. Planta de Alimentos Balanceados. Salto |Bs As| Argentina.

Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de


18.30 a 10.30
p. 2 de 18

2. DESARROLLO
2.1. Bondad de Ajuste
2.1.1. MODELO NORMAL

ESTIMACIN DE LA MEDIA Y EL DESVO ESTNDAR.

= 9,1047619 millones de $
= 4,55584148 millones de $

ENSAYO DE HIPTESIS.
Ho) La variable X sigue una distribucin Normal.

(= 0.05)

HI) La variable X no sigue una distribucin Normal.

Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de


18.30 a 10.30
p. 3 de 18

TABLA DE VALORES OBSERVADOS Y ESPERADOS

2CALC = 18,3711
2(0,95; 3) = 7,8147

(= 6 1 2 = 3)

Como 18,3711 > 2(0,95; 3) = 7,8147, la hiptesis nula se rechaza y podemos asegurar, con
probabilidad mxima de equivocarnos del 5%, que esta variable no tiene distribucin Normal.

Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de


18.30 a 10.30
p. 4 de 18

2.1.2. MODELO LOG-NORMAL

ESTIMACIN DE LA MEDIA Y EL DESVO ESTNDAR DEL LOGARITMO DE LA VARIABLE.

ENSAYO DE HIPTESIS.
Ho) La variable X sigue una distribucin Log-Normal.

(= 0.05)

HI) La variable X no sigue una distribucin Log-Normal.


TABLA DE VALORES OBSERVADOS Y ESPERADOS

2CALC = 8,3209
2(0,95; 3) = 7,8147

(= 6 1 2 = 3)

Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de


18.30 a 10.30
p. 5 de 18

Como 8,3209 > 2(0,95; 3) = 7,8147, la hiptesis nula se rechaza y podemos asegurar, con
probabilidad mxima de equivocarnos del 5%, que esta variable no tiene distribucin LogNormal.
2.1.3. MODELO EXPONENCIAL

ESTIMACIN DEL PARMETRO LAMDA.

= 9,1047619

= 0,109832636

ENSAYO DE HIPTESIS.
H0) La variable X sigue una distribucin Exponencial.

( : 0.05 )

HI) La variable X no sigue una distribucin Exponencial.


TABLA DE VALORES OBSERVADOS Y ESPERADOS

Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de


18.30 a 10.30
p. 6 de 18

2CALC = 57,8471
2(0,95; 5) = 11,0705

(= 7 1 1 = 5)

Como 57,8471 >>> 2(0,95; 5) = 11,0705, la hiptesis nula se rechaza y podemos asegurar, con
probabilidad mxima de equivocarnos del 5%, que esta variable no tiene distribucin
Exponencial.
2.1.4. MODELO de WEIBULL

ESTIMACIN DE PARMETROS.

Este es un sistema de ecuaciones para las incgnitas y que no puede resolverse en forma
elemental. La estimacin de los parmetros se hizo a travs de tablas diseadas para este fin
(Ajuste por Momentos de la Distribucin de Weibull).
Las tablas, tienen como columnas a

/.

Para usarlas, se calculan primero

, y

, d = / , con la que se ingresa en la segunda columna y se obtiene,


el valor de = ' y de la tercera el de / = '/' = /'. Con este ltimo
, se determina finalmente el de '.

luego la estimacin de
de la primera
valor, y el de

= 9,1047619
= 4,55584148

d=

= 0,50038

' = 2,10
'/' = /' = 0,8857 ' = 10,2797

ENSAYO DE HIPTESIS.
H0) La variable X sigue una distribucin de Weibull.

( : 0.05 )

HI) La variable X no sigue una distribucin Weibull.

Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de


18.30 a 10.30
p. 7 de 18

TABLA DE VALORES OBSERVADOS Y ESPERADOS

2CALC = 8,1323
2(0,95; 3) = 7,8147

(= 6 1 2 = 3)

Como 8,1323 > 2(0,95; 3) = 7,8147, la hiptesis nula se rechaza y podemos asegurar, con
probabilidad mxima de equivocarnos del 5%, que esta variable no tiene distribucin de
Weibull.

Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de


18.30 a 10.30
p. 8 de 18

2.1.5. MODELO GUMBEL del MNIMO

ESTIMACIN DE PARMETROS.

ENSAYO DE HIPTESIS.
H0) La variable X sigue una distribucin Gumbel del Mnimo.

( : 0.05 )

HI) La variable X no sigue una distribucin Gumbel del Mnimo.


TABLA DE VALORES OBSERVADOS Y ESPERADOS

Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de


18.30 a 10.30
p. 9 de 18

2CALC = 32,2118
2(0,95; 2) = 5,9915

(= 5 1 2 = 2)

Como 32,2118 >>> 2(0,95; 2) = 5,9915, la hiptesis nula se rechaza y podemos asegurar, con
probabilidad mxima de equivocarnos del 5%, que esta variable no tiene distribucin Gumbel
del mnimo.
2.1.6. MODELO GUMBEL del MXIMO

ESTIMACIN DE PARMETROS.

ENSAYO DE HIPTESIS.
H0) La variable X sigue una distribucin Gumbel del Mximo.

( : 0.05 )

HI) La variable X no sigue una distribucin Gumbel del Mximo.


TABLA DE VALORES OBSERVADOS Y ESPERADOS
Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de
18.30 a 10.30
p. 10 de 18

2CALC = 6,4991
2(0,95; 3) = 7,8147

(= 6 1 2 = 3)

Como 6,4991 no es mayor que 2(0,95; 3) = 7,8147, la hiptesis nula no se rechaza, con lo cual
no se rechaza el modelo Gumbel del mximo.
2.1.7. MODELO de PARETO

ESTIMACIN DE PARMETROS.
Para estimar los parmetros se utiliza el Ajuste por momentos al modelo de Pareto.

Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de


18.30 a 10.30
p. 11 de 18

d=

= 0,50038

'= 6,2900542
b'= 3,2347096

ENSAYO DE HIPTESIS.
H0) La variable X sigue una distribucin de Pareto.

( : 0.05 )

HI) La variable X no sigue una distribucin de Pareto.


La variable X no se ajusta al modelo de Pareto ya que el valor mnimo de la variable '=
6,2900542 y el dominio de la variable de estudio elegida abarca valores por debajo de dicho
valor.

2.1.8. MODELO GAMMA

ESTIMACIN DE PARMETROS.

ENSAYO DE HIPTESIS.
H0) La variable X sigue una distribucin de Gamma.

( : 0.05 )

HI) La variable X no sigue una distribucin Gamma.


Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de
18.30 a 10.30
p. 12 de 18

TABLA DE VALORES OBSERVADOS Y ESPERADOS

2CALC = 5,2544
2(0,95; 3) = 7,8147

(= 6 1 2 = 3)

Como 5,2544 no es mayor que 2(0,95; 3) = 7,8147, la hiptesis nula no se rechaza, con lo cual
no se rechaza el modelo Gamma.
2.1.9. TABLA DE CONTRASTES

2.2. Distribuciones univariantes de probabilidad


2.2.1 Histograma

Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de


18.30 a 10.30
p. 13 de 18

2.2.2. Regresin y anlisis de correlacin

Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de


18.30 a 10.30
p. 14 de 18

Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de


18.30 a 10.30
p. 15 de 18

Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de


18.30 a 10.30
p. 16 de 18

3. CONCLUSIONES
Luego de comparar los diferentes modelos continuos, mediante el anlisis de Bondad de
Ajuste, con los coeficientes de correlacin de distribuciones univariantes de probabilidad y las
rectas de regresin, se concluye en que, el modelo que mejor se ajusta a los datos de la
variable de estudio, venta mensual (en millones de pesos), es el modelo Gamma.
Se llega a esta conclusin ya que, de los modelos que la prueba de Bondad de Ajuste no
rechaza (Gamma y Gumbel del Mximo), la distribucin Gamma es el modelo que el software
MOVAC seala con el mayor coeficiente de correlacin. Cabe destacar que, a pesar de que
Gumbel del Mximo es el segundo modelo con el mayor coeficiente de correlacin, no cumple
con la asimetra.
En cuanto al anlisis de las rectas de regresin de los tres posibles candidatos (Gamma,
LogNormal y Normal), los puntos muestrales del modelo Gamma son los que se encuentran
ms prximos a la recta, es decir, es el modelo que posee menos error.
FUENTES
GARCA, Roberto Mariano. Inferencia estadstica y diseo de experimentos.1a ed., 2a reimpr.
Buenos Aires : EUDEBA, 2008. 734 p. Manuales. ISBN: 9502312958
Osvaldo L. Mermoz Y Roberto M. Garca. Distribuciones univariantes de probabilidad: modelos
y su identificacin. 1a ed. Buenos Aires: Nueva Librera, 2006. 218 p. ISBN: 987-1104-44-8

Profesor: Dopazo, Sergio Anibal. Cuatrimestre 2 de 2011. Curso da lunes noche de


18.30 a 10.30
p. 17 de 18

S-ar putea să vă placă și