Documente Academic
Documente Profesional
Documente Cultură
MEN
Ejemplo 1: Caso de Ambas variables Aleatorias.
La Lnea de Regresin Estimada
Las Hiptesis y la Prueba.
La Correlacin.: Ejemplo 2.
Ejemplo 3: Caso en que X es un Factor.
Anlisis de la Varianza Completo.
Ejemplo 4. Caso en que X se determina (Anualidades)
Regresin con variables Indexadas.
El Mtodo de la Correlacin
Es la Tcnica Estadstica para medir el grado y la naturaleza de la
asociacin de las distintas variables.
Suele aplicarse en:
Tcnicas de Muestreo;
Anlisis de Experimentos;
O simples exploraciones estadsticas.
Para esto, es insoslayable que todas las variables sean de naturaleza
aleatoria.
Usualmente, en los estudios por muestreo tanto la variable Dependiente Y
como (rango de la funcin) la variable Independiente X (dominio de la
funcin) son de naturaleza aleatoria. Es estos casos, Los Mtodos de
Regresin y de Correlacin son alternativas de anlisis vlidas.
5
El Modelo de Regresin
La relacin funcional lineal ms simple se puede aproximar
mediante el modelo:
yi b0 b1 xi
En este:
yi es la el valor de variable de inters en la -sima observacin,
obligadamente de naturaleza aleatoria. En matemtica El Rango de la
funcin.
bo Interceptada y b1 o Pendiente, son los parmetros que definen la
funcin lineal;
xi es el valor de la variable concomitante de la -sima observacin. No
necesariamente ser de naturaleza aleatoria. En matemtica El
dominio de la funcin.
7
El Diagrama de Dispersin
1,85
1,80
1,75
Pendiente = 0,55 m
Ordenando los datos
1,70 ascendentemente y tomando
1,65
como base la estatura de los
1,60
1,55 padres. Usando el Grfico X, Y
1,50 de la HE y acomode a mano
1,40 1,50 1,60 1,70 1,80 1,90
La Pendiente
La Pendiente, es sin duda, el indicador ms importante de la relacin
funcional entre dos variables.
Indica el Incremento o Decremento de la variable Y (rango) a un
Incremento o Decremento unitario de la variable X (dominio).
El estimado de la pendiente b1 = 0,55 indicar al investigador que en
promedio, un metro en el aumento de la estatura de los padres se
reflejar en en los hijos en promedio 0,55 metros.
En este ejemplo, un incremento en la estatura de los padres se refleja
en un incremento en la estatura de los hijos, por tanto, la relacin es
positiva.
Habr otros problemas en los que un incremento en la variable X se
traduzca en decrementos de la variable Y, entonces la relacin ser
negativa.
10
yi b0 b1 xi
La Interceptada es b0, La Pendiente es b1, yi la estatura del -
simo hijo; xi la estatura del -simo padre. Que la HE calcula
directamente para cada uno de los parmetros dando por
resultado el modelo:
y i 0,8581 0,4885( x i )
11
1,85
1,80
1,75
acomoda de maneta tal que
1,70
1,65
aproxima al diagrama de
1,60
1,55
dispersin de los a los datos.
1,50 Esta se puede observar en el
1,45
1,45 1,55 1,65 1,75 1,85 1,95 grfico como una lnea sobre
Estatura de los padres en m
una serie de puntos de color
fucsia.
Esta lnea que Mejor Ajusta Los Datos posee cualidades muy
deseables en un modelo de aproximacin y prediccin que se
irn desvelando a medida que se avance en el tema.
12
i 0,1866
d 2
i 1
13
Estadstica Descriptiva.
13
i 1
i 1 i 1
La Hiptesis y La Prueba
Interesa conocer si las dos componentes de variacin total son iguales. Esto
es:
Ho; C. M. De Regresin = C. M. Del Error.
La Teora Estadstica desarroll una prueba para valorar dos varianzas
mediante cociente llamado de F. Esto es:
S R2 SCR (c 1)
F( GLR ; GLE ) 2
S E SCE (n 2)
Evidentemente, s F = 1 las varianzas sern iguales, cuando el nmero de
observaciones es alto. Para compensar esto, se ha desarrollado la funcin de
densidad de F que considera los grados de libertad. En el ejemplo el valor
calculado de F:
0,3006 1 0,3006
F(1; 83) 133,6997
0,1866 83 0,0022
De Y De X Productos XY
Nmero 85
Suma 142,97 143,36
Promedio 1,6820 1,6866
Corrector por la media 240,4755 241,7893 241,1315
Sumas Cuadraticas 240,9627 243,0488 241,7468
Sumas de Cuadrados 0,4872 1,2595 0,6153
Pendiente 0,4885
Interceptada 0,8581
20
Cuadro de la varianza o ANDEVA
Valor que determina una probabilidad de 0,000.. De que B1 sea cero. Existe
una relacin entre la estatura de los padres y la estatura de los hijos.
Puede comprobar que elevando al cuadrado esta t obtiene el valor de la F.
24
Intervalo de Confianza para la Pendiente
Pr b1 t ( Sb1 ) 1 b1 t ( Sb1 ) 1
Pr 0,4885 - 2,6364 0,0422 1 0,4885 2,6364 0,0422 95%
Pr 0,3771 1 0,5999 95%
Bandas de Confianza
Dado que la lnea de regresin cubre una infinidad de puntos yi
asociados con cada xi los intervalos de confianza se estiman en
todo el recorrido de la lnea de regresin. En el plano
cartesiano parecen bandas a ambos lados de la lnea estimada.
Se acostumbra presentar dos tipos de intervalos confiables:
Para promedios, que el Teorema Central del Lmite asegura que
siempre sern vlidos si se cumple que la variable Y se
distribuya normal o se trabaja con promedios;
Y para observaciones, vlidos nicamente si la distribucin Yi
(Rango) es normal en cada punto Xi (del dominio).
En las siguientes diapositivas se ofrecen las frmulas y
resultados.
26
Bandas de Confianza
1,90 Generalmente, el Anlisis
1,85
de Regresin Concluye con
Estatura de los hijos en m
1,80
1,65
1,60
La lnea central
1,55 corresponde a los valores
1,50
1,45 1,50 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,90 1,95 2,00 estimados. Sobre estos se
calculan los lmites de
Estatura de los padres en m
La Correlacin
Para poder ofrecer conclusiones mediante anlisis de
correlacin, es insoslayable que las variables involucradas
sean de naturaleza aleatoria. Esto no impide, por ejemplo,
calcule la correlacin entre niveles de fertilizante aplicados a
una planta y el rendimiento, o las ventas y el costo del
producto de las mismas de una empresa en una serie de aos.
Ser incorrecto que reporte por ejemplo que la correlacin
entre ventas y aos es significativa, puesto que los aos no son
una variable aleatoria, para estos casos se usa la regresin.
Ambos coeficientes, el de correlacin y el de regresin estn
ntimamente relacionados, pero su uso es diferente.
31
El Ejemplo de Correlacin
El ejemplo consiste en agregar un nuevo conjunto de
85 observaciones que incluye el peso de padres e hijos
varones.
Todas las variables X1 = La Estatura de los Padres; X2
= El Peso de los Padres; X3 = La Estatura de los hijos;
X4 = El peso de los hijos son de naturaleza aleatoria.
El Objetivo del anlisis:
Conocer las relaciones entre las variables
mencionadas en un estudio gentico de peso y estatura
entre hijos y padres varones.
32
Definicin de Correlacin
La correlacin mide la relacin concomitante entre dos
variables aleatorias. Esta definida por la ecuacin:
n
x y
i 1
i i
S xy n 1
Sx Sy n n
xi x
i
2 2
y y
i 1 i 1
n 1 n 1
r 2 n 2
F(1; n -2)
1 r 2
35
Valorando la Hiptesis
La hiptesis que se valora para el coeficiente de determinacin es:
Ho; 0 : Contra Ha : 0
Los estadsticos t o F se valoran directamente utilizando la funcin de
densidad de la HE que indicar la probabilidad que va del punto
determinado por el valor del estadstico a mas infinito. Dicho de otra forma,
la probabilidad de la zona de rechazo. Para la t:
831
2
4,2770 2
F (4,2770; 83) Y0 1 dt 0,0001
0
83
O para F:
Fc 14,989
F (18,2927;1 ; 83) f ;1 ; 83 df 0,0001
0
0,819
Se puede usar el mtodo antiguo de cuando no se contaba con la facilidad de
la HE comparando el valor del estadstico contra el valor que determina una
probabilidad de significacin definida, por ejemplo 0,05. Para t = 1,9890 y
para F = 3,9560 y tomado la decisin de rechazar la hiptesis si los
estadsticos son mayores o iguales a los criterios.
36
105
Tratamientos
90
75
60
45
Efecto Cbico ?
105
75
60
45
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,9382
Coeficiente de determinacin R^2 0,8803
R^2 ajustado 0,8716
Error tpico 3,7788
Observaciones 60
ANLISIS DE VARIANZA
Fuente de la Grados de Suma de Promedio de Cociente de Probabilidad Valores Crticos
Variacin Libertad Cuadrados los Cuadrados F de F 0,05 0,01
Regresin 4 5.775,44 1.443,86 101,12 0,0000 2,5397 2,5397
Residuos 55 785,35 14,28
Total 59 6.560,79
Se ha venido expandiendo el
rendimiento por parcela a
rendimiento por hectrea. Es
ms conveniente expandir cada
observacin y analizarla para
obtener un modelo significativo
para la variable.
La Correlacin
An cuando las correlaciones de los gastos con el ao se
manifiestan positivas y altamente significativas,
estrictamente no se puede hacer referencia a estas pues el
ao no es una variable aleatoria. Por tanto, la nica
correlacin a la que se puede hacer mencin es entre gastos
que es de 0,7139 o 71,39% altamente significativa.
Grados de Libertad 28
Ao I. Vivienda G. Pblico
Ao 1,0000
I. Vivienda 0,8305 1,0000
G. Pblico 0,8159 0,7139 1,0000
Probabilidad de F
Ao 1,0000
I. Vivienda 0,0000 1,0000
G. Pblico 0,0000 0,0000 1,0000
56
Representacin Grfica
Comparacin de Tendencias de Crecimiento
2,00
1,50
1,00
Valores Estndar
0,50
0,00
-0,50
-1,00
-1,50
-2,00
Aos
I. Vivienda G. Pblico