Documente Academic
Documente Profesional
Documente Cultură
I. Objetivos
1. Conocer los principios teóricos del análisis de regresión y correlación.
2. Interpretar el diagrama de dispersión.
3. Calcular, analizar e interpretar el coeficiente de correlación.
4. Calcular, analizar e interpretar el coeficiente de determinación.
5. Realizar pruebas de hipótesis para los coeficientes de la ecuación de regresión
poblacional.
1. Coeficiente de Correlación
La correlación es el método es el método empleado para determinar el grado de
relacionamiento entre las variables que se estudian, para así determinar en que medida
una relación funcional describe o explica de una forma adecuada la relación entre estas
dos variables Se usa el término correlación cuando se habla de relaciones entre
variables de experimentos bivariantes.
Los diversos tipos de correlación que existen pueden ser:
S XY nΣXY − ( ΣX )( ΣY )
r= =
σ XσY ( nΣX 2 − ( ΣX )2 )( nΣY 2 − ( ΣY )2 )
Donde:
n
SXY = Covarianza de X e Y.
∑ ( x − x )( y − y )
i =1
i i
σ X = Desviación estándar de X. S XY =
n
σ Y = Desviación estándar de Y.
Propiedades
• r está siempre comprendido entre -1 y 1.
• Si r = 1 ó r = -1 entonces los puntos de la muestra están situados en línea recta
(correlación lineal perfecta).
• Si r está próximo a 1 ó a -1, habrá una asociación lineal fuerte entre ambas variables.
• Si r es cercano a 0, habrá una asociación lineal muy débil.
• r no varía cuando en las variables se realiza un cambio de escala o de origen. Esto
demuestra que r no tiene dimensión.
1. Se trata de una medida matemática que luego hay que interpretar. Aunque un alto
grado de correlación indique buena aproximación a un modelo matemático lineal, su
interpretación puede no tener ningún sentido. Por ejemplo puede haber un alto grado
de correlación entre las ventas de celulares y el consumo de alcohol en Arequipa,
pero ambas variables están claramente disociadas.
2. Coeficiente de determinación
El coeficiente de determinación se calcula elevando al cuadrado el coeficiente de
correlación y representa el porcentaje de la variación explicada por la recta de regresión.
El coeficiente de determinación r2, es una medida de la proximidad del ajuste de la recta
de regresión; cuanto mayor sea el valor de r2, mejor será el ajuste y mas útil la recta de
regresión como instrumento de predicción. (r2 = 0.92 indica que de 100 pares de puntos
92 están en la recta de regresión y 8 fueran de la recta de regresión)
Cuando el n es pequeño se debe calcular el coeficiente de determinación corregido.
CME
R 2=R 2=1-
CMT
∑( y − µ i Y ) Donde N es el tamaño
2
(
σ = E Y − µY
X
)= i =1
N
X
de la población
SCE ∑( yi − y i ) ∑ yi2 − a∑ yi − b∑ xi yi
s2 = = i =1
= i =1 i =1 i =1
Se siguen todos los pasos para el análisis de la varianza de más de dos medias
poblacionales, resumiéndose los cálculos en la siguiente tabla:
Donde:
1 (x0 -x)2
y0 ± t 0 s +
n Σ(xi -x)2
III. Actividades
Resolver los siguientes ejercicios
Tabla P.3
Y X Y X
1250 41 1300 46
1380 54 1400 62
1425 63 1510 61
1425 54 1575 64
1450 48 1650 71
4. El tiempo requerido para que los clientes paguen en el supermercado y los valores
correspondientes de las compras se muestran en la tabla P.4. Conteste los incisos a), b),
Tabla P.4
Tiempo Tiempo
requerido para Valor de la requerido para Valor de la
pagar en caja compra (dólares) pagar en caja compra (dólares)
(minutos) (minutos)
3.6 30.6 1.8 6.2
4.1 30.5 4.3 40.1
0.8 2.4 0.2 2.0
5.7 42.2 2.6 15.5
3.4 21.8 1.3 6.5
Tabla P.5
Autobus Costo de mantenimiento ($) Edad (años)
Y X
1 859 8
2 682 5
3 471 3
4 708 9
5 1094 11
6 224 2
7 320 1
8 651 8
9 1049 12
Tabla P.6
Nro de libros vendidos Espacio en pies en los anaqueles
Semana
Y X
1 275 6.8
2 142 3.3
3 168 4.1
4 197 4.2
5 215 4.8
6 188 3.9
7 241 4.9
8 295 7.7
9 125 3.1
10 266 5.9
11 200 5.0
Tabla P.7
Número de Número de Número de Número de
órdenes postales Catálogos órdenes postales Catálogos
Ciudad Ciudad
recibidas (Miles) recibidos (Miles) recibidas (Miles) recibidos (Miles)
Y X Y X
A 24 6G 18 15
B 16 2H 18 3
C 23 5I 35 11
D 15 1J 34 13
E 32 10 K 15 2
F 25 7L 32 12
Nro Vendedores 2 6 8 8 12 16 20 20
Ventas Mensuales
58 105 88 118 117 137 157 169
Miles de $
Edad 25 46 58 37 55 32 41 50 23 60
Ausentismo 18 12 8 15 10 13 7 9 16 6
Nota.- La edad esta expresada en años y el ausentismo en días por año.
10. Se presenta la siguiente información del ingreso de una personas con el su ahorro.
Ingreso 350 400 450 500 950 850 700 900 600
Ahorro 100 110 130 160 350 350 250 320 130