Documente Academic
Documente Profesional
Documente Cultură
En este tema trabajaremos con muestras bivariantes cuantitativas, es decir, donde cada unidad estadística
presenta dos características cuantitativas y medibles X e Y.
Por Ej. Peso y Talla, trata de estudiar la asociación entre dos variables conocidas.
Existen 2 formas de estudio de asociación entre las variables X e Y.
1º La Regresión.- Consiste en determinar la relación funcional X e Y; con la finalidad de predecir el valor
de una variable en base a otra. Donde:
La variable que se va a predecir Variable Dependiente.
La variable que es la base de la predicción Variable Independiente.
2º La Correlación.- Que consiste en determinar la variación conjunta de las dos variables, su grado de
relación y su sentido (+ ó -); al grado de relación se denomina Coeficiente de Correlación o Índice de
Correlación.
DIAGRAMA DE DISPERSIÓN
Esta dado por n pares de valores (X1; Y1), (X2; Y2),.... (Xn; Yn); de una variable bidimensional.
Se denomina diagrama de dispersión o nube de puntos a la gráfica de valores (X i; Yi) de la variable X e Y en
el sistema cartesiano. Que al graficar se puede observar:
S XY
(X X)(Y Y) XY XY
n n
Ŷ a bX
n X´Y´ X´ Y´
b
n X´ X ´
2 2
i i
Publicidad Ventas XY X2 Y2
Semana X Y
1 20 50 1000 400 2500 50
2 30 73 2190 900 5329 70
3 30 69 2070 900 4761 70
4 40 87 3480 1600 7569 90
5 50 108 5400 2500 11664 110
6 60 128 7680 3600 16184 130
7 60 135 8100 3600 18225 130
8 60 132 7920 3600 17424 130
9 70 148 10360 4900 21904 150
10 80 170 13600 6400 28900 170
TOTAL 500 1100 61800 28400 134660
b) La regresión lineal
n = 10 x = 500 y = 500 xy = 61800 x2 = 28400 y2 = 134660
x = 500/10 = 50 y = 1100/10 = 110
b = 61800/34000 = 2 a = 110 – 2(50) = 10
Ejemplo: ^
Los datos de la siguiente tabla representan las horas de trabajo(X) y la longitud en metros de una zanja (Y).
Se tomó una muestra de personas que hicieron ese trabajo y se obtuvieron los siguientes datos:
X 8 7 5 4 2 3 5 6 8 9
Y 20 20 25 30 40 40 35 35 35 30
Diagrama de dispersión y estimaciones
Solución
Ord X Y X2 Y2 XY Y*
1 8 20 64 400 160 26.84
2 7 20 49 400 140 28.65
3 5 25 25 625 125 32.27
4 4 30 16 900 120 34.08
5 2 40 4 1600 80 37.69
6 3 40 9 1600 120 35.88
7 5 35 25 1225 175 32.27
8 6 35 36 1225 210 30.46
9 8 35 64 1225 280 26.84
10 9 30 81 900 270 25.03
∑ 57 310 373 10100 1680 26.84
b
XY n X Y
1680 10 x5.7 x31
87
1.8087
X nX
2 2
373 10(5.7) 2 48.1
a Y b X 31 ( 1.8087)(5.7) 41.31
Y = a + bX = 41.31 -1.8087X
r
XY X Y
n
n X X n Y X
2 2 2 2
Ejemplo:
En una fábrica de telas, se ha trabajado con lotes de algodón en toneladas, y las horas trabajadas.
Realizar el diagrama de dispersión y la fórmula para la regresión lineal, además realizar
pronósticos, para los datos siguientes:
Solución:
Tamaño de Horas
lote trabajadas
Ord X Y X Y XY Y*
1 20 30 400 900 600 5.14
2 20 55 400 3025 1100 5.14
3 30 73 900 5329 2190 -12.95
4 30 67 900 4489 2010 -12.95
5 40 87 1600 7569 3480 -31.04
6 40 95 1600 9025 3800 -31.04
7 50 108 2500 11664 5400 -49.13
8 50 112 2500 12544 5600 -49.13
9 60 128 3600 16384 7680 -67.21
10 60 135 3600 18225 8100 -67.21
11 70 148 4900 21904 10360 -85.30
12 70 160 4900 25600 11200 -85.30
13 80 170 6400 28900 13600 -103.39
14 80 162 6400 26244 12960 -103.39
∑ 700 1530 40600 191802 88080
50 109.2857
b
XY n X Y
88080 14 x50 x109.2857
14905920
2.18581
X nX
2 2
40600 14(20) 2 6819400
Y = -0.005 + 2.1858X
1. Se quiere analizar la relación entre la edad (X) y el tiempo efectivo de servicio (Y) de los
trabajadores, obteniéndose los siguientes resultados. Determinar: (a) El diagrama de
dispersión (b) Regresión Lineal (c) Coeficiente de correlación y su interpretación
X 30 25 39 46 48 40 46 32 28 32 42
Y 3 3 18 20 23 16 18 7 4 8 17
2. Los datos de la siguiente tabla representan las alturas(X) y los pesos (Y) de varios hombres
para adecuar a un sistema puente aéreo a través de carril entre Kuélap y una de las
comunidades rurales cercanas. Se tomó una muestra de personas que hicieron ese recorrido y
se obtuvieron los siguientes datos:
X 1.650 1.655 1.550 1.560 1.680 1.672 1.580 1.840 1.830 1.780 1.630
Y 63.500 65.550 29.759 63.250 75.750 67.350 58.650 81.600 82.575 78.850 63.250
a. Diagrama de dispersión y estimaciones
b. Cual es el modelo matemático y realizar las estimaciones.
c. El coeficiente de: correlación y de determinación, explique
3. Se quiere analizar la relación entre la edad (X) y el tiempo efectivo de servicio (Y) de los trabajadores,
para el efecto se tomó una muestra, obteniéndose los siguientes resultados. Determinar:
a) El diagrama de dispersión b) Regresión Lineal
c) Coeficiente de correlación y su interpretación
X 30 25 38 32 27 30 27 41 36 28 36 30 32 29 25 21 19 36 34 24 40
Y 5 4 12 8 7 5 7 9 11 4 12 12 6 4 3 1 1 12 14 6 14
4. Sean los ingresos en miles de soles (X) y consumo en alimentos básicos en miles de soles (Y)
a. Realizar el diagrama de dispersión
X 1.624 2.15 1.186 2.855 1.28 1.08 3.15 1.282
Y 1.58 2.095 0.98 3.41 0.982 0.888 5.20 0.98
7. Se tiene Las notas de cierta asignatura en el segundo examen y el número de horas semanales dedicadas
al estudio. Calcular:
(a) Definir las variables (b) La Regresión Lineal (c) Coeficiente de determinación y su
interpretación (d) Error Estándar (e) Calcular el coeficiente de variación para ambas variables y
analizarlas.
Notas 7 6 9 4 9 3 6 8 5 4 7 9 6 7 7 5
Número de horas 20 16 34 8 27 5 18 22 14 9 22 30 15 20 19 11
8. Se quiere analizar la relación entre la edad (X) y el tiempo efectivo de servicio (Y) de los trabajadores,
para el efecto se tomó una muestra, obteniéndose los siguientes resultados. Determinar: a) El diagrama
de dispersión b) Regresión Lineal c) Coeficiente de correlación y su interpretación
X 30 25 38 32 27 30 27 41 36 28 36 30 35 29 25 21 19 36 34 24 40
Y 5 4 12 8 7 5 7 14 11 4 12 8 10 6 3 1 1 12 12 4 14
10. Dada la recta de regresión de mínimos cuadrados Y = a + bX, si el tiempo efectivo de servicio del
trabajador es de 20. ¿Cuál seria la edad del trabajador?