Sunteți pe pagina 1din 8

Estadística bivariada.

Estadística.

Instituto IACC

29 de julio 2019.
Desarrollo

INSTRUCCIONES:
Lea atentamente y responda.
La tarea debe ser respondida en Word y adjuntando el archivo Excel cuando corresponda,
identificando adecuadamente la pregunta.
Se obtuvo la siguiente información acerca del número de años de estudio y la edad, de un grupo
de trabajadores de una nueva empresa en el norte de Chile:

Años de estudio
Edad
12 13 14 15
20 - 25 4 2 1 2
25 - 30 5 1 3 3
30 - 35 2 1 2 1

a)Complete la tabla bivariada (subtotales, totales).

Y
Total
X 12 13 14 15
20 - 25 4 2 1 2 9
25 - 30 5 1 3 3 12
30 - 35 2 1 2 1 6
Total 11 4 6 6 27

b) ¿Cuál es el promedio de edad de los que estudian 14 años?

Y
Total
X 12 13 14 15
20 - 25 4 2 1 2 9
25 - 30 5 1 3 3 12
30 - 35 2 1 2 1 6
Total 11 4 6 6 27

X 𝑛𝑖3
20 - 25 1
25 - 30 3
30 - 35 2
Total 6
((20 + 25|2) ∗ 1) + ((25 + 30|2) ∗ 3) + ((30 + 35|2) ∗ 2)
Promedio = = 28,33
6

Respuesta: el promedio de edad para los que estudian 14 años es de 28 años.

c) ¿Cuál es la cantidad de años de estudios promedio para quienes tienen a lo más 30 años?

Y
Total
X 12 13 14 15
20 - 25 4 2 1 2 9
25 - 30 5 1 3 3 12
30 - 35 2 1 2 1 6
Total 11 4 6 6 27

𝑛1𝑗+ 𝑛2𝑗
Y

12 9
13 3
14 4
15 5
Total 21

(12 ∗ 9) + (13 ∗ 3) + (14 ∗ 4) + (15 ∗ 5)


𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = = 13,23
21

Respuesta: la cantidad de años de estudios promedio para los menores de 30 años es de 13.

¿Qué grupo de trabajadores presenta la edad más homogénea: los que tienen 12 años de estudio o
15 años de estudio?

años años
d1) Edad estudio d2) Edad estudio
12 15
20 - 25 4 20 - 25 2
25 - 30 5 25 - 30 3
30 - 35 2 30 - 35 1
Total 11 Total 6
Marca de 12 años Mc*años Mc2*años
d1) Clase Edad estudio estudio estudio
22,5 20 - 25 4 90,0 2.025,0
27,5 25 - 30 5 137,5 3.781,3
32,5 30 - 35 2 65,0 2.112,5
11 292,5 7.918,8

292,50
̅=
𝑿 = 26,5909
11

σ = = 3,579

3,579
cv = = 0,1346 = 13,46%
26,590

Marca de 15 años Mc*años Mc2*años


Edad
d2) Clase estudio estudio estudio
22,5 20 - 25 2 45,0 1.012,5
27,5 25 - 30 3 82,5 2.268,8
32,5 30 - 35 1 32,5 1.056,3
6 160,0 4.337,5

160,0
̅=
𝑿 = 26,666
6

σ = = 3,441

3,441
CV = = 0,1290 = 12,90%
26,666
Respuesta: El grupo que presenta más homogeneidad son los que tienen 15 años de estudio, ya
que su coeficiente de variación es menor.
2) En esa misma empresa del norte, a los trabajadores se les realizó una prueba para poder
determinar el orden jerárquico y así obtener un mejor sueldo, los datos son:

N° de Puntaje obtenido
preguntas 1,0 - 3,0 3,0 - 5,0 5,0 - 7,0
20 - 25 5 15 16
25 - 30 23 12 15
30 - 35 19 5 7

Calcule e interprete la covarianza.

N° de Puntaje
N° trabajadores N° trabajadores
preguntas obtenido
20 - 25 36 1,0 - 3,0 47
25 - 30 50 3,0 - 5,0 32
30 - 35 31 5,0 - 7,0 38
Total 117 Total 117

(22,5 ∗ 36) + (27,5 ∗ 50) + (32,5 ∗ 31)


̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅ =
𝑃𝑟𝑒𝑔𝑢𝑛𝑡𝑎𝑠 = 27,29
117

(2 ∗ 47) + (4 ∗ 32) + (6 ∗ 38)


̅̅̅̅̅̅̅̅̅̅̅
𝑃𝑢𝑛𝑡𝑎𝑗𝑒 = = 3,85
117

Promedio de la multiplicación de las variables:

Puntaje obtenido
N° de
Mc
preguntas 1,0 - 3,0 3,0 - 5,0 5,0 - 7,0 Total fila
(preguntas)
20 - 25 5/225 15/1350 16/2160 36 22,5
25 - 30 23/1265 12/1320 15/2475 50 27,5
30 - 35 19/1235 5/650 7/1365 31 32,5
Total columna 47 32 38
N=117
Mc (puntaje) 2 4 6
225 + 1350 + 2160 + 1265 + 1320 + 2475 + 1235 + 650 + 1365
̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅
𝑃𝑟𝑒𝑔 ∗ 𝑃𝑢𝑛𝑡 = =
117

12045
̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅
𝑃𝑟𝑒𝑔 ∗ 𝑃𝑢𝑛𝑡 = = 102,95
117

𝑆𝑥𝑦 = 102,95 − (27,29 ∗ 3,85) = −2,12

Entonces, se puede concluir que la relación entre las variables es inversa, es decir, si el número
de preguntas aumenta, el puntaje obtenido disminuye en -2,12 puntos.

b)Calcule e interprete el coeficiente de correlación.

36 ∗ 22,5 + 50 ∗ 27,5 + 31 ∗ 32,5 3192,5


̅=
𝑿 = = 27,29
117 117

2 ∗ 47 + 4 ∗ 32 + 6 ∗ 38 450
̅=
𝒀 = = 3,85
117 117

2 ∗ 22,5 ∗ 5 + 4 ∗ 22,5 ∗ 15 + 6 ∗ 22,5 ∗ 16 + 2 ∗ 27,5 ∗ 23 + 4 ∗ 27,5 ∗ 12


+6 ∗ 27,5 ∗ 15 + 2 ∗ 32,5 ∗ 19 + 4 ∗ 32,5 ∗ 12 + 6 ∗ 32,5 ∗ 7 12955
̅̅̅̅
𝑿𝒀 = =
117 117
= 110,73

𝑆𝑥𝑦 = ̅̅̅̅̅̅̅
𝑿∗𝒀− 𝑿 ̅∗ 𝒀
̅ = 110,73 − (27,29 ∗ 3,85) = 5,66

Sx=1,94
Sy=-3,78

5,66
rxy = 1,94∗−3,78
= −0,77
Respuesta de Interpretación: Dados los resultados de rxy ≈ -1 se concluye que la relación entre
las variables es lineal con pendiente negativa, es decir, los trabajadores con mayor número de
preguntas suelen obtener menor puntaje.

3)Continuando con la empresa del norte, el departamento de bienestar está realizando estudios
médicos, por lo que consideró a 9 trabajadores, preguntándoles su estatura (cm) y peso (kg):

Altura 164 157 190 161 174 172 169 179 166
Peso 52 62 78 64 68 62 56 86 70

El jefe de RR.HH. plantea que a mayor altura, menor es el peso de los trabajadores, ¿usted está
de acuerdo? Justifique su respuesta.

n= 9
Promedio x= 170,2222222
Promedio y= 66,44444444

1
𝑺𝒙 = √ ∗ ((164 − 170,22)2 + (157 − 170,22)2 + (190 − 170,22)2 + (161 − 170,22)2 + (174 − 170,22)2
9−1
+ (172 − 170,22)2 + (169 − 170,22)2 + (179 − 170,22)2 + (166 − 170,22)2 ) = 1,49

1
𝑺𝒙 = √ ∗ ((52 − 66,44)2 + (62 − 66,44)2 + (78 − 66,44)2 + (64 − 66,44)2 + (68 − 66,44)2 + (62 − 66,44)2
9−1
+ (56 − 66,44)2 + (86 − 66,44)2 + (70 − 66,44)2 ) = 10,57

Rxy= 0,66901749

Utilizando Excel y la formula =Coef.de.correl(datos_de_x;datos_de_y).

Respuesta: se concluye que la relación entre las variables es lineal con pendiente positiva, es
decir, los trabajadores con mayor altura suelen presentar mayor peso. Por lo tanto lo planteado
por el jefe de RR.HH no concuerda con los resultados.
Bibliografía

IACC(2018). Estadística bivariada. Estadística. Semana 5.

S-ar putea să vă placă și