Sunteți pe pagina 1din 10

PROBLEMAS DE ESTADÍSTICA

Problema 4:
a) La fórmula de Sturgess propone como número k de intervalos, para agrupar un
conjunto de N observaciones en intervalos:
𝑘 = 1 + [3.3 ∗ log⁡ 𝑁]
En este caso 𝑁 = 70, luego 𝑘 = 7, ahora debemos propones el límite inferior del primer
intervalo y el límite superior del último intervalo. Al ser el valor mínimo 10.504 se
propone 10 como límite superior del último intervalo, y al ser 7 intervalos se propone
como anchura 12 para cada uno de ellos, para que sea un valor entero, con lo cual el
límite superior del último intervalo es 94.
La tabla de frecuencias será:
Intervalos: 10 < 𝑥 ≤ 22 22 < 𝑥 ≤ 34 34 < 𝑥 ≤ 46 46 < 𝑥 ≤ 58
Frecuencia
1 2 12 22
absoluta:
Frecuencia
0.014 0.028 0.171 0.314
relativa:

Intervalos: 58 < 𝑥 ≤ 70 70 < 𝑥 ≤ 82 82 < 𝑥 ≤ 94


Frecuencia
17 10 6
absoluta:
Frecuencia
0.243 0.142 0.085
relativa:

En esta tabla aparecen por filas los intervalos, junto con la frecuencia absoluta y la
frecuencia relativa. Por ejemplo, la cuarta columna se puede interpretar diciendo que el
24.3% de estos neumáticos han recorrido entre 58’000 y 70’000 Km hasta que se ha
producido un pinchazo o reventón.

b) La tabla de frecuencias acumuladas ascendente sería:

Intervalos: < 10,22] < 22,34] < 34,46] < 46,58] < 58,70] < 70,82] < 82,94]
𝑘

∑ 𝑛𝑗 1 3 15 37 54 64 70
𝑗=1

Y la tabla de frecuencias acumuladas descendente quedaría:


Intervalos: < 80,94] < 70,82] < 58,70] < 46,58] < 34,46] < 22,34] < 10,22]
𝑘

∑ 𝑛𝑗 70 64 54 37 15 3 1
𝑗=1

c) El histograma de frecuencias relativas se representa es la figura 1 y el de


frecuencias acumuladas en la figura 2:

Frecuencias relativas
0.35

0.3

0.25

0.2

0.15

0.1

0.05

0
<10,22] <22,34] <34,46] <46,58] <58,70] <70,82] <82,94]

Figura 1

Frecuencias acumuladas
1.2

0.8

0.6

0.4

0.2

0
<10,22] <22,34] <34,46] <46,58] <58,70] <70,82] <82,94]

Figura 2

d) Para calcular las medidas de tendencia central trabajamos con la tabla de


frecuencias del apartado a). Resulta que la media aritmética es:
𝑋̅ = 57′573⁡𝑘𝑚
Se interpreta diciendo que son los 70 neumáticos analizados se han recorrido
57′573⁡𝑘𝑚 antes de un pinchazo o reventón.
La mediana será:
̅̅̅̅ = 56′ 072⁡𝑘𝑚
𝑀𝑒
Significa que la mitad de los neumáticos han recorrido a lo sumo 56′ 0.72⁡𝑘𝑚 antes de
un pinchazo o reventón.
También observamos que no hay moda única.

e) La desviación típica es:


𝜎 = 15′ 969⁡𝑘𝑚
Y nos informa sobre lo que se dispersan los kilómetros recorridos por los diferentes
neumáticos respecto del kilómetro medio.
El coeficiente de variación de Pearson será:
𝜎
𝑔= ∗ 100% = 27.73%
𝑋̅
Al tomar un valor inferior al 100% resulta que la mediana es representativa, y al ser
dicho valor del 27.73% nos informa que el valor de la desviación típica es el 27.73% del
valor de la media.

f) Los coeficientes de asimetría de Pearson son en este caso:


57′ 573 − 56′072
𝑉1 = = 0.09399
15′ 969
Para calcular el coeficiente 𝑔1 calculamos:
7

𝑚3 = ∑ 𝑓𝑖 (𝑋𝑖 − 𝑋̅)3 = −12′ 720.315


𝑖=𝑖

Luego 𝑔1 = −3.123667, resultado de dividir 𝑚3 entre 𝜎 3 a la vista de este coeficiente


de asimetría la distribución resulta ser asimétrica a la izquierda, lo que significa que
algo menos de la mitad de los neumáticos pinchan o revientan antes de los 56′ 072⁡𝑘𝑚,
valor mediano de la distribución.
Para el cálculo del coeficiente de curtosis 𝑔2 necesitamos:
7

𝑚4 = ∑ 𝑓𝑖 (𝑋𝑖 − 𝑋̅)4 = 234594.7408


𝑖=𝑖

Luego:
𝑚4
𝑔2 = = −0.123
𝜎4
Esto significa que la distribución es de tupo platicúrtica, algo menos apuntada que la
distribución normal de media 57’573 km y desviación típica 15’969 km. Por tanto, en
los intervalos X ± ks con k ∈ Ν habrá menos proporción de observaciones que en dicha
distribución normal.

g) Propondría un kilometraje tal que el 70% de los neumáticos no hayan pinchado


o reventado antes de este kilometraje. Por tanto, buscamos el centil del 30%, que
vendrá dado por:
7
𝑐0.3 = 46 + 12 ∗ = 49.818
22
Luego el fabricante propondría cambiar los neumáticos a los 49818 km.

Problema 5:
En este problema deseamos comprobar si, al agrupar los datos en intervalos, la
información original aportada por los datos en cierta forma se conserva, o por el
contrario, hay diferencias relevantes. Teniendo en cuenta los resultados concretos
procedentes de diferentes familias, recogemos esta información:
N.º de datos: 50
Mínimo: 0’2 millones
Máximo: 3’8 millones
Media: 1’964
Moda: 2’3
Varianza: 0’7095
Desv. Típica: 0’8423
Primer Cuartel: 1’3
Mediana: 2
Tercer Cuartel: 2,6
Asimetría: 0’1697
Curtosis: -0’5984
Coef. de Pearson: 0’4289
En este primer análisis, las rentas son valores que oscilan entre 200.000 ptas. y 3’8
millones; la renta media familiar es de 1.964.000 ptas.; es una distribución que tiende a
ser simétrica (el coeficiente de asimetría es igual a 0’1697) y el coeficiente de curtosis
es negativo, que indica que la distribución está por debajo de la distribución normal
tipificada, es decir, es platicúrtica. Agrupemos los datos en intervalos de amplitud 0’5;
como la renta toma valores positivos y no superan el valor 4, podemos considerar rango
0-4.
𝑳𝒊−𝟏 − 𝑳𝒊 𝒙𝒊 𝒏𝒊 𝑵𝒊
0’0 – 0’5 0’25 2 2
0’5 – 1’0 0’75 4 6
1’0 – 1’5 1’25 10 16
1’5 – 2’0 1’75 8 24
2’0 – 2’5 2’25 13 37
2’5 – 3’0 2’75 6 43
3’0 – 3’5 3’25 5 48
3’5 – 4’0 3’75 2 50

Figura 3

Como esta información se puede calcular las siguientes medidas:


Media: 1’99
Varianza: 0’7324
Desv. Típica: 0’8558
Moda: 2’2143
Mediana: 2’0385
Asimetría: 0’046
Curtosis: -0’5888
Índice de Pearson: 0’4301
No hay mucha variación respecto del caso anterior; lo más significativo es que la renta
media ahora es 1990.000; si nos guiamos por este procedimiento, comparando este
valor medio con el primero, estaremos sustrayendo a cada familia unas 26.000 ptas.
Los intervalos con mayor frecuencia están situados en el centro; agrupar los datos en un
sentido u otro hace que el coeficiente de asimetría cambie (el nuevo valor es 0’046),
aunque en todos los casos toma valores cercanos a cero. A pesar de que el intervalo con
marca 2’25 es el de mayor frecuencia (por encima de la gráfica de la distribución
normal), los intervalos adyacentes reflejan lo contrario. Debido a esta situación, el
coeficiente de curtosis es negativo.
Si consideramos intervalos con mayor amplitud:
𝑳𝒊−𝟏 − 𝑳𝒊 𝒙𝒊 𝒏𝒊 𝑵𝒊
0-1 0’5 6 6
1-2 1’5 18 24
2-3 2’5 19 43
3-4 3’5 7 50

Media: 2’04
Varianza: 0’7684
Desviación Típica: 0’8766
Moda: 2’28
Mediana: 2’0526
Asimetría: -0’0331
Curtosis: - 0’6989
Coef. Pearson: 0’4297

Figura 4
De acuerdo con estos resultados, la renta media aumenta en 41000 ptas. de los datos
originales, siendo el resto de valores muy similares. Observar que ahora el coeficiente
de asimetría es negativo, pero en todos los casos muy próximo a cero, con lo cual la
distribución se puede considerar prácticamente simétrica.

Problema 6:
a) Vemos que es un conjunto de datos NO AGRUPADOS. Calculamos la media:
24

𝑋̅ = ∑ 𝑋𝑖 ∗ 𝑓𝑖 = 2.625
𝑖=1

Calculamos la mediana:
𝑋𝑛 + 𝑋𝑛+1
2 2
𝑀𝑒 = =3
2
Finalmente, la moda será:
𝑀𝑜 = 3

b) Para esto, agrupamos los datos en intervalos por Sturges:


𝑅 = 𝑋𝑚á𝑥 − 𝑋𝑚í𝑛 = 5 − 1 = 4
𝑘(𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠) = 1 + 3.3 ∗ log(𝑁) = 1 + 3.3 ∗ log(24) = 5.55
𝑘≈5
𝑅 4
𝐴= = = 0.8
𝑘 5
Entonces, graficamos:
Clases: X f 𝒇𝒓 F
1 – 1.8 1.4 5 0.208 5
1.8 – 2.6 2.2 6 0.25 11
2.6 – 3.4 3 8 0.333 19
3.4 – 4.2 3.8 3 0.125 22
4.2 – 5 4.6 2 0.083 24

Ahora, graficando:
Cantidad de familias que usan celulares
9
8
7
6
5
4
3
2
1
0
1 - 1.8 1.8 - 2.6 2.6 - 3.4 3.4 - 4.2 4.2 - 5

Figura 5

Vemos gráficamente, que la distribución de datos es asimétrica.

c) Evaluaremos formalmente la asimetría de la distribución mediante el índice de


asimetría de Pearson:
𝑋̅ − 𝑀𝑜
𝐴𝑠 =
𝜎
Reemplazando con los datos obtenidos en el inciso a):
2.625 − 3
𝐴𝑠 =
𝜎
Ahora, calculamos la desviación estándar:

𝑁
(𝑋𝑖 − 𝑋̅)2
𝜎 = √∑ = √1.401 = 1.183
𝑁
𝑖

Entonces, reemplazando:
2.625 − 3
𝐴𝑠 = = −0.317
1.183
Como el índice comprobamos que, al ser diferente de 0, la distribución presenta una
asimetría concordante con la histéresis gráfica hallada en el inciso b).

Problema 7:
Para calcular el coeficiente de variabilidad en cada caso debemos usar la siguiente
fórmula:
𝜎
𝐶𝑣 =
𝑋̅
Calculamos las medias de Tarma y la Oroya respectivamente:
5

𝑋̅1 = ∑ 𝑋𝑖 ∗ 𝑓𝑖 = 40.76
𝑖=1
5

𝑋̅2 = ∑ 𝑋𝑖 ∗ 𝑓𝑖 = 43.79
𝑖=1

Ahora, hacemos lo mismo con la desviación estándar de cada provincia


respectivamente:

𝑁
(𝑋𝑖 − 𝑋̅)2 ∗ 𝑓𝑖
𝜎1 = √∑ = √557.392 = 23.6
𝑁
𝑖

𝑁
(𝑋𝑖 − 𝑋̅)2 ∗ 𝑓𝑖
𝜎2 = √∑ = √473.248 = 21.754
𝑁
𝑖

Finalmente, calculamos los coeficientes de variabilidad de cada provincia:


𝜎1
𝐶𝑣1 = = 0.578
𝑋̅1
𝜎2
𝐶𝑣2 = = 0.497
𝑋̅2
Vemos que la provincia que presenta mayor dispersión o variabilidad es TARMA.

Problema 8:
Sabemos que, para calcular la curtosis para datos no agrupados, como es el caso,
usaremos la siguiente fórmula:
∑(𝑋𝑖 − 𝑋̅)4
𝑘= −3
𝑁 ∗ 𝜎4
Donde:
𝜎: 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛⁡𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
𝑋̅: 𝑀𝑒𝑑𝑖𝑎⁡𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
Calculamos primero la media:
15

𝑋̅ = ∑ 𝑋𝑖 ∗ 𝑓𝑖 = 0.166
𝑖=1
Ahora, procederemos a calcular la desviación estándar:

𝑁
(𝑋𝑖 − 𝑋̅)2
𝜎 = √∑ = √0.003 = 0.058
𝑁
𝑖

Finalmente, calculamos la curtosis con la fórmula planteada al inicio del problema:


∑(𝑋𝑖 − 𝑋̅)4
𝑘= − 3 = 2.672 − 3 = −0.327
𝑁 ∗ 𝜎4
𝑘 = −0.327
Al ser menor que 0, vemos que la distribución es menos apuntada y con colas menos
gruesas que la distribución normal.
La distribución es PLATICÚRTICA.

S-ar putea să vă placă și