Sunteți pe pagina 1din 82

Estadı́stica I

Estadı́stica Descriptiva y Probabilidad

Eduardo Marı́n Nicolalde

Universidad de las Fuerzas Armadas ESPE


eemarin@espe.edu.ec

Octubre 2017

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 1 / 68


Descripción del Curso

1 Estadı́stica Descriptiva
Definiciones básicas
Gráficos Estadı́sticos
Medidas descriptivas

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 2 / 68


Definiciones básicas

Datos
Información proveniente de observaciones, conteos, medidas o respuestas.

La estadı́stica es la rama de la ciencia que se encarga de:


1 Recolectar datos
2 Organizar y resumir datos
3 Analizar datos
4 Realizar inferencia (decisiones y predicciones)

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 3 / 68


Definiciones básicas

Población (Universo)
Conjunto finito o infinito de todos los elementos que se desea estudiar.

Muestra
Subconjunto representativo de una población.

Ejemplo: A 2016, el 11.5% de las personas de 15 a 49 años en el Ecuador


son analfabetas digitales (Encuesta ENEMDU, diciembre 2016).
.
Población: Todas las personas de 15 a 49 años en el Ecuador.
Muestra: Las personas de 15 a 49 años en el Ecuador que
participaron en la encuesta ENEMDU.

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 4 / 68


Definiciones básicas

Parámetro
Medición numérica de una caracterı́stica de la población.

Ejemplo: A 2010, el 6.3% de la población ecuatoriana tiene tı́tulo de edu-


cación superior (Censo de Población y Vivienda, 2010)

Estadı́stico
Medición numérica de una caracterı́stica de la muestra.
Ejemplo: En Ecuador, el 85.5% de las personas tienen una instalación para
lavarse las manos con agua y jabón dentro de la vivienda. (Encuesta EN-
EMDU, diciembre 2016)

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 5 / 68


Definiciones básicas

Tipos de Datos
Cualitativos (Categóricos): Atributos, etiquetas o cualquier entrada
no numérica (i.e. La nacionalidad de los jugadores de fútbol del Manch-
ester United).
Cuantitativos: Medidas numéricas o conteos.
Discretos: Datos que toman números finitos o contables (i.e. Número
de panes que compra una familia en la tienda del barrio).
Continuos: Infinitos posibles valores que corresponden a alguna escala
continua sin interrupciones o saltos (i.e. La cantidad de gasolina a la
semana que utiliza un auto 4x4 medido en galones).

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 6 / 68


Definiciones básicas

Niveles de Medida
Nominal: Nombres, etiquetas o categorı́as. No existe esquema de
orden (i.e. Colores de automóviles).
Ordinal: Cualitativas o cuantitativas. Siguen un orden determinado.
Las diferencias entre datos carecen de significado (i.e. Tamaño de un
objeto).
Intervalo: Similar a ordinal. Las diferencia entre datos tiene signifi-
cado. No tiene punto de partida natural (i.e. Temperatura, tiempo)
Razón: Similar a intervalo pero con punto de partida natural 0. Las
diferencias y proporciones tienen significado (i.e. Peso, precios)

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 7 / 68


Descripción del Curso

1 Estadı́stica Descriptiva
Definiciones básicas
Gráficos Estadı́sticos
Medidas descriptivas

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 8 / 68


Gráficos Estadı́sticos
Distribución de Frecuencias
Tabla que muestra los datos agrupados en clases (intervalos) mutualmente
excluyentes, acompañadas de su frecuencia (número de datos que caen en
cada clase).

Ejemplo:

Edades Frecuencia (fi ) Definiciones:


Número de clases: 6
21-30 28
31-40 30 Lı́mites de clase inferiores: 21,31,41,51,61,71.
41-50 12 Lı́mites de clase superiores:30,40,50,60,70,80.
51-60 2 Anchura de clase:41-31 = 10
61-70 2 Fronteras de clase: Punto medio separación
71-80 2 clases ⇒ 20.5, 30.5, 40.5, 50.5, 60.5, 70.5, 80.5
Marcas de clase: Punto medio intra
Tabla: Edades de actrices clases ⇒ 25.5, 35.5, 45.5, 55.5, 65.5, 75.5
ganadoras del premio Oscar

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 9 / 68


Gráficos Estadı́sticos

Construcción de la Distribución de Frecuencias


Precio de 30 dispositivos GPS en dólares
90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 10 / 68


Gráficos Estadı́sticos

Construcción de la Distribución de Frecuencias


Precio de 30 dispositivos GPS en dólares
90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

1 Escoger número de clases deseadas (entre 5 y 20) ⇒ 7

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 10 / 68


Gráficos Estadı́sticos

Construcción de la Distribución de Frecuencias


Precio de 30 dispositivos GPS en dólares
90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

1 Escoger número de clases deseadas (entre 5 y 20) ⇒ 7


l m 
Calcular anchura de clase: Máximo - Mı́nimo
= 450−59

2
# clases 7 = 56

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 10 / 68


Gráficos Estadı́sticos

Construcción de la Distribución de Frecuencias


Precio de 30 dispositivos GPS en dólares
90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

1 Escoger número de clases deseadas (entre 5 y 20) ⇒ 7


l m 
Calcular anchura de clase: Máximo - Mı́nimo
= 450−59

2
# clases 7 = 56
3 Encontrar lı́mites de clase inferiores sumando (2) al lı́mite anterior.
Empezar por el mı́nimo.
59 −−→ 115 −−→ 171 −−→ 227 −−→ 283 −−→ 339 −−→ 395
+56 +56 +56 +56 +56 +56

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 10 / 68


Gráficos Estadı́sticos

Construcción de la Distribución de Frecuencias


Precio de 30 dispositivos GPS en dólares
90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

1 Escoger número de clases deseadas (entre 5 y 20) ⇒ 7


l m 
Calcular anchura de clase: Máximo - Mı́nimo
= 450−59

2
# clases 7 = 56
3 Encontrar lı́mites de clase inferiores sumando (2) al lı́mite anterior.
Empezar por el mı́nimo.
59 −−→ 115 −−→ 171 −−→ 227 −−→ 283 −−→ 339 −−→ 395
+56 +56 +56 +56 +56 +56
4 Encontrar lı́mites de clase superiores restando 1 al lim inf de la siguiente
clase, o:
114 −−→ 170 −−→ 226 −−→ 282 −−→ 338 −−→ 394 −−→ 450
+56 +56 +56 +56 +56 +56

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 10 / 68


Gráficos Estadı́sticos

Construcción de la Distribución de Frecuencias


Precio de 30 dispositivos GPS en dólares
90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

1 Escoger número de clases deseadas (entre 5 y 20) ⇒ 7


l m 
Calcular anchura de clase: Máximo - Mı́nimo
= 450−59

2
# clases 7 = 56
3 Encontrar lı́mites de clase inferiores sumando (2) al lı́mite anterior.
Empezar por el mı́nimo.
59 −−→ 115 −−→ 171 −−→ 227 −−→ 283 −−→ 339 −−→ 395
+56 +56 +56 +56 +56 +56
4 Encontrar lı́mites de clase superiores restando 1 al lim inf de la siguiente
clase, o:
114 −−→ 170 −−→ 226 −−→ 282 −−→ 338 −−→ 394 −−→ 450
+56 +56 +56 +56 +56 +56
5 Contar el número de datos en cada clase.

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 10 / 68


Gráficos Estadı́sticos
Construcción de la Distribución de Frecuencias
Precio de 30 dispositivos GPS en dólares
90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

Tabla: Distribución Frecuencias para los precios de dispositivos GPS

Precios Conteo Frecuencia (fi )

59-114 ||||| 5
115-170 |||||||| 8
171-226 |||||| 6
227-282 ||||| 5
283-338 || 2
339-394 | 1
395-450 ||| 3
P
i fi = 30

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 11 / 68


Gráficos Estadı́sticos
Cálculos adicionales
Marca de clase (MC): Punto medio dentro de cada clase
lim inf clasei + lim sup clasei
M Ci = 2

Precios Frecuencia (fi ) MC


59+114
59-114 5 2
=86.5
115+170
115-170 8 2
=142.5
171+226
171-226 6 2
=198.5
227+282
227-282 5 2
=254.5
283+338
283-338 2 2
=310.5
339+394
339-394 1 2
=366.5
395+450
395-450 3 2
=422.5
P
i fi = 30

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 12 / 68


Gráficos Estadı́sticos

Cálculos adicionales
Frecuencia Relativa: proporción de datos en cada clase.
Frecuencia de clase i-ésima fi
FR = # datos = n

fi 
Precios Frecuencia (fi ) MC FR n

5
59-114 5 86.5 30
= 0.17
8
115-170 8 142.5 30
= 0.27
6
171-226 6 198.5 30
= 0.20
5
227-282 5 254.5 30
= 0.17
2
283-338 2 310.5 30
= 0.07
1
339-394 1 366.5 30
= 0.03
3
395-450 3 422.5 30
= 0.10
P P fi
i fi = 30 i n ≈1

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 13 / 68


Gráficos Estadı́sticos
Cálculos adicionales
Frecuencia acumulativa (FA): suma de las frecuencias de la clase
i-ésima con todas las clases previas a ella.
F A ⇒ 5 −−→ 13 −−→ 19 −−→ 24 −−→ 26 −−→ 27 −−→ 30
+8 +6 +5 +2 +1 +3

fi 
Precios Frecuencia (fi ) MC FR n
FA

59-114 5 86.5 0.17 5


115-170 8 142.5 0.27 13
171-226 6 198.5 0.20 19
227-282 5 254.5 0.17 24
283-338 2 310.5 0.07 26
339-394 1 366.5 0.03 27
395-450 3 422.5 0.10 30
P P fi
i fi = 30 i n ≈1

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 14 / 68


Gráficos Estadı́sticos

Histograma de Frecuencias
Gráfico de barras que representa la distribución de frecuencias de un
conjunto de datos cuantitativos.

Caracterı́sticas:
Eje horizontal es cuantitativo y representa los valores de los datos.
Eje vertical representa frecuencias (absolutas o relativas).
Barras se dibujan sin espacios entre ellas.
Cada barra empieza y termina en la frontera de clase.
El eje horizontal puede contener etiquetas de las fronteras de clase o
de las marcas de clase.

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 15 / 68


Gráficos Estadı́sticos

Ejemplo: Histograma de frecuencias (fronteras de clase)

Tabla: Precios de dispositivos GPS Precios de dispositivos GPS en dólares

8
Precios fi MC FR FA

59-114 5 86.5 0.17 5 6


115-170 8 142.5 0.27 13
5

Frecuencia
171-226 6 198.5 0.20 19
227-282 5 254.5 0.17 24
283-338 2 310.5 0.07 26 3

339-394 1 366.5 0.03 27 2


395-450 3 422.5 0.10 30
1

0
Interpretación: Más de la mitad de los disposi-
58.5 114.5 170.5 226.5 282.5 338.5 394.5 450.5
tivos tienen precios inferiores a los $226.5
Precios

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 16 / 68


Gráficos Estadı́sticos

Ejemplo: Histograma de frecuencias relativas (fronteras de clase)

Tabla: Precios de dispositivos GPS Precios de dispositivos GPS en dólares

0.27

Precios fi MC FR FA

59-114 5 86.5 0.17 5 0.20


115-170 8 142.5 0.27 13

Frecuencia relativa
0.17
171-226 6 198.5 0.20 19
227-282 5 254.5 0.17 24
283-338 2 310.5 0.07 26 0.10

339-394 1 366.5 0.03 27 0.07


395-450 3 422.5 0.10 30
0.03

0.00
Interpretación: 64% de los dispositivos tienen
58.5 114.5 170.5 226.5 282.5 338.5 394.5 450.5
precios inferiores a los $226.5
Precios

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 17 / 68


Gráficos Estadı́sticos

Ejemplo: Histograma de frecuencias (marca de clase)

Tabla: Precios de dispositivos GPS Precios de dispositivos GPS en dólares

8
Precios fi MC FR FA

59-114 5 86.5 0.17 5 6


115-170 8 142.5 0.27 13
5

Frecuencia
171-226 6 198.5 0.20 19
227-282 5 254.5 0.17 24
283-338 2 310.5 0.07 26 3

339-394 1 366.5 0.03 27 2


395-450 3 422.5 0.10 30
1

0
Interpretación: 8 dispositivos tienen un precio de
86.5 142.5 198.5 254.5 310.5 366.5 422.5
alrededor de $142.5
Precios

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 18 / 68


Gráficos Estadı́sticos

Ejemplo: Histograma de frecuencias relativas (marca de clase)

Tabla: Precios de dispositivos GPS Precios de dispositivos GPS en dólares

0.27

Precios fi MC FR FA

59-114 5 86.5 0.17 5 0.20


115-170 8 142.5 0.27 13

Frecuencia relativa
0.17
171-226 6 198.5 0.20 19
227-282 5 254.5 0.17 24
283-338 2 310.5 0.07 26 0.10

339-394 1 366.5 0.03 27 0.07


395-450 3 422.5 0.10 30
0.03

0.00
Interpretación: El 3% de los dispositivos tiene
86.5 142.5 198.5 254.5 310.5 366.5 422.5
un precio de alrededor de $366.5
Precios

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 19 / 68


Gráficos Estadı́sticos

Polı́gono de Frecuencias
Gráfico de lı́nea que muestra el cambio en las frecuencias de manera
continua.
Caracterı́sticas:
Eje horizontal cuantitativo.
Etiquetas de marcas de clase (puntos medios) sobre el eje horizontal.
Eje vertical representa frecuencias (absolutas o relativas).
Marcas de clase conectadas por segmentos lineales.
La gráfica inicia y termina sobre el eje horizontal.

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 20 / 68


Gráficos Estadı́sticos

Ejemplo: Polı́gono de frecuencias

Tabla: Precios de dispositivos GPS Precios de dispositivos GPS en dólares

8
Precios fi MC FR FA

59-114 5 86.5 0.17 5 6


115-170 8 142.5 0.27 13
5

Frecuencia
171-226 6 198.5 0.20 19
227-282 5 254.5 0.17 24
283-338 2 310.5 0.07 26 3

339-394 1 366.5 0.03 27 2


395-450 3 422.5 0.10 30
1

0
Interpretación: La frecuencia de dispositivos
86.5 142.5 254.5 366.5
GPS incrementa hasta $142.5 y luego decrece.
Precios

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 21 / 68


Gráficos Estadı́sticos

Ojiva (Gráfico de Frecuencia Acumulativa)


Gráfico de lı́nea que muestra la frecuencia acumulativa de cada clase en su
lı́mite de clase superior.

Caracterı́sticas:
Eje horizontal cuantitativo.
Etiquetas de fronteras de clase sobre el eje horizontal.
Eje vertical representa frecuencias acumulativas (absolutas o relativas).
La gráfica inicia en la frontera inferior de la primera clase (frecuencia
acumulativa igual a 0) y termina en la frontera superior de la última
clase (frecuencia acumulativa es igual al número de datos).

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 22 / 68


Gráficos Estadı́sticos

Ejemplo: Ojiva (frecuencia absoluta)

Tabla: Precios de dispositivos GPS Precios de dispositivos GPS en dólares

30
Precios fi MC FR FA 27
26
24
59-114 5 86.5 0.17 5

Frecuencia acumulativa
115-170 8 142.5 0.27 13
19
171-226 6 198.5 0.20 19
227-282 5 254.5 0.17 24
13
283-338 2 310.5 0.07 26
339-394 1 366.5 0.03 27
395-450 3 422.5 0.10 30 5

0
Interpretación: 24 dispositivos tienen un precio
58.5 114.5 170.5 226.5 282.5 338.5 394.5 450.5
inferior a $282.5
Precios

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 23 / 68


Gráficos Estadı́sticos
Cálculos adicionales
Frecuencia relativa acumulativa (FRA): suma de las frecuencias
relativas de la clase i-ésima con todas las clases previas a ella.
F RA ⇒ 0.17 −
−−−
→ 0.44 −
−−−
→ 0.64 −
−−−
→ 0.81 −
−−−
→ 0.88 −
−−−
→ 0.91 −
−−−
→≈
+0.27 +0.20 +0.17 +0.07 +0.03 +0.10
1

fi 
Precios Frecuencia (fi ) MC FR n
FA FRA

59-114 5 86.5 0.17 5 0.17


115-170 8 142.5 0.27 13 0.44
171-226 6 198.5 0.20 19 0.64
227-282 5 254.5 0.17 24 0.81
283-338 2 310.5 0.07 26 0.88
339-394 1 366.5 0.03 27 0.91
395-450 3 422.5 0.10 30 1
P P fi
i fi = 30 i n ≈1

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 24 / 68


Gráficos Estadı́sticos

Ejemplo: Ojiva (frecuencia relativa)

Tabla: Precios de dispositivos GPS Precios de dispositivos GPS en dólares

1.00
Precios fi MC FR FA FRA 0.91
0.88
0.81

Frecuencia relativa acumulativa


59-114 5 86.5 0.17 5 0.17
115-170 8 142.5 0.27 13 0.44
0.64
171-226 6 198.5 0.20 19 0.64
227-282 5 254.5 0.17 24 0.81
0.44
283-338 2 310.5 0.07 26 0.88
339-394 1 366.5 0.03 27 0.91
395-450 3 422.5 0.10 30 1 0.17

0.00
Interpretación: 81% de los dispositivos tienen un
58.5 114.5 170.5 226.5 282.5 338.5 394.5 450.5
precio inferior a $282.5
Precios

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 25 / 68


Gráficos Estadı́sticos

Pastel
Cı́rculo dividido en sectores que representan categorı́as.

Caracterı́sticas:
Presenta datos cualitativos como porcentajes de un total.
El área de cada sector es proporcional a la frecuencia de cada categorı́a

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 26 / 68


Gráficos Estadı́sticos
Ejemplo: Pastel

Tabla: Precios de dispositivos GPS Precios de dispositivos GPS en dólares

Precios fi MC FR FA
115−170
59-114 5 86.5 0.17 5 27%

115-170 8 142.5 0.27 13


59−114
171-226 6 198.5 0.20 19 17%

227-282 5 254.5 0.17 24


283-338 2 310.5 0.07 26
339-394 1 366.5 0.03 27 171−226
20% 395−450
395-450 3 422.5 0.10 30 10%

339−394
3%
283−338
Interpretación: El 27% de dispositivos 227−282 7%
tienen un precio entre $115 y $170. 17%

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 27 / 68


Gráficos Estadı́sticos
Ejemplo: Pastel

Tipo de grados conferidos en 2007 (EEUU)


Tabla: Tipo de grados conferidos en 2007

Tipo fi FR

Asociado 728 0.24 Asociado


24%
Licenciatura 1525 0.51
Máster 604 0.20
Técnico 90 0.03
Licenciatura
51% Doctorado
Doctorado 60 0.02 2%
Técnico
3%

Interpretación: El 51% de grados conferidos


conferidos en EEUU en 2007 corresponde a Máster
20%
Licenciaturas.

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 28 / 68


Descripción del Curso

1 Estadı́stica Descriptiva
Definiciones básicas
Gráficos Estadı́sticos
Medidas descriptivas

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 29 / 68


Medidas descriptivas

Medidas descriptivas
Valores numéricos que permiten medir y describir diferentes caracterı́sticas
de un conjunto de datos.

Clasificación
1 Medidas de Tendencia Central
2 Medidas de Dispersión
3 Medidas de Posición
4 Medidas de Forma

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 30 / 68


1. Medidas de Tendencia Central

Medidas de Tendencia Central


Valores que se encuentran en el centro o a la mitad de un conjunto de
datos.
Clasificación
Media
Mediana
Moda
Rango medio

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 31 / 68


1. Medidas de Tendencia Central: Media

Media Aritmética (Media o Promedio)


Es la suma de los valores del conjunto de datos dividido entre el número
de datos.

Media poblacional Media muestral


N n
1 X 1X
µ= xi x̄ = xi
N n
i=1 i=1

Donde µ es la letra ”mu” del alfabeto griego. N y n son el número de


datos en la población y la muestra respectivamente y xi hace referencia al
i-ésimo dato.

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 32 / 68


1. Medidas de Tendencia Central: Media

Media Aritmética (Media o Promedio)


Es la suma de los valores del conjunto de datos dividido entre el número
de datos.
Caracterı́sticas:
Utiliza todos los valores del conjunto de datos.
Ejemplo: Calcular la media x̄ de la siguiente muestra.
Precio de 30 dispositivos GPS en dólares
90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

30
1 X 90 + 130 + · · · + 150 6304
x̄ = xi = = = 210.13 dólares
30 30 30
i=1

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 33 / 68


1. Medidas de Tendencia Central: Media

Caracterı́sticas:
Sensible a observaciones extremas.
Ejemplo: Calcular la media x̄ de la siguiente muestra.

Niveles de plomo en el aire (µg/m3 )


5.40 1.10 0.42 0.73 0.48 1.10

6
1X 9.23
x̄ = xi = = 1.538
6 6
i=1

Claramente, el valor 5.40 no corresponde al comportamiento tı́pico del con-


junto de datos. La media sobrestima los niveles de plomo en el aire.

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 34 / 68


1. Medidas de Tendencia Central: Mediana

Mediana
Valor que está en el medio de un conjunto de datos ordenados.



 x n+1
 si n = 2k + 1 (impar)
 2
x
e= h i
 1

 2 x n
+x
n
 si n = 2k (par)
2 2
+1

Donde x e se lee ”equis tilda”, k es un número entero y x(k) hace referencia


al estadı́stico de orden k.

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 35 / 68


1. Medidas de Tendencia Central: Mediana

Estadı́sticos de orden
El estadı́stico de orden k es igual al k-ésimo valor más pequeño de un
conjunto de datos.

Ejemplo: Suponga el siguiente conjunto de datos de tamaño n = 5

5, 7, 1, 3, 6

Normalmente x1 = 5, x2 = 7, x3 = 1, x4 = 3 y x5 = 6 donde el subı́ndice


i en xi indica el orden de observación de los datos. Los estadı́sticos de
orden se denotan:

x(1) = 1, x(2) = 3, x(3) = 5, x(4) = 6 y x(5) = 7

donde el subı́ndice (i) encerrado en paréntesis indica el estadı́stico de orden i


del conjunto de datos. Ası́, x(1) y x(n) serán siempre el mı́nimo y el máximo.

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 36 / 68


1. Medidas de Tendencia Central: Mediana

Caracterı́sticas:
Utiliza máximo 2 valores del conjunto de datos para el cálculo.
Ejemplo: Calcular la mediana x e de la siguiente muestra.
Precio de 30 dispositivos GPS en dólares
90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 37 / 68


1. Medidas de Tendencia Central: Mediana
Continuación: Calcular la mediana x
e de la siguiente muestra.
1 Ordenar los datos de forma ascendente.

59 70 90 95 100 130 130 130 150 150


150 160 170 180 200 200 200 200 220 250
250 250 270 275 300 325 350 400 400 450

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 38 / 68


1. Medidas de Tendencia Central: Mediana
Continuación: Calcular la mediana x
e de la siguiente muestra.
1 Ordenar los datos de forma ascendente.

59 70 90 95 100 130 130 130 150 150


150 160 170 180 200 200 200 200 220 250
250 250 270 275 300 325 350 400 400 450
2 Identificar si n es par o impar
n = 30 puede expresarse como n = 2k si k = 15 ⇒ par

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 38 / 68


1. Medidas de Tendencia Central: Mediana
Continuación: Calcular la mediana x
e de la siguiente muestra.
1 Ordenar los datos de forma ascendente.

59 70 90 95 100 130 130 130 150 150


150 160 170 180 200 200 200 200 220 250
250 250 270 275 300 325 350 400 400 450
2 Identificar si n es par o impar
n = 30 puede expresarse como n = 2k si k = 15 ⇒ par
3 Emplear la definición de xe según corresponda.
1 
x
e= x( n2 ) + x( n2 +1)
2
1 
= x(15) + x(16)
2
1
= [200 + 200]
2
= 200
El cálculo emplea solamente a los estadı́sticos de orden 15 y 16.
Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 38 / 68
1. Medidas de Tendencia Central: Mediana
Caracterı́sticas:
No es sensible a observaciones extremas.
Ejemplo: Calcular la mediana x e de la siguiente muestra.
Niveles de plomo en el aire (µg/m3 )
5.40 1.10 0.42 0.73 0.48 1.10

1 Ordenar los datos de forma ascendente.


0.42 0.48 0.73 1.10 1.10 5.40

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 39 / 68


1. Medidas de Tendencia Central: Mediana
Caracterı́sticas:
No es sensible a observaciones extremas.
Ejemplo: Calcular la mediana x e de la siguiente muestra.
Niveles de plomo en el aire (µg/m3 )
5.40 1.10 0.42 0.73 0.48 1.10

1 Ordenar los datos de forma ascendente.


0.42 0.48 0.73 1.10 1.10 5.40
2 Identificar si n es par o impar
n = 6 ⇒ par

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 39 / 68


1. Medidas de Tendencia Central: Mediana
Caracterı́sticas:
No es sensible a observaciones extremas.
Ejemplo: Calcular la mediana x e de la siguiente muestra.
Niveles de plomo en el aire (µg/m3 )
5.40 1.10 0.42 0.73 0.48 1.10

1 Ordenar los datos de forma ascendente.


0.42 0.48 0.73 1.10 1.10 5.40
2 Identificar si n es par o impar
n = 6 ⇒ par
3 Emplear la definición de xe según corresponda.
1  1
x
e= x(3) + x(4) = = 0.915
2 2
A diferencia del promedio, la mediana no se ve afectada por valores
extremos.
Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 39 / 68
1. Medidas de Tendencia Central: Moda

Moda
Valor que ocurre con mayor frecuencia en un conjunto de datos. Se denota
con la letra M .

Unimodal: si un solo valor ocurre con mayor frecuencia.


Bimodal: si dos valores ocurren con la misma frecuencia y esta es la
más alta.
Multimodal: si más de dos valores ocurren con la misma frecuencia y
esta es la más alta.
No hay moda: si ningún valor se repite.

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 40 / 68


1. Medidas de Tendencia Central: Moda

Ejemplo: Calcular la moda M del siguiente conjunto de datos


Precio de 30 dispositivos GPS en dólares
90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

1 Determinar la frecuencia de cada dato.


dato: 59 70 90 95 100 130 150 160 170 180 200 220 250 270 275 300 325 350 400 450
frecuencia: 1 1 1 1 1 3 3 1 1 1 4 1 3 1 1 1 1 1 2 1

2 La moda es 200. La distribución de los datos es unimodal.

El cálculo de la moda considera un solo valor del conjunto de datos. M no


se ve afectada por valores extremos.

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 41 / 68


1. Medidas de Tendencia Central: Rango Medio

Rango medio
Valor que se encuentra a medio camino entre el mı́nimo y el máximo del
conjunto de datos.

x(1) + x(n)
Rango medio =
2
Toma solamente el mı́nimo y el máximo para el cálculo ⇒
extremadamente sensible a valores extremos.

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 42 / 68


1. Medidas de Tendencia Central: Rango medio

Ejemplo: Calcular el rango medio del siguiente conjunto de datos.


Precio de 30 dispositivos GPS en dólares
90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

1 Ordenar los datos de forma ascendente.


59 70 90 95 100 130 130 130 150 150
150 160 170 180 200 200 200 200 220 250
250 250 270 275 300 325 350 400 400 450
2 Aplicar fórmula:
x(1) + x(n) 59 + 450
Rango medio = = = 254.5
2 2

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 43 / 68


1. Medidas de Tendencia Central
Comparación:
Precios de dispositivos GPS en dólares

~
x = 200 x = 210.13
M = 200 rango medio = 254.5
6

5
Frecuencia

58.5 114.5 170.5 226.5 282.5 338.5 394.5 450.5

Precios

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 44 / 68


2. Medidas de Dispersión

Medidas de dispersión
Valor numérico que muestra la variabilidad de una distribución.

Clasificación:
Rango
Varianza
Desviación estándar
Coeficiente de Variación

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 45 / 68


2. Medidas de Dispersión: Rango

Rango
Diferencia entre el valor máximo y el valor mı́nimo de un conjunto de
datos.

Rango = x(n) − x(1)

El rango mide el ancho del intervalo en el cual se encuentran representados


los datos.

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 46 / 68


2. Medidas de Dispersión: Rango

Ejemplo: Calcular el rango del siguiente conjunto de datos.


Precio de 30 dispositivos GPS en dólares
90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

1 Ordenar los datos de forma ascendente.


59 70 90 95 100 130 130 130 150 150
150 160 170 180 200 200 200 200 220 250
250 250 270 275 300 325 350 400 400 450
2 Aplicar fórmula:

Rango = x(n) − x(1) = 450 − 59 = 391

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 47 / 68


2. Medidas de Dispersión: Varianza

Varianza
Promedio del cuadrado de las desviaciones respecto a la media de un
conjunto de datos.

Varianza poblacional Varianza muestral


N n
1 X 2 1 X
2
σ = (xi − µ)2 s = (xi − x̄)2
N n−1
i=1 i=1

Donde σ es la letra minúscula sigma del alfabeto griego. Al elevar al


cuadrado las desviaciones respecto a la media (xi − x̄), las unidades de
medida también se expresan en términos cuadráticos, dificultando la inter-
pretación.

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 48 / 68


2. Medidas de Dispersión: Desviación Estándar

Desviación estándar
Medida de variación de los datos respecto a la media. Se calcula como la
raı́z cuadrada de la varianza.

Desviación estándar Desviación estándar


poblacional muestral
v v
N √
u n

u
u1 X u 1 X
2
σ= σ =t (xi − µ)2 s = s2 = t (xi − x̄)2
N n−1
i=1 i=1

Al sacar la raı́z cuadrada de la varianza, las unidades vuelven a la escala


original de los datos, facilitando su interpretación como el promedio de las
desviaciones respecto a la media.

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 49 / 68


2. Medidas de Dispersión: Desviación Estándar

Desviación estándar
Medida de variación de los datos respecto a la media. Se calcula como la
raı́z cuadrada de la varianza.

Tabla: Estructura para el cálculo de la


Fórmula abreviada varianza y desviación estándar

Pn 2
Pn 2 i xi x2i
n i=1 xi − ( i=1 xi )
s2 = 1 x1 x21
n(n − 1)
2 x2 x22
.. .. ..
s P
n ni=1 x2i − ( ni=1 xi )2
P
. . .
s=
n(n − 1) n xn x2n
Pn Pn
Totales i=1 xi i=1 x2i

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 50 / 68


2. Medidas de Dispersión: Desviación Estándar
Ejemplo: Calcular la varianza σ 2 y la desviación estándar σ del siguiente
conjunto de datos.
Precio de 30 dispositivos GPS en dólares
90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

Varianza: Tabla: Cálculo de la varianza


Pn Pn
n i=1 x2i − ( i=1 xi )2
s2 = i xi x2i
n(n − 1)
30 × 1625656 − (6304)2 1 90 8100
= 2 130 16900
30(29)
.. .. ..
48769680 − 39740416 . . .
=
870 30 150 22500
= 10378.46 dólares2 Totales 6304 1625656

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 51 / 68


2. Medidas de Dispersión: Desviación Estándar
Ejemplo: Calcular la varianza σ 2 y la desviación estándar σ del siguiente
conjunto de datos.
Precio de 30 dispositivos GPS en dólares
90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

Tabla: Cálculo de la varianza


Desviación estándar:
s i xi x2i
30 × 1625656 − (6304)2
s= 1 90 8100
30(29)
p 2 130 16900
= 10378.46 dólares2 .. .. ..
. . .
= 101.47 dólares 30 150 22500
Totales 6304 1625656

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 52 / 68


2. Medidas de Dispersión: Coeficiente de variación

Coeficiente de variación (CV)


Describe a la desviación estándar como porcentaje de media. Permite com-
parar la dispersión de conjuntos de datos medidos en distintas unidades.

CV poblacional CV muestral
σ s
CVp = × 100% CVm = × 100%
µ x̄

A diferencia del resto de medidas de dispersión, el coeficiente de variación


no posee unidades (utiliza porcentajes), lo que permite comparar la
dispersión de diferentes conjuntos de datos.

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 53 / 68


2. Medidas de Dispersión: Coeficiente de variación

Ejemplo: Calcular el coeficiente de variación CV del siguiente conjunto de


datos.
Precio de 30 dispositivos GPS en dólares
90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150
Si s = 101.47 dólares y x̄ = 210.13 dólares. El coeficiente de variación:
s
CVm = × 100%

101.47 dólares
= × 100%
210.13 dólares
= 48.48%

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 54 / 68


3. Medidas de Posición

Cuantiles
Valores numéricos que dividen al conjunto de datos ordenados en partes
iguales.

Clasificación:
Mediana: x
e ⇒ 2 partes iguales (50%).
Cuartiles: Q1 , Q2 y Q3 ⇒ 4 partes iguales (25%).
Quintiles: Qt1 , Qt2 , Qt3 y Qt4 ⇒ 5 partes iguales (20%).
Deciles: D1 , D2 , . . . , D9 ⇒ 10 partes iguales (10%).
Percentiles: P1 , P2 , . . . , P9 9 ⇒ 100 partes iguales (1%).

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 55 / 68


3. Medidas de Posición

Figura: Equivalencias entre medidas de posición.


Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 56 / 68
3. Medidas de Posición: Valor a percentil
De valor a percentil:
Dado un valor x del conjunto de datos, deseamos saber en que percentil se
ubica. Utilizamos la siguiente fórmula:
n
100 X
percentilx = 1{xi <x}
n
i=1

Donde percentilx hace referencia al percentil en el que se encuentra un


valor x cualquiera. La función indicatriz 1{xi <x} asigna un valor de 1 a los
elementos que cumplen con la condición xi < x. Caso contrario se asigna
el valor 0. Formalmente:

1 si xi < x
1{xi <x} =
0 si xi ≥ x
En sı́ntesis: La suma de los elementos de función indicatriz ni=1 1{xi <x}
P
sirve para contar el número de elementos menores al valor x.
Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 57 / 68
3. Medidas de Posición: Valor a percentil
Ejemplo: Calcular el percentil correspondiente al precio 275.
Precio de 30 dispositivos GPS en dólares
90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

1 Ordenar los datos de forma ascendente


59 70 90 95 100 130 130 130 150 150
150 160 170 180 200 200 200 200 220 250
250 250 270 275 300 325 350 400 400 450
Pn
2 Contar el número de datos menores a 275 (i.e. i=1 1{xi <275} )
3 Aplicar la fórmula
30
100 X 2400
percentil275 = 1{xi <275} = = 80
n 30
i=1

Ası́, el precio 275 corresponde a P80 . Equivalentemente P80 = D8 = Qt4


Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 58 / 68
3. Medidas de Posición: Percentil a valor

De percentil a valor:
Dado un percentil p, deseamos conocer qué valor lo representa.

Algorı́tmo de cálculo: 1

1 Determinar el percentil p a calcular, tal que 0 ≤ p ≤ 1.


2 Ordenar los datos de forma ascendente.
3 Calcular h = (p(n − 1) + 1)
4 Tomar una decisión:
Si h ∈ N ⇒ el percentil p = x(h)
Si h ∈
/N⇒
Calcular j = bhc
Encontrar x(j)
Encontrar x(j+1)  
El percentil p = x(j) + (h − j) x(j+1) − x(j)

1
Algoritmo predeterminado para el cálculo de cuantiles en el software R.
Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 59 / 68
3. Medidas de Posición: Percentil a valor

Ejemplo: Para el siguiente grupo de datos, calcule el Cuartil 3 (Q3 ).

Precio de 30 dispositivos GPS en dólares


90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 60 / 68


3. Medidas de Posición: Percentil a valor

Ejemplo: Para el siguiente grupo de datos, calcule el Cuartil 3 (Q3 ).

Precio de 30 dispositivos GPS en dólares


90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

1 Determinar el percentil p a calcular, tal que 0 ≤ p ≤ 1.


Q3 = P75 ⇒ p = 0.75

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 60 / 68


3. Medidas de Posición: Percentil a valor

Ejemplo: Para el siguiente grupo de datos, calcule el Cuartil 3 (Q3 ).

Precio de 30 dispositivos GPS en dólares


90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

1 Determinar el percentil p a calcular, tal que 0 ≤ p ≤ 1.


Q3 = P75 ⇒ p = 0.75
2 Ordenar los datos de forma ascendente.
59 70 90 95 100 130 130 130 150 150
150 160 170 180 200 200 200 200 220 250
250 250 270 275 300 325 350 400 400 450

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 60 / 68


3. Medidas de Posición: Percentil a valor

Ejemplo: Para el siguiente grupo de datos, calcule el Cuartil 3 (Q3 ).

Precio de 30 dispositivos GPS en dólares


90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

1 Determinar el percentil p a calcular, tal que 0 ≤ p ≤ 1.


Q3 = P75 ⇒ p = 0.75
2 Ordenar los datos de forma ascendente.
59 70 90 95 100 130 130 130 150 150
150 160 170 180 200 200 200 200 220 250
250 250 270 275 300 325 350 400 400 450
3 Calcular h = (p(n − 1) + 1)
h = (0.75(29) + 1) = 22.75

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 60 / 68


3. Medidas de Posición: Percentil a valor

Ejemplo: Para el siguiente grupo de datos, calcule el Cuartil 3 (Q3 ).

Precio de 30 dispositivos GPS en dólares


90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

4 Tomar una decisión:


Si h ∈ N ⇒ el percentil p = x(h)

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 61 / 68


3. Medidas de Posición: Percentil a valor

Ejemplo: Para el siguiente grupo de datos, calcule el Cuartil 3 (Q3 ).

Precio de 30 dispositivos GPS en dólares


90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

4 Tomar una decisión:


Si h ∈ N ⇒ el percentil p = x(h)
Si h ∈
/N⇒
Calcular j = bhc = b22.75c = 22

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 61 / 68


3. Medidas de Posición: Percentil a valor

Ejemplo: Para el siguiente grupo de datos, calcule el Cuartil 3 (Q3 ).

Precio de 30 dispositivos GPS en dólares


90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

4 Tomar una decisión:


Si h ∈ N ⇒ el percentil p = x(h)
Si h ∈
/N⇒
Calcular j = bhc = b22.75c = 22
Encontrar x(j) = x(22) = 250
Encontrar x(j+1) = x(23) = 270

59 70 90 95 100 130 130 130 150 150


150 160 170 180 200 200 200 200 220 250
250 250 270 275 300 325 350 400 400 450

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 61 / 68


3. Medidas de Posición: Percentil a valor
Ejemplo: Para el siguiente grupo de datos, calcule el Cuartil 3 (Q3 ).
Precio de 30 dispositivos GPS en dólares
90 130 400 200 350 70 325 250 150 250
275 270 150 130 59 200 160 450 300 130
220 100 200 400 200 250 95 180 170 150

Tenemos: h = 22.75, j = 22, x(j) = 250 y x(j+1) = 270

El percentil p es igual a:

 
p = x(j) + (h − j) x(j+1) − x(j)
 
= 250 + (22.75 − 22) x(23) − x(22)
= 250 + [(0.75) (270 − 250)]
= 265
Al menos 75% de los datos son menores a 265. El Q3 divide al conjunto de
datos en dos partes: 75% inicial y 25% final.
Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 62 / 68
3. Medidas de Forma

Medidas de forma
Proporcionan información acerca de la forma de la distribución.

Clasificación:
Coeficiente de asimetrı́a
Curtosis

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 63 / 68


3. Medidas de Forma: Coeficiente de asimetrı́a

Coeficiente de asimetrı́a
Determina el grado de asimetrı́a de la distribución.

La fórmula de cálculo del coeficiente de asimetrı́a de la muestra se


presenta a continuación2 :
Pn 3
n i=1 (xi − x̄)
γ1 =
(n − 1)(n − 2) s3

Interpretación:
Si γ1 > 0 asimetrı́a positiva.
Si γ1 < 0 asimetrı́a negativa.
Si γ1 = 0 simétrica.

2
Fórmula de cálculo utilizada por el paquete ”PerformanceAnalytics” del software R y por Excel.
Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 64 / 68
3. Medidas de Forma: Coeficiente de asimetrı́a
Grado de asimetrı́a:
Si (γ1 < −1) o (γ1 > 1) altamente asimétrico.
Si (−1 ≤ γ1 < −0.5) o (0.5 < γ1 ≤ 1) asimetrı́a moderada.
Si (−0.5 ≤ γ1 ≤ 0.5) aproximadamente simétrica.

Figura: Grados de Asimetrı́a [Bulmer, 1979] .

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 65 / 68


3. Medidas de Forma: Curtosis

Curtosis
Determina el grado de apuntalamiento de la distribución.

La fórmula de cálculo para el exceso de curtosis se presenta a contin-


uación3 :
Pn 4
n(n + 1) i=1 (xi − x̄) 3(n − 1)2
γ2 = −
(n − 1)(n − 2)(n − 3) s4 (n − 2)(n − 3)

Se denomina exceso de curtosis ya que se resta la curtosis teórica de una


distribución normal (lado derecho de la resta) de la curtosis de la muestra.
Interpretación:
Si γ2 > 0 leptocúrtica (apuntalada).
Si γ2 < 0 platicúrtica (aplastada)
Si γ2 = 0 mesocúrtica (normal)
3
Fórmula de cálculo utilizada por el paquete ”PerformanceAnalytics” del software R y por Excel.
Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 66 / 68
Referencias

Bogaert Patrick (2007)


Probabilités pour scientifiques et ingénieurs
De Boeck & Larcier 2ed.
Bulmer M. G. (1979)
Principles of Statistics
Dover Publications 1ed.
Larson Ron & Farber Betsy (2012)
Elementary statistics. Picturing the world
Pearson Education 5ed.
Triola, Mario F. (2009)
Estadı́stica
Pearson Education 10ed.
Wackerly, Mendenhall & Scheaffer (2008)
Estadı́stica Matemática con Aplicaciones
Cengage Learning 7ed.

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 67 / 68


Fin

Eduardo Marı́n Nicolalde (ESPE) Estadı́stica Descriptiva y Probabilidad Octubre 2017 68 / 68

S-ar putea să vă placă și