Sunteți pe pagina 1din 21

3.

Medidas de Tendencia Central y dispersión

• Media aritmética, mediana, media ponderada, media geométrica, moda


• Varianza, desviación estándar
• Rango de la muestra
• Coeficiente de variación
• Media y varianza para datos agrupados
• Matriz de varianzas y covarianzas. Correlación.
• Sesgo y kurtosis
Medidas de TC
Medidas de Tendencia Central

Media Mediana Moda Media Ponderada


𝑁 Punto de mayor
1 𝑀𝑤 = 𝑤1 𝑋1 + 𝑤2 𝑋2 + ⋯ + 𝑤𝑛 𝑋𝑛
𝜇𝑥 = 𝑥𝑖 frecuencia
𝑁
𝑖=1
Condiciones:
𝑛 𝑛
1 𝑖=1 𝑤𝑖 = 1 y 0 ≤ 𝑤𝑖 ≤ 1
𝑥= 𝑥𝑖
𝑛
𝑖=1

…..
Medidas de TC
Medidas de Tendencia Central

Media cortada Media geométrica


Denotada por 𝑇α Representa la tasa (razón o
proporción) media de variación. Es
Es la media aritmética decir, muestra los cambios
del (1- α) 100 por ciento porcentuales en una serie de
de los datos números.
𝑛
𝑀𝐺 = 𝑋1 ∗ 𝑋2 ∗ ⋯ ∗ 𝑋𝑛
Medidas de TC – Media artimética, Mediana y
moda (1)
A continuación se detallan las calificaciones de álgebra obtenidas por un
grupo de estudiantes de octavo año:

Se solicita calcular:
- Media aritmética=
- Mediana=
- Moda=
Medidas de TC – Media ponderada (1)
Denotada por 𝑀𝑤 , cada observación tiene un peso positivo 𝑤𝑖 , condicionado a que
la suma de los “n” pesos sea igual a 1.

𝑀𝑤 = 𝑤1 𝑋1 + 𝑤2 𝑋2 + ⋯ + 𝑤𝑛 𝑋𝑛 Condiciones:
𝑛
𝑖=1 𝑤𝑖 = 1 y 0 ≤ 𝑤𝑖 ≤ 1

Ejemplo:
Un examen consta de 5 preguntas en las que dos alumnos A y B obtienen las
siguientes calificaciones según el orden de las preguntas:
A: 5,8,6,5,4 B: 3,7,8,6,3
¿Cuál de los dos alumnos tuvo mejor nota sabiendo que los ejercicios 1, 3 y 4
puntúan la mitad que los ejercicios 2 y 5?
Medidas de TC – Media ponderada (2)
Un examen consta de 5 preguntas en las que dos alumnos A y B obtienen las
siguientes calificaciones según el orden de las preguntas:
A: 5,8,6,5,4 B: 3,7,8,6,3
¿Cuál de los dos alumnos tuvo mejor nota sabiendo que los ejercicios 1, 3 y 4
puntúan la mitad que los ejercicios 2 y 5?
Preguntas Pesos
P1 = 1 0,143 𝑀𝑤𝐴 = 0,143 5 + 0,285 8 + 0,143 6 + 0,143 5 + 0,285 4 = 5,71
P2 = 2 0,285
𝑀𝑤𝐵 = 0,143 3 + 0,285 7 + 0,143 8 + 0,143 6 + 0,285 3 = 5,29
P3 = 1 0,143
P4 = 1 0,143
P5 = 2 0,285
Medidas de TC – Media cortada (1)
Medida que se ha sugerido para obviar la sensibilidad de la media
aritmética a los datos aberrantes y al mismo tiempo poder utilizar la
mayor cantidad de datos contenidos en la muestra. De esta manera se
tiene que:
𝑇α = 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 𝑑𝑒𝑙 1 − α 100 𝑝𝑜𝑟 𝑐𝑖𝑒𝑛𝑡𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠

α
Suprimiéndose, en una muestra ordenada, el 100% de los datos de la
α 2
parte “superior” y el 100% de la parte “inferior”.
2

¿Qué ocurre con los valores extremos al utilizar la media cortada?


Medidas de TC – Media cortada (2)
Ejemplo:
Tenemos la siguiente muestra
𝑋 𝑇 = (12, 7, 10, 3, 4, 7, 3, 9, 6, 9, 1, 4, 6, 4, 4, 9, 7, 4, 7, 11)

Calcular la media aritmética, la mediana, moda y la media cortada 𝑇0,10

- Ordenamos: 𝑋 1 =1 ; 𝑋 2 =3; 𝑋 3 =3; … ; 𝑋 18 =10; 𝑋 19 =11; 𝑋 20 =12


- La media cortada me pide suprimir el 10% de los datos lo que implica que para la
parte superior e inferior de mi muestra ordenada suprimiré 5% respectivamente.
Medidas de TC – Media cortada (3)
Ejemplo:
Muestra ordenada:
𝑋 𝑇 = (1, 3, 3, 4, 4, 4, 4, 4, 6, 6, 7, 7, 7, 7, 9, 9, 9, 10, 11, 12)

Nueva muestra:
𝑌 𝑇 = (3, 3, 4, 4, 4, 4, 4, 6, 6, 7, 7, 7, 7, 9, 9, 9, 10, 11)

𝑻𝟎,𝟏𝟎 = (𝟑 + 𝟑 + 𝟒 + 𝟒 + 𝟒 + 𝟒 + 𝟒 + 𝟔 + 𝟔 + 𝟕 + 𝟕 + 𝟕 + 𝟕 + 𝟗 + 𝟗 + 𝟗 + 𝟏𝟎 + 𝟏𝟏)/18 = 6,33


Medidas de TC – Media geométrica (1)
• Ejemplo:
El director ejecutivo de la empresa White-Knuckle Airlines desea
determinar la tasa de crecimiento promedio en los ingresos con base
en las cifras dadas en la tabla. Si la tasa de crecimiento promedio es
menor que el promedio industrial del 10%, se asumirá una nueva
campaña publicitaria.
Año Ingreso %año anterior
2005 US$ 50,000 -- --
2006 US$ 55,000 55/50= 1,10
2007 US$ 66,000 66/55= 1,20
2008 US$ 60,000 60/66= 0,91
2009 US$ 78,000 78/60= 1,30
Medidas de TC – Media geométrica (2)
• Ejemplo:
Año Ingreso %año anterior
2005 US$ 50,000 -- -- 4
𝑀𝐺 = 1,10 ∗ 1,20 ∗ 0,91 ∗ 1,30 = 1,1179
2006 US$ 55,000 55/50= 1,10
2007 US$ 66,000 66/55= 1,20 Concluimos que hay un incremento promedio
2008 US$ 60,000 60/66= 0,91 anual de 11,79%
2009 US$ 78,000 78/60= 1,30

1,10 + 1,20 + 0,91 + 1,30


𝑋= = 1,1275
4
Medidas de TC – Media geométrica (3)

Utilizando la media aritmética (1,1275) Utilizando la media geométrica (1,1179)

Año Ingreso Año Ingreso


2005 US$ 50,000 2005 US$ 50,000
2006 US$ 56,375 2006 US$ 55,895
2007 US$ 63,563 2007 US$ 62,485
2008 US$ 71,667 2008 US$ 69,852
2009 US$ 80,805 2009 US$ 78,088

¿Qué tasa de crecimiento promedio se asemeja más a la realidad?


Medidas de dispersión (1)
• Conocer las medidas de tendencia central es importante; sin embargo al
trabajar con diferentes muestras es probable que ambas presenten la
misma medida de tendencia central (Ej: Media aritmética) pero
diferente composición de datos.

𝑋1𝑇 = (1,2,3) 𝑋2𝑇 = (−5,2,9) 𝑋3𝑇 = (−10, −3, 0, 2, 3,20) 𝑋4𝑇 = (0,2,4)
𝑥=2

-10 -5 0 5 10 15 20
Medidas de Dispersión (2)
Variación

Rango Rango Varianza Desviación Coeficiente de


Intercuartílico Estándar Variación
R  X n   X 1 Varianza
s
Poblacional Desviación V
RI  Q3   Q1 100
N
Estándar x
 (x i  μ) 2 Poblacional
σ2  i1
N σ σ2
Varianza Desviación
Muestral Estándar
n Muestral
 (x i  x)2
s 
2 i 1 s s2
n -1
Medidas de dispersión (3)
Datos centrados:
Dada una muestra 𝑋 𝑇 = (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) se dice que los datos han sido
centrados si 𝑌𝑖 = 𝑋𝑖 − 𝑥, siendo 𝑦 = 0

Ejemplo:
𝑋3𝑇 = (−10, −3, 0, 2, 3,20) 𝑥=2
𝑌𝑖 = 𝑋𝑖 − 𝑥  𝑦 𝑇 = (−12 − 5 − 2 0 1 18)  𝑦 = 0
Medidas de dispersión (4)
Varianza muestral (𝑺𝟐 ):
Este valor no puede ser negativo, y toma valor de “0”
𝑛
𝑖=1(𝑋𝑖
−𝑥 )2 si y sólo si todas las observaciones adopten el mismo
𝑆2 = valor.
𝑛−1

Desviación estándar (S):

𝑛 Se utiliza la desviación típica de la muestra para utilizar


− 𝑥 )2
𝑖=1(𝑋𝑖 la misma unidad de los valores observados…
𝑆 =
𝑛−1 (Ej: 𝑐𝑚3 de precipitación pluvial)

Calcular 𝑆 2 y S para las 4 muestras del ejemplo anterior. ¿Cuál es menos dispersa?
¿Con qué muestra convendría trabajar?
Medidas de dispersión (5)
Datos estandarizados:
Estandarizar una muestra significa definir una nueva variable Y, en términos de los
valores observados X, de tal manera que:

𝑋𝑖 −𝑥
𝑌𝑖 = ; 𝑦 = 0 ꓥ 𝑆𝑦 = 1
𝑠

Ejemplo:
𝑋3𝑇 = (−10, −3, 0, 2, 3,20) 𝑥=2 𝑠 = 9,97

𝑋𝑖 −𝑥 −10−2 −3−2 0−2 2−2 3−2 20−2


𝑌𝑖 =
𝑠
 𝑦𝑇 =
9,97 9,97 9,97 9,97 9,97 9,97
 𝑦 𝑇 = −1,202 − 0,501 − 0,2 0 0,10 1,804
Medidas de Dispersión (6)
Rango muestral: Es la diferencia entre el valor máximo y el valor mínimo
de la muestra. Mide la dispersión en función de sus valores extremos,
determinando un intervalo que en el que se ubica el 100% de las
observaciones.
R  X n   X 1

Rango Intercuartil (RI): Es la diferencia entre el tercer y primer cuartil.


Determinando un intervalo que incluye el 50% de las observaciones de la
muestra.
RI  Q3   Q1
Coeficiente de Variación (1)

Sea una muestra 𝑋 𝑇 = (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) que tiene media aritmética 𝑥 y desviación


estándar S , el coeficiente de variación se define como:
𝑆
V = 100
𝑥

• Muestra la variación relativa a la media. En • Especialmente relevante para comparar la


otras palabras, compara la variabilidad de dos distribuciones con
representatividad de la media entre distintas medias.
distintas variables • Usado para comparar dos o más conjuntos
• Se expresa siempre en porcentaje (%). de datos medidos en diferentes unidades o
niveles.
Coeficiente de Variación (2)
CHOL AGE
Var= 3082,92 Var= 116,91
Sd= 55,52 Sd= 10,81
CV= 21,52 CV= 23,47
Media= 258,10 Media= 46,06

WT SPB
Var= 709,67 Var= 328.14
Sd= 26,64 Sd= 18.11
CV= 15,85 CV= 14,53
Media= 168,07 Media= 124,7

HT
Var= 7,66
Sd= 2,77
CV= 4,06
Media= 68,16
Estimar la función de distribución empírica y
graficarla…

0 𝑠𝑖 𝑥 < 𝑋(1)
𝑖
𝐹 𝑥 = 𝑠𝑖 𝑋(𝑖) ≤ 𝑥 < 𝑋(𝑖+1) i=1,2, … , n-1
𝑛
1 𝑠𝑖 𝑋(𝑛) ≤ 𝑥

S-ar putea să vă placă și