Sunteți pe pagina 1din 20

ESTADISTICA I

ESTD080
2do semestre 2018

Prof.: Magaly Moraga C.


Medidas de variabilidad
2

La variabilidad de una muestra desempeña un papel


importante en el análisis de datos. La variabilidad de
procesos y productos es un hecho real en los
sistemas científicos y de ingeniería: el control o la
reducción de la variabilidad de un proceso a menudo
es una fuente de mayores dificultades.

Estadística I - 2018
Medidas de variabilidad
3

Compare los siguientes conjuntos de datos, cada uno


contiene dos muestras:

Estadística I - 2018
Medidas de variabilidad
4

Se definen los siguientes estadígrafos de


dispersión:
 Recorrido o Amplitud de la variable (R)

 Recorrido Intercuartílico (R.I)

 Varianza

 Desviación Estándar

 Coeficiente de Variabilidad o Variación (C.V.)

Estadística I - 2018
Medidas de Dispersión: Amplitud o Rango
5

 La amplitud o rango, se obtiene restando el valor más bajo de


un conjunto de observaciones del valor más alto. Indica si los
valores observados están próximas o concentrados entre sí o
por el contrario están muy dispersas.
 Es fácil de calcular y sus unidades son las mismas que las de la
variable, pero tiene algunas limitaciones:
• no utiliza todas las observaciones (sólo dos de ellas);
• está muy afectada por observaciones extremas;
• el rango aumenta con el número de observaciones, o bien se
queda igual (nunca disminuye).

Estadística I - 2018
Medidas de dispersión: Varianza
6

 De todas las distintas formas de cuantificar esa variabilidad, la


varianza (S2) de los datos es la más utilizada.
 Es la media de los cuadrados de las diferencias entre cada
valor de la variable y la media aritmética de la distribución.
 La varianza viene dada por las mismas unidades que la
variable pero al cuadrado.
𝑛 2
2
σ (𝑥
𝑖=1 𝑖 − 𝑥)
ҧ
𝑠 =
𝑛−1

Estadística I - 2018
Desviación estándar
7

 La desviación estándar (S) es la raíz cuadrada de la varianza.


 Expresa la dispersión de la distribución y se expresa en las
mismas unidades de medida de la variable.
 Es la medida de dispersión más utilizada en estadística.

σ𝒏𝒊=𝟏(𝒙𝒊 − 𝒙
ഥ) 𝟐
𝑠=
𝒏−𝟏
 El cambio de denominador de n por n-1 permite una
estimación más precisa de la desviación estándar verdadera
de la población y posee las propiedades que necesitamos
para realizar inferencias a la población.

Estadística I - 2018
Características de la varianza y desviación estándar
8

 Las características principales de la varianza y desviación


estándar:
• Son índices que describen la dispersión y si los datos están muy
alejados de la media, el numerador de sus fórmulas será grande
y por lo tanto la varianza y la desviación estándar lo serán.
• Al aumentar el tamaño de la muestra, disminuye la varianza y la
desviación estándar. Para reducir a la mitad la desviación
estándar, la muestra se tiene que multiplicar por 4.
• Cuando todos los datos de la distribución son iguales, la varianza
y la desviación estándar son iguales a 0.
• Para su cálculo se utilizan todos los datos de la distribución; por
tanto, cualquier cambio de valor se detecta.
Estadística I - 2018
Coeficiente de variación
9

 Es una medida de dispersión relativa de los datos y se calcula:


𝑠
𝐶𝑉 = ҧ ∙ 100
𝑥
Su función es comparar la dispersión o variabilidad de dos o más
grupos.
Ejemplo: ¿Que variable es más dispersa: Peso o Talla?

10.44
CV de la variable peso =
69.6
= 15% La desviación estándar de la talla es
mucho mayor; sin embargo, no
21.30
podemos comparar dos variables que
CV de la variable talla= = 12.8% tienen escalas de medidas diferentes.
166

Estadística I - 2018
Medidas de forma
10

Se definen los siguientes estadígrafos de forma:


 Curtosis

 Asimetría

Estadística I - 2018
Curtosis
11

Este coeficiente indica la cantidad de datos que hay


cercanos a la media, de manera que a mayor grado
de curtosis, más escarpada (o apuntada) será la
forma de la curva.

Estadística I - 2018
Curtosis
12

Sea el conjunto X=(x1, x2,…, xn), entonces el coeficiente de curtosis


será:

σ𝑛
𝑖=1(𝑥𝑖 − ҧ
𝑥) 4
Curtosis = −3
𝑛𝑠4

Mientras menor sea el coeficiente de curtosis, es más plana la


distribución.

Estadística I - 2018
Medidas de Asimetría
13

Estadística I - 2018
Asimetría
14

La asimetría es la medida que indica la simetría de la


distribución de una variable respecto a la media aritmética, sin
necesidad de hacer la representación gráfica. Los coeficientes
de asimetría indican si hay el mismo número de elementos a
izquierda y derecha de la media.

Estadística I - 2018
Asimetría
15

 Existen tres tipos de curva de distribución según su


asimetría:
 Asimetría negativa: la cola de la distribución se alarga para
valores inferiores a la media.
 Simétrica: hay el mismo número de elementos a izquierda y
derecha de la media. En este caso, coinciden la media, la
mediana y la moda. La distribución se adapta a la forma de la
campana de Gauss, o distribución normal.
 Asimetría positiva: la cola de la distribución se alarga para
valores superiores a la media.

Estadística I - 2018
Asimetría de Fisher CAF
16

 El coeficiente de asimetría de Fisher CAF, evalúa la


proximidad de los datos a su media.
 Cuanto mayor sea la suma, mayor será la asimetría.
 Sea el conjunto X=(x1, x2,…, xn), entonces la fórmula de la
asimetría de Fisher es:

σ𝑛𝑖=1(𝑥𝑖 − 𝑥)ҧ 3
𝐶𝐴𝐹 =
𝑛𝑠 3
Donde:
𝑥ҧ es la media y 𝑠 es la desviación estándar

Estadística I - 2018
Asimetría de Pearson
17

 Permite identificar si los datos se distribuyen de forma


uniforme alrededor de la Media.
 Mide la diferencia entre la media y la moda respecto a la

dispersión del conjunto X=(x1, x2,…, xn).


 Sólo se usa en distribuciones uniformes, unimodales y
moderadamente asimétricas.
 Se basa en que una distribución simétrica, la media de la

distribución es igual a la moda.


𝑥ҧ − 𝑀𝑜(𝑥)
𝐶𝐴𝑃 =
𝑠
Donde: 𝑥ҧ es la media, 𝑠 la desviación estándar y Mo(x) la moda.
Estadística I - 2018
Asimetría de Pearson CAP
18

 Presenta 3 formas, según distribución respecto de la media y


moda:
• Si CAP<0: la distribución tiene una asimetría negativa, puesto que la
media es menor que la moda.
• Si CAP=0: la distribución es simétrica.
• Si CAP>0: la distribución tiene una asimetría positiva, ya que la
media es mayor que la moda.

Estadística I - 2018
Diagrama de caja (box-plot)
19

Denominado también cajón con bigotes, es una


representación gráfica de los datos basados en los cinco
números: mínimo, primer cuartil, mediana, tercer cuartil y
máximo.
 Si el Histograma exhibe una forma
similar a la normal, esto debería
reflejarse también el Diagrama de Caja,
cuya forma se esperaría fuera:

Estadística I - 2018
Diagrama de cajón (box-plot)
20

La línea vertical que es dibujada desde el tercer cuartil hacia


arriba generalmente se extiende hasta el mayor valor que está a
una distancia de C3 +1,5(C3-C1).
Análogamente la línea que sale
del primer cuartil, hacia abajo, se
extiende hasta el menor valor que está a
la distancia C1-1,5(C3-C1). Los datos que caen
fuera de estos puntos se marcan con * y
se denominan puntos atípicos (outliers).

Estadística I - 2018

S-ar putea să vă placă și