Sunteți pe pagina 1din 9

ESTADISTICA Y CONTROL DE CALIDAD

Medidas de Tendencia central (o de posición)

Una medida de tendencia central o de posición es un valor que se calcula para un grupo de
datos y que se utiliza para describirlos de alguna manera. Normalmente se desea que el valor sea
representativo de todos los valores incluidos en el grupo y, por ello, se desea alguna clase de
promedio. En sentido estadístico, un “promedio” es una medida de tendencia central para un
conjunto de valores.

Medidas de Tendencia Central:

- Media Aritmética
- Media Ponderada
- Mediana
- Moda
La media aritmética y media ponderada.

La media aritmética, o promedio aritmético, se define como la división de la suma de todos los
valores entre el número de valores.

PROPIEDADES DE LA MEDIA ARITMETICA

1. Todo conjunto de datos de nivel de intervalo y nivel de razón tienen un valor medio.
2. al evaluar la media se incluyen todos los valores
3. un conjunto de datos solo tiene una media
4. la media es una medida útil para comparar dos o más poblaciones
5. la media es la única medida de posición donde la suma de las desviaciones de cada valor
con respecto a la media siempre será cero.

En estadística es normal representar una medida descriptiva de una población, o


parámetro poblacional, mediante letras griegas, en tanto que se utilizan letras romanas para las
medidas descriptivas de muestras, o estadísticos muestrales. Así, la media aritmética para una
población de valores se presenta mediante el símbolo μ (que se pronuncia mu), en tanto que la
media aritmética de una muestra de valores se representa mediante el símbolo X (que se lee “x
barra”).

En estadística las características o medidas descriptivas de una población que son los parámetros
se representan mediante letras griegas.

Para las características o medidas descriptivas de una muestra que son estadísticos se
representan mediante letras romanas.

  Media de la población
∑𝜒
𝜇=
𝑁

x representa los valores de la variable de interés


N Número total de valores o elementos en la población

UNIDAD I Página 1
ESTADISTICA Y CONTROL DE CALIDAD

x  Media de la muestra

∑𝜒
𝜒̅ =
𝑛

n  Número total de valores o elementos en la muestra

En cuanto a operaciones se refiere, las dos fórmulas son idénticas; en ambos casos se
suman todos los valores y después se divide este total entre el número de valores que son. Sin
embargo, la diferencia en los denominadores se debe a que el análisis estadístico, la N
normalmente indica el número de elementos de una población, en tanto que la n señala el
número de elementos de una muestra.

La Media Aritmética para Datos Agrupados.

Cuando se agrupan datos en una distribución de frecuencias, se utiliza el punto medio de


cada clase como aproximación de todos los valores contenidos en ella. El punto medio se
representa con el símbolo Xc, en donde el subíndice c se debe a “clase”, y se utiliza la letra f
para representar la frecuencia observada de valores en la clase respectiva. Por ello, las fórmulas
para la media de la población y de la muestra para datos agrupados son:

∑(fxc )
μ=
N

∑(fxc )
𝓍̅ =
n

Media ponderada.- es u caso especial de la media aritmética en la cual se considera a cada uno
de los valores de acuerdo con su importancia en el grupo. A cada valor se le asigna una
ponderación o peso de acuerdo a su importancia en el grupo.

∑(𝑤𝑥)
𝜇𝑤 ó 𝜒̅𝑤 =
∑𝑤
w  valor ponderado o peso
La Mediana.

La mediana (
~x) de un grupo de datos es el valor del dato que ocupa un lugar medio de
cuando se les agrupa a todos en orden ascendente o descendente. Si el número de medidas es
impar, la mediana será la medida en el centro. Para un grupo con un número par de elementos,
se supone que la mediana se encuentra a la mitad entre los dos valores adyacentes al centro.
Cuando el conjunto de datos contiene un número grande de valores, resulta útil la siguiente
fórmula para determinar la posición de la mediana en el conjunto ordenado.

UNIDAD I Página 2
ESTADISTICA Y CONTROL DE CALIDAD
PROPIEDADES DE LA MEDIANA

1. Es única; esto es, a semejanza de la media, sólo existe una mediana para un conjunto de
datos.
2. No se ve afectada por valores muy grandes o muy pequeños, por lo tanto es una medida
valiosa de tendencia central cuando ocurre este tipo de valores.
3. Puede calcularse para una distribución de frecuencia con una clase de extremo abierto.
4. Puede calcularse para datos de nivel de razón, de intervalo y ordinal.

La media aritmética puede no ser representativa cuando se tienen en los datos uno o dos valores
sumamente grandes o pequeños

La Mediana para Datos Agrupados.

Para datos agrupados, en primer lugar es necesario determinar la clase que contiene el
valor de la mediana, para después determinar la posición de la mediana dentro de la clase
mediante interpolación. La clase que contiene la mediana es la primera cuya frecuencia
acumulada iguala o excede la mitad del total de observaciones. Una vez que se identifica esta
clase, se determina el valor específico mediante la siguiente fórmula:

𝑁
− ∑ 𝑓𝑎𝐴
𝑀𝑒𝑑 = 𝐿𝑖 + [ 2 ]𝑐
𝑓𝑐

En donde: Li = límite exacto inferior de la clase que contiene la mediana.


N = número total de observaciones en la distribución de frecuencias (n para una
muestra)
faA = la frecuencia acumulada de la clase que precede (“antes”) a la clase que
contiene la mediana
fc = número de observaciones en la clase que contiene la mediana.
c = tamaño del intervalo de clase.

UNIDAD I Página 3
ESTADISTICA Y CONTROL DE CALIDAD
La Moda.

La moda es el valor que se presenta con mayor frecuencia en un conjunto de datos. A


una distribución que tiene una sola moda se le denomina unimodal. Para un conjunto de datos
poco numeroso, en el que no se repite ningún valor, no existe moda. Cuando dos valores no
adyacentes tienen frecuencias máximas similares, se dice que la distribución es bimodal. A las
distribuciones de mediciones que tienen varias modas se les denomina multimodales.
La moda para el ejemplo es 2860 pues es el valor que presenta mayor frecuencia.

PROPIEDADES DE LA MODA

1. Puede calcularse para datos de nivel de razón, de intervalo, nominal y ordinal.


2. No se ve afectada por valores muy grandes o muy pequeños.
3. Puede utilizarse para una distribución de frecuencia con una clase de extremo abierto.

Sin embargo, la moda tiene algunas desventajas que hacen que se utilice con menos frecuencia
que la media o la mediana.

1. Para muchos conjuntos de datos no hay valor modal porque ningún valor aparece más de
una vez. Tendría que tomarse cada valor como una moda.
2. Para algunos conjuntos de datos hay más de una moda. Sería cuestionable utilizar más de
una moda para representar la tendencia central de un conjunto de datos.
 con una moda se le denomina unimodal
 cuando dos valores no adyacentes tienen frecuencias máximas similares en el
conjunto de datos se dice que se tiene dos modas se le denomina bimodal
 a las distribuciones de mediciones que tienen varias modas se les denomina
multimodal.

La Moda para Datos Agrupados.

Para datos agrupados en una distribución de frecuencias con intervalos de clase iguales, primero
se identifica la clase que contiene la moda determinando cuál de ellas tiene el mayor número de
observaciones. Algunos profesionales de estadística consideran que la moda es el punto medio de
la clase modal. Sin embargo, la mayoría de ellos interpolan dentro de la clase modal, de acuerdo
con la siguiente fórmula:

𝑑1
𝑀𝑜𝑑𝑎 = 𝐿𝑖 + [ ]𝑐
𝑑1 + 𝑑2

En donde: Li = límite exacto inferior de la clase que contiene la moda.


d1 = diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
precedente.
d2 = diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
siguiente.
c = tamaño del intervalo de clase.

UNIDAD I Página 4
ESTADISTICA Y CONTROL DE CALIDAD
La diferencia entre los valores de la media, la mediana y la moda permiten saber la forma de la
curva de frecuencia en términos de asimetría.

 Para una distribución unimodal simétrica, el valor de la media, la mediana y la moda es


igual.

F
R Media
Mediana
E Moda
C
U
E
N
C
I
A X

 Para una distribución asimétrica positiva, la media es el mayor valor de las tres y la
mediana es mayor que la moda pero menor que la media

F
R Moda
E Mediana
C Media
U
E
N
C
I
A
X

 Para una distribución asimétrica negativa, la media es el menor valor de las tres y la
mediana es inferior a la moda pero mayor que la media

F
R Media
E Mediana
Moda
C
U
E
N
C
I
A
X

Medidas de dispersión.

UNIDAD I Página 5
ESTADISTICA Y CONTROL DE CALIDAD

Las medidas de tendencia central son útiles para identificar un valor típico en un conjunto de
datos. Estas localizan el centro de los datos.

Un promedio no dice nada de la dispersión o variabilidad de los datos.

Un valor pequeño para una medida de dispersión indica que los datos se encuentran acumulados
cercanamente, alrededor de la media por lo que es un promedio confiable.
Por lo contrario una medida de dispersión grande indica que la media no es factible.

Una segunda razón para estudiar la dispersión en un conjunto de datos es poder comparar cuán
dispersas están dos o más distribuciones.

MEDIDAS DE DISPERSION

 Amplitud de variación o Rango (se basa en la ubicación del valor mayor y el más pequeño
en un conjunto de datos).
 Desviación media
 Varianza
 Desviación estándar
Estas tres se basan en las desviaciones respecto a la media.

Amplitud de variación o Rango.- es la medida de dispersión más sencilla se trata de la


diferencia entre el valor más grande y el más pequeño de un conjunto de datos.
Una desventaja es que no se consideran todos los datos.
R = Xmay - Xmin

R = rango
Xmay = el valor mayor
Xmin = valor mínimo
Para los ejemplos de las medidas de tendencia central calcular el rango.

Las medidas de variabilidad o dispersión se ocupan de describir la variabilidad entre los


valores.

Rango.

El rango o R es la diferencia entre los valores mayor y menor del conjunto de datos. Así cuando
U representa el mayor valor del grupo y L representa el menor, el rango de los datos es:

R=U−L

Las descripciones más comprensivas de la dispersión son aquellas que tratan con la desviación
promedio con respecto a alguna medida de tendencia central. Dos de tales medidas son
importantes para el estudio estadístico: la varianza y la desviación estándar. Ambas medidas nos
dan una distancia promedio de cualquier observación del conjunto de datos con respecto a la
media de la distribución.

UNIDAD I Página 6
ESTADISTICA Y CONTROL DE CALIDAD
Para el ejemplo, el rango de los datos no agrupados es:

R = 3590 − 2400 = 1190


Varianza.

Cada población tiene una varianza, que se simboliza con (σ² sigma cuadrada). La fórmula
para calcular la varianza de una población es

(∑ x̅)2
∑(x − μ)2 ∑ x̅ 2 −
σ2 = ó σ2 = N
N N

La fórmula para calcular la varianza muestral incluye un factor de corrección para que
la varianza muestral sea un estimador insesgado de la varianza poblacional.

∑(x − χ̅)2 n ∑ni=1 x 2 − (∑ni=1 x)2


s2 = ó s2 =
n−1 n(n − 1)

La fórmula de varianza para datos agrupados es:

∑[f(Xc − μ)2 ]
σ2 =
N

∑[f(Xc − χ̅)2 ]
s2 =
n−1

Desviación Estándar.

Por lo general resulta difícil interpretar el significado del valor de una varianza porque las
unidades en las que se expresa son valores al cuadrado, así que con mayor frecuencia
utilizamos la raíz cuadrada de la varianza denominada desviación estándar. La desviación
estándar poblacional se denota por σ y la desviación estándar muestral por s.

∑(x−μ)2 ∑(x−x̅)2
σ=√ s=√
N n−1

La fórmula de desviación estándar para datos agrupados es la raíz de la fórmula


correspondiente de varianza.

UNIDAD I Página 7
ESTADISTICA Y CONTROL DE CALIDAD
Coeficiente de Variación.

El coeficiente de variación proporciona una medida de variabilidad que es


independiente de la unidad de medida, por ello, puede usarse para comparar la variabilidad de
dos grupos de datos expresados en dos distintas unidades de medida. Por ejemplo, puede
usarse para comparar la desviación estándar de la distribución de los ingresos anuales, y la
desviación estándar de los años de servicio de todos los empleados de una compañía.
El coeficiente de Variación (CV) expresa la desviación estándar como un porcentaje de
la media y se define como

σ
CV =
μ(100)

s
CV = ( ) (100)

Dicho de otra manera, el CV indica la magnitud relativa de la desviación estándar con respecto a
la medida de la distribución. El CV es útil cuando se desea comparar la variabilidad de dos
conjuntos de datos con respecto al nivel general de los valores de cada conjunto.

FORMULARIO:
Distribución de frecuencia
1. El intervalo de clase o amplitud w

Núm. Clases  3.3 ln n 


n  núm. Datos
(valor mayor de los datos no agrupados−valor menor de los datos no agrupados)
𝐼𝑁𝑇𝐸𝑅𝑉𝐴𝐿𝑂 𝐴𝑃𝑅𝑂𝑋𝐼𝑀𝐴𝐷𝑂 (𝑤) =
número de clases que se desean

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN


(MEDIA, MODA, VARIANZA Y DESVIACIÓN ESTÁNDAR).

DATOS AGRUPADOS:
A) MEDIDAS DE TENDENCIA CENTRAL:

1. MEDIA DE LA POBLACIÓN:
∑(fxc )
μ=
N

2. MEDIANA:
𝑁
− 𝑓𝑎𝐴
𝑀𝑒𝑑 = 𝐿𝑖 + [ 2 ]𝑤
𝑓𝑐
Li= limite exacto inferior de la clase que contiene la mediana
N = Número total de observaciones en la distribución de frecuencias (n para muestras)
𝑓𝑎𝐴 = Frecuencia acumulada de la clase que precede (antes) a la clase que contiene la
mediana
𝑓𝑐 = Frecuencia de clase que contiene la mediana
w = longitud del intervalo de clase

UNIDAD I Página 8
ESTADISTICA Y CONTROL DE CALIDAD
3. MODA:
𝑑1
𝑀𝑜𝑑𝑎 = 𝐿𝑖 + [ ]𝑤
𝑑1 + 𝑑2
Li = limite exacto inferior de la clase modal
d1 = diferencia entre la frecuencia de clase modal y la frecuencia de clase precedente
(antes)
d2 = diferencia entre la frecuencia de clase modal y la frecuencia de la siguiente clase.
w = longitud del intervalo de clase.

VARIANZA:
∑[f(xc − μ)2 ]
σ2 =
N

DATOS NO AGRUPADOS:
A) MEDIDAS DE TENDENCIA CENTRAL.
̅ ).
1. Media aritmética (𝑿
n

 x i
x i 1

n
2. Media aritmética ponderada ( xw ).
k

 wi xi
xw  i 1
k

 wi
i 1

3. Mediana (xmed).

4. Moda (xmod).

B) Varianza o variancia (s2).

POBLACIÓN:
(∑ x̅)2
∑(x − μ)2 ∑ x̅ 2 −
σ2 = ó σ2 = N
N N

MUESTRA:
∑ni=1 ∑(xi − x̅)2 n ∑ni=1 x 2 − (∑ni=1 x)2
s2 = ó s2 =
n−1 n(n − 1)

UNIDAD I Página 9

S-ar putea să vă placă și