Sunteți pe pagina 1din 7

Medidas de Localizacin para datos no agrupados: medidas de tendencia central

Media: La media aritmtica de los datos nos muestra el valor central o promedio de los datos
alrededor del cual oscilan los dems datos analizados. La ecuacin que la determina es la siguiente:



Dnde:

Xi = representa los valores que toma la variable analizada y que forman la serie de datos.

N = al nmero de datos analizados.

Ejemplo:
Si tenemos esta serie de datos:

5, 4, 7, 9, 15, 3, 6, 21, 16

Su Media ser:

(5+4+7+9+15+3+6+21+16)/9 = 9,55

Percentiles:
Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de ubicacin o clasificacin
de las personas cuando atienden caractersticas tales como peso, estatura, etc.
Los percentiles son ciertos nmeros que dividen la sucesin de datos ordenados en cien partes
porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de
datos ordenados. Los percentiles (P1, P2,... P99), ledos primer percentil,..., percentil 99.

Funcin
Si se tienen una serie de valores X1, X2, X3... X
n
, los percentiles se localiza mediante las siguientes
frmulas:
Para los percentiles, cuando n es par:
(A)(N)
100

Cuando N es impar:


Siendo A, el nmero del percentil.







=

=1


+1
100

Ejemplo

Dado los siguientes datos:
2, 3, 4, 5, 6, 7, 8, 9


Calcular los el 15avo Percentil:

P15 = (15*8/100) = 1,2 P15 = 2


Medidas de Dispersin o de Variabilidad para datos no agrupados

Rango:
En estadstica descriptiva se denomina rango estadstico (R) o recorrido estadstico al intervalo de
menor tamao que contiene a los datos; es calculable mediante la resta del valor mnimo al valor
mximo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersin de los
datos.
Por ejemplo, para una serie de datos de carcter cuantitativo como es la estatura tal y como:
x
1
= 185,x
2
= 165,x
3
= 170,x
4
= 182,x
5
= 155
Es posible ordenar los datos como sigue:
x
(1)
= 155,x
(2)
= 165,x
(3)
= 170,x
(4)
= 182,x
(5)
= 185
Donde la notacin x
(i)
indica que se trata del elemento i-simo de la serie de datos. De este modo, el
rango sera la diferencia entre el valor mximo (k) y el mnimo; o, lo que es lo mismo:
R = x
(k)
x
(1)

En nuestro ejemplo, con cinco valores, nos da que R = 185-155 = 30.

Rango Intercuartilico:
En estadstica descriptiva, se denomina rango intercuartlico o rango intercuartil, a la diferencia entre
el tercer y el primer cuartil de una distribucin. Es una medida de la dispersin estadstica. A
diferencia del rango, se trata de un estadstico robusto.
El rango intercuartlico es una medida de variabilidad adecuada cuando la medida de posicin central
empleada ha sido la mediana. Se define como la diferencia entre el tercer cuartil (Q
3
) y el primer
cuartil (Q
1
), es decir: RQ = Q
3
- Q
1
. A la mitad del rango intercuartil se le conoce como desviacin
cuartil (DQ): DQ = RQ/2= (Q
3
- Q
1
)/2.
Se usa para construir los diagramas de caja y bigote (box plots) que sirven para visualizar la
variabilidad de una variable y comparar distribuciones de la misma variable; adems de ubicar
valores extremos.

Diagrama de Caja.

Q3 (Cuartil 3) = Percentil 75;
Q1 (Cuartil 1) = Percentil 25;
Mediana = Q2 (Cuartil 2) = Percentil 50

Desviacin Estndar:

La desviacin estndar o desviacin tpica (denotada con el smbolo ) es una medida de
centralizacin o dispersin para variables de razn (ratio o cociente) y de intervalo, de gran utilidad
en la estadstica descriptiva. Para conocer con detalle un conjunto de datos, no basta con conocer
las medidas de tendencia central, sino que necesitamos conocer tambin la desviacin que
presentan los datos en su distribucin respecto de la media aritmtica de dicha distribucin, con
objeto de tener una visin de los mismos ms acorde con la realidad al momento de describirlos e
interpretarlos para la toma de decisiones.
Expresin de la desviacin estndar poblacional:

La desviacin estndar es una medida del grado de dispersin de los datos con respecto al valor
promedio. Dicho de otra manera, la desviacin estndar es simplemente el "promedio" o variacin
esperada con respecto a la media aritmtica.
Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de
7. Sus desviaciones estndar mustrales son 8,08; 5,77 y 1,15 respectivamente. La tercera muestra
tiene una desviacin mucho menor que las otras dos porque sus valores estn ms cerca de 7.



=

=1


Ejemplo:
Se tiene la serie de datos: 5, 8, 9, 6, 4, 12, 7, 3, 10, 5
Cuyo Promedio es:
Promedio = (5+8+9+6+4+12+7+3+10+5)/10 = 6,9
=

= 2,7

Coeficiente de Variacin:
Cuando se quiere comparar el grado de dispersin de dos distribuciones que no vienen dadas en las
mismas unidades o que las medias no son iguales se utiliza el coeficiente de variacin que se define
como el cociente entre la desviacin tpica y el valor absoluto de la media aritmtica. A mayor valor
de C.V. mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor homogeneidad
en los valores de la variable. Suele representarse por medio de las siglas C.V..
Exigimos que:
Se calcula:

Donde es la desviacin estndar. Se puede dar en tanto por ciento calculando:





















Distribuciones de Frecuencia: Relativas, Porcentuales y Acumuladas

Para Datos Agrupados (Aplicando la Regla de Esturges):
La regla de Sturges, propuesta por Herbert Sturges en 1926, es una regla prctica acerca de cul
debe ser el nmero de grupos o intervalos en cual dividiremos los datos analizados
Este nmero viene dado por la siguiente expresin:

c = 1 + 3322 * log10(R)

Donde N representa el nmero de datos que sern agrupados. El valor de "c" (nmero de clases)
es comn redondearlo al entero ms cercano.
La regla de Sturges nos permite calcular la magnitud de las clases a utilizar durante la elaboracin
de la distribucin de frecuencias para datos agrupados.

Se tiene la siguiente serie de datos que corresponde a las edades de un grupo de personas
asistentes a citas mdicas en un mismo hospital:




10 26 46 51
12 25 48 53
16 30 42 58
15 31 42 60
21 35 41 63
20 35 43 65
26 36 45 66
28 38 43 63
25 33 50 62
27 32 55 70
23 33 56 78
22 31 55 71
26 44 52 75

Primero ordenamos los datos de menor a mayor, para posteriormente calcular el rango de los
mismos, que resulta de restarle el valor mximo al mnimo
Dato mayor = 80
Dato menor = 10
Rango = 80 10 = 70

Despus pasamos a calcular el nmero de clases a utilizar (c)

c = 1+ 3,322*log10(70) = 7,13 7

Posteriormente pasamos a calcular la Amplitud del Intervalo, el cual se define como:

Amplitud del Intervalo = Rango/c



Para este caso sera:

70/7 = 10

Se procede a realizar una tabla en donde en la primera columna se coloca el valor de la variable y en
la segunda la Frecuencia, es decir cuntas veces se repite el valor de este variable:

Intervalo Frecuencia
[10, 20) 4
[20, 30) 11
[30, 40) 10
[40, 50) 9
[50, 60) 8
[60, 70) 6
[70, 80) 4

Distribucin de Frecuencia Relativa: Nos muestra cual es la proporcin del valor de una variable
con respecto a los dems valores que toma la misma en la suma de sus valores.
Se obtiene dividiendo cada una de las frecuencias entre el total de datos analizado, en este caso 52
datos:



Intervalo Frecuencia Frecuencia Relativa
[10, 20) 4 4/52 = 0,08
[20, 30) 11 11/52 = 0,21
[30, 40) 10 10/52 = 0,19
[40, 50) 9 9/52 = 0,17
[50, 60) 8 8/52 = 0,15
[60, 70) 6 6/52 = 0,12
[70, 80) 4 4/52 = 0,08


Distribucin de Frecuencia Porcentual: Nos muestra la Frecuencia Relativa de los datos
expresada en trminos de porcentaje, se halla al multiplicar por 100 cada uno de los valores de las
frecuencias relativas.

Intervalo Frecuencia Frecuencia Relativa Frecuencia Porcentual
[10, 20) 4 4/52 = 0,08 0,08 X 100 = 8%
[20, 30) 11 11/52 = 0,21 0,21 X 100 = 21%
[30, 40) 10 10/52 = 0,19 0,19 X 100 = 19%
[40, 50) 9 9/52 = 0,17 0,17 X 100 = 17%
[50, 60) 8 8/52 = 0,15 0,15 X 100 = 15%
[60, 70) 6 6/52 = 0,12 0,12 X 100 = 12%
[70, 80) 4 4/52 = 0,08 0,08 X 100 = 8%


Distribucin de Frecuencia Acumulada: Para la Frecuencia Acumulada podemos ordenar los
datos segn las necesidades de anlisis que tengamos, ya sea por Frecuencia o por el valor de los
Intervalos, etc.

Para este caso se organizaran segn los valores de los intervalos y segn los valores de las
frecuencias:

Intervalo Frecuencia Frecuencia Relativa Frecuencia Porcentual
Frecuencia
Acumulada
[10, 20) 4 4/52 = 0,08 0,08 X 100 = 8% 8%
[20, 30) 11 11/52 = 0,21 0,21 X 100 = 21% 8% + 21% = 29%
[30, 40) 10 10/52 = 0,19 0,19 X 100 = 19% 29% + 19% = 48%
[40, 50) 9 9/52 = 0,17 0,17 X 100 = 17% 48% + 17% = 65%
[50, 60) 8 8/52 = 0,15 0,15 X 100 = 15% 65% + 15% = 80%
[60, 70) 6 6/52 = 0,12 0,12 X 100 = 12% 80% + 12% = 92%
[70, 80) 4 4/52 = 0,08 0,08 X 100 = 8% 92% + 8% = 100%


Intervalo Frecuencia Frecuencia Relativa Frecuencia Porcentual
Frecuencia
Acumulada
[20, 30) 11 11/52 = 0,21 0,21 X 100 = 21% 21%
[30, 40) 10 10/52 = 0,19 0,19 X 100 = 19% 21% + 19% = 40%
[40, 50) 9 9/52 = 0,17 0,17 X 100 = 17% 40% + 17% = 57%
[50, 60) 8 8/52 = 0,15 0,15 X 100 = 15% 57% + 15% = 72%
[60, 70) 6 6/52 = 0,12 0,12 X 100 = 12% 72% + 12% = 84%
[70, 80) 4 4/52 = 0,08 0,08 X 100 = 8% 84% + 8% = 92%
[10, 20) 4 4/52 = 0,08 0,08 X 100 = 8% 92% + 8% = 100%

S-ar putea să vă placă și