Sunteți pe pagina 1din 19

Medidas de tendencia central

Al describir grupos de observaciones, con frecuencia es conveniente resumir la informacin con un solo nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la distribucin de datos se denomina medida o parmetro de tendencia central o de centralizacin. Cuando se hace referencia nicamente a la posicin de estos parmetros dentro de la distribucin, independientemente de que sta est ms o menos centrada, se habla de estas medidas como medidas de posicin.1 En este caso se incluyen tambin los cuantiles entre estas medidas. Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que las medidas de posicin o medidas de tendencia se usan de acuerdo al tipo de variable que se est observando, en este caso se observan variables cuantitativas. Entre las medidas de tendencia central tenemos:

Media . Media ponderada. Media geomtrica. Media armnica. Mediana. Moda.

Media .
La media aritmtica (o simplemente media) La media aritmtica es el valor obtenido por la suma de todos sus valores dividida entre el nmero de sumandos.

Por ejemplo, las notas de 5 alumnos en una prueba:

nio 1 2 3 4 5

nota 6,0 5,4 3,1 7,0 6,1 Primero, se suman las notas: 6,0+5,4+3,1+7,0+6,1 = 27,6 Luego el total se divide entre la cantidad de alumnos: 27,6/5=5,52

La media aritmtica en este ejemplo es 5,52

La media aritmtica es, probablemente, uno de los parmetros estadsticos ms extendidos.2 Se le llama tambin promedio o, simplemente, media.

Definicin formal
Dado un conjunto numrico de datos, x1, x2, ..., xn, se define su media aritmtica como

Esta definicin vara, aunque no sustancialmente, cuando se trata de variables continuas, esto es, tambin puede calcularse para variables agrupadas en intervalos.

Propiedades
Las principales propiedades de la media aritmtica son:3

Su clculo es muy sencillo y en l intervienen todos los datos. Su valor es nico para una serie de datos dada. Se usa con frecuencia para comparar poblaciones, aunque es ms apropiado acompaarla de una medida de dispersin.

Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor:

Minimiza las desviaciones cuadrticas de los datos respecto de cualquier valor prefijado, esto es,

el valor de

es mnimo cuando

. Este resultado se conoce

comoTeorema de Knig. Esta propiedad permite interpretar uno de los parmetros de dispersin ms importantes: la varianza.

Se ve afectada por transformaciones afines (cambios de origen y escala), esto es, si entonces , donde es la media aritmtica de los , para i = 1,

..., n y a y b nmeros reales.

Es poco sensible a fluctuaciones muestrales, por lo que es un parmetro muy til en inferencia estadstica.

Inconvenientes de su uso

Este parmetro, an teniendo mltiples propiedades que aconsejan su uso en situaciones muy diversas, tiene tambin algunos inconvenientes, como son:

Para datos agrupados en intervalos (variables continuas) su valor oscila en funcin de la cantidad y amplitud de los intervalos que se consideren.

La estatura media como resumen de una poblacin homognea (abajo) o heterognea (arriba).

Es una medida a cuyo significado afecta sobremanera la dispersin, de modo que cuanto menos homogneos sean los datos, menos informacin proporciona. Dicho de otro modo, poblaciones muy distintas en su composicin pueden tener la misma media. 4 Por ejemplo, un equipo de baloncesto con cinco jugadores de igual estatura, 1,95 m, evidentemente, tendra una estatura media de 1,95 m, valor que representa fielmente a esta poblacin homognea. Sin embargo, un equipo de jugadores de estaturas ms heterogneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo, tendra tambin, como puede comprobarse, una estatura media de 1,95 m, valor que no representa a casi ninguno de sus componentes.

En el clculo de la media no todos los valores contribuyen de la misma manera. Los valores altos tienen ms peso que los valores cercanos a cero. Por ejemplo, en el clculo del salario medio de un empresa, el salario de un alto directivo que gane 1.000.000 de tiene tanto peso como el de diez empleados "normales" que ganen 1.000 . En otras palabras, se ve muy afectada por valores extremos.

No se puede determinar si en una distribucin de frecuencias hay intervalos de clase abiertos.

Media aritmtica ponderada


A veces puede ser til otorgar pesos o valores a los datos dependiendo de su relevancia para determinado estudio. En esos casos se puede utilizar una media ponderada. Si son nuestros datos y son sus "pesos" respectivos, la

media ponderada se define de la siguiente forma:

Media muestral
Esencialmente, la media muestral es el mismo parmetro que el anterior, aunque el adjetivo "muestral" se aplica a aquellas situaciones en las que la media aritmtica se calcula para unsubconjunto de la poblacin objeto de estudio. La media muestral es un parmetro de extrema importancia en la inferencia estadstica, siendo de gran utilidad para la estimacin de la media poblacional, entre otros usos.

Moda
La moda es el dato ms repetido, el valor de la variable con mayor frecuencia absoluta.5 En cierto sentido la definicin matemtica corresponde con la locucin "estar de moda", esto es, ser lo que ms se lleva. Su clculo es extremadamente sencillo, pues slo necesita un recuento. En variables continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se recurre a la interpolacin. Por ejemplo, el nmero de personas en distintos vehculos en una carretera: 5-7-4-6-9-5-6-1-5-37. El nmero que ms se repite es 5, entonces la moda es 5. Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima. Cuando en una distribucin de datos se encuentran tres o ms modas, entonces es multimodal. Por ltimo, si todas las variables tienen la misma frecuencia diremos que no hay moda.

Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta. La moda, cuando los datos estn agrupados, es un punto que divide el intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo

la frecuencia absoluta del intervalo modal y

las frecuencias absolutas

de los intervalos anterior y posterior, respectivamente, al Las calificaciones en la asignatura de Matemticas de 39 alumnos de una clase viene dada por la siguiente tabla (debajo):

Calificaciones

1 2 3 4 5 6 7 8 9

Nmero de alumnos 2 2 4 5 8 9 3 4 2

Propiedades
Sus principales propiedades son:

Clculo sencillo. Interpretacin muy clara. Al depender slo de las frecuencias, puede calcularse para variables cualitativas. Es por ello el parmetro ms utilizado cuando al resumir una poblacin no es posible realizar otros clculos, por ejemplo, cuando se enumeran en medios periodsticos las caractersticas ms frecuentes de determinado sector social. Esto se conoce informalmente como "retrato robot".6

Inconvenientes

Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su valor depende excesivamente del nmero de intervalos y de su amplitud.

Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la moda, no afectan en modo alguno a su valor.

No siempre se sita hacia el centro de la distribucin. Puede haber ms de una moda en el caso en que dos o ms valores de la variable presenten la misma frecuencia (distribuciones bimodales o multimodales).

Mediana

La mediana es un valor de la variable que deja por debajo de s a la mitad de los datos, una vez que stos estn ordenados de menor a mayor.7 Por ejemplo, la mediana del nmero de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posicin central es 2:

En caso de un nmero par de datos, la mediana no correspondera a ningn valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los siguientes:

Se toma como mediana Existen mtodos de clculo ms rpidos para datos ms nmerosos (vase el artculo principal dedicado a este parmetro). Del mismo modo, para valores agrupados en intervalos, se halla el "intervalo mediano" y, dentro de ste, se obtiene un valor concreto por interpolacin.

Clculo de la mediana para datos agrupados


Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del margen derecho). As, aplicando la formula asociada a la mediana para n impar, obtenemos X(39+1)/2 = X20 y basndonos en la frmula que hace referencia a las frecuencias absolutas: Ni-1< n/2 < Ni = N19 < 19.5 < N20 Por tanto la mediana ser el valor de la variable que ocupe el vigsimo lugar. En nuestro ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es aconsejable no olvidar las unidades; en este caso como estamos hablando de calificaciones, sern puntos) La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o ms. Ejemplo (N par) Las calificaciones en la asignatura de Matemticas de 38 alumnos de una clase viene dada por la siguiente tabla (debajo):

Calificaciones

1 2 3 4 5 6 7 8 9

xi fi 1 2 2 2 3 4 4 5

Fi 2 4 8 13

5 6 19 = 19 6 9 7 4 8 4 9 2 Nmero de alumnos 2 2 4 5 6 9 4 4 2
Calculemos la Mediana: Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen derecho). Si volvemos a utilizar la frmula asociada a la mediana para n par, obtenemos X(38/2) = X19 y basndonos en la frmula que hace referencia a las frecuencias absolutas --> Ni1< n/2 < Ni = N18 < 19 < N19 Con lo cual la mediana ser la media aritmtica de los valores de la variable que ocupen el decimonoveno y el vigsimo lugar. En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigsimo el 6, (desde el vigsimo hasta el vigsimo octavo) con lo que Me = (5+6)/2 = 5,5 puntos.

28 32 36 38

Propiedades e inconvenientes
Las principales propiedades de la mediana son:8

Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de transcripcin en la serie del ejemplo anterior en, pongamos por caso, el ltimo nmero, deja a la mediana inalterada.

Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso cuando alguno de ellos no est acotado.

No se ve afectada por la dispersin. De hecho, es ms representativa que la media aritmtica cuando la poblacin es bastante heterognea. Suele darse esta

circunstancia cuando se resume la informacin sobre los salarios de un pas o una empresa. Hay unos pocos salarios muy altos que elevan la media aritmtica haciendo que pierda representatividad respecto al grueso de la poblacin. Sin embargo, alguien con el salario "mediano" sabra que hay tanta gente que gana ms dinero que l, como que gana menos. Sus principales inconvenientes son que en el caso de datos agrupados en intervalos, su valor vara en funcin de la amplitud de estos. Por otra parte, no se presta a clculos algebraicos tan bien como la media aritmtica.

Medidas de dispersin
Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la mediana media. As se sabe si todos los casos son parecidos o varan mucho entre ellos. Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviacin media) y otra es tomando las desviaciones al cuadrado (Varianza).1
ndice
[ocultar]

1 Rango estadstico

1.1 Requisitos del rango

1.1.1 Ejemplo

2 Medio rango o Rango medio

2.1 Ejemplo

3 Varianza

3.1 Propiedades

4 Desviacin tpica

o o

4.1 Desviacin tpica muestral 4.2 Desviacin tpica poblacional

5 Covarianza 6 Coeficiente de Correlacin de Pearson

6.1 Propiedades

6.1.1 Ejemplo

7 Vase tambin 8 Referencias 9 Enlaces externos

Rango estadstico
El rango o recorrido estadstico es la diferencia entre el valor mximo y el valor mnimo en un grupo de nmeros aleatorios. Se le suele simbolizar con R.

Requisitos del rango



Ordenamos los nmeros segn su tamao. Restamos el valor mnimo del valor mximo

Ejemplo
Para una muestra (8,7,6,9,4,5), el dato menor es 4 y el dato mayor es 9 (Valor unitario inmediatamente posterior al dato mayor menos el dato menor). Sus valores se encuentran en un rango de:

Medio rango o Rango medio


El medio rango o rango medio de un conjunto de valores numricos es la media del menor y mayor valor, o la mitad del camino entre el dato de menor valor y el dato de mayor valor. En consecuencia, el medio rango es:

Ejemplo
Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor valor Max= 8. El medio rango resolvindolo mediante la correspondiente frmula sera:

Representacin del medio rango:

Varianza
La varianza es una medida estadstica que mide la dispersin de los valores respecto a un valor

central (media), es decir, es el cuadrado de las desviaciones:

Propiedades

La varianza es siempre positiva o 0: Si a los datos de la distribucin les sumamos una cantidad constante la varianza no se modifica.

Si a los dato de la distribucin los multiplicamos una constante, la varianza queda multiplicada por el cuadrado de esa constante.

Propiedad distributiva:

cov

FORBES

Desviacin tpica

La varianza a veces no se interpreta claramente, ya que se mide en unidades cuadrticas. Para evitar ese problema se define otra medida de dispersin, que es la desviacin tpica, odesviacin estndar, que se halla como la raz cuadrada positiva de la varianza. La desviacin tpica informa sobre la dispersin de los datos respecto al valor de la media; cuanto mayor sea su valor, ms dispersos estarn los datos. Esta medida viene representada en la mayora de los casos por S, dado que es su inicial de su nominacin en ingls.

Desviacin tpica muestral

Desviacin tpica poblacional

-->x = [17 14 2 5 8 7 6 8 5 4 3 15 9] x = 17. 14. 2. 5. 8. 7. 6. 8. 5. 4. 3. 15. 9. -->stdev(x) ans = 4.716311 -->

Primero hemos declarado un vector con nombre X, donde introduzco los nmeros de la serie. Luego con el comando stdev se hallar la desviacin tpica.

Covarianza
Artculo principal: Covarianza.

La covarianza entre dos variables es un estadstico resumen indicador de si las puntuaciones estn relacionadas entre s. La formulacin clsica, se simboliza por la letra griega sigma () cuando ha sido calculada en la poblacin. Si se obtiene sobre una muestra, se designa por la letra " ".

La formula suele aparecer expresada como:

Este tipo de estadstico puede utilizarse para medir el grado de relacin de dos variables si ambas utilizan una escala de medida a nivel de intervalo/razn (variables cuantitativas). La expresin se resuelve promediando el producto de las puntuaciones diferenciales por su tamao muestral (n pares de puntuaciones, n-1 en su forma insesgada). Este estadstico, refleja la relacin lineal que existe entre dos variables. El resultado numrico fluctua entre los rangos de +infinito a -infinito. Al no tener unos lmites establecidos no puede determinarse el grado de relacin lineal que existe entre las dos variables, solo es posible ver la tendencia.

Coeficiente de Correlacin de Pearson


El coeficiente de correlacin de Pearson, r, permite saber si el ajuste de la nube de puntos a la recta de regresin obtenida es satisfactorio. Se define como el cociente entre la covarianza y el producto de las desviaciones tpicas (raz cuadrada de las varianzas).

Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos expresiones siguientes:

[editar]Propiedades
El coeficiente de correlacin, r, presenta valores entre 1 y +1. Cuando r es prximo a 0, no hay correlacin lineal entre las variables. La nube de puntos est muy dispersa o bien no forma una lnea recta. No se puede trazar una recta de regresin.

Cuando r es cercano a +1, hay una buena correlacin positiva entre las variables segn un modelo lineal y la recta de regresin que se determine tendr pendiente positiva, ser creciente.

Cuando r es cercano a -1, hay una buena correlacin negativa entre las variables segn un modelo lineal y la recta de regresin que se determine tendr pendiente negativa: es decreciente.es

Ejemplo
Tenemos una tabla con dos datos (x y h), elaboramos su tabla de frecuencias (fre) -->x = [2.5 7.5 12.5 17.5] Vector de datos X x = 2.5 7.5 12.5 17.5 -->h = [0 1 2] Vector de datos H h = 0. 1. 2. -->fre = [.03 .12 .07; .02 .13 .11; .01 .13 .14; .01 .09 .14] Matriz de frecuencias fre = 0.03 0.12 0.07 0.02 0.13 0.11 0.01 0.13 0.14 0.01 0.09 0.14 -->rho = correl(x,h,fre) Aplicacin del Comando correl rho = 0.2097870c

Asimetra estadstica

En punteado negro: la media, en punteado gris: la moda.

Ejemplo de datos experimentales con una asimetra positiva (respuesta gravitrpica de los coleptilos del trigo).

ndice
[ocultar]

1 Definicin 2 Medidas de asimetra

o o o

2.1 Coeficiente de asimetra de Fisher 2.2 Coeficiente de asimetra de Pearson 2.3 Coeficiente de asimetra de Bowley

3 Utilidad 4 Referencias 5 Enlaces externos

Definicin
Las medidas de asimetra son indicadores que permiten establecer el grado de simetra (o asimetra) que presenta una distribucin de probabilidad de una variable aleatoria sin tener que hacer su representacin grfica. Como eje de simetra consideramos una recta paralela al eje de ordenadas que pasa por la media de la distribucin. Si una distribucin es simtrica, existe el mismo nmero de valores a la derecha que a la izquierda de la media, por tanto, el mismo nmero de desviaciones con signo positivo que con signo negativo. Decimos que hay asimetra positiva (o a la derecha) si la "cola" a la derecha de la media es ms larga que la de la izquierda, es decir, si hay valores ms separados de la media a la derecha. Diremos que hay asimetra negativa (o a la izquierda) si la "cola" a la izquierda de la media es ms larga que la de la derecha, es decir, si hay valores ms separados de la media a la izquierda.

Medidas de asimetra
Coeficiente de asimetra de Fisher
En teora de la probabilidad y estadstica, la medida de asimetra ms utilizada parte del uso del tercer momento estndar. La razn de esto es que nos interesa mantener el signo de las desviaciones con respecto a la media, para obtener si son mayores las que ocurren a la derecha de la media que las de la izquierda. Sin embargo, no es buena idea tomar el momento estndar con respecto a la media de orden 1. Debido a que una simple suma de todas las desviaciones siempre es cero. En efecto, si por ejemplo, los datos estn agrupados en clases, se tiene que:

en donde

representa la marca de la clase

-sima y

denota la frecuencia relativa de dicha clase.

Por ello, lo ms sencillo es tomar las desviaciones al cubo. El coeficiente de asimetra de Fisher, representado por , se define como:

donde Si Si

es el tercer momento en torno a la media y

es la desviacin estndar.

, la distribucin es asimtrica positiva o a la derecha. , la distribucin es asimtrica negativa o a la izquierda. . El recproco no es cierto: es un

Si la distribucin es simtrica, entonces sabemos que error comn asegurar que si

entonces la distribucin es simtrica (lo cual es falso).

Coeficiente de asimetra de Pearson


Slo se puede utilizar en distribuciones uniformes, unimodales y moderadamente asimtricas. Se basa en que en distribuciones simtricas la media de la distribucin es igual a la moda.

Si la distribucin es simtrica,

. Si la distribucin es asimtrica positiva la .

media se sita por encima de la moda y, por tanto,

Coeficiente de asimetra de Bowley


Est basado en la posicin de los cuartiles y la mediana, y utiliza la siguiente expresin:

En una distribucin simtrica el tercer cuartil estar a la misma distancia de la mediana que el primer cuartil. Por tanto . .

Si la distribucin es positiva o a la derecha,

Utilidad
La asimetra resulta til en muchos campos. Muchos modelos simplistas asumen una distribucin normal, esto es, simtrica en torno a la media. La distribucin normal tiene una asimetra cero. Pero en realidad, los valores no son nunca perfectamente simtricos y la asimetra de la distribucin proporciona una idea sobre si las desviaciones de la media son positivas o negativas. Una asimetra positiva implica que hay ms valores distintos a la derecha de la media. Las medidas de asimetra, sobre todo el coeficiente de asimetra de Fisher, junto con las medidas de apuntamiento o curtosis se utilizan para contrastar si se puede aceptar que una distribucin estadstica sigue la distribucin normal. Esto es necesario para realizar numerosos contrastes estadsticos en la teora de inferencia estadstica.

Distribucin de frecuencias
En estadstica, se le llama distribucin de frecuencias a la agrupacin de datos en categoras mutuamente excluyentes que indican el nmero de observaciones en cada categora.1 Esto proporciona un valor aadido a la agrupacin de datos. La distribucin de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas.
ndice
[ocultar]

1 Caractersticas 2 Tipos de frecuencias

o o o o o

2.1 Frecuencia absoluta 2.2 Frecuencia relativa 2.3 Frecuencia acumulada 2.4 Frecuencia relativa acumulada 2.5 Distribucin de frecuencias agrupadas

3 Referencias

Caractersticas
Una distribucin de frecuencias es un formato tabular en la que se organizan los datos en clases, es decir, en grupos de valores que describen una caracterstica de los [datos] y muestra el nmero de observaciones del conjunto de datos que caen en cada una de las clases. La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el nmero de veces que aparece, es decir, su Frecuencia. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia simple y la frecuencia acumulada. La tabla de frecuencias puede representarse grficamente en un histograma(Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalos devalores. La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.

Tipos de frecuencias

Frecuencia absoluta
La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por ni. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria. puesto que es mentira se hace el intercambio en la nterfaz de la frecuencia absoluta.

Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por fi. La suma de las frecuencias relativas es igual a 1.

Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fa.

Frecuencia relativa acumulada


La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento. Ejemplo: Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27

Distribucin de frecuencias agrupadas


La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un nmero grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Lmites de la clase. Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase. La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros. Construccin de una tabla de datos agrupados: 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1. Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48.

2. Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible por el nmero de intervalos queramos establecer. Es conveniente que el nmero de intervalos oscile entre 6 y 15. En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10 intervalos. Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al intervalo, pero el lmite superior no no pertenece intervalo, se cuenta en el siguiente intervalo.

ci [0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) [35, 40) [40, 45) [45, 50) Total: 2.5 1 7.5

fi 1 1 3 3 3 6 7 10 4 2

Fi 2 5 8 11 17 24 34 38 40

ni 0.025

Ni 0.025 0.025 0.075 0.075 0.075 0.150 0.175 0.250 0.100 0.050 1 0.050 0.125 0.200 0.2775 0.425 0.600 0.850 0.950 1

12.5 17.5 22.5 27.5 32.5 37.5 42.5 47.5

S-ar putea să vă placă și