Sunteți pe pagina 1din 7

DATOS AGRUPADOS

Los datos agrupados se refieren al hecho de que estn ordenados, clasificados y contados. Las caractersticas de los elementos de una poblacin pueden ser de tipo cualitativo o de tipo cuantitativo. En el primer caso se trata de cualidades que distinguen un elemento de otro, se clasifican en varias clases o categoras, que corresponden a las cualidades, se ubican en clases independientes y separadas. Se realiza un conteo de los elementos, que pertenece a cada clase o categora. Para llevar un orden y no quitar algn valor, se le aade una columna para el conteo y se coloca una marca para cada elemento de la muestra o poblacin, donde corresponda su categora. Las propiedades de tipo cuantitativo son aquellas que pueden medirse o contarse. Una caracterstica cuantitativa que toma datos aislados de modo que no acepta valores intermedios entre dos consecutivos, se llama Cuantitativa Discreta. Si se trata de una caracterstica que puede tomar valores consecutivos, se dice que es una variable Cuantitativa Continua. Esto es: que la informacin sea repetitiva, tambin debemos de verificar que los datos puedan clasificarse. Y que dicha clasificacin tiene coherencia y lgica (de acuerdo a lo que se nos esta pidiendo). Una vez que ya hemos ordenado y clasificado las diferentes caractersticas de los elementos de una poblacin pueden representarse de diversas maneras: tablas, diagramas de barras o diagramas circulares.

Agrupacin Voluntaria.
La representacin de una variable continua puede hacerse mediante tablas, en donde la variable se presenta agrupada en clases o intervalos numricos, por medio de diagramas de barras unidas, llamadas histogramas o usando diagramas lineales. Un ejemplo variable contina, es la estatura de cierta poblacin, la cual podemos agrupar de la siguiente forma:
Est. en cm. N Poblacin 146 1 148 2 150 2 152 3 153 5 155 9 157 7 161 4 163 3 166 2 168 1 170 1

Se agrupa en intervalos de 5 cm:


Estatura (fi) 145, 150 5 150, 155 17 155, 160 7 160, 165 7 165, 170 4

Y la representamos con un histograma de frecuencias para la estatura.

Frecuencia.
Entendemos por frecuencia el nmero de veces que se repite cierta accin. En estadstica, dada una variable que toma diferentes valores, cada uno de estos valores puede presentarse cierto nmero de veces, esa es la frecuencia, el nmero de veces que se presenta un dato.

Notacin Sigma.
La notacin sigma se utiliza para escribir de forma abreviada sumas que involucran muchos sumandos.

Grficos en datos agrupados.


Una forma alternativa a las tablas, para resumir los datos de una variable es la utilizacin de un dibujo o gr.ca que permita interpretar mejor algunas de sus caractersticas principales. Es importante tener en cuenta que las representaciones grficas ayudan a comprender mejor como se comportan los datos, pero de ninguna manera reemplazan el anlisis cuantitativo de la informacin. Son slo ayudas visuales. Diagrama Circular: Tambin conocidos como diagramas de "tartas", se divide un crculo en tantas porciones como clases tenga la variable, de modo que a cada clase le corresponde un arco de crculo proporcional a su frecuencia absoluta o relativa. Como se puede observar, la informacin que se debe mostrar en cada sector hace referencia al nmero de casos dentro de cada categora y al porcentaje del total que estos representan. Si el nmero de categoras es excesivamente grande, la imagen proporcionada por el grfico de sectores no es lo suficientemente clara y por lo tanto la situacin ideal es cuando hay alrededor de tres categoras. En este caso se pueden apreciar con claridad dichos subgrupos.

Ojiva: Es la tabla de frecuencia (absoluta o relativa) acumulada. Indica la frecuencia acumulada en y por debajo de un intervalo dado. Facilita la comparacin de datos de forma visual.

Histograma: Esta formado por rectngulos cuya base es la amplitud del intervalo y tiene la caracterstica que la superficie que corresponde a las barras es representativa de la cantidad de casos o frecuencia de cada tramo de valores, puede construirse con clases que tienen el mismo tamao o diferente (intervalo variable). La utilizacin de los intervalos de amplitud variable se recomienda cuando en alguno de los intervalos, de amplitud constante, se presente la frecuencia cero o la frecuencia de alguno o algunos de los intervalos sea mucho mayor que la de los dems, logrando as que las observaciones se hallen mejor repartidas dentro del intervalo.

Poligono de frecuencia: Se puede obtener uniendo cada punto medio (marca de clase) de los rectngulos del histograma con lneas rectas, teniendo cuidado de agregar al inicio y al final marcas de clase adicionales, con el objeto de asegurar la igualdad del reas.

De Barras: son similares a los grficos de sectores. Se representan tantas barras como categoras tiene la variable, de modo que la altura de cada una de ellas sea proporcional a la frecuencia o porcentaje de casos en cada clase. Estos mismos grficos pueden utilizarse tambin para describir variables numricas discretas que toman pocos valores.

DATOS NO AGRUPADOS.
Los DATOS NO AGRUPADOS es un conjunto de informacin si ningn orden que no nos establece relacin clara con lo que se pretende desarrollar a lo largo de un problema. Entonces estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados, son brutos(es decir, no se presentan clasificados). Cuando la muestra que se ha tomado de la poblacin o proceso que se desea analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados. No es necesario clasificar ni generar una tabla de frecuencias, ya que no tiene mucho sentido. Cuando la muestra consta de 20 o ms datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las caractersticas de la muestra y por consiguiente las de la poblacin de donde fue tomada. Distribucin de frecuencia para datos no Agrupados (n<20): Es aquella distribucin que indica las frecuencias con que aparecen los datos estadsticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificacin al tamao de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad despus que la distribucin de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lgico con sus respectivas frecuencias. Aunque contemos con menos de 20 elementos, debe de verificarse que los datos no sean significativos, Esto es: que la informacin no sea repetitiva, de esta forma, sabremos que no se podr clasificar y por lo tanto ser resumida en una tabla de frecuencias. En caso de que una vez que hayamos ordenado los elementos, se cuente con datos significativos. Procedemos a clasificarlos (si es posible, ya que tambin debemos de buscar la lgica al clasificar los elementos) para convertirlos en datos agrupados. Por ejemplo: Vas a investigar la edad a un grupo de 20 Nios en datos no agrupados (es decir, vienen los 20 nios y as como te dan la edad as la anotas: 2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3, (Total 20 nios) Los datos no agrupados tambin los puedes ordenar, por ejemplo de la edad menor a la edad mayor, no estn contabilizados ni clasificados solamente estn ordenados 1,1,2,2,2,2,3,3,3,3,3,3,3,4,4,4,4,5,5, (Total 20 nios) Estos son datos no agrupados por qu no los has clasificado y contado, tambin se pueden ordenar de la edad menor a mayor. El hecho de que los datos no agrupados pueden ordenarse, no significa que se conviertan en datos agrupados. Los datos no agrupados, tambin pueden ser ordenamos y de la misma forma, tambin se pueden obtener graficas, determinar media, desviacin estndar, etc.

Media Aritmtica
Para calcular la media aritmtica, sumamos todos los datos y dividimos entre el nmero de datos. Podemos diferenciar la frmula del promedio simple para datos poblaciones y mustrales: Observe que la variacin de ambas frmulas radica en el tamao de los datos (N identifica el tamao de la poblacin, mientras que n el de la muestra).

x = media aritmtica xi = dato i n = nmero de datos en la muestra

Media Geogrfica
Es la raz en ensima del producto de los valores de los elementos de la muestra, es usada cuando los valores de los datos de la muestra no son lineales, es decir que su valor depende de varios factores a la vez, se determina de la siguiente forma:

G = media geomtrica xi = dato i n = nmero de datos en la muestra

La mediana
La mediana es el dato que se encuentra a la mitad de la lista. Para calcular su posicin se aplica la siguiente ecuacin:

Para calculara la mediana, se ordenan los datos y se encuentra el punto medio de stos (la posicin (n+1)/2). Si la media y la mediana coinciden, la distribucin es simtrica. Si la media es mayor que la mediana, la distribucin es asimtrica positiva; si la mediana es mayor, la distribucin es asimtrica negativa.

La moda
La moda de un conjunto de nmeros es el valor que ocurre con mayor frecuencia; es decir, el valor ms frecuente. La moda puede no existir, e incluso no ser nica en caso de existir. Se han obtenido en una muestra, la muestra de una poblacin nos genera la distribucin de los datos una vez que estos se han graficado y en esta grfica es posible observar la moda o modas de la misma, es por esto que una distribucin de datos puede ser amodal (carece de moda), unimodal (tiene una sola moda), bimodal (tiene dos modas) o polimodal (tiene ms de dos modas).

MEDIDAS DE DISPERSIN.
Cuando se tiene una muestra de datos obtenida de una poblacin cualquiera, es importante determinar sus medidas de tendencia central as como tambin es bsico el determinar que tan dispersos estn los datos en la muestra, por lo que se hace necesario determinar su rango, la varianza, la desviacin estndar, etc., ya que una excesiva variabilidad o dispersin en los datos indica la inestabilidad del proceso en anlisis en la mayora de los casos.

Rango o recorrido. El rango es la diferencia entre el valor mayor y el valor menor encontrado en la muestra, tambin se le denomina recorrido ya que nos dice entre que valores hace su recorrido la variable de inters; y se determina de la siguiente manera: R = VM Vm

R = rango o recorrido VM = valor mayor en la muestra Vm = valor menor en la muestra

Desviacin absoluta media ( ). Esta medida de dispersin nos representa la diferencia absoluta promedio que existe entre cada dato que se encuentra en la muestra y la media de los datos y se determina de la siguiente manera:

xi = dato i

= media aritmtica de la muestra n = nmero de datos en la muestra

Varianza o variancia (s2). Es el promedio de las diferencias elevadas al cuadrado entre cada valor que se tiene en la muestra (xi) y la media aritmtica ( ) de los datos y se determina de la siguiente manera:

n= es el nmero de datos en la muestra

Desviacin estndar (s). Es la desviacin o diferencia promedio que existe entre cada dato de la muestra y la media aritmtica de la muestra. Y se obtiene a partir de la varianza, sacndole raz cuadrada.

s2= varianza o variancia

Integrantes del Equipo: Juan Arturo Leycegui Padilla. Jaime Ebenezer Arroyo Buclon Daniel Gmez Castillo Lus Javier Curiel Islas

Fuentes:
http://200.21.193.162:81/pub/proyectos/estadistica/8/material_de_clase.pdf http://html.rincondelvago.com/estadistica_42.html http://www.buenastareas.com/ensayos/Estadistica-Basica-Unidad-2-Datos-Agrupados/2708011.html http://www.buenastareas.com/ensayos/Datos-Agrupados-y-No-Agrupados/1425334.html http://www.buenastareas.com/ensayos/Datos-Agrupados-y-No-Agrupados/1479645.html http://www.foros.net/viewtopic.php?t=3&mforum=esadestadistica http://www.eumed.net/libros/2007a/239/4a.htm http://pdf.rincondelvago.com/media-mediana-y-moda-para-datos-agrupados.html http://www.monografias.com/trabajos87/mediana-datos-no-agrupados-y-agrupados/mediana-datos-no-agrupados-y-agrupados.shtml http://www.itch.edu.mx/academic/industrial/sabaticorita/_private/02TRATAMIENTO%20PARA%20DATOS%20NO%20AGRUPADOS.htm

S-ar putea să vă placă și