Sunteți pe pagina 1din 19

Universidad Jurez Autnoma De Tabasco

Divisin Acadmica De Ciencias Biolgicas

Materia: Estadstica Descriptiva

Licenciatura: Biologa

Profesor: Filemn Vidal Baeza

Alumna: Rosario Eunice Franco Flix

Tema: Organizacin de Datos (unidad 1)

Febrero de 2010

INDICE

UNIDAD UNO: ORGANIZACIN DE DATOS


1.1) 1.2) 1.3) 1.4) 1.5) 1.6) 1.7) 1.8)

La naturaleza de la estadstica y su importancia biolgica. Concepto y clasificacin de estadstica. Arreglo ordenado Rango Datos no agrupados Datos agrupados Distribucin de frecuencias Representacin grfica (histograma, polgonos de frecuencias, etc.)

INTRODUCCION El presente trabajo tiene como propsito presentar material para la exposicin sobre la Importancia, Utilidad y Caractersticas Deseables en un Grfico, pero para hablar de este tema, debemos tener presente la importancia y utilidad en s de la Estadstica. En la prctica docente es muy difcil concebir la evaluacin de resultados sin tomar en cuanta algn tipo de estadstica. En la vida cotidiana la estadstica permite a una persona comn hacer uso y entender datos que de otro modo ni siquiera tendramos. La Estadstica es mucho ms que slo nmeros apilados y grficas bonitas. Es una ciencia con tanta antigedad como la escritura, y es por s misma auxiliar de todas las dems ciencias. Los mercados, la medicina, la ingeniera, los gobiernos, etc. se nombran entre los ms destacados clientes de sta. La ausencia de sta conllevara a un caos generalizado, dejando a los administradores y ejecutivos sin informacin vital a la hora de tomar decisiones en tiempos de incertidumbre. La Estadstica que conocemos hoy en da debe gran parte de su realizacin a los trabajos matemticos de aquellos hombres que desarrollaron la teora de las probabilidades, con la cual se adhiri a la Estadstica a las ciencias formales. En este breve material se expone los conceptos, la historia, la divisin as como algunos errores bsicos cometidos al momento de analizar datos Estadsticos.

CONCEPTOS DE ESTADISTICA Y CLASIFICACION ESTADISTICA Rama de las matemticas que se ocupa de reunir, organizar y analizar datos numricos y que ayuda a resolver problemas como el diseo de experimentos y la toma de decisiones. La estadstica es una ciencia con base matemtica referente a la recoleccin, anlisis e interpretacin de datos, que busca explicar condiciones regulares en fenmenos de tipo aleatorio. Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad, y es usada para la toma de decisiones en reas de negocios e instituciones gubernamentales. La Estadstica se divide en dos ramas: La estadstica descriptiva, que se dedica a los mtodos de recoleccin, descripcin, visualizacin y resumen de datos originados a partir de los fenmenos en estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de parmetros estadsticos son: la media y la desviacin estndar. Algunos ejemplos grficos son: histograma, pirmide poblacional, clusters, etc. La inferencia estadstica, que se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hiptesis), estimaciones de caractersticas numricas (estimacin), pronsticos de futuras observaciones, descripciones de asociacin (correlacin) o modelamiento de relaciones entre variables (anlisis de regresin). Otras tcnicas de modelamiento incluyen ANOVA, series de tiempo y minera de datos. Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada. Hay tambin una disciplina llamada estadstica matemtica, la cual se refiere a las bases tericas de la materia. La palabra estadsticas tambin se refiere al resultado de aplicar un algoritmo estadstico a un conjunto de datos, como en estadsticas econmicas, estadsticas criminales, etc.

DISTRIBUCIN DE FRECUENCIAS Distribucin de frecuencias es como se denomina en estadstica a la agrupacin de datos en categoras mutuamente excluyentes que indican el nmero de observaciones en cada categora. Esto significa una de las cosas ms importantes de la matemtica, su estadstica con la agrupacin de datos. La distribucin de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase. Elementos fundamentales para elaborar una distribucin de frecuencia: 1) RANGO. Es una medida de dispersin que se obtiene como la diferencia entre el nmero mayor y el nmero menor de los datos. R = N_max - N_min Ejemplo. Dados los nmeros: 5, 10, 12, 8, 13, 9, 15 R= 15- 5 2) AMPLITUD TOTAL. Simplemente se obtiene sumndole 1 al rango. AT = (R+1) 3) LAS CLASES. Estn formadas por dos extremos. el menor se llama lmite inferior el mayor se llama lmite superior. hay distintos tipos de clases. Ej. Notas (20-26) Edades (20-26.5) Salarios (20-26.99) 4) EL NMERO DE CLASES. Se determina a travs de la formula de stuger, la cual es vlida cuando el No de observaciones sea menor o igual a 500. Formula. Nc= 1 + 3.33log (N) Donde: Nc es el nmero de clases. N es la cantidad de muestras tomadas. 5) VALOR DEL INTERVALO O AMPLITUD Se Obtiene por medio de la ecuacin de dicta: Vi = AT / Nc Donde: Vi es el valor de intervalo AT es la amplitud total Nc es el nmero de clase

REPRESENTACIN GRFICA En los anlisis estadsticos, es frecuente utilizar representaciones visuales complementarias de las tablas que resumen los datos de estudio. Con estas representaciones, adaptadas en cada caso a la finalidad informativa que se persigue, se transmiten los resultados de los anlisis de forma rpida, directa y comprensible para un conjunto amplio de personas. Tipos de representaciones grficas Cuando se muestran los datos estadsticos a travs de representaciones grficas, se ha de adaptar el contenido a la informacin visual que se pretende transmitir. Para ello, se barajan mltiples formas de representacin:

Diagramas de barras: muestran los valores de las frecuencias absolutas sobre un sistema de ejes cartesianos, cuando la variable es discreta o cualitativa. Histogramas: formas especiales de diagramas de barras para distribuciones cuantitativas continuas. Polgonos de frecuencias: formados por lneas poligonales abiertas sobre un sistema de ejes cartesianos. Grficos de sectores: circulares o de tarta, dividen un crculo en porciones proporcionales segn el valor de las frecuencias relativas. Pictogramas: o representaciones visuales figurativas. En realidad son diagramas de barras en los que las barras se sustituyen con dibujos alusivos a la variable. Cartogramas: expresiones grficas a modo de mapa. Pirmides de poblacin: para clasificaciones de grupos de poblacin por sexo y edad.

Diagramas de barras e histogramas Los diagramas de barras se usan para representar grficamente series estadsticas de valores en un sistema de ejes cartesianos, de manera que en las abscisas se indica el valor de la variable estadstica y en las ordenadas se seala su frecuencia absoluta. Estos grficos se usan en representacin de caracteres cualitativos y cuantitativos discretos. En variables cuantitativas continuas, se emplea una variante de los mismos llamada histograma.

Diagrama de barras.

Histograma. Polgonos de frecuencias Para construir polgonos de frecuencias, se trazan las frecuencias absolutas o relativas de los valores de la variable en un sistema de ejes cartesianos y se unen los puntos resultantes mediante trazos rectos. Con ello se obtiene una forma de lnea poligonal abierta. Los polgonos de frecuencias se utilizan preferentemente en la presentacin de caracteres cuantitativos, y tienen especial inters cuando se indican frecuencias acumulativas. Se usan en la expresin de fenmenos que varan con el tiempo, como la densidad de poblacin, el precio o la temperatura. Grficos de sectores En los diagramas de sectores, tambin llamados circulares o de tarta, se muestra el valor de la frecuencia de la variable sealada como un sector circular dentro de un crculo completo. Por ello, resultan tiles particularmente para mostrar comparaciones entre datos, sobre todo en forma de frecuencias relativas de las variables expresadas en forma de porcentaje. Pictogramas y cartogramas Para aligerar la presentacin de datos estadsticos, con frecuencia se recurre a imgenes pictricas representativas del valor de las variables. Dos formas comunes de expresin grfica de los datos son:

Los pictogramas, que muestran diagramas figurativos con figuras o motivos que aluden a la distribucin estadstica analizada (por ejemplo, una imagen antropomrfica para indicar tamaos, alturas u otros). Los cartogramas, basados en mapas geogrficos que utilizan distintas tramas, colores o intensidades para remarcar las diferencias entre los datos.

Pirmide de poblacin Otra forma corriente de presentacin visual de datos estadsticos es la llamada pirmide de poblacin. Las pirmides de poblacin se utilizan en la expresin de informaciones demogrficas, econmicas o sociales, y en ellas se clasifican comnmente los datos de la poblacin del grupo de muestra considerado en diferentes escalas de edad y diferenciada por sexo.

Ejemplo de una pirmide de poblacin. Polgono de frecuencias. Polgono de frecuencias acumulativas. Grfico de sectores. Representacin de datos estadsticos en un pictograma. Variables estadsticas Medidas de tendencia central Ms informacin

Polgono de frecuencias.

Polgono de frecuencias acumulativas.

Grfico de sectores.

Representacin de datos estadsticos en un pictograma.

RANGO El rango en estadstica es la diferencia o resta del lmite superior menos el lmite inferior, de los datos utilizados en una clase. Se simboliza con la letra R mayscula. Para averiguar el rango de un grupo de nmeros: Ordene los nmeros segn su tamao Reste el valor mnimo al valor mximo. Requisitos del rango

Ordenamos los nmeros segn su tamao. Restamos el valor mnimo del valor mximo.

Ejemplo Para una muestra (1, 45, 50, 55, 100), el dato menor es 1 y el dato mayor es 100. Sus valores se encuentran en un rango de: Rango = 100 1 =99 El intervalo del rango de un conjunto de datos numricos es el intervalo cuyos extremos son el menor y el mayor valor. Ejemplo Para una muestra (1, 45, 50, 55, 100), el dato menor es 1 y el dato mayor es 100. Sus valores se encuentran en el intervalo del rango de: IR = [1,100] Medio rango El medio rango de un conjunto de valores numricos es la media del menor y mayor valor, o la mitad del camino entre el dato de menor valor y el dato de mayor valor. En consecuencia el medio rango es:

Ejemplo Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor valor Max= 8. El medio rango resolviendolo mediante la correspondiente frmula sera:

Representacin del medio rango: RECOPILACION DE DATOS

Poblacion y muestra Al recoger datos relativos a las caractersticas de un grupo de individuos u objetos, sean alturas y pesos de estudiantes de una universidad o tuercas defectuosas producidas en una fbrica, suele ser imposible o nada prctico observar todo el grupo, en especial si es muy grande. En vez de examinar el grupo entero, llamado poblacin o universo, se examina una pequea parte del grupo, llamada muestra. Una poblacin puede ser finita o infinita. Por ejemplo, la poblacin consistente en todas las tuercas producidas por una fbrica un cierto da es finita, mientras que la determinada por todos los posibles resultados (caras, cruces) de sucesivas tiradas de una moneda, es infinita. Si una muestra es representativa de una poblacin, es posible inferir importantes conclusiones sobre las poblaciones a partir del anlisis de la muestra. La fase de la estadstica que trata con las condiciones bajo las cuales tal diferencia es vlida se llama estadstica inductiva o inferencia estadstica. Ya que dicha inferencia no es del todo exacta, el lenguaje de las probabilidades aparecer al establecer nuestras conclusiones. La parte de la estadstica que slo se ocupa de describir y analizar un grupo dado, sin sacar conclusiones sobre un grupo mayor, se llama estadstica descriptiva o deductiva. Muestra aleatoria: muestra elegida independientemente de todas las dems, con la misma probabilidad que cualquier otra y cuyos elementos estn elegidos independientemente unos de otros y con la misma probabilidad.

1.4 ANLISIS DESCRIPTIVO DE LA INFORMACION:


Ayudar a observar el comportamiento de la muestra en estudio, a travs de tablas, grficos..... Los resultados recogidos en la muestra se resumen en una matriz de datos N x M, en la cual N es el nmero de unidades de anlisis utilizadas (nmero de casos) y M es el nmero de caractersticas de dichas unidades, unidades de las que tenemos informacin. Transformacin de los datos: la transformacin persigue la consecucin de una distribucin aproximada a la normal. Tipos de transformacin: Lineales: suma, resta, divisin, multiplicacin, cambia los valores brutos (datos obtenidos) de la variable sin alterar nada ms. No lineales monotnicas : cambian los valores originales y tambin sus distancias pero no el orden No lineales no monotnicas : similar a la anterior pero no altera el orden..

1.4.1 DATOS NO AGRUPADOS Tendencia central: la tendencia central se refiere al punto medio de una distribucin. Las medidas de tendencia central se conocen como medidas de posicin. Dispersin: se refiere a la extensin de los datos en una distribucin, es decir, al grado en que las observaciones se distribuyen. 1.4.2 DATOS AGRUPADOS Medidas de Dispersin Se llaman medidas de dispersin aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentracin de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas. Medidas de Tendencia central La estadstica busca entre otras cosas, describir las caractersticas tpicas de conjuntos de datos y, como hay varias formas de hacerlo, existen y se utilizan varios tipos de promedios. Se les llama medidas de tendencia central porque general mente la acumulacin ms alta de datos se encuentra en los valores intermedios. Las medidas de tendencia central comnmente empleadas son :

Media aritmtica Mediana Moda Media geomtrica Media armnica Los cuantiaos

1.5 GRAFICOS DE ESTADISTICA DESCRIPTIVA Los grficos se han de explicar enteramente por s mismos. El contenido de un grfico deber ser tan completo como sea posible. Las escalas vertical y horizontal estarn rotuladas con claridad dando las unidades pertinentes. Las mayoras de los grficos presentan informacin numrica con escalas, que deben rotularse para describir completamente la variable presentada en la escala y para variables de medida se dirn las unidades de medicin. No se debe tratar de abarcar demasiada informacin en un solo grfico. Es mejor hacer varios grficos que comprimir toda la informacin en uno solo. Una regla prctica segura es evitar grficos que contengan ms de 3 curvas. Los grficos tienen que dar una visin general y no una imagen detallada de un conjunto de datos. Las presentaciones detalladas se deben reservar para las tablas. Las tablas se explicarn por s mismas enteramente. Como los grficos, se ha de dar suficiente informacin en el ttulo y en los encabezamientos de columnas y filas de la tabla para permitir que el lector identifique fcilmente su contenido. Como el ttulo ser por lo general lo primero que se lee en detalle, deber suministrar toda la informacin esencial sobre el contenido de la tabla y deber especificar el tiempo, lugar, material estudio experimental y relaciones que se presenten en la tabla. Para cada variable numrica se han de dar las unidades. La funcin del rayado es dar claridad de interpretacin. Las anotaciones de numricas del cero se han de escribir explcitamente. Una anotacin numrica no debe comenzar con un punto decimal. Los nmeros que indican valores de la misma caracterstica se han de dar con el mismo nmero de decimales.

PARA LOS SUIGUITES DATOS VAN A SER VASADOS EN LA TABLA 1(TANTO AGRUPADOS COMO NO AGRUPADOS)

Tabla I. Distribucin frecuencias de la edad en 100 pacientes. N de pacientes 1 3 4 7 5 8 10 8 9 6 6 4 3 4 5 3 2 3 1 2 3 1 1 1

de

Edad

18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 41 42

1.5.1 NO AGRUPADOS
Otro modo habitual, y muy til, de resumir una variable de tipo numrico es utilizando el concepto de percentiles, mediante diagramas de cajas. La Figura muestra un grfico de cajas correspondiente a los datos de la Tabla I. La caja central indica el rango en el que se concentra el 50% central de los datos. Sus extremos son, por lo tanto, el 1er y 3er cuartil de la distribucin. La lnea central en la caja es la mediana. De este modo, si la variable es simtrica, dicha lnea se encontrar en el centro de la caja. Los extremos de los "bigotes" que salen de la caja son los valores que delimitan el 95% central de los datos, aunque en ocasiones coinciden con los valores extremos de la distribucin. Se suelen tambin representar aquellas observaciones que caen fuera de este rango (outliers o valores extremos). Esto resulta especialmente til para comprobar, grficamente, posibles errores en nuestros datos. En general, los

diagramas de cajas resultan ms apropiados para representar variables que presenten una gran desviacin de la distribucin normal.

1.5.2 DATOS AGRUPADOS Histograma: Est formado por rectngulos cuya base es la amplitud del intervalo y tiene la caracterstica que la superficie que corresponde a las barras es representativa de la cantidad de casos o frecuencia de cada tramo de valores, puede construirse con clases que tienen el mismo tamao o diferente (intervalo variable). La utilizacin de los intervalos de amplitud variable se recomienda cuando en alguno de los intervalos, de amplitud constante, se presente la frecuencia cero o la frecuencia de alguno o algunos de los intervalos sea mucho mayor que la de los dems, logrando as que las observaciones se hallen mejor repartidas dentro del intervalo.

Ojivas: Cuando se trata de relacionar observaciones en un mismo aspecto para dos colectivos diferentes no es posible ejecutar comparaciones sobre la base de la frecuencia, es necesario tener una base estndar, la frecuencia relativa. La ojiva representa grficamente la forma en que se acumulan los datos y permiten ver cuntas observaciones se hallan por arriba o debajo de ciertos valores. Es til para obtener una medida de los cuartiles, deciles, percentiles. Polgono de Frecuencias

Se puede obtener uniendo cada punto medio (marca de clase) de los rectngulos del histograma con lneas rectas, teniendo cuidado de agregar al inicio y al final marcas de clase adicionales, con el objeto de asegurar la igualdad del reas.

Diagramas de barras son similares a los grficos de sectores. Se representan tantas barras como categoras tiene la variable, de modo que la altura de cada una de ellas sea proporcional a la frecuencia o porcentaje de casos en cada clase. Estos mismos grficos pueden utilizarse tambin para describir variables numricas discretas que toman pocos valores

En los grficos de sectores, tambin conocidos como diagramas de "tartas", se divide un crculo en tantas porciones como clases tenga la variable, de modo que a cada clase le corresponde un arco de crculo proporcional a su frecuencia absoluta o relativa. Un ejemplo se muestra en la. Como se puede observar, la informacin que se debe mostrar en cada sector hace referencia al nmero de casos dentro de cada categora y al porcentaje del total que estos representan. Si el nmero de categoras es excesivamente grande, la imagen proporcionada por el grfico de sectores no es lo suficientemente clara y por lo tanto la situacin ideal es cuando hay alrededor de tres categoras. En este caso se pueden apreciar con claridad dichos subgrupos.

1.6 MEDIDAS DE ASIMETRIA Y APUNTAMIENTO Sesgo: las curvas que representan los puntos de datos de un conjunto de datos pueden ser simtricas o sesgadas. Las curvas simtricas, tienen una forma tal que una lnea vertical que pase por el punto ms alto de la curva dividir el rea de sta en dos partes iguales. Cada parte es una imagen espejo de la otra. En las curvas sesgadas, los valores de su distribucin de frecuencias estn concentrados en el extremo inferior o en el superior de la escala de medicin del eje horizontal. Los valores no estn igualmente distribuidos. Las curvas pueden estar sesgadas hacia la derecha (positivamente sesgadas) o sesgadas hacia la izquierda (negativamente sesgadas). MEDIDAS DE CURTOSIS Al comparar cun aguda es una distribucin en relacin con la Distribucin Normal, se pueden presentar diferentes grados de apuntalamiento. 1. Mesocrtica, Normal 2. PlarticrtiCa, Menor apuntalamiento 3. Leptocrtica, Mayor apuntalamiento

ARREGLO ORDENADO
Un arreglo ordenado es una secuencia de datos ordenados del mayor a menor valor. La siguiente tabla contiene la informacin ordenada para el precio de las comidas en restaurante citadinos y de los suburbios. En la tabla se observa el precio de una comida en los restaurantes citadinos se encuentra entre $14 y $63, y que los restaurante fueras de la ciudad se encuentra entre $23 y $55.

Tabla.- arreglo ordenado Del precio por persona En 50 restaurante De la ciudad y 50 restaurantes Fuera de la ciudad 30 36 39 45 53 31 36 40 48 53 31 37 41 48 56 32 37 42 49 63

26 29 33 38 48

26 30 33 38 51

26 30 34 38 51

26 30 34 38 55

CONCLUSIN
El ser humano es curioso y controlador por naturaleza; ejercer ese control sobre su entorno le presenta un problema serio; por ello la Estadstica le es tan til en su vida diaria. El hombre acumula informacin, luego la clasifica y la analiza para poder entenderla, de ese modo podr controlarla; despus la traduce a cifras, clculos y datos que le ayudan a tomar decisiones sobre cosas tan cotidianas como la compra de un vehculo, el lugar ms seguro para vivir, la variacin del clima en una zona o cosas tan indispensables como la compra y venta de un producto en una empresa o la matrcula de una institucin educativa. Pero para que el hombre pueda hacer todo esto, debe tener un mtodo, una forma de recolectar e interpretar esos datos; este mtodo es a lo que llamamos estadstica. Existen mil usos para la informacin que recopilemos, pero independientemente de la necesidad o el enfoque que queramos darle, la presentacin final nos permitir comunicar nuestros resultados; las tablas y los informes son efectivos, pero sin duda ninguno es tan claro ni tan popular como los grficos, ya que son legibles incluso para un nio. Agregado al punto anterior su esttica le da un aspecto artstico, an al ms aburrido de los informes.

BIBILIOGRAFIA
http://www.hiru.com/matematika/matematika_06000.html Texto Estadstica para las Ciencias Administrativas. Martinez, Ciro. Estadstica y Muestreo. Ecoe Ediciones. Bogot. 11. Edicin.

S-ar putea să vă placă și