Sunteți pe pagina 1din 14

Martha Yolotzi Snchez Lino 2RM4

Unidad Temtica I Estadstica Descriptiva Introduccin


La naturaleza de la estadstica radica en los primeros estudiosos que se dedicaron, por lo general, a la recoleccin y exposicin de datos tiles para el Estado, de ah se deriv el nombre estadstica. POR EJEMPLO recolectaban datos sobre nacimientos y decesos, para auxiliar a los encargados del reclutamiento militar; sobre enfermedades, para ayudar a quienes se ocupaban de la salud pblica, y acerca de exportaciones, importaciones, ingresos y egresos, y gastos para facilitar la recaudacin de impuestos. La estadstica se refiere a un conjunto de mtodos para manejar la obtencin, presentacin y anlisis de diferentes tipos de datos numricos. La Estadstica descriptiva, se encarga de recopilar, organizar, presentar toda la informacin obtenida de una encuesta o estudio. Los mtodos estadsticos se integran por 3 procesos: Por medio de la recopilacin de datos.- este es el nico proceso el cual ya se tiene y no es objeto de estudio de la estadstica solo tomaremos la informacin. Clasificacin de datos Presentacin de datos (ordenar) La estadstica ha evolucionado mucho y los alcances que ha tenido durante el tiempo ha sido significativa, hablando espacialmente en el rea mercadolgica podemos hablar de los mtodos y tcnicas de la estadstica que le ayudan a la realizacin de mltiples tareas en las organizaciones productivas y sociales, tanto en las empresas pblicas como en las privadas; son la base para la realizacin de estudios tcnicos e investigaciones que permiten la mejora de procesos de produccin, de bienes y de servicios o el sustento de la toma de decisiones en las empresas u organizaciones de los ms diversos giros. La velocidad del desarrollo tecnolgico, los volmenes de nueva informacin y el avance vertiginoso de la ciencia, han generado una gran diversificacin en las aplicaciones de la metodologa estadstica; incuestionable, incluso a nivel mundial. Hoy en da la estadstica tiene un lugar muy significativo en la sociedad. 1.1 RECOPILACIN DE DATOS La recopilacin de datos o tambin llamada presentacin es la parte que se dedica a la recopilacin de la informacin ya sea cuantitativa y cualitativa, as como el ordenamiento de la mismas til para la explicacin de la informacin (por ejemplo el peso, talla, estatura, promedio de un grupo de personas) dicha informacin tambin se les conoce como variables. 1.1.1 DATOS NO AGRUPADOS Recoleccin simple o no organizada (datos no organizados): Es el enunciado de los datos presentados en su forma primaria, es decir, tal como fueron obtenidos durante el proceso de observacin o medicin en la muestra o poblacin. Los datos no agrupados son cuando te dan menos de 30 datos. POR EJEMPLO Te dan el peso de 10 personas as conforme llegan las cuales son: 48, 55, 60, 45, 52, 50, 58, 65, 46, 60, 70. 1

Martha Yolotzi Snchez Lino 2RM4 DATOS AGRUPADOS Recopilacin organizada o tabulacin (datos organizados): Es el ordenamiento de la informacin en tablas o en un listado denominadas tablas de frecuencias o distribuciones de frecuencias, a partir de los datos primarios. Los datos agrupados deben ser de una cantidad ms de 30 y cuenta con un Rango de ms de 5, adems estos pueden ser repetitivos y no; Cuando los datos se tabulan o se organizan en las tablas de frecuencias, pueden estar no agrupados, es decir, de manera que se leen directamente los valores observados, o agrupados, esto es se construyen intervalos para resumir la informacin observada. POR EJEMPLO Te dan el peso de 15 personas as conforme llegan las cuales son: 45 58 60 45 50 47 50 58 65 45 60 66 58 70 58 45 50 48 65 52 45 44 70 50 45 66 56 59 47 69 60 79 70 46 50 67

1.2 ORDENACIN Y CLASIFICACIN Ordenacin de datos: Es una colocacin de los datos numricos tomados en orden creciente a decreciente de magnitud; aunque se puede hacer de manera inversa. Clasificacin de datos: Caractersticas o nmeros que son recolectados por observacin. No son otra cosa que el producto de las observaciones efectuadas en las personas y objetos en los cuales se produce el fenmeno que queremos estudiar los datos estadsticos puede ser clasificado en cualitativos y cuantitativos. Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de clase y no de cantidad. POR EJEMPLO Si deseamos clasificar los estudiantes que cursan la materia de estadstica I por su estado civil, observamos que pueden existir solteros, casados, divorciados, viudos. Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes, decimos que son datos cuantitativos. POR EJEMPLO Se clasifican los estudiantes que cursan la materia de estadstica I por su calificacin o promedio, es decir del 1 al 10.

1.2.1 NMERO DE INTERVALOS DE CLASE Son los intervalos de clase en que se divide el conjunto de datos. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Para su clculo es: N de clase = Rango / Tamao de clase. La diferencia entre el mayor y el menor de los nmeros se llama rango o recorrido de datos. Para poder hacer intervalos de clase debe tener menos de 5 clases y ms de 15 clases El intervalo de clase es la informacin entre esos 2 datos los cuales son un lmite superior y un lmite inferior. 29 34 Lim. Inf. - Lim. Sup. 2

Martha Yolotzi Snchez Lino 2RM4 1.2.2 TAMAO DE INTERVALOS Los intervalos de clase pueden ser de tres tipos, segn el tamao que estos presenten en una distribucin de frecuencia: a) Clases de igual tamao b) Clases desiguales de tamao c) Clases abiertas. La separacin entre clases no debe ser mayor a una unidad y menos de media unidad. La anchura de los lmites son de 2 tipos: Limites a secas: su nombre es anchura y es el que se separa del lmite superior al inferior. POR EJEMPLO: 2 5; 6 9. Limites reales:su nombre es tamao y es el que coinciden o no hay una separacin entre los limites. POR EJEMPLO: 2 5; 5 8. 1.2.3 DISTRIBUCIN DE FRECUENCIA La distribucin de frecuencia es una disposicin tabular de datos estadsticos, ordenados ascendente o descendentemente, con la frecuencia (fi) de cada dato. Las distribuciones de frecuencias pueden ser para datos no agrupados y para datos agrupados o de intervalos de clase. Es la presentacin y la clasificacin de la informacin ya sea en datos agrupados y no agrupados, con todos sus elementos, as se conocern: X1= se refiere a los datos encontrados en caso de datos no agrupados. IC= es el intervalo de clase en caso de datos agrupados. F1= es la frecuencia absoluta o el nmero de veces que se repite cada dato. Fr= es la frecuencia relativa, nos habla de el numero de frecuencia absoluta pero de manera fraccionaria. Fa= es la frecuencia acumulada, es la que va sumando la frecuencia relativa. Fra o Far= es la frecuencia porcentual, y como lo dice nos habla del % o de manera fraccionaria la frecuencia acumulada. POR EJEMPLO Aqu podemos ver la distribucin de frecuencias de datos no agrupados Listado 45 46 48 50 52 55 58 60 65 70 F1 1 1 1 1 1 1 1 1 1 1 Fr 1/10 1/10 1/10 1/10 1/10 1/10 1/10 1/10 1/10 1/10 % 10 10 10 10 10 10 10 10 10 10 Fa 1 2 3 4 5 6 7 8 9 10 Fra 1/10 2/10 3/10 4/10 5/10 6/10 7/10 8/10 9/10 10/10 3

Martha Yolotzi Snchez Lino 2RM4 POR EJEMPLO Aqu podemos ver la distribucin de frecuencias de datos agrupados Listado 108 112 113 117 118 122 123 127 128 133 134 138 F1 3 3 6 6 7 11 Fr 3/36 3/36 6/36 6/36 7/36 11/36 % 8.33 8.33 16.66 16.66 19.44 30.55 Fa 3 6 12 18 25 36 Fra 3/36 6/36 12/36 18/36 25/36 36/36

1.3 REPRESENTACIN GRFICA DE LAS DISTRIBUCIONES DE FRECUENCIAS Las representaciones graficas o graficos es una representacin de la relacin entre variables. En estadstica existen muchos tipos de graficas. Un grfico es, adems, la representacin de datos numricos mediante una o ms lneas que permiten hacer visible la relacin entre los datos. 1.3.1 Para datos no agrupados Las representaciones graficas en datos no agrupados son las siguientes: De puntos Una grfica de puntos muestra cada elemento de un conjunto de datos numricos por encima de una recta numrica. Las grficas de puntos facilitan ver los espacios vacos y los agrupamientos en un conjunto de datos, estos grficos se realizan con la frecuencia absoluta (fi). POR EJEMPLO.- En este ejemplo, cada punto representa el peso de una persona y la altura de la misma persona.

De lneas

Los grficos de lneas muestran una serie como un conjunto de puntos conectados mediante una lnea en el eje X y los valores se representan por el alto de los puntos con relacin al eje Y en esta unidad se refiere a la frecuencia absoluta (fi), los grficos de lneas suelen utilizarse para comparar valores a lo largo del tiempo. 4

Martha Yolotzi Snchez Lino 2RM4

POR EJEMPLO.- Aqu podemos ver la relacin entre la cantidad de gramos de helado entre los sabores que se encuentran en la heladera.

Escalonada

El tipo de grfico de lneas escalonadas es similar al tipo de grfico de lneas, pero no utiliza la distancia ms corta para conectar dos puntos de datos. En su lugar, este tipo de grfico utiliza lneas verticales y horizontales para conectar los puntos de datos de una serie formando una progresin escalonada. POR EJEMPLO.- En este ejemplo nos muestra lo que gane en pesos por cada 2 horas de trabajo.

1.3.2 Para datos agrupados Histograma Un histograma de frecuencias, consiste en un conjunto de rectngulos, con bases en el eje horizontal y longitudes iguales a los tamaos de cada clase. Este grafico se realiza con las frecuencias absolutas, acumulativas, relativas y relativas acumulativas. La caracterstica principal de este tipo de grficos es que entre cada rectngulo del histograma no existe separacin alguna.

Martha Yolotzi Snchez Lino 2RM4 POR EJEMPLO: A continuacin se da la tabla de frecuencia correspondiente a las calificaciones finales de un curso en Ciencias Naturales, expresadas en la escala de 1 a 6: Intervalo 1 2 3 4 5 6 Frecuencia 2 3 7 18 7 3

Polgono La figura que se forma cuando se unen los puntos medios de la parte superior de los rectngulos del histograma, comenzando por el punto medio adicional hacia la izquierda y cerrndolo con el punto medio adicional hacia la derecha, se le llama polgono de frecuencias. Hay varios tipos de polgonos: Fi polgono Fa ojiva Fr polgono Fra ojiva % POR EJEMPLO: El ejemplo nos muestra entre las unidades de las frecuencias absolutas y la cantidad que estas la contiene.

Martha Yolotzi Snchez Lino 2RM4

Ojiva La curva que une los puntos medios de la parte superior de los rectngulos escalonados del histograma, comenzando por el punto medio adicional hacia la izquierda y as continuar hasta el punto medio del ltimo rectngulo del histograma, se le llama ojiva. POR EJEMPLO: La relacin que existe entre las horas de visita y la cantidad de visita pero en frecuencias relativas acumuladas (fra %).

1.3.3 Otros tipos de grficos. Barras Un grfico de barras es aquella representacin grfica bidimensional en que los objetos grficos elementales son un conjunto de rectngulos dispuestos paralelamente de manera que la extensin de los mismos es proporcional a la magnitud que se quiere representar. Los rectngulos o barras pueden estar colocados horizontal o verticalmente. En ste ltimo caso reciben tambin el nombre de grficos de columnas. POR EJEMPLO.- La relacin en este ejemplo es que clase de mascota tiene y la cantidad que este contiene.

Martha Yolotzi Snchez Lino 2RM4

Pastel Para este tipo de grafico, se toma en cuenta el crculo como unidad o el 100% y se divide en sectores segn la proporcin en que cada clase participe respecto al total. Cada proporcin de la grafica representa 1 clase, estas graficas son muy ilustrativas y facilita una lectura rpida de la informacin que se desea comunicar. POR EJEMPLO: Se tiene la informacin de 80 semanas de operacin de un terminal de computacin conectado por va telefnica a un computador central, donde se registr el nmero de cadas del sistema por semanas.

Cadas por semana


0 1 2 3

Semanas
36 27 10 7

Frec. Relativa porcentual


45,00 33,75 12,50 8,75

As una forma de representar la situacin por medio de un grfico circular es la siguiente:

Porcentajes de cadas del sistema computacional

Martha Yolotzi Snchez Lino 2RM4 Pictogramas Un pictograma es un grfico que utiliza una figura alusiva al tema para representar la frecuencia. POR EJEMPLO: En cada mes del cumpleaos de los nios y nias del curso. Cada representa a un nio o nia que est de cumpleaos ese mes. As entonces en marzo, 5 nios o nias estn de cumpleaos.

1.4 PRINCIPALES CARACTERSTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS ESTUDIO DESCRIPTIVO El estudio descriptivo analiza, estudia y describe a la totalidad de los individuos de una poblacin, su finalidad es obtener informacin, analizarla, elaborarla y simplificarla lo necesario para que pueda ser interpretada cmoda y rpidamente y, por tanto, pueda utilizarse eficazmente para el fin que se desee. 1.4.1 MEDIDAS DE TENDENCIA CENTRAL Son las que describen el comportamiento de una muestra y por lo tanto de la poblacin donde fue tomada esa muestra. MEDIA Es tal vez uno de los promedios ms utilizados puesto que la media es una medida promedio de la poblacin, es decir, indica el comportamiento de toda la poblacin. Si los datos se presentan en una forma desordenada o que no estn agrupados, la media se obtiene utilizando la siguiente condicin. Datos no agrupados = x - x / n POR EJEMPLO Cual es la media o el promedio de los nmeros 3, 5, 7, 9, 11 35/ 5 = 7 Datos agrupados = fi Xi / N POR EJEMPLO.- Se debe obtener la media en un grupo de datos agrupados en donde la naturaleza es puntos de rating y primero que nada se debe obtener la sumatoria de todas las multiplicaciones de fi y de Xi, es decir, la frecuencia absoluta y las marcas de clase. 9

Martha Yolotzi Snchez Lino 2RM4

MODA La moda de un conjunto de datos ordenados en magnitud, es aquel que se repite ms veces. La moda puede no existir e incluso no sea nica en caso de que exista. Se simboliza por Mo Mo= Li + ( I / 1 + 2 ) c Li= limite inferior de la clase que contiene a la moda (fronteras de clases) 1= frecuencia de la moda una frecuencia anterior inmediata a ella 2= frecuencia de la moda una frecuencia posterior inmediata a ella POR EJEMPLO Cual es la moda del siguiente conjunto 2, 5, 7, 9, 10, 9, 11, 10, 9 = 9 En caso de datos agrupados: POR EJEMPLO.- La Moda en caso de datos no agrupados es el valor de x que ocurre con mayor frecuencia o el que ms se repite. En este caso estamos hablando de la misma naturaleza que la media es de puntos de rating ah nos muestra los siguientes elementos: Li.- Es el lmite donde contiene la frecuencia absoluta mayor. di.- es la diferencia de la frecuencia absoluta elegida o mayor menos la frecuencia absoluta anterior. d2.- es la diferencia de la frecuencia absoluta elegida o mayor menos la frecuencia absoluta consecutiva. t.- es el tamao de clase en donde contiene la moda.

( ) ( )

10

Martha Yolotzi Snchez Lino 2RM4 MEDIANA La mediana de un conjunto de datos ordenados en magnitud, es el dato que esta ubicado exactamente a la mitad de dicha conjunto. Se simboliza Md. Md = Li + ( N/2 F / f ) c Li= limite inferior de la clase que contiene la mediana (fronteras de clases) N= suma total de frecuencias absolutas F= frecuencia acumulada anterior a la que contiene la mediana f= frecuencia absoluta de la clase que contiene a la mediana c= tamao de las clases POR EJEMPLO Cual es la mediana de los nmeros 2, 5, 3, 8, 2, 10, 8, 6, 8 (Ordena) = 6 Para datos agrupados es lo siguiente.- la mediana es el valor que ocupa la posicin central, o sea la mitad cuando los datos se ordenan de acuerdo con su magnitud, esto es el valor que divide a una distribucin en dos partes iguales. Sus elementos son los siguientes: Li.- Es el lmite donde contiene la media N.-es el numero de poblacin de estudio. faa.- es la frecuencia acumulada anterior de donde se la clase de la media. F med.- es la frecuencia absoluta donde se encuentra la media. t.- es el tamao de clase en donde contiene la moda. POR EJEMPLO.- Seguimos hablando de la misma naturaleza de puntos de rating y asi nos nuestra el resultado.

( (

) )

11

Martha Yolotzi Snchez Lino 2RM4 1.4.2 MEDIDAS DE DISPERSIN ABSOLUTAS 2 muestras dadas pueden llegar a coincidir en sus valores, en la media, en la moda, o en la mediana; sin embargo, los dems datos de ambas muestras pueden estar muy alejados o muy cerca de los promedios, las medidas que nos manifestaran tal situacin, son las medidas de variacin las cuales cuantifican que tan cercanas o alejadas estn las observaciones de los promedios. RANGO El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica. R= Xma Xme POR EJEMPLO: 69 18 = 51 RANGO INTERCUARTILICO Se denomina rango intercuartlico o rango intercuartil, a la diferencia entre el tercer y el primer cuartil de una distribucin. Es una medida de la dispersin estadstica. DESVIACIN MEDIA ABSOLUTA La desviacin respecto a la media es la diferencia entre cada valor de la variable estadstica y la media aritmtica. DM = | x - | / n POR EJEMPLO: Calcular la desviacin media de la distribucin. 9, 3, 8, 8, 9, 8, 9, 18

VARIANZA La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica. S2 = (x - ) 2 / n POR EJEMPLO: Calcular la varianza de la distribucin. 9, 3, 8, 8, 9, 8, 9, 18

DESVIACIN ESTANDAR La desviacin tpica es la raz cuadrada de la varianza, es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin. 12

Martha Yolotzi Snchez Lino 2RM4 S= (x - ) 2 / n

POR EJEMPLO: Calcular la desviacin tpica de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

COEFICIENTE DE VARIACIN El coeficiente de variacin es la relacin entre la desviacin tpica de una muestra y su media. V = S / M * 100 POR EJEMPLO: Una distribucin tiene x= 140 y =28.28 y otra x = 150 y = 25 Cul de las 2 presenta mayor dispersin?

La primera distribucin presenta mayor dispersin. 1.4.3 MEDIDAS DE SESGO Y APUNTUAMIENTO ABSOLUTAS COEFICIENTE DE ASIMETRIA DE PEARSON Y EL MOMENTO TRES. Indica la relacin existente entre la desviacin tpica de una muestra y su media. Se basa en el hecho de que en una distribucin simtrica, la media coincide con la moda. A partir de este dato se define el coeficiente de asimetra de Pearson como: Si Mo < Med < es sesgo derecho POSITIVA Si < Med < Mo es sesgo izquierdo NEGATIVO Si Mo = Med = es SMETRIA . Este coeficiente no es muy bueno para medir asimetras leves. CURTOSIS MOMENTO CUATRO O POR PERCILES El concepto de curtosis o apuntamiento de una distribucin surge al comparar la forma de dicha distribucin con la forma de la distribucin Normal. De esta forma, clasificaremos las distribuciones segn sean ms o menos apuntadas que la distribucin Normal. Coeficiente de Curtosis de Fischer El Coeficiente de Curtosis o Apuntamiento de Fischer pretende comparar la curva de una distribucin con la curva de la variable Normal, en funcin de la cantidad de valores extremos e la distribucin.

13

Martha Yolotzi Snchez Lino 2RM4 FUENTES BIBLIOGRAFICAS Apuntes de clase de probabilidad y estadstica Lisandro Pineda Celaya Probabilidad y Estadstica Manuel Fuenlabrada Edit. Mc. Graw Hill Paginas consultadas 115 a la 222 Estadstica Garca F. /Garza F. Edit. Mc. Graw Hill Paginas consultadas 135 a la 148

FUENTES URL www.slideshare.net/LuisFernando1956/estadistica-2010 www.ditutor.com/estadistica estadstica bsica/ aldocgh.tripod.com/

14

S-ar putea să vă placă și