Sunteți pe pagina 1din 28

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
SUBSECTOR DE APRENDIZAJE: Matemtica NOMBRE GUIA Y/O MODULO N2: Estadstica NIVEL: 4 Medio PROFESORA: Alejandra Urrea Manns OBJETIVOS GUIA DE APRENDIZAJE: Grficar e interpretar datos estadsticos( tablas de frecuencias). Aplicar medidas de tendencia central ( promedio mediana y moda). Aplicar medidas de dispersin.( varianza ,desviacin media ,desviacin tpica). Seleccionar diversas formas de organizar, presentar y sintetizar un conjunto de datos. Analizar muestras al azar, considerando situaciones de la vida cotidiana; inferencias a partir de distintos tipos de muestra.

HISTORIA DE LA ESTADSTICA

La estadstica es una rama de las matemticas que se ocupa de reunir, organizar y analizar datos numricos y que ayuda a resolver problemas como el diseo de experimentos y la toma de decisiones. Historia Desde los comienzos de la civilizacin han existido formas sencillas de estadstica, pues ya se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero de personas, animales o ciertas cosas. Hacia el ao 3000 a.C. los babilonios usaban ya pequeas tablillas de arcilla para recopilar datos en tablas sobre la produccin agrcola y de los gneros vendidos o cambiados mediante trueque. Los egipcios analizaban los datos de la poblacin y la renta del pas mucho antes de construir las pirmides en el siglo XXXI a.C. Los libros bblicos de Nmeros y Crnicas incluyen, en algunas partes, trabajos de estadstica. El primero contiene dos censos de la poblacin de Israel y el segundo describe el bienestar material de las diversas tribus judas. En China existan registros numricos similares con anterioridad al ao 2000 a.C. Los griegos clsicos realizaban censos cuya informacin se utilizaba hacia el 594 a.C. para cobrar impuestos. El Imperio romano fue el primer gobierno que recopil una gran cantidad de datos sobre la poblacin, superficie y renta de todos los territorios bajo su control. Durante la edad media slo se realizaron algunos censos exhaustivos en Europa. Los reyes carolingios Pipino, el Breve, y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los aos 758 y 762 respectivamente. Despus de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encarg un censo. La informacin obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book. El registro de nacimientos y defunciones comenz en Inglaterra a principios del siglo XVI, y en 1662 apareci el primer estudio estadstico notable de poblacin, titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defuncin en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrnomo ingls Edmund Halley como base para la primera tabla de mortalidad En el siglo XIX, con la generalizacin del mtodo cientfico para estudiar todos los fenmenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la informacin a valores numricos para evitar la ambigedad de las descripciones verbales. En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve como herramienta para relacionar y analizar dichos datos. El

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo en el proceso de interpretacin de esa informacin. El desarrollo de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilsticas; los resultados de stas se pueden utilizar para analizar datos estadsticos. La probabilidad es til para comprobar la fiabilidad de las inferencias estadsticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadstico. Mtodos estadsticos La materia prima de la estadstica consiste en conjuntos de nmeros obtenidos al contar o medir cosas. Al recopilar datos estadsticos se ha de tener especial cuidado para garantizar que la informacin sea completa y correcta. El primer problema para los estadsticos reside en determinar qu informacin y cunta se ha de reunir. En realidad, la dificultad al compilar un censo est en obtener el nmero de habitantes de forma completa y exacta; de la misma manera que un fsico que quiere contar el nmero de colisiones por segundo entre las molculas de un gas debe empezar determinando con precisin la naturaleza de los objetos a contar. Los estadsticos se enfrentan a un complejo problema cuando, por ejemplo, toman una muestra para un sondeo de opinin o una encuesta electoral. El seleccionar una muestra capaz de representar con exactitud las preferencias del total de la poblacin no es tarea fcil. Para establecer una ley fsica, biolgica o social, el estadstico debe comenzar con un conjunto de datos y modificarlo basndose en la experiencia. Por ejemplo, en los primeros estudios sobre crecimiento de la poblacin los cambios en el nmero de habitantes se predecan calculando la diferencia entre el nmero de nacimientos y el de fallecimientos en un determinado lapso. Los expertos en estudios de poblacin comprobaron que la tasa de crecimiento depende slo del nmero de nacimientos, sin que el nmero de defunciones tenga importancia. Por tanto, el futuro crecimiento de la poblacin se empez a calcular basndose en el nmero anual de nacimientos por cada 1.000 habitantes. Sin embargo, pronto se dieron cuenta de que las predicciones obtenidas utilizando este mtodo no daban resultados correctos. Los estadsticos comprobaron que hay otros factores que limitan el crecimiento de la poblacin. Debido a que el nmero de posibles nacimientos depende del nmero de mujeres, y no del total de la poblacin, y debido a que las mujeres slo tienen hijos durante parte de su vida, el dato ms importante que se ha de utilizar para predecir la poblacin es el nmero de nios nacidos vivos por cada 1.000 mujeres en edad de procrear. El valor obtenido utilizando este dato mejora al combinarlo con el dato del porcentaje de mujeres sin descendencia. Por tanto, la diferencia entre nacimientos y fallecimientos slo es til para indicar el crecimiento de poblacin en un determinado periodo de tiempo del pasado, el nmero de nacimientos por cada 1.000 habitantes slo expresa la tasa de crecimiento en el mismo periodo, y slo el nmero de nacimientos por cada 1.000 mujeres en edad de procrear sirve para predecir el nmero de habitantes en el futuro. ESTADSTICA

La palabra "estadstica" suele utilizarse bajo dos significados distintos: 1 Como coleccin de datos numricos. Esto es el significado ms vulgar de la palabra estadstica. Se sobrentiende que dichos datos numricos han de estar presentados de manera ordenada y sistemtica. Una informacin numrica cualquiera puede no constituir una estadstica, para merecer este apelativo, los datos han de constituir un conjunto coherente, establecido de forma sistemtica y siguiendo un criterio de ordenacin.

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
2 Como ciencia. En este significado, la Estadstica estudia el comportamiento de los fenmenos de masas. Como todas las ciencias, busca las caractersticas generales de un colectivo y prescinde de las particulares de cada elemento. As por ejemplo al investigar el sexo de los nacimientos, iniciaremos el trabajo tomando un grupo numeroso de nacimientos y obtener despus la proporcin de varones. Es muy frecuente enfrentarnos con fenmenos en los que es muy difcil predecir el resultado; as, no podemos dar una lista con las personas que van a morir con una cierta edad, o el sexo de un nuevo ser hasta que transcurra un determinado tiempo de embarazo. Por tanto, el objetivo de la estadstica es hallar las regularidades que se encuentran en los fenmenos de masa. Poblacin, elementos y caracteres. Es obvio que todo estudio estadstico ha de estar referido a un conjunto o coleccin de personas o cosas. Este conjunto de personas o cosas es lo que denominaremos poblacin. Las personas o cosas que forman parte de la poblacin se denominan elementos. En sentido estadstico un elemento puede ser algo con existencia real, como un automvil o una casa, o algo ms abstracto como la temperatura, un voto, o un intervalo de tiempo. A su vez, cada elemento de la poblacin tiene una serie de caractersticas que pueden ser objeto del estudio estadstico. As por ejemplo si consideramos como elemento a una persona, podemos distinguir en ella los siguientes caracteres: Sexo, Edad, Nivel de estudios, Profesin, Peso, Altura, Color de pelo, etc. Luego por tanto de cada elemento de la poblacin podremos estudiar uno o ms aspectos cualidades o caracteres. La poblacin puede ser segn su tamao de dos tipos: Poblacin finita: cuando el nmero de elementos que la forman es finito, por ejemplo el nmero de alumnos de un centro de enseanza, o grupo clase. Poblacin infinita: cuando el nmero de elementos que la forman es infinito, o tan grande que pudiesen considerarse infinitos. Como por ejemplo si se realizase un estudio sobre los productos que hay en el mercado. Hay tantos y de tantas calidades que esta poblacin podra considerarse infinita. Ahora bien, normalmente en un estudio estadstico no se puede trabajar con todos los elementos de la poblacin sino que se realiza sobre un subconjunto de la misma. Este subconjunto puede ser una muestra, cuando se toman un determinado nmero de elementos de la poblacin, sin que en principio tengan nada en comn; o una subpoblacin, que es el subconjunto de la poblacin formado por los elementos de la poblacin que comparten una determinada caracterstica, por ejemplo de los alumnos del centro la subpoblacin formada por los alumnos de 3 Medio o la subpoblacin de los varones. Variables y atributos. Como hemos visto, los caracteres de un elemento pueden ser de muy diversos tipos, por lo que los podemos clasificar en: dos grandes clases: Variables Cuantitativas. Variables Cualitativas o Atributos. Las variables cuantitativas son las que se describen por medio de nmeros, como por ejemplo el peso, altura, edad, nmero de suspendidos A su vez este tipo de variables se puede dividir en dos subclases: Cuantitativas discretas. Aquellas a las que se les puede asociar un nmero entero, es decir, aquellas que por su naturaleza no admiten un fraccionamiento de la unidad, por ejemplo nmero de hermanos, pginas de un libro, etc. Cuantitativas continuas: Aquellas que no se pueden expresar mediante un nmero entero, es decir, aquellas que por su naturaleza admiten que entre dos valores cualesquiera la variable pueda tomar cualquier valor intermedio, por ejemplo peso, tiempo. etc. No obstante en muchos casos el tratamiento estadstico hace que a variables discretas las trabajemos como si fuesen continuas y viceversa.

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
Los atributos son aquellos caracteres que para su definicin precisan de palabras, es decir, no le podemos asignar un nmero. Por ejemplo sexo, profesin, estado civil, etc. A su vez las podemos clasificar en: Ordenables: Aquellas que sugieren una ordenacin, por ejemplo la graduacin militar, el nivel de estudios, etc. No ordenables: Aquellas que slo admiten una mera ordenacin alfabtica, pero no establece orden por su naturaleza, por ejemplo el color de pelo, sexo, estado civil, etc. Distintos Tipos de Frecuencia: Una de los primeros pasos que se realizan en cualquier estudio estadstico es la tabulacin de resultados, es decir, recoger la informacin de la muestra resumida en una tabla en la que a cada valor de la variable se le asocian determinados nmeros que representan el nmero de veces que ha aparecido, su proporcin con respecto a otros valores de la variable, etc. Estos nmeros se denominan frecuencias: As tenemos los siguientes tipos de frecuencia: Frecuencia absoluta: La frecuencia absoluta de una variable estadstica es el nmero de veces que aparece en la muestra dicho valor de la variable, la representaremos por ni Frecuencia relativa: La frecuencia absoluta, es una medida que est influida por el tamao de la muestra, al aumentar el tamao de la muestra aumentar tambin el tamao de la frecuencia absoluta. Esto hace que no sea una medida til para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamao de la muestra. La denotaremos por fi

Donde N = Tamao de la muestra Frecuencia Absoluta Acumulada: Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadstica ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el clculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el nmero de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por Ni. Frecuencia Relativa Acumulada: Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el tamao de la muestra, y la denotaremos por Fi

Porcentaje Acumulado: Anlogamente se define el Porcentaje Acumulado y lo vamos a denotar por Pi como la frecuencia relativa acumulada multiplicada por 100.

Ejemplo: Cuando se manejan conjuntos extensos de datos, el procedimiento preliminar ms adecuado consiste en distribuirlos en clases o categoras de acuerdo con el nmero de casos que pertenecen a cada una de dichas clases.

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
Por ejemplo, se quiere estudiar el puntaje que alcanzan los alumnos universitarios en la asignatura de Educacin Fsica. La escala de notas va del 0% al 100%, obtenindose la siguiente coleccin de valores: 75609589786282 93 78 83 85 76 - 68 - 90 - 71 - 82 - 75 - 76 - 73 59 75 62 75 94 73 72 88 87 77 67 88 74 69 97 88 76 73 - 62 - 74 - 97 - 78 - 75

- 95 - 65 - 81

60 - 79

63 -

Para facilitar el anlisis de los datos, stos se ordenan en forma creciente, es decir, de menor a mayor (tambin puede ordenarse en forma decreciente). El modo ms sencillo de agrupar los datos, es mediante una tabla de datos, que indique, para cada uno de los valores de la coleccin, el nmero de veces que aparece, es decir, su frecuencia de aparicin. Distribuciones de frecuencia Frecuencia absoluta (ni): corresponde al nmero de veces que se observa dicho valor, o en otras palabras al nmero de veces que se presenta un cierto dato. Para agrupar los datos por su frecuencia, se deben seguir los siguientes pasos: 1) Se ordenan los datos en orden creciente o decreciente. 2) Se cuenta la frecuencia absoluta de cada valor (cuntas veces se repite cada magnitud)

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
De acuerdo a los datos anteriores, se observa que el nmero menor es 59 y el nmero mayor es 97. Puntaje 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 Frecuencia total Frecuencia absoluta (ni) 1 2 0 3 1 0 1 0 1 1 1 0 1 1 3 2 5 3 1 3 1 0 1 2 1 0 1 0 1 3 1 1 0 0 1 1 2 0 2 (N) 48

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
La Tabla de distribucin de frecuencias hecha anteriormente sirve para facilitar el estudio de los valores estadsticos. El puntaje corresponde a la variable estadstica (primera columna) y las veces que se repite la variable (segunda columna), a la frecuencia absoluta. Frecuencia total (F): corresponde la suma de las frecuencias absolutas de cada uno de los valores de la variable. Una vez que se ha construido la Tabla de distribucin de frecuencias, sta debe ampliarse con otras tres columnas ms, que correspondern a la frecuencia absoluta acumulada, frecuencia relativa y frecuencia porcentual. Frecuencia absoluta Acumulada (Ni ): es la suma de las frecuencias absolutas de cada intervalo. La frecuencia acumulada hasta el ltimo intervalo es igual a la frecuencia total de toda la distribucin. Si se ampla la Tabla de distribucin del ejemplo, la frecuencia absoluta acumulada se obtiene sumando el nmero que est escrito en una lnea con el nmero de la lnea siguiente. Puntaje 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 Frecuencia absoluta (ni ) 1 2 0 3 1 0 1 0 1 1 1 0 1 1 3 2 5 3 1 3 1 0 1 2 1 0 1 0 1 3 1 1 0 Frecuencia absoluta acumulada (Ni) 1 3 3 6 7 7 8 8 9 10 11 11 12 13 16 18 23 26 27 30 31 31 32 34 35 35 36 36 37 40 41 42 42

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
92 93 94 95 96 97 Frecuencia total 0 1 1 2 0 2 (N) 48 42 43 44 46 46 48

La frecuencia absoluta acumulada sirve para responder, por ejemplo, la siguiente pregunta: Cuntos alumnos obtuvieron nota inferior a 80?; la respuesta es 31 alumnos.

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
Frecuencia relativa (fi): >corresponde a la razn (divisin) entre la frecuencia absoluta (ni) y el nmero total (N) de individuos de la poblacin.

Puntaje 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97

Frecuencia absoluta (ni ) 1 2 0 3 1 0 1 0 1 1 1 0 1 1 3 2 5 3 1 3 1 0 1 2 1 0 1 0 1 3 1 1 0 0 1 1 2 0 2

Frecuencia absoluta Frecuencia relativa acumulada (Ni) (fi ) 1 3 3 6 7 7 8 8 9 10 11 11 12 13 16 18 23 26 27 30 31 31 32 34 35 35 36 36 37 40 41 42 42 42 43 44 46 46 48 0,02083 (1 : 48) 0,0416 (2 : 48) 0 0,0625 0,02083 0 0,02083 0 0,02083 0,02083 0,02083 0 0,02083 0,02083 0,0625 0,0416 0,10416 0,0625 0,02083 0,0625 0,02083 0 0,02083 0,0416 0,02083 0 0,02083 0 0,02083 0,0625 0,02083 0,02083 0 0 0,02083 0,02083 0, 0416 0 0,0416

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
Frecuencia total (N) 48 1

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
La suma de las frecuencias relativas es 1 Frecuencia relativa porcentual: es la frecuencia relativa expresada en porcentajes (%) P
i

100

Puntaje 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97

(ni ) 1 2 0 3 1 0 1 0 1 1 1 0 1 1 3 2 5 3 1 3 1 0 1 2 1 0 1 0 1 3 1 1 0 0 1 1 2 0 2

(Ni) 1 3 3 6 7 7 8 8 9 10 11 11 12 13 16 18 23 26 27 30 31 31 32 34 35 35 36 36 37 40 41 42 42 42 43 44 46 46 48

(fi ) 0,02083 (1 : 48) 0,0416 (2 : 48) 0 0,0625 0,02083 0 0,02083 0 0,02083 0,02083 0,02083 0 0,02083 0,02083 0,0625 0,0416 0,10416 0,0625 0,02083 0,0625 0,02083 0 0,02083 0,0416 0,02083 0 0,02083 0 0,02083 0,0625 0,02083 0,02083 0 0 0,02083 0,02083 0, 0416 0 0,0416

% (Pi %) 2,083 4,16 0 6,25 2,083 0 2,083 0 2,083 2,083 2,083 0 2,083 2,083 6,25 4,16 10,416 6,25 2,083 6,25 2,083 0 2,083 4,16 2,083 0 2,083 0 2,083 6,25 2,083 2,083 0 0 2,083 2,083 4,16 0 4,16

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
Frecuencia total (N)48 1 100 %

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
En el ejemplo el rango de los datos es: Rango: 97 - 59 = 38 Rango: Corresponde a la diferencia (resta) entre el mayor y el menor de los datos

GRFICOS

En estadstica, un grfico bien construido, a la medida de los datos y del mensaje que se desea trasmitir, es ms rpido y ms fcil de interpretar que una gran cantidad de nmeros y variables. a) Grfico de barra: Es un grfico estadstico que est formado por varios rectngulos igualmente espaciados, del mismo ancho, cuyas bases estn colocadas sobre una misma lnea horizontal. A los rectngulos que forman el grfico de barras se les llama barras. En este tipo de grfico, es posible observar que las barras: 1.- Estn sobre el eje de las abscisas. 2.- Tienen el mismo ancho. 3.- Estn igualmente espaciadas. En el eje de las abscisas se representan los valores de una de las variables (eje x) y en el eje de las ordenadas se representa la otra variable (eje y).

Grfico de barras

Tabla temperatura por da b) Grfico lineal o de segmentos: Se usa especialmente para representar datos numricos de situaciones que ocurren en perodos sucesivos. Adems permite visualizar rpidamente una situacin determinada. En el ejemplo (a la derecha), los datos numricos corresponden a las temperaturas mximas registradas durante una semana del mes de octubre; estos datos son nmeros que se obtuvieron en forma sucesiva, da tras da.

En el grfico lineal de la izquierda se puede visualizar fcil y rpidamente que el da mircoles de esa semana se registr la temperatura ms alta, y tambin que el da jueves fue la ms baja.

Grfico lineal

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
c) grfico en un sistema de coordenadas: Est formado por un conjunto de puntos que se ubican en un sistema, el cual est formado por dos rectas que se cortan perpendicularmente. El eje horizontal se llama abscisa o eje de las x, y la lnea vertical se llama ordenada o eje de la y. Grfico de coordenadas o cartesiano

d) diagrama: Un elemento de la derecha se relaciona con uno de la izquierda. Grfico de flechas e) Grfico circular: Muestra las relaciones o proporciones de las partes con un todo. Este grfico es de utilidad cuando se pretende destacar un elemento importante. Un grfico circular siempre se compone de una serie de datos.

f) Grfico de puntos: El denominado grfico de puntos permite mostrar apropiadamente a pequeos conjuntos de datos y tiene la gran ventaja de ser fcilmente construido a mano. En este tipo de grfico, la abcisa (lnea horizontal) representa los valores de la variable estudiada y la ordenada (lnea vertical) la frecuencia de aparicin de un valor en el conjunto de datos estudiado. Comentario pedaggico. Para la construccin de un grfico de puntos, es necesario que el alumno conozca la representacin de puntos en una recta graduada. Por ejemplo, el siguiente grfico representa una alumna de cuarto medio cuya altura es 162 cm.

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________

Si hubiese que representar otra alumna con esta misma estatura, el grfico se vera de la siguiente forma:

Ahora, si se quisiera representar una muestra de la estatura de treinta alumnas de cuarto ao medio, el grfico quedara como sigue.

MEDIDAS ESTADSTICAS

Medidas de tendencia central: Media, Mediana, Moda Supngase que un determinado alumno obtiene 35 puntos en una prueba de matemtica. Este puntaje, por s mismo tiene muy poco significado a menos que podamos conocer el total de puntos que obtiene una persona promedio al participar en esa prueba, saber cul es la calificacin menor y mayor que se obtiene, y cun variadas son esas calificaciones.

En otras palabras, para que una calificacin tenga significado hay que contar con elementos de referencia generalmente relacionados con ciertos criterios estadsticos. Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar las calificaciones que se obtienen en una prueba.

El promedio de notas es muy importante.

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
Volviendo a nuestro ejemplo, digamos que la calificacin promedio en la prueba que hizo el alumno fue de 20 puntos. Con este dato podemos decir que la calificacin del alumno se ubica notablemente sobre el promedio. Pero si la calificacin promedio fue de 65 puntos, entonces la conclusin sera muy diferente, debido a que se ubicara muy por debajo del promedio de la clase. En resumen, el propsito de las medidas de tendencia central es: Mostrar en qu lugar se ubica la persona promedio o tpica del grupo. Sirve como un mtodo para comparar o interpretar cualquier puntaje en relacin con el puntaje central o tpico. Sirve como un mtodo para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones. Sirve como un mtodo para comparar los resultados medios obtenidos por dos o ms grupos.

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
Las medidas de tendencia central ms comunes son: La media aritmtica: comnmente conocida como media o promedio. Se representa por medio de una letra M o por una X con una lnea en la parte superior. La mediana: la cual es el puntaje que se ubica en el centro de una distribucin. Se representa como Md. La moda: que es el puntaje que se presenta con mayor frecuencia en una distribucin. Se representa Mo. De estas tres medidas de tendencia central, la media es reconocida como la mejor y ms til. Sin embargo, cuando en una distribucin se presentan casos cuyos puntajes son muy bajos o muy altos respecto al resto del grupo, es recomendable utilizar la mediana o la moda. (Porque dadas las caractersticas de la media, esta es afectada por los valores extremos). La media es considerada como la mejor medida de tendencia central, por las siguientes razones: La media, el mejor dato. utilizada. Las medias de dos o ms distribuciones pueden ser fcilmente promediadas mientras que las medianas y las modas de las distribuciones no se promedian. La media se utiliza en procesos y tcnicas estadsticas ms complejas mientras que la mediana y la moda en muy pocos casos. Cmo calcular, la media, la moda y la mediana Media aritmtica o promedio Los puntajes contribuyen de manera proporcional al hacer el cmputo de la media. Es la medida de tendencia central ms conocida y

Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. En palabras ms simples, corresponde a la suma de un conjunto de datos dividida por el nmero total de dichos datos.

Ejemplo 1: En matemticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3 n = 6 (nmero total de datos)

La media aritmtica de las notas de esa asignatura es 4,8. Este nmero representa el promedio. Ejemplo 2: Cuando se tienen muchos datos es ms conveniente agruparlos en una tabla de frecuencias y luego calcular la media aritmtica. El siguiente cuadro con las medidas de 63 varas de pino lo ilustra. Largo (en m) 5 6 7 8 Frecuencia absoluta 10 15 20 12 Largo por Frecuencia absoluta 5 6 7 8 . . . . 10 = 50 15 = 90 20 = 140 12 = 96

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
9 6 Frecuencia total = 63 9 . 430 6 = 54

Se debe recordar que la frecuencia absoluta indica cuntas veces se repite cada valor, por lo tanto, la tabla es una manera ms corta de anotar los datos (si la frecuencia absoluta es 10, significa que el valor a que corresponde se repite 10 veces).

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
Moda (Mo) Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o sea, cual se repite ms. Ejemplo 1: Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de nias de un Jardn Infantil. 5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3 La edad que ms se repite es 3, por lo tanto, la Moda es 3 (Mo = 3) Ejemplo 2: 20, 12, 14, 23, 78, 56, 96 En este conjunto de datos no existe ningn valor que se repita, por lo tanto, este conjunto de valores no tiene moda. Mediana (Med) Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a menor o lo contrario. Usted divide el total de casos (N) entre dos, y el valor resultante corresponde al nmero del caso que representa la mediana de la distribucin. Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual nmero de valores antes y despus de l en un conjunto de datos agrupados. Segn el nmero de valores que se tengan se pueden presentar dos casos: Si el nmero de valores es impar, la Mediana corresponder al valor central de dicho conjunto de datos. Si el nmero de valores es par, la Mediana corresponder al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2). Ejemplo 1: Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2 Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene: 1, 2, 4, 5, 8, 9, 10 El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares. Ejemplo 2: El siguiente conjunto de datos est ordenado en forma decreciente, de mayor a menor, y corresponde a un conjunto de valores pares, por lo tanto, la Med ser el promedio de los valores centrales. 21, 19, 18, 15, 13, 11, 10, 9, 5, 3

Ejemplo 3:

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
En el grfico de barras (que tiene un nmero par de columnas) los valores centrales son 72 y 77, por lo tanto, la

MEDIDAS DE POSICION RELATIVA: Llamados tambin CUANTILES, son aquellos valores de las variables que dividen una distribucin de frecuencias o serie de nmeros en 4, 10 100 partes iguales, tomando la denominacin de QUARTILES, DECILES PERCENTILES. Determinan la dispersin alrededor de la mediana. Se obtienen de la siguiente manera: a) Para datos no agrupados: A. Ordenar los datos de menor a mayor. B. Encontrar la posicin con: M pCj = jn + 2 = E + f M Donde M = nmero de partes en que se divide la distribucin

C. Calcular el valor con:

vCj = xE + fD

donde

D = (xE+1 - xE)

MEDIDA SIMBOLO POSICION -----------------------------------------------------------------------------CUANTILES C j M CUARTILES DECILES Q D 1, 2, 3 1, 2, 3,....8, 9 4 10

PERCENTILES P 1, 2, 3,...98, 99 100 -----------------------------------------------------------------------------

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________ CUANTILES a) Para datos no agrupados: A. Ordenar los datos de menor a mayor. B. Encontrar la posicin con: M pCj = jn + 2 M =E+f

Donde M = nmero de partes en que se divide la distribucin C. Calcular el valor con:

vCj = xE + fD
MEDIDA CUANTILES CUARTILES DECILES

donde

D = (xE+1 - xE)
POSICION j 1, 2, 3 1, 2, 3,....8, 9 PARTES M 4 10

SIMBOLO C Q D

---------------------------------------------------------------------------------------------------

PERCENTILES P 1, 2, 3,...98, 99 ------------------------------------------------------------------------------Ejemplo: n xi Cj ---------------------------1 19 17 2 17 18 3 24 19 4 21 19 5 39 21 6 31 24 7 19 24 8 24 26 9 26 31 10 18 39


--------------------------------------

238 pQ1 = 1(10) + 2 = 3 + (0)(19-19) = 19 4 pD7 = 7(10) + 5 = 7.5 0.5(26-24) = 25 10 pP46 = 46(10) + 50 = 5.1 0.1(24-21) = 21.3 100 vP46 = 21 + vD7 vQ1 = 19

24

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________ b) Para datos agrupados: A. Obtener Nh (nmero de datos acumulado) B. Determinar la posicin del cuantil clase que lo contiene), con: pCj = jNh M C. Calcular el valor del cuantil con: j (y marcar la

LCji + ICj (jN /M) - N vCj = ---------------------------h (Cj-1)

nCj
Donde: LCji = Lmite real inferior (por redondeo) de la clase que contiene el cuantil j ICj = Tamao del intervalo de la clase cuantil j N(Cj-1) = Nmero de datos acumulado hasta la clase anterior a la clase cuantil j NCj = Nmero de datos de la clase cuantil j. Ejemplo: Xh1 - xh2 nh xh nh.xh Nh -----------------------------------------------50 - 52 3 51 153 3 53 - 55 2 54 108 5 56 - 58 5 57 285 10 59 - 61 3 60 180 13 62 - 64 4 63 252 17 65 - 67 3 66 198 20 68 - 70 1 69 69 21 71 - 73 1 72 72 22 74 - 76 3 75 225 25
------------------------------------------------------------------------

pQ1 = 1(25) = 6.75 vQ1 = 58.5 + 3 [(6.75-5)/5] = 56.25 4 pD4 = 4(25) = 10 vD4 = 55.5 + 3[(10-5)/5] = 58.5
10

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________ b) Para datos agrupados: Se realizan los siguientes pasos: A. Obtener Nh (nmero de datos acumulado) B. Determinar la posicin del cuantil j (y marcar la clase que lo contiene), con: pCj = jNh M C. Calcular el valor del cuantil con:

vCj =

LCji + ICj

(jNh/M) - N(Cj-1) nCj

Donde: LCji = Lmite real inferior (por redondeo) de la clase que contiene el cuantil j ICj = Tamao del intervalo de la clase cuantil j N(Cj-1) = Nmero de datos acumulado hasta la clase anterior a la clase cuantil j NCj = Nmero de datos de la clase cuantil j. 2.3. MEDIDAS DE DISPERSION: Son aquellas que miden cunto se alejan de la media cada uno de los valores de la variable.

A.

VARIANZA: Es el promedio de la suma de las desviaciones al cuadrado con respecto a la media. Sirve para comparar dos o ms distribuciones. Se obtiene de la siguiente manera:
a) Para datos no agrupados: n i=1

(x i - x)2
n

S =

VARIANZA a) Para datos no agrupados: n i=1

(x i - x)2
n

S=

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________

Ejemplo: n xi xi - x (xi - x)2 -------------------------------------------------1 19 4.8 23.04 2 17 6.8 46.24 3 24 0.2 0.04 4 21 2.8 7.84 5 39 15.2 231.04 6 31 7.2 51.84 7 19 4.8 23.04 8 24 0.2 0.04 9 26 2.2 4.84 10 18 5.8 33.64
-----------------------------------------------------------

238

421.60

S2 = 421.60 = 42.16 10

b) Para datos agrupados:

I2 [N nh dh2 - ( nh dh)2]

S=
2

N2
Ejemplo:

Xh1 - xh2
50 53 56 59 62 65 68 71 74 52 55 58 61 64 67 70 73 76

nh
3 2 5 3 4 3 1 1 3 25

dh
-2 -1 0 1 2 3 4 5 6

nh.dh nh.dh2
-6 -2 -8/47 3 8 9 4 5 18 39 12 2 0 3 16 27 16 25 108 209

Nh
3 5 10 13 17 20 21 22 25

A cualquier clase se le ubica como cero, luego va en positivo hacia abajo y en negativo hacia arriba, esa es la columna dh S2 = 9 [25(209) - (39)2] 525

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________ b) Para datos agrupados:

S2 = I2 [N nh dh2 - ( nh dh)2]
N2

B.

DESVIACION STANDARD: Es igual a la raz


cuadrada de la varianza, tiene algunos principios que mencionamos: a) A mayor dispersin alrededor de la media, mayor valor de la desviacin standard. b) Las desviaciones extremas con respecto a la media, pesan mucho para determinar el valor de la desviacin standard.

c) Para distribuciones normales: El 68,97 % de las observaciones est en X 1 S El 95,45 % de las observaciones est en X 2 S El 99,73 % de las observaciones est en X 3 S C.

COEFICIENTE
CV = S x 100 X .

DE

VARIACIN:

Mide

la

homogeneidad de una muestra.

Se da en porcentaje, el resultado es la heterogeneidad de la poblacin; el resto de 100 % es la homogeneidad

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
EJERCITACION 1) Los siguientes datos numricos corresponden a la cantidad de veces que cada alumno de un grupo ha ido a un recital o concierto: 2 4 3 2 1 1 6 3 0 3 2 4 6 9 3 2 16 Calcula, sin tabular, Media, moda, mediana, desviacin, n, rango. 2) En un diagnostico de educacin fsica se pidi a los alumnos de los cuartos medios que hicieran abdominales durante 3 minutos. Se obtuvieron los siguientes resultados: 4 A: 45 38 43 29 34 60 54 27 32 33 23 34 34 28 56 62 56 57 45 47 48 54 33 45 44 41 34 36 34 54 4 B: 43 45 44 38 34 46 43 42 43 45 57 44 38 38 37 43 61 38 37 45 28 42 41 49 40 37 34 44 41 43 Cul de los dos cursos tiene el rendimiento ms parejo? Qu distribucin estadstico permite comparar la distribucin de este tipo de datos? 3) A continuacin se presentan los resultados de ambos cursos en la prueba de diagnstico de salto largo. 4 A : 3.2 3.5 4.9 5.0 3.1 4.1 2.9 2.8 3.8 4.5 4.3 4.5 4.1 5.8 3.9 3.6 4.2 4.6 1.9 2.8 2.9 3.3 3.9 4.2 4.1 4.3 4.6 4.4 3.8 3.6 4 B : 3.5 2.9 1.3 1.7 3.6 5.6 2.8 5.2 5.3 4.1 4.1 4.4 1.6 5.1 4.3 5.0 5.3 3.2 2.8 2.6 5.5 5.4 4.8 4.9 4.3 2.9 3.9 5.4 5.3 4.2 a) Calcula el promedio de ambos cursos. b) Construye una tabla de frecuencias para cada curso c) Cul de los dos cursos tuvo un rendimiento mas parejo? 4) Se han medido 75 alumnos, en centmetros, obtenindose los siguientes datos: 175 156 172 159 161 185 186 192 179 163 164 170 164 167 168 174 172 168 176 166 167 169 182 170 169 167 170 162 172 171 174 171 155 171 171 170 157 170 173 173 174 168 166 172 172 158 159 163 163 168 174 175 150 154 175 160 175 177 178 180 169 165 180 166 184 183 174 173 162 185 189 169 173 171 173 Agrupa estos resultados en 8 intervalos y confecciona una tabla de frecuencias y calcula las medidas de tendencia central y de dispersin. Adems, grafica esta tabla. 5) A los mismos alumnos anteriores se les aplico una prueba de inteligencia, estos han sido: 87 105 88 103 114 125 108 107 118 114 129 100 106 113 105 111 94 115 89 82 141 92 132 112 97 135 101 104 130 99 114 91 145 95 101 115 104 87 108 115 103 132 110 113 102 109 124 98 140 107 93 108 122 117 114 141 116 108 102 101 118 138 99 105 112 94 96 132 118 123 108 131 127 100 91 Agrupa los datos en intervalos de amplitud 8. y haz lo mismo que en problema anterior. Los sueldos de cinco empleados de una empresa son: $ 400000, $500000, $450000, $600000 y $3500000. Calcula el sueldo medio, la moda, si es que existe, y la mediana e indica cul representa mejor a los datos. El entrenador de un equipo de natacin debe elegir a uno de sus integrantes para la prxima competencia de estilo libre. Segn los tiempos en segundos que obtuvieron los postulantes de las cinco ltimas carreras de 100 m de estilo libre, qu nadador le conviene elegir? Diego 61,7 61,7 62,3 62,9 63,1 Toms 61,5 62,9 62,9 63,7 63,7 Sergio 60,7 62,4 62,7 62,7 63,2

Colegio Alberto Blest Gana Jvenes emprendedores para el siglo XXI Coordinacin Acadmica

______________________________________________________________________
Para poder decidir, calcula las medidas de posicin de cada uno.

Diego Toms Sergio

promedio 62,34

moda 61,7

mediana 62,3

En promedio, los nadadores ms rpidos son ................................ y ................................., pero esto no significa que hayan tenido el mismo rendimiento; por eso necesitamos las otras medidas de posicin: de ellos dos, tanto la moda como la mediana indican que ................................ fue ms veloz. Sin embargo, para elegir el nadador adecuado, no basta con considerar las medidas de posicin, ya que tambin es necesario que su rendimiento sea parejo, es decir, que los tiempos de sus 100 m libres no tengan mucha dispersin. Diego y Sergio, dos de los nadadores del ejercicio anterior, obtuvieron el mismo promedio y sin embargo sus tiempos estn distribuidos de manera diferente. Calcula los desvos estndares de los tiempos de los nadadores: Tiempos de Diego xi 61,7 61,7 62,3 62,9 63,1 total
Diego =

Tiempos de Sergio (xi x)2 xi (xi x) (xi x)2

(xi x) -0,64 -0,64 -0,04 0,56 0,76

total

Sergio =

Entonces: Podemos ver que el desvo estndar de ................................... es menor que el de ................................., lo cual indica que el promedio representa mejor los datos de ................................., porque sus tiempos fueron menos dispersos. Entonces, aunque cinco datos son muy pocos para hacer estadstica, si con esa informacin hay que elegir un nadador de ese equipo para la prxima competencia, conviene que sea ....................................... Confecciona una tabla de intervalos de clase. Las edades de veinte chicos son 12, 13, 14, 10, 11, 12, 11, 13, 14, 12, 10, 12, 11, 13, 12, 11, 13, 12, 10 y15. Organiza los datos en una tabla de frecuencias. Qu porcentaje de chicos tienen 12 aos? Cuntos chicos tienen menos de 14 aos? En cada da del mes de enero, en el camping Igl hubo la siguiente cantidad de turistas: 12, 14, 17, 16, 19, 15, 15, 21, 24, 26, 28, 24, 25, 26, 20, 21, 34, 35, 33, 32, 34, 38, 40, 43, 41, 45, 50, 53, 58. Construye una tabla de frecuencias para estos datos.

S-ar putea să vă placă și