Sunteți pe pagina 1din 118

REPBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER POPULAR PARA EDUCACIN SUPERIOR UNIVERSIDAD BOLIVARIANA DE VENEZUELA CENTRO DE ESTUDIOS

EN CIENCIAS DE LA ENERGA PROGRAMAS DE FORMACIN DE GRADO HIDROCARBUROS

ANLISIS DEL DATO ESTADSTICO


GUA DIDCTICA
Por los profesores Deivis Cardoza Emilio Silva Jos Silva Julio Csar Falcn Melsi Goitte Ramn Roberto Herrera C.

CARACAS-VENEZUELA

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

NDICE

Presentacin Unidad I Unidad II Unidad III Unidad IV Unidad V Bibliografa La Estadstica: Herramienta fundamental en diversos escenarios de aplicacin Organizacin de los Datos Representacin de los Datos Medidas de Posicin, de Tendencia Central y de Dispersin Introduccin a la Probabilidad, Muestreo y Estimacin

3 7 24 45 67 107 117

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

ANLISIS DEL DATO ESTADSTICO GUA DIDCTICA PRESENTACIN La Gua Didctica de "ANLISIS DEL DATO ESTADSTICO esta diseada con la finalidad de que los estudiantes alcancen competencias en el uso de las herramientas estadsticas relacionadas con el PFG de inters. La Estadstica es una herramienta fundamental para la formulacin, ejecucin y seguimiento de cualquier proyecto socio-comunitario, tcnico y/o de investigacin. El egresado de la UBV tiene que manejar con soltura un leguaje estadstico revestido con una gran sencillez y comprensibilidad, que permita una fluida comunicacin dentro de un grupo de trabajo interdisciplinario, y que al mismo tiempo pueda apoyar la resolucin de una gran cantidad de situaciones que requieran el estudio de un conjunto de datos para su mejor compresin y aporte de soluciones. Por tanto, no se est buscando de que el egresado de la UBV se convierta en un experto especialista en Estadstica, sino ms buen que desde su disciplina profesional pueda hacer un adecuado uso de aquella especialidad matemtica para su propia rea de trabajo individual y colectivo. Esta Gua Didctica expone de manera sencilla, sustancial y consistente los principales mtodos de la Estadstica y sus relaciones. La sencillez de esta Gua no disminuye su validez didctica, apta para todo aquel que se inicia en el estudio de la Estadstica Descriptiva e Inferencial. Esta herramienta es indispensable para los proyectos socio-comunitarios, tcnicos y de investigacin que aspiren a tener base cuantitativa, pues un proyecto sin datos estadsticos presenta una gran debilidad. Esta gua bsica ha sido diseada de maneja de suministrar una herramienta de gran utilidad, la cual, apoyada en la antropogoga como estrategia didctica, impulsar el trabajo autnomo, creativo, responsable y participativo de los estudiantes en la ejecucin eficaz de las tareas propias de Proyecto I y Proyecto II. La estructura de la Gua consta de cinco Unidades divididas en Temas. Unidad I Unidad II Unidad III Unidad IV La Estadstica: Herramienta escenarios de aplicacin Organizacin de los Datos Representacin de los Datos Medidas de Posicin, de Tendencia Central y de Dispersin
3

fundamental

en

diversos

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

Unidad V

Introduccin a la Probabilidad, Muestreo y Estimacin

En estas Unidades se presentan los contenidos y las correspondientes actividades didcticas que se realizan en el lapso acadmico estimado para esta Unidad Curricular. Estructura de la Unidad Cada Unidad est compuesta de cuatro partes: 1) Objetivo. 2) Competencia a lograr. 3) Contenido. 4) Actividades. Se presentan como estrategias de aprendizaje/evaluacin para ser realizadas por los estudiantes bajo la gua y supervisin del profesor-facilitador. Son de varios tipos: 4.1) Individuales: Incluyen resmenes, ensayos, informes y exposiciones que debern ser realizados en forma individual por el alumno. 4.2) Grupales o Cooperativos: Incluyen investigaciones, debates y otros trabajos y experiencias realizadas en equipo por los estudiantes. 4.3) Comunitarias: Actividades centradas en la interaccin socio comunitario y el trabajo participativo. Sugerencias para uso de la Gua Para los profesores: La Gua constituye una orientacin para apoyar la actividad, debe ser utilizada en forma secuencial y flexible. El profesorfacilitador debe orientar y adaptar esta propuesta al grupo de estudiantes que tiene a su cargo, de manera que podr cambiar, agregar, combinar o eliminar contenidos. El profesor actuar como compaero facilitador del aprendizaje (es un estudiante ms de la seccin pero con Ttulo Universitario), aclarando conceptos y explicando los ejercicios (actividades) que se les propongan y no entiendan. En todo momento el profesor debe hacer uso constante, en forma amena y sencilla, de ejemplos propios de la vida cotidiana individual y colectiva del estudiante en su mbito acadmico, tcnico y social, pues de esa manera se podr facilitar el proceso educativo y dialgico de enseanza-aprendizaje de las ideas y planteamientos matemticos de la Estadstica, y as se podr percibir y valorar objetivamente la utilidad prctica de esta disciplina, y a su vez se contrarrestar la tendencia equivocada, negativa y prejuiciada de considerarla como algo muy difcil y aburrido y de escaso provecho y nula importancia.
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

El profesorfacilitador llevar el registro de la evolucin del proceso de aprendizaje, as como la metodologa de evaluacin de cada uno de los estudiantes, con quienes se reunir para validar el desarrollo de sus actividades y aprendizaje. La actividad a ejecutar por el profesorfacilitador en cada seccin de facilitacin del proceso de aprendizaje constar de dos partes. 1) Validar la ejecucin de las actividades por parte de cada grupo y al mismo tiempo evaluar la evolucin del proceso de aprendizaje individual, para lo cual llevar un registro. 2) Presentar la nueva propuesta de actividad, respondiendo las preguntas que se presenten u ofreciendo algunas ideas del material mediante el uso de diversas metodologas pedaggicas, como por ejemplo mapas conceptuales, Aprendizaje por Proyecto, Tablas de resumen acerca de la teora presentada a consideracin, entre otros. Se sugiere usar metodologas pertinentes con respecto a los lineamientos institucionales de la UBV en materia de evaluacin. Para los estudiantes El estudiante debe comprometerse con su proceso de aprendizaje, leyendo cuidadosamente la gua consultando los textos de estadstica a su alcance y cumpliendo con las actividades asignadas. Debe acudir a los encuentros programados con el profesor para comentar, indagar, ampliar lo conocimientos que ha adquirido por si mismo; y para encontrar orientacin acerca de temas relacionados, problemas estadsticos y otros relacionados que puedan surgir. Los estudiantes se agruparn en equipos de trabajo para realizar las actividades asignadas. De esa manera, cada alumno podr elaborar con mayor facilidad su portafolio de aprendizaje, en el se reunirn todos los aportes y resultados de las actividades grupales e individuales. El desarrollo del portafolio de aprendizaje queda a libre decisin de los integrantes del curso, y tiene varias finalidades: Sirve como insumo para la evaluacin. Sirve como registro de la actividad creadora de los estudiantes para ser recopilado como testimonio de produccin de saber en la UBV. Podr presentado en eventos cientficos y exposiciones de inters. Al final de cada Unidad se propone realizar una prueba diagnstica a fin de validar el avance del proceso de aprendizaje o logro de las competencias esperadas. Independientemente de los mecanismos de evaluacin a
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

implementarse, estos deben tener carcter formativo para que, ms all de obtener cualquier nota o resultado cuantitativo, el verdadero objetivo sea alcanzar resultados cualitativos que reflejen el aprendizaje de los conocimientos de la Unidad Curricular. Como propuesta organizativa para las actividades asignadas, los equipos de trabajo contarn como mximo con el 20% del total de estudiantes de la seccin. Dentro del equipo de trabajo se nombrar un coordinador quien ejercer dicha funcin (asignndole a cada uno su aporte en la ejecucin de la actividad) y apoyar positivamente la discusin y ejecucin de las actividades a realizar en cada Unidad. Con el fin de que el lector pueda aportar ideas y sugerencias para enriquecer y mejorar la Gua Didctica, ponemos a su disposicin los siguientes correos electrnicos: mgoitte@yahoo.com, jsilva_ve@yahoo.com y silvachapellin@yahoo.es. Esperamos que esta Gua sea realmente til para todos ustedes, que disfruten de la aventura de aprender haciendo, y que sirva de apoyo y estmulo para el desarrollo profesional y la creacin de su propio conocimiento individual y colectivo.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

UNIDAD I: LA ESTADSTICA: Herramienta fundamental en diversos escenarios de aplicacin. OBJETIVO: El estudiante comprende la importancia de la Estadstica, sus conceptos bsicos y aplicaciones. COMPETENCIAS A LOGRAR: 1) 2) 3) 4) 5) Definir y analizar la Estadstica. Citar algunas aplicaciones de la Estadstica en la vida real. Definir y diferenciar poblacin y muestra. Mencionar y definir las diferentes ramas de la Estadstica. Explicar el objetivo, las ventajas y la necesidad de las muestras. 6) Definir los conceptos de dato y variable, y reconocer la diferencia entre una variable discreta y una continua y la escala o nivel de medicin de un grupo de datos. 7) Comprender la importancia de obtener buenos datos y los mtodos para su obtencin. 8) Comprender cada uno de los procesos que involucra una investigacin estadstica. 9) Definir la fuente y la tcnica de muestreo a emplear en la recoleccin de datos. 10) Disear el instrumento para la recoleccin de datos. CONTENIDO:

TEMA 1
1.1 Qu es la Estadstica?

Es un conjunto de mtodos y tcnicas a usarse para recolectar, clasificar, organizar, presentar, analizar, explicar, simular, controlar y evaluar hechos sujetos a un estudio numrico como base para la descripcin, explicacin y comparacin de un fenmeno (al cual estn asociado tales hechos) que afecta a grupos de naturaleza diversa, teniendo ese estudio el fin de generar conocimientos de los mismos, y ayudar a tomar mejores decisiones sobre dicho fenmeno adems de predecirlo a futuro. O sea, la Estadstica es el estudio de la incertidumbre y capacita para enfrentar el azar. 1.1.1 Qu significa Estadstica? En nuestro lenguaje cotidiano, Estadstica se refiere a informacin numrica que puede presentarse tanto en forma grafica como en tablas, haciendo ms fcil y prctica la transmisin de esa informacin.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

Ejemplos: El nmero de nios que viven en una determinada parroquia de Caracas. El porcentaje de graduados de las universidades pblicas del pas. La cantidad de estudiantes de la UBV por cada Programa de Formacin de Grado y por cada sede a nivel nacional. El salario promedio de los habitantes de la parroquia La Vega. El nmero de decesos anuales debidos al alcoholismo. El nmero de goles anotados por la vino tinto. 1.1.2 Por qu y para qu se estudia la Estadstica? Hay tres razones para estudiar Estadstica: 1) Hay datos en todas partes. 2) Las tcnicas estadsticas se usan para tomar decisiones que afectan nuestro bienestar. 3) No importa cual sea la lnea de trabajo, se tomarn decisiones que involucren datos. La Estadstica se ocupa de la caracterizacin y aplicacin de tcnicas para: 1) Disear una investigacin, bien sea un experimento comparativo, una encuesta por muestreo, un estudio observacional, o de construccin de un modelo. 2) Resumir los datos de la investigacin. 3) Inferir sobre grupos numerosos en estudio, a partir de los datos de la investigacin. 1.1.3 Cul es la utilidad de la Estadstica? El verdadero alcance de la Estadstica no puede circunscribirse a las formulaciones abstractas numrico-algebraicas propias de su concepcin tcnicometodolgica. La Estadstica es algo ms que nmeros, cuentas y frmulas de apariencia complicada, extraa o poco comn. Esos tres elementos tienen su origen en situaciones cotidianas de la vida real que el ser humano debe resolver de diversas maneras, y las soluciones y decisiones a tomar pueden ser o no ser de orden cuantitativo. Si son de ese orden, quien estudie y use la Estadstica debe contextualizarla en su justa dimensin, y asimilarla e interpretarla en funcin de revelar el carcter terico-prctico y abstracto-concreto de la vinculacin entre conocimiento y realidad. Luego, la Estadstica: Es una herramienta que ayuda a interpretar los datos generando informacin y conocimiento de la realidad.
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

Ayuda a obtener la informacin indispensable en la planificacin de las soluciones necesarias que las comunidades requieren en diversos otros escenarios. Permite procesar informacin que sirve de base a la ejecucin de cualquier proyecto.

Partiendo de las anteriores consideraciones, dejara de tener sentido cualquier tendencia a descontextualizar la Estadstica en particular, y la Matemticas en general, como un compendio de conocimientos misteriosos y de escasa o nula utilidad real. 1.1.4 Ciencias y fenmenos que requieren del uso de la Estadstica En vista de la utilidad de la Estadstica en diversas reas, las ciencias que la necesitan se clasifican en: Las que obligatoriamente la requieren, lo cual implica que muchas veces se confundan con esta, como es el caso de la Demografa. Las que la usan para estudiar fenmenos cualitativos y cuantitativos, como la Biologa, la Economa, la Educacin, la Sociologa, entre otros. Las que deben obtener sus resultados con la mxima exactitud posible, como la Astronoma, la Fsica y la Meteorologa. Cada una de estas ciencias se aboca a estudiar fenmenos que por sus caractersticas particulares requieren de diferentes tratamientos al aplicarles los mtodos estadsticos. Partiendo de este criterio, tales fenmenos podemos clasificarlos en: Los que no pueden estudiarse por simple observacin porque es muy grande la cantidad de objetos o casos a considerar en esos fenmenos, el tiempo en que estos ocurren es muy distante, o se presentan con diferentes intensidades o frecuencias. Los que deben estudiarse desde el punto de vista cualitativo y cuantitativo, como las investigaciones socio-econmicas. Los que al estudiarse cuantitativamente reproducen errores que necesitan de la Estadstica para corregirlos o eliminarlos.

1.2

Poblacin y Parmetro

Poblacin es el conjunto total de elementos, cantidades, individuos u objetos a los que se le consideran en estudio una o varias caractersticas comunes. Ejemplo: Los pacientes de los hospitales pblicos del pas, el nmeros de participantes en los consejos comunales del pas, el nmero de tcnicos e

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

ingenieros en una planta de refinacin y petroqumica del occidente del pas, entre otros ejemplos. Parmetro es una medida numrica obtenida por el manejo y procesamiento de los datos de la poblacin descrita por dicha medida, representndose esta con letras griegas minsculas. Medida Media Desviacin Estndar Varianza 1.3 Smbolo del Parmetro 2

Muestra y Estadstico, Estadgrafo o Estimador Muestra es un subconjunto o parte de la poblacin.

Ejemplo: De la poblacin anterior, los pacientes del hospital de los Magallanes de Catia, Los participantes del comit de energa de consejo comunal de la Parroquia San pedro, Los tcnicos e ingenieros de la planta de Refinacin y petroqumica de Morn. Estadstico, Estadgrafo o Estimador es una medida numrica obtenida por el manejo y procesamiento de los datos de la muestra descrita por dicha medida, representndose esta con letras latinas, generalmente minsculas. Medida Media Desviacin Estndar Varianza 1.4 Tipos de Estadstica Smbolo del Estadstico
X

S S2

1.4.1 Estadstica Descriptiva o Deductiva (o Anlisis Estadstico) Consiste en procedimientos usados para tratar y organizar los datos de una muestra en estudio con el fin de sistematizarlos, reducirlos, condensarlos y presentarlos mediante cuadros, grficas y tablas, procedimientos que permiten describir y analizar, por medio de ciertas medidas, las caractersticas esenciales de la muestra en cuestin sin que sobrepasen los conocimientos que proporcionan los datos. Ejemplo: De acuerdo a los datos suministrados por el Instituto Nacional de Estadstica (I.N.E.)
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

10

Cuadro 1: Hogares y personas en situacin de pobreza Primer Semestre 2.004 Categora Cantidad Porcentaje No Pobres 9.610.104 39,85% Pobres 7.727.355 32,05% Pobres Extremos 6.776.393 28,10% Poblacin Total 24.113.852 100% 1.4.2 Estadstica Inferencial o Inductiva (o Inferencia Estadstica) Es un conjunto de tcnicas que se utilizan para una poblacin con el propsito de seleccionar una muestra representativa de esta y obtenerle estimaciones, generalizaciones e inducciones vlidas mediante el procesamiento de los datos de esa muestra, siendo que el alcance de los conocimientos aportados por esos datos es sobrepasado por las estimaciones antes referidas. Ejemplo: La cooperativa de enlatados de Ro Caribe pidi a una muestra de 1.960 consumidores probar una variedad de atn enlatado con organo llamado Delicias de Sucre. De los 1.960 encuestado 1.176 dijeron que compraran el atn si lo ponan en venta. Que informacin obtuvo la cooperativa de enlatados de Ro Caribe acerca de la aceptacin del atn con organo por parte de la poblacin? Es ste un ejemplo de Estadstica Descriptiva o Estadstica Inferencial? Tome este ejemplo, responda las preguntas y agrguelo a su portafolio. 1.5 Consideraciones acerca de la Poblacin y la Muestra

Para estudiar las caractersticas de los elementos que integran una poblacin o de algn fenmeno que la afecte, se puede ejecutar un censo o escoger una muestra. En el caso del censo, tenemos que investigar todos y cada uno de los elementos de la poblacin. En el caso de una muestra, investigamos solo un conjunto parcial de los elementos que integran una poblacin, analizamos sus caractersticas particulares, y en base a los resultados deducimos las leyes que rigen a la muestra o al fenmeno (a travs de las Probabilidades) e inferimos sobre las caractersticas de la poblacin total para hacer previsiones sobre los mismos, tomamos decisiones u obtenemos conclusiones. Una muestra debe ser representativa de la poblacin de la que ha sido extrada, y todos sus elementos deben contener caractersticas en la misma proporcin en que se hallan para la poblacin total. Para realizar un censo se requiere de gran cantidad de personas entrenadas, planificacin, presupuesto y suficiente tiempo antes y despus del levantamiento. De all que gran nmero de veces, en lugar de realizarse un
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

11

censo, se investiga una poblacin en base a muestras, y mediante la Inferencia Estadstica se determinan las caractersticas de la poblacin total. Es importante diferenciar en el estudio estadstico que se realiza si los datos provienen de una poblacin o de una muestra. Si disponemos de los datos de las caractersticas de todos los individuos que componen una poblacin, podemos analizarlos mediante los mtodos que provee la Estadstica Descriptiva, reduciendo los datos a tablas o distribuciones, y simplificar stas obteniendo algunas medidas que las representan (estadsticos). Si los datos provienen de un conjunto parcial de la poblacin (muestra), tambin usaremos la Estadstica Descriptiva para analizarlos y obtener algunas medidas (estadsticos) que nos describan las caractersticas de los datos de la muestra, pero para conocer de manera muy aproximada las caractersticas de la poblacin (parmetros) es necesario recurrir a la Estadstica Inferencial. En conclusin, un objetivo tpico en Estadstica es describir la poblacin con base en informacin obtenida mediante la observacin de relativamente pocos elementos individuales. Para dar as una solucin estadstica a un problema, se desarrolla una secuencia de pasos: 1) La situacin bajo investigacin se define cuidadosa y completamente. 2) Se recolecta una muestra de la poblacin siguiendo un procedimiento establecido e idneo. 3) Los datos de la muestra se convierten en informacin til (la cual, dada en forma numrica o grfica, se denomina Estadsticas de la Muestra). 4) Se aplican las teoras de inferencia estadstica a la informacin de la muestra para obtener conclusiones sobre la poblacin muestreada (estas conclusiones o respuestas se denominan inferencias). Estos pasos se indican en la siguiente figura.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

12

1.6

Datos y Variables

1.6.1 Definiciones Dato Estadstico es una cantidad o categora susceptible de ser observable y medible en una poblacin o muestra. En general se le denomina simplemente como Dato. Por otra parte, Variable Estadstica es una caracterstica o propiedad que vara de acuerdo con alguna escala o dimensin al asumir diferentes valores (cantidades o categoras) por parte de los componentes de una poblacin o muestra. Generalmente se le denomina solamente como Variable. Las variables asumen los datos como valores. Una variable est asociada a una coleccin de datos, y recprocamente ocurre lo mismo. Si un valor no aparece en algn componente o elementos de la poblacin o muestra, entonces ese valor no es un dato y s lo es en caso contrario. 1.6.2 Para qu necesitamos recolectar datos? Mide el desempeo de un servicio o proceso de produccin en curso que realizan las distintas comunidades. Ayuda en el proceso de toma de decisiones cuando se estudia un determinado evento. Facilita la administracin de recursos de diversa ndole a ser empleados en la concrecin y/o ejecucin de las decisiones. 1.7 Tipos de variables Variables
Discretas: son respuestas Cualitativas o Categricas: Cuantitativa o Numrica: numricas surgidas del son aquellas caractersticas o de conteo.son aquellas caractersticas proceso Asume 2007: Aovariables de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, de impulso que Geometra del poder y Explosin del poder e nocantidades especficasvariables que son son o popular. numricas, es decir, La revolucin, en esencia, es educacin. denotan cantidades, es decir, interrumpidas en su Ejemplos: modalidad, cualidad, es decir,producen respuestas extensin, nmeros -.Estado civil categora -.Gnero o atributo. enteros o exactos. numricas.

13

Continuas: son respuestas numricas surgidas del proceso de medicin. Asume cantidades decimales e ininterrumpidas en su extensin, es decir, cualquier nmero entre dos dados. Ejemplos: -.Numero de hijos por familia -.Nmero de empleado por empresa -.Nmero de televisores vendidos en el ao -.Produccin de crudo y gas por aos. Ejemplos: -.Peso de los alumnos -.Kilmetros recorridos -.Estatura. -.Litros de gasolina en una estacin

Explicando de otra forma la clasificacin de las variables cuantitativas, decimos que para una variable discreta se dan de modo inherente separaciones entre valores observables sucesivos, o sea, una variable discreta es aquella tal que entre 2 valores cualesquiera observables (potencialmente), hay por lo menos un valor no observable (potencialmente). En cambio, una variable continua tiene la propiedad de que entre 2 valores cualesquiera observables (potencialmente), hay otro valor observable (potencialmente), es decir, una variable continua puede tomar todos los valores a lo largo de un intervalo. Una variable continua siempre se registra en forma discreta, y entre valores registrables adyacentes la magnitud de la distancia queda determinada por la precisin de la medicin, pero a diferencia de una variable discreta, nunca se puede medir exactamente a la variable continua, con la cual debe haber inevitablemente un error de medida. Las variables se representan con letras maysculas del alfabeto latino, y los datos se representan con el mismo tipo de letra de las correspondientes variables con las que estn vinculadas, pero colocndoseles subndices para diferenciarlas. Por otra parte, los datos se pueden clasificar con las mismas denominaciones que tengan las respectivas variables a la que estn asociadas. Por tanto, podemos
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

14

hablar de datos cualitativos y cuantitativos, y entre estos, existen datos discretos y continuos. Si la variable es cualitativa, cada categora asumida por est se halla asociada a un grupo de datos.

TEMA 2
1.8 Escalas o Niveles de Medicin de los Datos

La medicin es la asignacin de valores numricos a atributos, categoras, elementos, sucesos u otros valores segn ciertas escalas o reglas. La medicin corresponde a las caractersticas o propiedades propias de los objetos en estudio y no de los objetos en s mismos. Si se mide cierta propiedad de dos objetos, los resultados pueden ser diferentes. No importan lo prximas que sean dos mediciones de un mismo objeto en dos instantes distintos, aquellas pueden dar resultados diferentes. Tal variacin, que ocurre de modo natural, ha dado motivo para que las caractersticas o propiedades que se miden sean denominadas como variables. El problema de la variacin se complica al reconocer que esta tambin ocurre en quienes miden y en los instrumentos que se usan para medir. Un proceso de medicin que sea confiable proporciona datos con poca variacin y mayor exactitud respecto al objeto a medirse. Si el proceso es vlido entonces mide lo que se desea medir, por lo que sera deseable disponer de un proceso de medicin vlido y confiable. Se requiere prestar atencin a la variacin y a como esta puede afectar la calidad de los datos. Por tal motivo se han propuesto criterios de validez y confiabilidad referentes a aspectos que conviene tener en cuenta para evaluar la calidad de los datos. Uno de esos criterios a considerar es la Escala o Nivel de Medicin de Datos, que se define como un sistema de valores y condiciones relacionales que asigna un grado o valor a una variable en base a los sujetos u objetos sometidos a medicin. La tcnica estadstica a emplearse en el anlisis de los datos obtenidos depende del uso de una de las cuatro escalas de medicin que se dan a continuacin. 1.8.1 Escala de Medicin Nominal o Clasificatoria Es una escala adoptada por variables cualitativas, la cual consiste en la clasificacin en dos o ms categoras, que no tienen vinculacin entre s y se les asignan nombres o smbolos. Si el smbolo es numrico, este sustituye a las palabras. Cualquiera que sea el smbolo, no se le aplican operaciones matemticas (suma, resta, multiplicacin y divisin), y slo se cuantifica la frecuencia o el nmero de casos asociados a una categora.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

15

Ejemplos: Gnero (hombre, mujer), nmero de estudiantes con credencial que entran a juego de ftbol y que sean mujeres, nmero de revistas deportivas. 1.8.2 Escala de Medicin Ordinal o de Rango Escala en la que se establece un orden jerrquico entre datos o categoras de variables cualitativas. En esta escala no se indica la magnitud de la diferencia entre categoras, ni se aplican operaciones matemticas bsicas a los nombres o smbolos que las representan. Al igual que en el nivel ordinal, nicamente se cuantifican frecuencias en cada categora.

Ejemplo: El escalafn militar, o la siguiente lista de las calificaciones que los alumnos dieron a un profesor de la UBV en el curso de PIUNI. Calificacin Superior Bueno Aceptable Pobre Inferior 1.8.3 Escala de Medicin de Intervalo Escala en la que se establece distancias o intervalos iguales entre valores numricos. Esta escala se utiliza para variables cuantitativas, y en la misma no existe un cero absoluto o verdadero, es decir, este se fija arbitrariamente en forma relativa, y no representa la ausencia de la caracterstica en estudio. Tiene la propiedad de orden de la Escala de Medicin Ordinal, y adems la distancia entre las medidas tiene significado. En esta escala s es posible realizar diferentes operaciones matemticas. Ejemplos: El tiempo calendario, como el Calendario Gregoriano o el Musulmn. Por otra parte, la temperatura en Grados Centgrados no posee un cero absoluto, ya que 0 no implica ausencia de temperatura, y esa medicin representa otro valor de la temperatura cuando se mide en Grados Fahrenheit, Kelvin o Raumur. 1.8.4 Escala de Medicin de Razn o de Proporcin
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

Frecuencia 6 28 25 12 3

16

Es la escala ms alta. Tiene todas las caractersticas de la escala de intervalo, y adems el valor cero tiene significado y representa la ausencia de la caracterstica estudiada, y la distancia y relacin proporcional entre dos nmeros tiene sentido. Ejemplos: El peso de las personas, la densidad de un objeto, el salario diario de los miembros de la comunidad, la altura de las personas.

El siguiente cuadro resume las escalas aqu referidas. Modo de Medir Asignacin de nombres y Nominal o smbolos (pudiendo ser Clasificatoria numricos) Asignacin de nombres y Ordinal o de smbolos (pudiendo ser Rango numricos) Asignacin de smbolos numricos comparndolos con De Intervalo una unidad de medicin, y se fija el cero relativo inicial Asignacin de smbolos De Razn o de numricos comparndolos con Proporcin una unidad de medicin, y se fija el cero absoluto inicial 1.9 Fuentes de los datos Tipo de Escala Usos admisibles Clasificar Clasificar y ordenar Clasificar, ordenar y obtener diferencias de mediciones Clasificar, ordenar y obtener diferencias y proporciones de mediciones

Son los sujetos u objetos que generan o contiene la informacin a usarse en una investigacin estadstica. Por ejemplo, los datos publicados por fuente gubernamentales, o los dados en la aplicacin de una encuesta o un experimento, o los obtenidos por la realizacin de un estudio u observacin directa.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

17

Los datos necesarios para la investigacin estadstica pueden hallarse a travs de diferentes fuentes, que son primarias si los datos suministrados por una persona o una institucin fueron obtenidos directamente por estos, y si no lo obtuvieron tenemos fuentes secundarias. La fuente primaria ms notable es la que publica la informacin de los Censos Nacionales. En la prctica es aconsejable utilizar fuentes primarias. Sin embargo, si por la naturaleza del fenmeno y de los recursos disponibles no es posible usar esas fuentes, es aconsejable emplear las secundarias siempre y cuando los datos facilitados se hayan obtenido de manera tcnicamente rigurosa. Las dependencias gubernamentales que suministran los datos son fuentes oficiales, y si se obtienen por personas, agencias u organizaciones no gubernamentales, estos se denominan fuentes privadas. 1.10 Tcnicas e Instrumentos de Recoleccin de Datos 1.10.1 Relacin entre Tcnica e Instrumento Tcnica: Se entiende como Tcnica el procedimiento o forma particular de obtener datos o informacin. La aplicacin de una tcnica conduce a la obtencin de informacin, la cual debe ser resguardada mediante un instrumento de recoleccin de datos. Instrumento de Recoleccin de Datos: Es un dispositivo o formato (en papel o digital), que se utiliza para contener, registrar o almacenar informacin. Son ejemplos de instrumentos: Un cuestionario en cuya estructura queda registradas las respuestas suministradas por el encuestado (formulario para rellenar). Una libreta en la que el investigador anota lo observado. Computadora porttil con sus respectivos medios de almacenaje. INSTRUMENTOS TECNICAS Dispositivos como cmara fotogrfica, video-filmadora, grabador de audio, DISEO Fichas. Anlisis entre otros.DE Documental Computadoras.
INVESTIGACION DOCUMENTAL
Cuadro de Registro y clasificacin contenido Diagrama de Tcnicas e Instrumentos para la Recoleccin de Datos de categoras Anlisis del

Lista de Cotejo. Estructurada Escala de Estimacin.

Observacin Diario de Campo. No Estructurada Cmaras fotogrfica y de video. Gua de encuesta. Grabador, Cmara de video.

Oral

DISEO DE INVESTIGACION DE CAMPO

Encuestas Cuestionario Escrita

Gua de entrevista. 2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Estructurada Geometra del poder y Explosin del poder popular. Grabador, Cmara de video. La revolucin, en esencia, es educacin. Entrevistas No Estructurada Libreta de Notas. Grabador, Cmara de video.

18

En esta Gua desarrollaremos la tcnica de la Encuesta. Encuesta: Se define como una tcnica que pretende obtener informacin que suministra un grupo, muestra o poblacin de sujetos acerca de si mismo, o en relacin a un tema en particular. La encuesta puede ser oral o escrita. Encuesta Oral: Se fundamenta en un interrogatorio cara a cara o va telefnica en el cual el encuestador pregunta y el encuestado responde. Su duracin es bastante corta por lo cual se realizan pocas preguntas. Esta modalidad utiliza como instrumento la gua de encuesta. Encuesta escrita: Se realiza a travs de un cuestionario auto-administrado, el cual como su nombre lo indica, siempre es respondido de forma escrita por el encuestado. Cuestionario: Se realiza de forma escrita mediante un instrumento o formato en papel, medios magnticos o electrnicos contentivo de una serie de preguntas. Se le denomina cuestionario auto-administrado porque debe ser llenado por el encuestado sin intervencin del encuestador. 1.10.2 Tipos de cuestionarios Preguntas Cerradas: Son aquellas que establecen previamente las opciones de respuesta. Ejemplo: Posee usted un televisor? Si No

Preguntas Abiertas o de desarrollo: Son las que no ofrecen opciones de respuesta, sino que se da la libertad de responder al encuestado, quien construye su respuesta de manera independiente. Ejemplo: Que actividades deportivas realiza durante el ltimo mes?
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

19

Preguntas Mixtas: Es aquel cuestionario que combina preguntas abierta y cerradas. 1.10.3 Recomendaciones para la elaboracin del cuestionario 1) Las preguntas del cuestionario no se inventan a capricho, es decir estas deben tener una correspondencia con los objetivos especficos de la investigacin. 2) Ordena las preguntas de lo general a lo particular. 3) Evitar preguntas que abusen de la memoria del encuestado. 4) Obviar preguntas sobre temas o conocimientos especializados. 5) No incluir preguntas que induzcan a la respuesta (preguntas guas). 6) Omitir preguntas que originen mltiples interpretaciones. 7) Separar las preguntas de doble can, es decir, aquellas que se interroga sobre dos puntos en una misma pregunta. 8) Incluir preguntas que permitan verificar respuestas anteriores o preguntas de control. 9) Emplear frases de enlace cuando sea necesario. 10)Utilizar escalas de rangos para preguntas sobre tpicos muy personales, tales como, la edad y el salario. 11) Una vez construido el cuestionario se recomienda aplicar una prueba piloto o sondeo preliminar a un pequeo grupo que no forme parte de la muestra, pero que sea equivalente en cuanto a su caracterstica. Esto con la finalidad de establecer la validez del cuestionario, y corregir cualquier falla y elaborar una versin definitiva del instrumento. Para mayores detalles al respecto, se puede consultar el libro Estadstica General, de Ernesto Rivas. 1.10.4 Planeamiento y ejecucin de un estudio estadstico comunitario La descripcin de los datos producidos por experimentos comparativos, encuestas, estudios convencionales o construccin de modelos es un paso para lograr inferir resultados obtenidos de los estudios particulares hacia las poblaciones de inters. En otras situaciones, la descripcin se apoya en el anlisis estadstico de los datos, y a aquella la podemos clasificar en los siguientes estilos o maneras: 1) Descripcin rgida (sin exploracin): dispone el uso de tcnicas de anlisis prescritas sin el examen previo de los datos. 2) Exploratorio: se emplea cuando no tenemos preguntas especficas que guen la recoleccin de datos. 3) Confirmatorio: se usa cuando formulamos preguntas precisas en una investigacin y recolectamos datos con el fin de darles respuesta.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

20

Estos estilos deben tomarse en cuenta para el planeamiento y ejecucin de la investigacin estadstica, abarcndose los siguientes pasos:
1) 2) 3) 4) 5) 6)

Formulacin de problema especifico de la investigacin Desarrollo del instrumento para la obtencin de los datos Recoleccin de los datos Organizacin y presentacin de los datos Anlisis estadstico Interpretacin de los resultados

1) Formulacin de problema especifico de la investigacin Este paso consiste en la definicin del evento, fenmeno u objeto y finalidad de la investigacin. Para poder lograr su exacta definicin es necesario detener conocimiento sobre el objeto a investigar.

2) Desarrollo del instrumento para la obtencin de los datos Este paso tiene un carcter subjetivo, ya que en l se necesita del esfuerzo creativo y constructivo del investigador. Es necesario el estudio de antecedentes y experiencias similares, recursos disponibles y necesarios, alcance y limitaciones. 3) Recoleccin de los datos Este es el paso mas importe dentro de la investigacin estadstica desde el punto de vista operativo. La recoleccin de datos es el fin del planeamiento y ejecucin de la investigacin estadstica. Previamente se ha de definir el universo estadstico, es decir, definir los tipos de casos que han de ser estudiados, as como el alcance de la investigacin en el espacio y el tiempo, y luego hay que disear el instrumento para la recoleccin de la informacin. La necesidad de hacerlo ya la expusimos previamente en la seccin 1.6.2. 4) Organizacin y presentacin de los datos Este se realiza mediante: La Revisin: Consiste en la inspeccin de los registros donde se han reunido los datos para corregir los errores, las respuestas ilgicas y las omisiones. 4.2) El agrupamiento: Significa volcar en una hoja todos los datos contenidos en los cuestionarios (instrumentos).
4.1)
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

21

La Clasificacin: Se determina cada variable evaluada en los instrumentos, y de todas las hojas antes usadas para registrar los datos se escogen, de entre estos ltimos, los que estn asociados a la variable en cuestin. 4.4) La Presentacin (tablas y grficos): Luego de la agrupacin de los datos estos se pueden presentar ordenados en tablas cuadros y mediante la representacin de graficas.
4.3)

5) Anlisis estadstico En este paso se calcula todas las medidas o caractersticas numricas (parmetros o estadsticos segn sea el caso). 6) Interpretacin de los resultados Consiste en traducir las medidas o caractersticas numricas obtenidas en el lenguaje relativo al objeto o evento estudiado. Se interpreta los resultados emitiendo en este momento opinin sobre lo estudiado.

1.11

ACTIVIDADES

Individual Lea la gua con cuidado antes de realizar las siguientes actividades. Recolecte dentro de su grupo familiar las observaciones y datos referentes a las variables edad, sexo, altura y color de ojos. Cules de esas variables son cualitativas y cuantitativas? Determine su nivel de medicin. Escribe un ensayo sobre la utilidad de la Estadstica en la formulacin, ejecucin y seguimiento de proyectos y trabajos de investigacin, e inclyalo en su portafolio de aprendizaje. Grupal Cooperativo Busque informacin estadstica en la prensa. Comente su utilidad y aplicacin e inclyalo en su portafolio. Resuelve los siguientes ejercicios e incorprelos a su portafolio de aprendizaje: 1. Explique la diferencia entre variables cualitativas y cuantitativas. De ejemplos. 2. Explique la diferencia entre una poblacin y una muestra, y de ejemplos.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

22

Busque en la pgina Web del INE la informacin poblacional que all se suministra sobre la fuerza de trabajo (poblacin ocupada). Tome los cuadros correspondientes al primer semestre del ao 2.004. 4. Considere las variables Poblacin y Fuerza de Trabajo. Cul es la variable cualitativa y cul la cuantitativa?. Explique 5. Busque informacin reciente en la pgina Web de PDVSA sobre la produccin de crudo y gas natural en el pas. Estas variables son cualitativas o cuantitativas?. Explique.
3.

Determine si los siguientes datos son cualitativos y cuantitativos, adems de su correspondiente nivel de medicin. 1. Numero de vivienda. 2. Tipo de telfono. 3. Produccin de petrleo (MB) en nuestro pas para un ao. 4. Duracin de llamadas a larga distancia. 5. Color de la vegetacin. 6. Produccin de gas natural (MMM3) en nuestro pas para un ao. 7. Altura de los rboles de Caracas. 8. Tipos de vivienda en la comunidad. 9. Nmero de camas en el hospital. y elabore tres tipos diferentes de encuestas (instrumentos). Use informacin de INE, FUNDACREDESA, PDVSA o Internet.

Investigue

Comunitario Trasldese en compaa de su profesor de Proyecto I (II) a la comunidad o lugar donde se ejecutar el Proyecto I (II). Inclyalo en su portafolio. 1. Formule el problema e identifique las variables presentes que sern consideradas dentro de su diagnstico. 2. Todos y cada uno de los grupos escogern un conjunto de estas variables, las cuales clasificar segn sus caractersticas. 3. Diga la utilidad de esta investigacin y de las variables escogidas. 4. Disee el instrumento para la recoleccin de los datos, siguiendo las recomendaciones presentada en la gua. 5. Aplique el instrumento y recolecte los datos en campo. 6. Recuerda trabajar en campo usando slo lpices de grafito, nunca con bolgrafo. Recuerde sistematizar todas y cada una de las actividades y generar un reporte para tu portafolio.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

23

UNIDAD II: ORGANIZACIN DE LOS DATOS OBJETIVO: Organizar datos estadsticos en una distribucin de frecuencias. COMPETENCIAS A LOGRAR: 1) Explicar la necesidad de organizar los datos. 2) Manejar la clasificacin de distribuciones de datos y frecuencias 3) Construir distribuciones de frecuencias para datos simples y agrupados. 4) Elaborar una presentacin organizada para distribuciones de frecuencias. 5) Usar paquetes computacionales (Excel, Stargrafic, SPSS, otros) para la elaboracin de tablas de datos simples y agrupados. CONTENIDO:

TEMA 1
2.1 Necesidad de organizar los datos

Para poder realizar un anlisis lgico de los datos obtenidos en una investigacin y contenidos en una serie de instrumentos, es necesario ordenarlos en forma lgica, es decir, clasificarlos en base a determinados criterios. En ese sentido, y recordando el paso 4 de la Seccin 1.10.4 del Unidad I, es necesario efectuar: La Revisin: Consiste en constatar y hacer recuento todos los instrumentos contentivos de los datos con el objeto de detectar los espacios en blanco u omisiones, y observar aquellas respuestas absurdas, errneas o ilgicas, corrigindolas cuando sea posible. 2) El Agrupamiento: Luego de ejecutarse el paso anterior, corresponde seleccionar, expresar (resumidamente) y agrupar en una hoja los datos tal como aparecen descritos en el respectivo instrumento a ser asociado a dicha hoja. 3) La Clasificacin: Se determina cada variable evaluada en los instrumentos, y de todas las hojas antes usadas para registrar los datos se escogen, de entre estos ltimos, los que estn asociados a la variable en cuestin.
1)

As obtenemos una mejor percepcin visual, conceptual y sectorizada del volumen de informacin a ser expuesta en forma manejable para su procesamiento estadstico con las tcnicas a ser estudiadas en la presente Gua Didctica.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

24

2.2

Qu se entiende por Observacin, Clase y Frecuencia?

Una Observacin (o Unidad Estadstica) es un dato asumido por una variable cuando esta es cualitativa, o es una repeticin de un dato propio de una poblacin o muestra cuando la variable es cuantitativa. En el primer caso, la cantidad N de observaciones es igual a la cantidad n de datos (N = n) pues cada observacin es un dato en s misma. En el segundo caso, cada dato est asociado a una serie de observaciones que lo repiten; el nmero N de observaciones de todos los datos es mayor o igual al nmero n de datos obtenidos (N n). Si cada observacin aparece repetida una sola vez, entonces la cantidad de datos resulta igual a la cantidad de observaciones (N = n), es decir, cada dato est asociado a una sola observacin. Necesariamente deben aplicarse tcnicas de conteo con el fin de identificar y cuantificar las observaciones de manera cuidadosa para evitar errores. La ms sencilla es escoger una observacin de una serie dada y en una hoja se le colocan al lado tantas rayitas como repeticiones se encuentren en la serie, en la cual se van tachando a medida que se van encontrando. Este procedimiento se ejecuta para todas las observaciones previa aplicacin de algn criterio que permita ordenarlas. Una Clase es un grupo determinado de datos u observaciones estudiados, los cuales se pueden ubicar en k grupos, pudindose colocar estos en orden de magnitud de ser as posible (de acuerdo a la escala o nivel de medicin a usarse), y se distribuyen de forma que un mismo dato u observacin no tenga ubicacin simultnea en clases diferentes. Es decir, cada dato u observacin se asocia a una y slo una de las k clases dadas. Se entiende por Frecuencia a la cantidad o porcentaje de observaciones asociadas a un dato o a una clase. Si la variable es cualitativa, cada observacin es un dato y cada categora asumida por la variable viene siendo una clase, cuya frecuencia en todo caso viene dada por la cantidad o porcentaje de datos que caen en esa categora. Si la variable es cuantitativa, un dato es un valor numrico repetido por las observaciones, y la cantidad de estas es la frecuencia del dato, y la frecuencia de una clase es la suma de las frecuencias de los datos que la conforman. 2.3 Distribuciones de Datos y Frecuencias

Una Distribucin de Datos en un conjunto de datos obtenidos de una serie de observaciones, y dispuestos de manera separada y consecutiva, ya sea en forma unitaria o grupal conforme a las categoras o valores de una variable, y ordenados segn la escala o nivel de medicin empleada al efecto.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

25

Una Distribucin de Frecuencias es un agrupamiento de datos en grupos mutuamente excluyentes, dando el nmero o porcentaje de observaciones a cada grupo. O sea, no hay Distribucin de Frecuencias sin Distribucin de Datos, y aquella tendr su respectiva denominacin de acuerdo al tipo de frecuencia a definirse en la Seccin 2.5. Por ejemplo, se puede hablar de una Distribucin de Frecuencias Relativas. 2.4 Tipos de Distribuciones de Datos y Frecuencias

2.4.1 Distribucin de Datos Simples o no Agrupados As se le denomina cuando a los datos no se les han aplicado algn tratamiento de agrupacin, es decir, cada uno de los n datos es tomado de manera unitaria y por separado. Cuando a estos datos les asociamos sus respectivas frecuencias, estamos ante una Distribucin de Frecuencias para Datos Simples o no Agrupados. Por otra parte, toda serie de N observaciones se puede representar como una distribucin de n datos simples y viceversa, por lo que uno es equivalente al otro, y de uno se construye el otro. 2.4.2 Distribucin de Datos Agrupados A partir de una Distribucin de Datos Simples o no Agrupados previamente elaborada, los datos se agrupan en k clases o grupos con el fin de sintetizar, condensar, resumir o hacer ms fcilmente manejable la informacin. Cuando a estas clases les asociamos sus respectivas frecuencias, estamos ante una Distribucin de Frecuencias para Datos Agrupados. 2.5 Tipos de Frecuencia

2.5.1 Frecuencia Absoluta (f o F) Es la cantidad f de veces que se repite cada uno de los n datos dentro de una coleccin de estos, o el nmero de observaciones F asociadas a cada una de las k clases. A veces a la Frecuencia Absoluta se le denomina Frecuencia Absoluta Simple. La suma de n o k frecuencias (para datos simples o agrupados, respectivamente) da el nmero N de todas las observaciones. Luego tenemos las correspondientes expresiones que simbolizan lo antes dicho: Datos Simples
N = f j
j =1 n

Datos Agrupados
N = F j
j =1 k

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

26

2.5.2 Frecuencia Absoluta Acumulada (fa o Fa) Es la suma de las frecuencias absolutas comprendidas hasta un determinado dato (fa) o hasta cierta clase (Fa). Datos Simples faj = f1 + f2++fj, j = 1,, n 2.5.3 Frecuencia Relativa (h o H) Se define como el porcentaje que resulta de dividir cada frecuencia absoluta sobre la sumatoria de todas las frecuencias absolutas de n datos o k clases, y luego multiplicar ese cociente por 100%, obtenindose h o H respectivamente. A veces a la Frecuencia Relativa se le denomina Frecuencia Relativa Simple. Datos Simples
hj = fj N 100%, j = 1,2,..., n

Datos Agrupados Faj = F1 + F2++Fj, j = 1,, k

Datos Agrupados
Hj = Fj N 100%, j = 1,2,..., k

2.5.4 Frecuencia Relativa Acumulada (ha o Ha) Es la suma de las frecuencias relativas comprendidas hasta un determinado dato (ha) o una cierta clase (Ha). Datos Simples haj = h1 + h2++hj, j = 1,, n Datos Agrupados Haj = H1 + H2++Hj, j = 1,, k

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

27

TEMA 2
2.6 Construccin de Distribuciones de Frecuencias para Datos Simples y Agrupados Si la variable X es cualitativa, hallaremos las frecuencias absolutas y relativas de cada una de las k modalidades de la variable. Aqu cada clase se expresa como una modalidad representada de acuerdo a la Escala de Medicin Nominal u Ordinal de la variable. Si la escala no es ordinal, no tiene sentido calcular las frecuencias absolutas acumuladas y las frecuencias relativas acumuladas. Modalida d de Clase c1 c2 c3 . . . ck F H Fa Fa1 Fa2 Fa3 . . . Fak N Ha Ha1 Ha2 Ha3 . . . Hak = 100%

F1 H1 F2 H2 F3 H3 . . . . . . Fk Hk = 100% N

Ejemplo: Un estudio hecho en un conjunto de 25 varones con objeto de determinar su grupo sanguneo ha conducido a los siguientes resultados: A, B, A, A, A, AB, O, A, A, A, O, B, O, A, B, O, B, O, A, B, B, A, A, O, B La variable que indica el tipo sanguneo es cualitativa, y no hay jerarqua entre los atributos o modalidades. Luego obtenemos la siguiente Distribucin de Frecuencias. Tipo de sangre A B O AB F H

11 44% 7 28% 6 24% 1 4% N = 25 100%

Si la variable X es cuantitativa (discreta o continua), hallaremos las frecuencias de cada uno de los valores o datos de la variable si son pocos, y se har de manera similar a como se expuso anteriormente.
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

28

Ejemplo: Observemos la siguiente tabla en la que se expresan las calificaciones obtenidas en un ejercicio evaluado en escala de 1 a 10 puntos. Tenemos una distribucin de frecuencias asociadas a una variable cuantitativa. Calificaciones 1 2 3 4 5 6 7 8 9 10 f 1 2 1 2 3 4 3 1 2 1 N = 20 h 5% 10% 5% 10% 15% 20% 15% 5% 10% 5% 100% fa 1 3 4 6 9 13 16 17 19 20 ha 5% 15% 20% 30% 45% 65% 80% 85% 95% 100%

2.7) Pasos necesarios en la construccin de una Distribucin de Frecuencias para Datos Agrupados En caso de asumir la variable cuantitativa X una cantidad relativamente numerosa de valores, los agrupamos en clases y hallamos sus frecuencias. Aqu la clase se representa por un nmero, y a esta se halla asociado un intervalo de la recta real llamado Intervalo de Clase, y una Marca de Clase Xm o valor que representa ese intervalo, tal como veremos a continuacin. N de Clase 1 2 3 . . . k Intervalo de Clase [Li1, Ls1] [Li2, Ls2] [Li3, Ls3] . . . [Lik, Lsk] Xm Xm1 Xm2 Xm3 . . . Xmk F F1 F2 F3 . . . FK N Fa Fa1 Fa2 Fa3 . . . FaK = N H H1 H2 H3 . . . HK 100% Ha Ha1 Ha2 Ha3 . . . HaK = 100%

Ejemplo: Una cooperativa de produccin fundada hace algunos aos se dedic a vender productos agrcolas que produca. Como consecuencia del paro petrolero y de escasez de alimentos enlatados en las comunidades a las que serva la cooperativa, se propuso negociar productos enlatados a fin de aumentar la oferta de productos y de esta manera ampliar sus servicios a la comunidad. Dada la gran variedad de productos as como de sus precios, la cooperativa necesita desarrollar una investigacin estadstica de productos y precios que ofrecan a fin de encontrar las variaciones en los precios y las tendencias de preferencia de la comunidad.
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

29

A continuacin presentamos una serie de datos de los precios de los nuevos productos ofrecidos por la cooperativa. 1.560 1.630 1.220 3.550 1.630 2.735
1)

1.870 3.240 1.630 3.030 3.240 2.330

1.890 2.330 2.010 2.750 1.893 3.240

2.330 2.550 1.150 2.330 2.111 2.567

3.030 2.010 3.020 2.110 1.630 2.789

1.990 3.030 1.893 1.630 2.010 1.234

Definimos la variable X, determinamos el nmero N de observaciones, y se ordena la serie de datos de menor a mayor (por filas o columnas)

Sea X la variable que indica el precio de cada producto enlatado vendido por la cooperativa. Vemos que X es cuantitativa y discreta. Hay N = 36 observaciones que ordenaremos por columnas en forma creciente. Para hacer esto, de cada una de las m columnas (filas) de la agrupacin anterior se selecciona la menor de las observaciones, y de all se escoge la menor de las m cantidades as obtenidas por columna. Luego, en una nueva columna (fila) a escribirse en otra agrupacin posterior, se expresan las repeticiones de ese valor a la vez que se tachan en la agrupacin anterior, y en sta se aplica el procedimiento de nuevo sin tomar en cuenta los valores ya tachados. 1.150 1.220 1.234 1.560 1.630 1.630 1.630 1.630 1.630 1.870 1.890 1.893 1.893 1.990 2.010 2.010 2.010 2.110 2.111 2.330 2.330 2.330 2.330 2.550 2.567 2.735 2.750 2.789 3.020 3.030 3.030 3.030 3.240 3.240 3.240 3.550

Interpretacin: Al observar los precios ordenados podemos decir que hay 18 productos con precios por debajo de Bs. 2.111 y el resto un precio mayor. La cantidad de observaciones realizadas es de 36 precios correspondientes a 36 productos enlatados diferentes.
2)

Determinamos la cantidad de datos n y la correspondiente Distribucin de Frecuencias para Datos Simples.

Dada la variable X, las observaciones se denotan con el smbolo xi, donde j asumir el valor de la posicin de cada observacin, j = 1, 2, 3,..., N. x1 = 1.150 x2 = 1.220 x3 = 1.234 x7 = 1.630 x8 = 1.630 x9 = 1.630 x13 = 1.893 x14 = 1.990 x15 = 2.010 x19 = 2.111 x20 = 2.330 x21 = 2.330 x25 = 2.567 x26 = 2.735 x27 = 2.750 x31 = 3.030 x32 = 3.030 x33 = 3.240
30

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

x4 = 1.560 x5 = 1.630 x6 = 1.630

x10 = 1.870 x11 = 1.890 x12 = 1.893

x16 = 2.010 x17 = 2.010 x18 = 2.110

x22 = 2.330 x23 = 2.330 x24 = 2.550

x28 = 2.789 x29 = 3.020 x30 = 3.030

x34 = 3.240 x35 = 3.240 x36 = 3.550

De aqu obtenemos la siguiente tabla, donde el nmero de datos es n = 22. Esa tabla es un ejemplo de una Distribucin de Frecuencias Absolutas para Datos Simples, donde a cada dato Xj se le asocia su correspondiente frecuencia absoluta fj, j = 1,, n. No sera posible obtener la tabla que veremos a continuacin sin la tabla anterior donde las observaciones estn ordenadas en forma creciente. Ambas tablas son equivalentes, pues de una se puede extraer la otra. X X1 = 1.150 X2 = 1.220 X3 = 1.234 X4 = 1.560 X5 = 1.630 X6 = 1.870 f 1 1 1 1 5 1 X X7 = 1.890 X8 = 1.893 X9 = 1.990 X10 = 2.010 X11 = 2.110 X12 = 2.111 f 1 2 1 3 1 1 X X13 = 2.330 X14 = 2.550 X15 = 2.567 X16 = 2.735 X17 = 2.750 X18 = 2.789 f 4 1 1 1 1 1 X X19 = 3.020 X20 = 3.030 X21 = 3.240 X22 = 3.550 f 1 3 3 1

Dada la variable X, en la Distribucin de Frecuencias Absolutas para Datos Simples cada uno de estos es tomado aisladamente del resto al representarlo con el smbolo Xj, donde j asumir el valor de la posicin de cada dato y X = Xj (j = 1, 2,..., n). En el presente caso, el dato X5 = 1.630 est asociado a las observaciones x5, x6, x7, x8 y x9, las cuales asumen cada una el valor 1.630, que se repite con una frecuencia f5 = 5. Interpretacin: Hay 5 productos enlatados que tienen un precio de Bs. 1.630. 3) Calculamos la Amplitud, Rango o Recorrido de la distribucin de datos considerada Para esto primero determinamos el valor mayor Xms grande y el valor menor Xms pequeo de la Distribucin de Datos Simples. Como en esta distribucin los datos estn ordenados del menor al mayor valor, tenemos que Xms grande = Xn y Xms pequeo = X1. Luego calculamos la Amplitud, Rango o Recorrido mediante la siguiente formula: A = Xms grande Xms pequeo = Xn X1. Xms pequeo = Bs. 1.150, Xms grande = Bs. 3.350 A = 3.350 1.150; A = 2.200 Interpretacin: La variacin de precios entre el mayor y el menor es de Bs.2.200.
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

31

4)

Calculo el nmero k de clases

Necesitamos determinar la cantidad de clases o grupos en que debemos separar a los distintos datos de la distribucin. La idea es hacer ms fcil el manejo de la informacin vinculada a numerosas observaciones o datos. Existen muchas maneras de definir la cantidad de clases a considerar. Un procedimiento til para este fin es la Regla de 2 a la k. Tomamos el menor valor entero para k de tal manera que 2k sea mayor o igual a N (numero de observaciones consideradas). El valor encontrado para k ser el nmero de clases para la agrupacin. Se recomienda que el nmero de clases este entre 5 y 25 (5 k 25). Ahora usamos esta regla para hallar el nmero de clases del ejercicio considerado. Asumimos (por tanteo) un valor de k = 5. Entonces 25 = 32, y como 32 es menor que N = 36, el valor de k = 5 no es til. Ahora asumimos el valor de k = 6, calculamos 26 = 64, y como ahora 64 es mayor que N = 36, entonces en este caso se usarn 6 clases. Siempre el valor de 2k tiene que ser mayor o igual que N (o sea, N 2k). Interpretacin: Los datos los agruparemos en 6 clases o grupos para poder obtener la mayor informacin posible de la distribucin considerada. Tratar esa cantidad de clases es un trabajo ms prctico que usar 22 datos o 36 observaciones.
5)

Clculo de la distancia entre los lmites consecutivos de los Intervalos de Clase (DC) y su correspondiente longitud (Ic)

Un Intervalo de Clase se define como aquel sector de la recta real que contiene una clase o conjunto de datos que se encuentra ubicado entre dos extremos o lmites establecidos. El tamao de cada intervalo debe ser el mismo para todas las clases, y el valor de esa distancia debe ser un nmero entero, no decimal. La sucesin de estos intervalos deben abarcar por lo menos la distancia desde el menor valor Xms pequeo hasta el valor mayor Xms grande, aunque pueden abarcar una distancia mayor. Con respecto a la clase j = 1,, k, el intervalo de clase que la contiene posee como extremos un lmite inferior Lij y un lmite superior Lsj. Aqu cada intervalo se tomar cerrado en sus extremos, y estar separado de los intervalos adyacentes a una distancia de una unidad de longitud para cada uno. Por ejemplo, para las clases 1 y 2 los respectivos intervalos [Li1, Ls1] y [Li2, Ls2] estarn separados de esa manera pues se debe cumplir que Li2 Ls1 = 1.
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

32

Por razones de orden prctico, a veces cada intervalo [Lij, Lsj] se representa como Lij Lsj tal como aparece en algunos libros de Estadstica. En tal caso no se est representando una resta ni un intervalo que no sea cerrado en sus extremos. Hay casos en que los intervalos de clase se pueden tomar abiertos o semiabiertos en sus lmites. En la presente Gua Didctica no estudiaremos los procedimientos para obtenerlos, pudindose consultar en otros textos de Estadstica. Sea DC la distancia existen entre los lmites inferiores o superiores consecutivos para dos intervalos de clases. Siguiendo el ejemplo dado, DC = Li2 Li1 = Ls2 Ls1. Para hallar esa distancia podemos utilizar la siguiente formula:
Dc = A + 1 ( X msgrande X mspequeo ) + 1 = k k

Si el resultado dado por esta frmula da un nmero decimal, este se redondea por exceso y se escoge como el valor buscado para DC. Se selecciona as para garantizar que los intervalos de clase puedan contener a todos los datos. Sea Ic la longitud que tiene cualquier intervalo de clase [Lij, Lsj], por lo que Ic = Lsj Lij, j = 1,, k, pues todos los intervalos tienen igual tamao. Es fcil deducir que Ic = Dc 1. En base a los clculos anteriores, tenemos que Xms pequeo = 1.150, Xms grande = 3.350, A = 2.200, k = 6 Aplicamos la formula:
Dc = 2.220 + 1 = 366,83 6

A este resultado lo aproximamos al entero inmediatamente superior, por lo cual tenemos que Dc = 367 e Ic = 366. Interpretacin: Determinamos que el precio menor de la distribucin es Bs. 1.150 y el mayor Bs. 3.350. La diferencia entre los valores extremos consecutivos de cada clase es Bs. 367.

6) Determinamos los Intervalos de Clases


2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

33

6.1)

Clculo de los lmites inferiores Li

Tomamos Li1 = Xms pequeo = 1.150 como lmite inferior de la clase j = 1. Para calcular el lmite inferior Li2 de la clase j = 2, sumamos al Li1 el valor DC y tendremos Li2 = Li1 + DC = 1.150 + 367 = 1.517. Entonces Li2 = 1.517, y as sucesivamente hasta completar los 6 lmites inferiores de los correspondientes intervalos de clases.
6.2)

Clculo de los lmites superiores Ls

Para calcular el limite superior Ls1 de la clase 1, a Li2 le restamos la unidad, y as Ls1 = Li2 1 = 1.517 1 = 1.516, Ls1 = 1.516. Luego, para calcular Ls2 le sumamos DC a Ls1 y tendremos Ls2 = Ls1 + DC = 1.516 + 367 = 1.883. Entonces Ls2 = 1.883, y as sucesivamente hasta completar los 6 lmites superiores de los correspondientes intervalos de clases. 6.3)Tabulacin de los Intervalos de Clase Ahora determinamos los intervalos de clases que usaremos. A la clase j le corresponde el intervalo [Lij, Lsj], j = 1,, k. Expondremos esta informacin por medio de una tabla. Recordemos que su tamao o longitud es Ic = Lsj Lij = Dc 1, el cual es igual para todos los intervalos de clase. N de Clase 1 2 3 4 5 6 Intervalo de Clase [1.150, 1.516] [1.517, 1.883] [1.884, 2.250] [2.251, 2.617] [2.618, 2.984] [2.985, 3.353]

Interpretacin: La clase o grupo 2 consta de todos los precios registrados de enlatados mayores o iguales a Bs. 1.517 y menores o iguales a Bs. 1.883, y la variacin entre estos dos lmites o extremos es de Bs. 366. 7) Calculamos la Marca de Clase La Marca de Clase es el punto medio del respectivo intervalo de clase al cual pertenece. Se calcula a partir de la semisuma de sus lmites.
Xm j = Li j + Ls j 2

, j = 1,, k

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

34

Calculamos el valor medio Xm1 de la clase j = 1.


Xm1 = Li1 + Ls1 1.150 + 1.516 = = 1.333 ; Xm1 = 1.333 2 2

De igual manera determinamos el resto de las marcas de clase. Luego, a la tabla anterior le anexamos una columna contentiva de dichas cantidades, asocindolas a sus correspondientes clases. N de Clase 1 2 3 4 5 6 Intervalo de Clase [1.150, 1.516] [1.517, 1.883] [1.884, 2.250] [2.251, 2.617] [2.618, 2.984] [2.985, 3.353] Xm 1.333 1.770 2.065 2.434 2.801 3.164

Interpretacin: El primer grupo de precios est definido entre Bs. 1.150 y Bs. 1.516, y el precio promedio de estos valores extremos es de Bs. 1.333. 8) Calculamos la Frecuencia Absoluta de cada clase De la distribucin de frecuencias para datos simples, la frecuencia absoluta Fj de la clase j = 1,, k es la suma de las frecuencias de los datos pertenecientes a esa clase. Para el caso de la clase j = 2, el respectivo intervalo de clase es [1.517, 1.883], y los datos X4 = 1.560, X5 = 1.630 y X6 = 1.870 conforman la clase 2. Luego tenemos que F2 = f4 + f5 + f6 = 7. Es decir, en el intervalo [1.517, 1.883] hay 7 observaciones. Las frecuencias as obtenidas las anexamos a la tabla en una columna adjunta a la de las marcas de clase. N de Clase 1 2 3 4 5 6 Intervalo de Clase [1.150, 1.516] [1.517, 1.883] [1.884, 2.250] [2.251, 2.617] [2.618, 2.984] [2.985, 3.353] Xm 1.333 1.770 2.065 2.434 2.801 3.164 F 3 7 9 6 3 8 N = 36

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

35

Interpretacin: Los precios de 7 productos enlatados son mayores o iguales a Bs. 1.517 y menores o iguales a 1.883.
9)

Calcularemos la Frecuencia Absoluta Acumulada (Fa)

Para la clase j = 1,, k, tenemos que Faj es la cantidad de observaciones contenidas entre el correspondiente intervalo de clase ms las de los anteriores siguiendo el orden, es decir, Faj = F1 + F2 ++ Fj. Las frecuencias absolutas acumuladas aqu obtenidas se ubican en la tabla anterior por orden de clase en una columna anexa a la de la frecuencia absoluta. Para la clase j = 3 tenemos que Fa3 = F1 + F2 + F3 = 3 + 7 + 9 =19. N de Clase 1 2 3 4 5 6 Intervalo de Clase [1.150, 1.516] [1.517, 1.883] [1.884, 2.250] [2.251, 2.617] [2.618, 2.984] [2.985, 3.353] Xm 1.333 1.770 2.065 2.434 2.801 3.164 F 3 7 9 6 3 8 N = 36 Fa 3 10 19 25 28 36

Interpretacin: Los precios de 19 productos enlatados son menores o iguales a Bs. 2.250. En algunos textos la Frecuencia Absoluta Acumulada Faj aqu referida para la clase j viene siendo la Frecuencia Absoluta Acumulada hacia Arriba Fa j , mientras que la Frecuencia Absoluta Acumulada hacia Abajo es Fa j = Fj + Fj+1 + + Fk-1 + Fk. N de Clase 1 2 3 4 5 6 Intervalo de Clase [1.150, 1.516] [1.517, 1.883] [1.884, 2.250] [2.251, 2.617] [2.618, 2.984] [2.985, 3.353] Xm 1.333 1.770 2.065 2.434 2.801 3.164 F 3 7 9 6 3 8 N = 36 Fa 3 10 19 25 28 36

Fa 36 33 26 17 11 8

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

36

Para la clase j = 3 tenemos que Fa 3 = F3 + F4 + F5 + F6 = 9 + 6 + 3 + 8 = 26. Interpretacin: Los precios de 26 productos enlatados son mayores o iguales a Bs. 1.884.
10)

Calculamos la Frecuencia Relativa (H) Aplicando la frmula respectiva para la clase j = 2, tenemos que

H2 =

F2 100% N
N de Clase 1 2 3 4 5 6

7 100% 36

= 19,44%

De igual manera se calcula la

frecuencia relativa de cada una de las clases restantes. Intervalo de Clase [1.150, 1.516] [1.517, 1.883] [1.884, 2.250] [2.251, 2.617] [2.618, 2.984] [2.985, 3.353] Xm 1.333 1.770 2.065 2.434 2.801 3.164 F 3 7 9 6 3 8 N = 36 Fa 3 10 19 25 28 36 H 8,33% 19,44% 25,00% 16,67% 8,33% 22,22% 99,99%

Interpretacin: El 19,44% de los productos enlatados tienen precios mayores o iguales a Bs. 1.517 y menores o iguales a Bs. 1.883.
11)

Calculamos la Frecuencia Relativa Acumulada (Ha)

Para la clase j = 1,, k, tenemos que Haj es el porcentaje de observaciones contenidas en el correspondiente intervalo de clase ms los porcentajes de observaciones de las anteriores clases siguindolas en orden creciente, es decir, Haj = H1 + H2++Hj. De aqu se deduce que necesariamente la frecuencia relativa acumulada de la clase j = k tiene que ser Hak = 100%, aunque a veces por errores de clculo a nivel de centsimas, o incluso de milsimas, puede que ese valor de la ltima clase se ubique en el entorno de 99,99 %. Para la clase j = 3 tenemos que Ha3 = H1 + H2 + H3 = 8,33% + 19,44% + 25,0 % = 52,78%. De igual manera calculamos las restantes frecuencias y las anexamos.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

37

N de Clase 1 2 3 4 5 6

Intervalo de Clase [1.150, 1.516] [1.517, 1.883] [1.884, 2.250] [2.251, 2.617] [2.618, 2.984] [2.985, 3.353]

Xm 1.333 1.770 2.065 2.434 2.801 3.164

F 3 7 9 6 3 8 N = 36

Fa 3 10 19 25 28 36

H 8,33% 19,44% 25,00% 16,67% 8,33% 22,22% 99,99%

Ha 8,33% 27,78% 52,78% 69,44% 77,78% 99,99%

La ltima tabla as obtenida es la Distribucin de Frecuencias para Datos Agrupados del problema tratado hasta ahora. As como nos hemos referido a la Frecuencia Absoluta Acumulada hacia Arriba ( Fa ) y hacia Abajo ( Fa ), en forma anloga se puede definir Frecuencia Relativa Acumulada hacia Arriba ( Ha ) y hacia Abajo ( Ha ). Interpretacin: La frecuencia absoluta F4 = 6 de la cuarta clase, significa que 6 productos enlatados tienen precios que oscilan entre Bs. 2.252 y Bs. 2.619. La frecuencia relativa H3 = 25,00% de la tercera clase, significa que el 25% de los productos referidos tienen precios que oscilan entre Bs. 1.884 y Bs. 2.251. La frecuencia acumulada Ha4 = 25 de la cuarta clase, significa que 25 productos tienen precios que oscilan entre Bs. 1.150 y Bs. 2.619. La frecuencia relativa acumulada Ha5 = 77,78% de la quinta clase, significa que el 77,78% de los productos tienen precios que oscilan entre Bs. 1.150 y Bs. 2.987. Del ejemplo anterior contesten las siguientes preguntas: Cuntos productos enlatados tienen precios entre Bs.2.252 y Bs. 2.986? Cuntos productos enlatados tienen precios entre Bs.1.150 y Bs. 2.251? Cul es el precio promedio del 25% de los productos enlatados? En qu precios oscilan por lo menos 28 productos enlatados? Nota 1: Al tener una Distribucin de Frecuencias para Datos Simples o no Agrupados, para cada uno de estos se calcula la frecuencia absoluta, relativa, acumulada (hacia arriba y hacia abajo), y relativa acumulada (hacia arriba y hacia abajo. Como los datos se toman unitariamente y no agrupados en clases, no hay intervalos de clase. Ejemplo: Las edades de los 20 integrantes de una seccin de estudiantes de la UBV se obtuvieron luego de aplicrseles una encuesta.
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

38

34 23

40 37

30 26

37 23

26 34

18 37

37 21

18 37

26 37

26 23

A esta serie de observaciones se le aplica los pasos 1 y 2 de la Seccin 2.7 para construir una tabla donde aparezcan ordenados en forma creciente los datos con sus respectivas frecuencias absolutas. X f 18 2 21 1 23 3 26 4 30 1 34 2 37 6 40 1

Posteriormente, se ejecutan los pasos 8, 9, 10 y 11 de la seccin antes mencionada. X 18 21 23 26 30 34 37 40 f 2 1 3 4 1 2 6 1 N = 20

fa 2 3 6 10 11 13 19 20

fa 20 18 17 14 10 9 7 1

h 10% 5% 15% 20% 5% 10% 30% 5% 100%

ha 10% 15% 30% 50% 55% 65% 95% 100%

ha 100% 90% 85% 70% 50% 45% 35% 5%

Nota 2: La Distribucin de Frecuencias para Datos Simples expresa informacin muy detallada y abundante acerca de los datos. La Distribucin de Frecuencias para Datos Agrupados expresa informacin muy resumida y austera acerca de estos, por lo que se pierde informacin y la segunda distribucin mencionada es una aproximacin de la primera. Manejarlos de cualquiera de las dos maneras es ms prctico y explcito en su contenido que tenerlos desordenados y dispersos. Nota 3: Todos los pasos de la Seccin 2.7 se han aplicado para una variable cuantitativa, pero algunos se pueden usar y adaptar para cualquier variable cualitativa. En ese caso no se podran calcular el rango ni nada referido propiamente a intervalos de clase, y si tal variable hace uso de una Escala de Medicin Ordinal tiene sentido determinar las frecuencias absolutas acumuladas y frecuencias relativas acumuladas para cada categora que asuma la variable en cuestin. Nota 4: Dependiendo de las particularidades del problema a estudiar y de la variable usada para una distribucin de frecuencias para datos agrupados, los intervalos asociados a las clases j = 1 y j = k (o sea, el primer y el ltimo intervalo)
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

39

pueden no tener definidos el lmite inferior Li1 y el lmite superior Lsk, respectivamente. En este caso hablamos de una Distribucin Abierta. Ejemplo: En una Unidad de Barrio Adentro fueron atendidas 200 personas en un da de consulta, y se distribuyeron en 6 grupos por edades. Edades Nmero de (aos) asistentes Menos de 29 16 30-39 25 40-49 51 50-59 80 60-69 20 Ms de 70 8 2.8 ACTIVIDADES Individual

Lea con cuidado los contenidos presentados en esta unidad y consulte la bibliografa a fin de ampliar sus conocimientos y considerar la opinin de otros autores sobre el tema.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

40

Grupal Cooperativo Problema 1.- La siguiente tabla muestra la inversin social de PDVSA en nuestro pas:

Fuente: PDVSA 1. Calcule

las frecuencias (F, Fa, H y Ha) por cada ao. Interprete los resultados y agrgalos a tu portafolio.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

41

Problema 2.- De acuerdo a la presente tabla:

1.

Organice y agrupe en clases por pares de aos (1995-1996, 1997-1998.) de los sectores Hidrocarburo y Petroqumico. Calcule las frecuencias F, Fa, H y Ha para cada sector. resultados y agrgalos a tu portafolio. Interprete los

2.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

42

Problema 3.- De la siguiente tabla:

1. Interprete

los resultados de esta tabla aplicando las herramientas de los problemas anteriores y agrgalos a tu portafolio.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

43

2. Actualice

la mayor cantidad de los conceptos de las tablas anteriores y aplique las herramientas estadsticas vistas en los problemas 1, 2 y 3. Interprete los resultados y agrgalos al portafolio. Comunitario Con los datos recopilados en su trabajo de campo correspondiente a Proyecto I (II) siga el siguiente tratamiento: 1. Revselos. 2. Determine si son datos discretos o continuos. 3. Agrpelos ordenados de mayor a menor. 4. Calcule los elementos de los datos agrupados. 5. Nmero de N observaciones, numero de n datos, nmero de k clases, Intervalo de Clase, Punto Medio de cada clase, F, Fa, H y Ha. Interprete los resultados.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

44

UNIDAD III: REPRESENTACIN DE LOS DATOS OBJETIVO: Cuando el estudiante culmine este Unidad, podr presentar los datos usando tcnicas de tabulacin y graficacin para extraer conclusiones descriptivas. COMPETENCIAS A LOGRAR: 1) Comprende la funcin de las tablas, cuadros y grficos para presentar los datos procesados. 2) Representa e interpreta datos en tablas. 3) Grafica los datos, con el propsito de representarlos. 4) Interpreta las representaciones grficas. 5) Uso de herramientas computacionales (Excel, SPSS, entre otras). CONTENIDO: En la prctica se realiza la representacin de los datos, dentro de la investigacin estadstica, luego de haberse agrupado y calculado los valores de frecuencia requerida. En gran parte el carcter de este proceso es publicitario por la forma de informar al interesado los resultados y datos obtenidos en una investigacin. En cualquier caso, las formas de presentacin de los datos son la textual, la tabular y la grfica.

TEMA 1
3.1 Forma Textual

Es la que se realiza a travs de palabras smbolos algebraicos. Esta forma es quizs la menos aconsejable, y solo debe utilizarse en los casos en que se requiera exponer resultados brevemente, pues en el caso de que el texto sea muy largo cansara al lector y no le permitira comprender totalmente lo expuesto. En la prctica se utiliza como un complemento de la forma tabular o de la forma grafica. Ejemplo: Los enlatados que vende una cooperativa de produccin presentan precios que estn agrupados en varias clases; los precios que estn en el intervalo entre Bs. 1.558 y Bs. 2.253 presentan una frecuencia de 9, o sea, el 25% de los productos enlatados, de los cuales Bs. 2.253 representa el precio ms alto del 69,45% de los productos enlatados que vende la cooperativa. 3.2 Forma Tabular

Es aquella que se realiza a travs de las tablas o cuadros estadsticos, entendindoseles como una ordenacin de datos numricos en filas y columnas
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

45

con las especificaciones correspondientes acerca de la naturaleza de los datos (simples o agrupados), y as poder apreciar de la mejor forma las caractersticas y la cuanta del fenmeno estudiado y establecer comparaciones entre dichos datos. Al respecto, la forma tabular contiene en s misma todas las cantidades que conforman una Distribucin de Frecuencias para Datos Simples o Agrupados. 3.2.1 Componentes del Cuadro Estadstico Las partes que componen un Cuadro Estadstico son: 1) Ttulo: Comprende el nmero del cuadro (cuando el mismo forma parte de un grupo), el tema del cuadro y a veces una nota complementaria; contesta el titulo las preguntas: Qu? (tema de los datos), Cundo? (referencia cronolgica), Dnde? (referencia geogrfica). 2) Encabezamiento: Comprende los ttulos de cada columna de datos. 3) Columna Matriz: Abarca las designaciones de cada fila de datos y se encuentra en la parte izquierda del cuadro. 4) Cuerpo: Consiste en las cifras o smbolos que se encuentran colocados en las filas y columnas del cuadro debajo del encabezamiento y a la derecha de la columna matriz. 5) Notas: Aparecen en cual parte del cuadro, y explican algunas aclaratorias sobre los datos y casi siembre la fuente de los datos, cuando las notas se encuentra al final del cuadro se denominan notas al pie. Ejemplo: Consideremos el ejemplo estudiado en la Seccin 2.7 del Unidad II. Cuadro 3
Ttulo

ESTADO SUCRE: PRECIOS DE LOS PRODUCTOS ENLATADOS COOPERATIVA DE PRODUCCION DE RO CARIBE 2.003
Encabezamiento
46

(Bolvares) N de Clase
Columna Matriz

Intervalo de Clase [1.150 1.516] [1.517 1.883] [1.884 2.250] [2.251 2.617] [2.618 2.984]

Xm 1.333 1.770 2.065 2.434 2.801

F 3 7 9 6 3

Fa 3 10 19 25 28

H (%) 8,33 19,44 % 25,00 % 16,67 % 8,33%

Ha (%) 8,33
Cuerpo

1 2 3 4 5

27,78 52,78 69,44 77,78

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

[2.985 3.353]

3.164

36

22,22 %

99,99

Nota: Representan los productos enlatados ofrecidos por la Cooperativa en Marzo de 2.003. Fuente: Gerencia de Ventas de la Cooperativa de Produccin de Ro Caribe. 3.2.2 Pasos recomendados para elaborar un Cuadro Estadstico
1)

Numeracin del Cuadro. Los cuadros, grficos, fotos y figuras de un informe deben esta numerados segn su tipo de presentacin y en orden correlativo. Por ejemplo: Cuadro 1, Cuadro 2,..., Grafico 1, Grafico 2,..., Foto 1, Foto 2, Foto 3,, Figura 1, Figura 2,... Ttulo propiamente dicho. Deber colocarse sin subrayar, centrado en la parte superior del cuadro, y usando letras maysculas para todo el enunciado. Es preciso redactar con claridad y expresar concisamente los datos que se presentan en el cuadro. En general, el orden del enunciado ser el siguiente:

2)

Referencia Geogrfica. Naturaleza de los datos. Referencia Cronolgica. Detalles de clasificacin o unidades. Estas debern colocarse entre parntesis y utilizando maysculas nicamente al iniciar la palabra. Ejemplo: Cuadro 3 ESTADO SUCRE: PRECIOS DE LOS PRODUCTOS ENLATADOS COOPERATIVA DE PRODUCCION DE RIO CARIBE 2.003 (Bolvares)

3)

Encabezamiento. Debe disponerse en la parte superior del cuadro, y las designaciones que comprenden debern escribirse en lo posible horizontalmente, debiendo ser claras y concisas. As mismo se dispondrn en un orden lgico de izquierda a derecha.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

47

4)

Columna matriz o principal. El arreglo puede hacerse de la siguiente manera:

Cuando se trate de datos cualitativos, stos debern ordenarse alfabticamente. Cuando su funcin sea analizar una tendencia de un fenmeno se ordenarn en forma ascendente ejemplo: 1.954, 1.955, 1.956, pero si se trata de la importancia de los ltimos aos se ordenarn los aos de manera descendente ejemplo: 1.959, 1.958, 1.957, 1.956. En lo que refiere a meses del ao o los das de semana se comenzarn con enero y lunes respectivamente.
5)

Tamao del cuadro. Todo cuadro deber en lo posible hacerse en tamao carta, y debe planearse de tal manera que no sea ni muy largo y angosto, ni muy ancho ni corto. Presentacin de notas y fuentes. Las notas preferiblemente se colocarn al pie del cuadro. Cuando se trate de la fuente de los datos, esta deber presentarse citando al autor y el ao de la publicacin.

6)

3.2.3 Ventajas de la presentacin tabular 1) Se sigue un orden o plan de acuerdo a la finalidad de la investigacin. 2) Facilita la observacin de la relacin existente entre los diversos datos presentados en un mismo cuadro o entre cuadros diferentes. 3) Favorece el descubrimiento de irregularidades en los datos por omisiones o errores de indagacin o clasificacin. 4) Facilita el resumen de los principales resultados obtenidos.

TEMA 2
3.3 Forma Grfica

Una vez que la informacin estadstica est expuesta en forma tabular, quien haga uso de esta necesita a menudo una visin rpida del comportamiento de las variables (ventas, enfermedades, tipologa de las viviendas, edad y genero de los habitantes de una comunidad, altura de los brotes, notas finales de los alumnos del primer ao, etc.). Por tanto, es preciso presentar dicha informacin mediante algn tipo de grfico estadstico que facilita la visualizacin y descripcin del comportamiento de las variables y sus particularidades ms notables. En base a los planteamientos anteriores, se definen los grficos como representaciones visuales de la informacin procesada estadsticamente y que permiten generar apreciaciones que tambin son visuales y estadsticas.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

48

La utilidad de los grficos estriba en la ideal global que dan sobre la situacin investigada. El volumen de informacin que aportan no es tan extenso como la que se entrega en una tabla de varias columnas a leerse por separado, pero los grficos tambin le dan coherencia a grandes conjuntos de datos, presentndolos en un espacio ms reducido y revelando diversos detalles comparables de los mismos a nivel general y especfico. La excelencia del grfico consiste en la comunicacin de ideas complejas con claridad, eficiencia y precisin, evitando la distorsin en el mensaje de los datos. Suministrar informacin de manera grfica es un verdadero arte funcional que no slo sirve para presentar los datos sino tambin para expresar ideas que se desean destacar. Por esta razn, quien presente un grfico aporta su imaginacin y temperamento para comunicar un mensaje a ser asimilado para quien vaya destinado. La forma de presentar cualquier idea a travs de grficos depender del nivel del destinatario, del lugar de exposicin y de otros factores a analizar para escoger el diseo que facilite la mejor y ms adecuada comunicacin posible. Los grficos se clasifican en dos grupos. Grficos Cartesianos: Son los que se basan en un sistema de coordenada cartesianas conformados por el Eje X (horizontal) y el Eje Y (vertical). Tenemos los Histogramas (de Frecuencia y de Frecuencia relativa), los Grficos de Lnea o Diagramas Lineales, los Polgonos (de Frecuencia, Acumulativos u Ojivas, de Frecuencia Relativa, y de Frecuencia Relativa Acumulada u Ojivas Porcentuales), los Diagramas de Barra y los Diagramas a Doble Columna. Grficos Simblicos: Son los que hacen uso de mapas geogrficos, dibujos y figuras geomtricas. Los ms usados vienen siendo los Cartogramas, los Pictogramas, Pictgrafos o Diagramas Pictricos, y los Diagramas o Grficos Circulares (o Sectoriales o de Pastel).

Los elementos componentes de todo grfico son: 1) 2) 3) 4) 5) 6) 7) Ttulo Principal. Ttulo Secundario o Subttulo. Descripcin del grfico. Regin de datos y smbolos. Regin a ser ocupada por el grfico. Descriptores o indicadores de seales y marcas. Notas.

Para ambos tipos de grficos antes definidos son vlidos los siguientes principios generales:

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

49

Los grficos se han de explicar enteramente por s mismos. El contenido de un grfico deber ser tan completo como sea posible. Deben evitarse elementos superfluos que lo recarguen exageradamente. Los elementos del grfico deben ser claramente distinguibles y visualmente prominentes, adems de representar eficientemente las distribuciones de datos y de frecuencias. No se debe tratar de abarcar demasiada informacin en un solo grfico. Es mejor hacer varios grficos en distintos espacios que comprimir toda la informacin en uno solo. Una regla prctica segura es evitar ms de 3 grficos en un mismo espacio, y en ese caso deben ser visualmente discernibles. Los elementos de estos grficos deben ser consistentes con los de otros grficos anteriormente usados. Los grficos tienen que dar una visin general y no una imagen detallada de un conjunto de datos. Las presentaciones detalladas se deben reservar para las tablas. En caso de agregarse notas, estas deben estar fuera del rea del grfico. 3.3.1 Grficos Cartesianos Para cada uno de los grficos que describiremos a continuacin, es preciso aplicar las siguientes reglas: En el eje donde se ubiquen las frecuencias, el cero siempre debe colocarse explcitamente. Cuando las variables se inician con valores muy altos, el eje donde se coloquen estos se puede comenzar el mismo valor por donde inicia la variable o por un valor cercano. Si en cualquiera de los ejes se hace necesario interrumpir la escala de los nmeros, esto debe hacerse en forma clara con una lnea en zigzag. La curva debe trazarse ms gruesa que las coordenadas para que resalte. Los ejes, ttulos, letreros y notas deben ser claros, y colocarse horizontal o verticalmente de acuerdo al eje, y de ser necesario se dibujan lneas de fondo para facilitar la lectura de los valores. Las unidades de medicin de las variables deben destacarse claramente, y los nmeros que indican valores de la misma caracterstica se han de dar con el mismo nmero de decimales. La longitud de los ejes y la equivalencia entre las unidades de medicin deben seleccionarse de modo que la grfica resulte balanceada a lo largo y ancho. Si es necesario mencionar puntos particulares de la curva, estos deben indicarse con notas al pie, y en general debe evitarse el recargamiento del grfico. Debe mencionarse la fuente de informacin. Si estas reglas no se aplican adecuadamente, se incurre en un mal uso de los grficos. Una de las maneras ms fciles de engaar al lector es hacer, en el eje donde se ubiquen las frecuencias, el rango muy pequeo en trminos de las
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

50

proporciones de las unidades de medicin que se usan para estos ejes coordenados. Otra manera de crear percepciones grficas equivocadas es empezar sin indicacin previa y explcita en cualquier otro valor distinto de cero en el eje donde aparezcan las frecuencias.
1)

Histograma: Es la reproduccin grfica de una Distribucin de Frecuencias para Datos Agrupados en un sistema de coordenadas cartesianas, componindose aquel grfico por una sucesin de rectngulos o barras, teniendo cada uno en el Eje X como base un intervalo de clase y en el Eje Y como altura la respectiva Frecuencia Absoluta (Histograma de Frecuencia o Histograma propiamente dicho) o la Frecuencia Relativa (Histograma de Frecuencia Relativa). Todos los puntos de un intervalo de clase tienen una misma altura dada por la respectiva frecuencia en el Eje Y. Los intervalos de clase se dibujan consecutivamente de igual tamao y sin separacin (juntos), por lo que los rectngulos son adyacentes, y el rea de cada uno es proporcional a la frecuencia a la cual est asociada. El Histograma proporciona una presentacin visual fcil de interpretar de la Distribucin de Frecuencias ya mencionada. Ejemplo: El siguiente Histograma de Frecuencia proviene de la Distribucin de Datos Agrupados del problema tratado en el problema de la Seccin 2.7 del Unidad II.

CANTIDAD DE ENLATADOS POR VARIACIN DE PRECIOS

9 8 7 6 5 4 3 2 1 0

CANTIDAD DE ENLATADO S

1.150 1.517 1.518 1.884 1.885 2.252 2.253 2.620 2.621 2.987 2.988 3.353 PRECIO S

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

51

Interpretacin: Entre Bs. 1.885 y Bs. 2.252 estn localizados los precios del grupo ms numeroso de enlatados, siendo Bs. 2.068 el precio promedio de los lmites de precios de ese grupo. Adems, existe otro grupo importante de productos cuyos precios estn ubicados entre Bs. 2.988 y Bs. 3.353.
2)

Grfico de Lnea o Diagrama Lineal: Partiendo de una Distribucin de Frecuencias para Datos Agrupados de una variable cuantitativa discreta, en un sistema de coordenadas cartesianas se ubican los datos en el Eje X y se colocan las Frecuencias Absolutas en el Eje Y. Luego se definen pares ordenados donde la abscisa (componente horizontal) es un dato y la ordenada (componente vertical) del par en cuestin es la respectiva frecuencia absoluta de ese dato discreto. Despus de dibujarse los pares ordenados, con segmentos de lnea recta estos se unen en forma consecutiva siguiendo las abscisas en orden creciente. Ejemplo: Veamos este grfico sobre la vacunacin de nios.

3)

Polgono: Es una sucesin de diferentes segmentos consecutivos que comparten de a dos un mismo extremo comn. En un sistema de coordenadas cartesianas, nos interesan los polgonos abiertos, es decir, aquellos en los que la secuencia de sus segmentos no encierra rea alguna por s misma a menos que la pueda encerrar con el Eje X. Polgono de Frecuencia: Es semejante a un histograma y a un grfico de lneas, pues cada par ordenado que conecta a dos segmentos lineales tiene como abscisa a una marca de clase de un intervalo de clase sobre el cual estn los segmentos referidos. La escala en el Eje X corresponde a las marcas de clase y la escala en el Eje Y corresponde a la Frecuencia Absoluta. Generalmente, el par ubicado sobre el primer intervalo de clase se une con un segmento al lmite inferior Li1 en el Eje X, y lo mismo se hace entre el par que se encuentra sobre el ltimo intervalo de clase y su lmite superior Lik en dicho eje. As obtenemos un rea cerrada por el polgono y el eje nombrado. Por otra parte, el Polgono de Frecuencia se puede dibujar en el mismo sistema de coordenadas donde aparece el
52

3.1)

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

correspondiente Histograma de Frecuencia, tenindose dos grficos a la vez.


3.2)

Polgono de Frecuencia Absoluta Acumulada o Polgono Acumulativo: Es semejante a los anteriores, pero en el Eje Y usaremos los valores de la Frecuencia Absoluta Acumulada. La curva obtenida se denomina Ojiva. Es pertinente referirnos a la Ojiva hacia Arriba (u ojiva propiamente dicha) y hacia Abajo cuando en el Eje Y se expresan respectivamente los valores de la Frecuencia Absoluta Acumulada hacia Arriba ( Fa ) y hacia Abajo ( Fa ), y ambas se pueden dibujar simultneamente. La primera ojiva es creciente y la otra es decreciente. Polgono de Frecuencia Relativa: Es semejante a los polgonos anteriores, pero en el Eje Y usaremos los valores de la Frecuencia Relativa. Ejemplo: Consideremos el problema de la Seccin 2.7.
PORCENTAJE DE ENLATADOS POR PRECIOS PROMEDIOS 30 25 20 15 10 5 0 1150 1516 1517 1883 1884 2251 2252 2619 2620 2986 2987 3353 19,45 16,67 25 22,22

3.3)

PORCENTAJE DE ENLATODS

8,33

8,33

PRECIOS PROMEDIOS

3.4)

Polgono de Frecuencia Relativa Acumulada: Es semejante a los polgonos anteriores, pero en el Eje Y usaremos los valores de la Frecuencia Relativa Acumulada. Este grfico tambin es conocido como Ojiva Porcentual. Aqu es vlido referirnos a la Ojiva Porcentual hacia Arriba y hacia Abajo cuando en el Eje Y se expresan respectivamente los valores de la Frecuencia Relativa Acumulada hacia Arriba ( Ha ) y hacia Abajo ( Ha ), y ambas se pueden dibujar en un mismo sistema de coordenadas cartesianas. La primera ojiva es creciente y la otra es decreciente. Si ambas ojivas se grafican a la vez en un mismo sistema de coordenadas, estas se interceptan en un par ordenado tal que su abscisa se denomina Mediana, concepto que estudiaremos en el siguiente Unidad. Ejemplo: De nuevo consideremos el problema de la Seccin 2.7.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

53

PO RCENTAJE DE CREC IMIENTO DE LO S ENLATADO S PO R PREC IO S PRO MEDIO 120 100 80 60 40 20 0

100 77,78 69, 45 52,78

27, 78 8, 33

1150 1516 1517 1883 1884 2251 2252 2619 2620 2986 2987 3353
P REC IOS P ROMEDIOS

Grfico de Barra: En uno de los ejes de un sistema de coordenadas cartesianas cada intervalo representa una categora asumida por una variable cualitativa, un valor numrico de una variable discreta, o un intervalo de clase de una Distribucin de Frecuencias para Datos Agrupados de cualquier variable cuantitativa. En el otro eje se ubican las respectivas frecuencias asociadas a las categoras, los valores o los intervalos de clase. Luego se dibuja una serie de rectngulos o barras, teniendo cada una a un intervalo como uno de sus lados y a la frecuencia como la longitud del otro lado. Muchas veces estos se ubican separados a igual distancia para mejor efecto visual en caso de tenerse numerosas barras.
4)

Los intervalos deben ser de igual tamao. Las barras son horizontales si los intervalos estn en el Eje Y, y verticales si estn en el Eje X, siendo el Histograma de Frecuencia un caso particular al respecto. Las barras pueden ser simples cuando representan una sola variable, y compuestas cuando en cada intervalo hay tantas columnas como variables a considerar. Ejemplo: Tomemos el diagrama de barras del problema de la Seccin 2.7.
PRECIOS PROMEDIO DE LOS ENLATADOS POR TIPO PRECIOS 2620 2986 1884 2251 1150 1516 0 1 2 3 4 5 6 7 8 9

CANTIDAD DE ENLATADOS

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

54

Interpretacin: Se puede observar que la mayor concentracin de precios de enlatados se encuentra entre Bs. 1.885 y Bs. 2.252, adems que entre Bs. 2.988 y Bs. 3.355 se concentran un segundo grupo de precios de enlatados. Tal como dijimos anteriormente, podemos representar una distribucin de frecuencias asociada a una variable cualitativa dibujando cada cualidad como un intervalo. Ejemplo: La siguiente grfica es tomada de un estudio hecho a un grupo de 25 varones para determinar su grupo sanguneo

Igualmente, cada intervalo del Grfico de Barras puede representar cada uno de los valores asumidos por una variable discreta. Ejemplo: Tomemos el siguiente grfico de barras donde se expresan las calificaciones de un ejercicio evaluado en la escala de 1 a 10 puntos.

4) Grfico a Doble Columna: Lo tenemos cuando a ambos lados de uno de los ejes se ubican columnas que parten de intervalos definidos en
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

55

ese eje, dirigidas cada una en sentido inverso o contrario con respecto a la otra con la que comparte el mismo intervalo (arriba y abajo en direccin vertical, o izquierda y derecha en direccin horizontal), siguindose las mismas indicaciones dadas para los Diagramas de Barras. A cada intervalo parten dos barras en sentido contrario, compartiendo el mismo intervalo aunque ambas barras aparezcan dibujadas en forma separada. En pocas palabras, un Diagrama a Doble Columna est formado por dos diagramas de barras que estn asociados a un mismo eje. Ejemplo: Tomamos una Pirmide Poblacional por aos y sexo de una determinada regin geogrfica.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

56

Del Grfico a Doble Columna se puede hacer un Diagrama de Barras Compuestas para dos variables.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

57

TEMA 3
3.3.2 Diagramas Simblicos Tal como se puede deducir sobre los diagramas que veremos a continuacin, y comparndolos con los anteriormente expuestos, estos ltimos proporcionan ms informacin y permiten una apreciacin estadstica ms rigurosa. Sin embargo, el uso de Diagramas Simblicos una manera fcil de transmitir una visin general de la informacin para el entendimiento del pblico cualquiera sea su nivel. Al respecto, la informacin numrica debe aparecer en el grfico y guardar la correspondiente proporcin con el dato numrico.
1)

Cartograma: Es un mapa de una regin geogrfica a ser usado para presentar informacin estadstica sobre caractersticas consideradas acerca de dicha regin. Tiene la ventaja de exponer ciertos aspectos geogrficos y relaciones espaciales que no se pueden revelar por cualquier otra forma de presentacin. Este tipo de grfico es propio de la ciencia de la Cartografa. Las diferentes maneras de presentar un cartograma son las siguientes: Cada punto o mancha colocada sobre el mapa representa un valor. El mapa se divide por sectores, y cada sector se identifica a travs de un color o sombreado. Sobre el mapa se superpone determinada figura que representa los valores relacionados con el fenmeno a presentar. Ejemplo: En el siguiente cartograma observamos la urbanizacin en el mundo atendiendo a la industrializacin.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

58

2)

Pictograma, Pictgrafo o Diagrama Pictrico: Es un grfico consistente en un dibujo o smbolo que por su forma es alegrico, sugerente o representativo de la naturaleza del dato del fenmeno que se quiere representar. La frecuencia absoluta de cada modalidad se representa por unidades y/o fracciones de un mismo pictograma, siendo este equivalente a una determinada cantidad de observaciones que se debe indicar con claridad en su encabezamiento. La repeticin de un mismo pictograma debe hacerse de igual forma y proporcin, puesto que un observador siempre muestra indecisin en la comparacin de alturas, reas y volmenes si el pictograma se presenta de dos o ms maneras diferentes. El inconveniente que se puede dar es cuando se busca de dibujar una fraccin del pictograma, lo que requiere cierto cuidado. Ejemplo: Consideremos las exportaciones de frutas que ha efectuado El Salvador desde 1.985 hasta 1.988, siendo medidas en colones ().

A veces no se usa la regla anterior, sino otra distinta: el tamao del pictograma suele ser proporcional a la frecuencia que representa, por lo que se requiere asociar la frecuencia a reflejar con las medidas de la figura. Ejemplo: Representamos el nmero de partidos ganados, perdidos o empatados de un equipo.

3)

Diagrama o Grfico Circular (o Diagrama Sectorial o de Pastel): Consiste en considerar el rea completa del crculo como equivalente al
59

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

100% o frecuencia relativa total de la poblacin o muestra a representar, determinado luego el rea cubierta por el sector circular correspondiente a cada frecuencia relativa parcial H de esa misma poblacin o muestra, siendo que la proporcin entre 100% y H es igual a la existente entre los 360 del crculo y el ngulo g limitado por los radios del sector circular mencionado. Por tanto, a g lo podemos hallar, y despus dibujar en el crculo, partiendo de la siguiente interpolacin proporcional o regla de tres: 100 % H 360 g
360 H 100%

g=

Aplicamos este procedimiento tantas veces como cantidades de frecuencias relativas existan en una Distribucin de Frecuencias consideradas para una variable cualitativa o para Datos Agrupados de una variable cuantitativa. Ejemplo: Usando las frecuencias relativas calculadas para el problema de la Seccin 2.7, obtenemos el siguiente diagrama circular.
PORCENTAJE DE ENLATADOS POR NIVELES PRECIOS
INTERVA LOS DE PRECIOS 1.150 - 1.516 1.517 - 1.883 1.884 - 2.251 2.252 - 2.619 2.620 - 2.986 2.987 - 3.354 N DE ENLATA DO S 3 7 9 6 3 8 % 8,33% 19,44% 25,00% 16,67% 8,33% 22,22%

22% 8% 17%

8% 19%

26%

Trace una circunferencia, y mediante el uso de un transportador, y construye una distribucin de frecuencia relativa con los siguientes datos: 15, 20, 35, 10, 8, 12. Resuelve e interprete. 3.4 ACTIVIDADES Individual

Lea con cuidado los contenidos presentados en este Unidad y consulte la bibliografa a fin de ampliar sus conocimientos y considerar la opinin de otros autores sobre el tema.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

60

Grupal Cooperativa Considere las actividades de la unidad II: problemas 1, 2 y 3, as como a los datos tomados en campo, construya manualmente los histogramas de frecuencia, diagramas de barras, diagramas lineales, diagramas de columnas, diagramas circulares y los polgonos aqu estudiados. Analice e interprete estas representaciones grficas. Cules son las diferencias, ventajas y desventajas entre la representacin tabular y la representacin grfica ? . Explique su respuesta. Construya los grficos o diagramas anteriores usando algn paquete computacional. Interprete los siguientes representaciones grficas:

Problema 1:

Problema 2:
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

61

Problema 3:

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

62

Problema 4:

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

63

Problema 5:

Problema 6:
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

64

Problema 7:
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

65

Problema 8:

Actualice grficamente e interprete los problemas anteriores. Incluir los resultados en el portafolio.
66

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

Comunitario

Con los datos recolectados en campo (durante las actividades de Proyecto I o II) y ya ordenados, represntelos utilizando tantos cuadros como los respectivos grficos.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

67

UNIDAD IV: MEDIDAS DE POSICIN, DE TENDENCIA CENTRAL Y DE DISPERSIN OBJETIVO: Analizar e interpretar las caractersticas o propiedades de los datos numricos (posicin, tendencia central y variacin) y sus mediciones descriptivas de resumen. COMPETENCIAS A LOGRAR:
1. 2. 3.

4. 5.
6. 7.

Comprender las propiedades de la posicin y la tendencia central. Calcular diversas Medidas de Posicin y de Tendencia Central para un conjunto de datos simples o agrupados. Interpretar las diferencias entre las diversas Medidas de Tendencia Central para un conjunto de datos simples o agrupados. Entender la importancia de analizar la dispersin de un grupo de datos. Calcular diversas Medidas de Dispersin para un conjunto de datos simples o agrupados. Interpretar las diferencias entre las diversas Medidas de Dispersin para un conjunto de datos agrupados o no agrupados. Usar paquetes computacionales (Excel, SPSS, entre otros) para calcular las medidas de tendencia central y de dispersin.

CONTENIDO:

TEMA 1
4.1 Necesidad del uso de medidas numricas descriptivas

Los mtodos grficos son tiles para obtener una descripcin general rpida de las observaciones y datos recolectados para su presentacin. Hay limitaciones en el uso de esos mtodos pues en caso de no poderse presentar los grficos, harn falta otras tcnicas descriptivas para transmitir una idea de la informacin contenida en aquellos, y por otro lado es difcil usarlos para hacer inferencia estadstica pues en particular el histograma de una muestra no necesariamente va a ser idntico al de la poblacin, y si lo fuesen sera necesario medir el grado de similitud o diferencia entre ambos histogramas. Estas dificultades descriptivas de los mtodos grficos pueden superarse mediante medidas descriptivas numricas. Por eso se desea usar los datos de una muestra para calcular un grupo de esas medidas (estadsticos) con el fin de transmitir una adecuada imagen mental de la distribucin de frecuencias en cuanto a su ubicacin, concentracin y variabilidad, y que sean tiles para hacer inferencia estadstica respecto a la poblacin. Los respectivos estadsticos a estudiarse aqu son las Medidas de Posicin, de Tendencia Central y de Dispersin.
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

68

Obviamente, en base a los planteamientos expuestos al comienzo, aqu los estadsticos estn solamente referidos para cualquier variable cuantitativa X. Adems, para una distribucin de datos simples los procedimientos para el clculo de estas medidas no son los mismos a emplearse en el caso de una distribucin de datos agrupados. Todas las medidas a estudiarse estarn referidas al estudio de muestras, pero se pueden generalizar para poblaciones. 4.2 Medidas de Posicin

Consideraremos un tipo especial de medida que determina cualquier posicin intermedia o lejana dentro de una distribucin de datos. Se denominan Cuantiles o Fractiles, y se utilizan sobre todo para resumir o describir las propiedades de conjuntos grandes de observaciones ordenadas de menor a mayor. Tenemos los Centiles o Percentiles, Deciles y Cuartiles. Los Centiles o Percentiles son 99 valores que dividen al conjunto de datos en 100 partes cada una con igual cantidad de observaciones ordenadas ascendentemente, y se denotan en forma respectiva como P1, P2,, P99. Por debajo de un valor Pi se encuentra el i % de las observaciones, y el (100 i) % son mayores que Pi, i = 1,, 99. Los Deciles son 9 valores que dividen al conjunto de datos en 10 partes cada una con igual cantidad de observaciones ordenadas ascendentemente, y se denotan en forma respectiva como D1, D2,, D9. Por debajo de Di se encuentra el (i 10) % de las observaciones, y el (100 i 10) % son mayores que Di, i = 1,, 9. Por ejemplo, el 30% de las observaciones son menores que D3 y el 70% de estos son mayores que D30. Los Cuartiles son 3 valores que dividen al conjunto de datos en 4 partes cada una con igual cantidad de observaciones ordenadas ascendentemente, y se denotan en forma respectiva como Q1, Q2 y Q3. Por debajo de Qi se encuentra el (i 25) % de las observaciones, y el (100 i 25) % de estas son mayores que Qi, i = 1, 2 ,3. El Primer Cuartil Q1 o Cuartil Inferior es un valor tal que el 25% o la cuarta parte de las observaciones son menores que ese valor, o lo que es lo mismo, el 75% o las tres cuartas partes de las observaciones son mayores que ese valor. El Segundo Cuartil Q2 o Cuartil Medio es un valor tal que el 50% o las dos cuartas partes) de las observaciones son menores que ese valor, o lo que es lo mismo, el 50% o las dos cuartas partes de las observaciones son mayores que ese valor.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

69

El Tercer Cuartil Q3 o Cuartil Superior es un valor tal que el 75% o las tres cuartas partes de las observaciones son menores que ese valor, o lo que es lo mismo, el 25% o la cuarta parte de las observaciones son mayores que ese valor. 1) Cuartiles para una Distribucin de Datos Simples De una distribucin de n datos simples, obtenemos una serie de N observaciones ordenadas de menos a mayor. Para esta serie y un cuartil Qi dado, sea xj la observacin que le es ms cercana de entre las que son menores a Qi, i = 1, 2, 3. La posicin j de esa observacin vara de acuerdo al tipo de cuartil, habiendo aproximadamente j observaciones con valores menores a Qi de acuerdo a esta expresin: i-simo Cuartil Qi:
j= i ( N + 1) , i = 1, 2, 3 4

El valor resultante de esa formulacin para j no necesariamente va a dar un valor entero, por lo que se hace necesario el uso de ciertas reglas al respecto. Regla 1: Si el valor obtenido para j es un nmero entero, se elige como cuartil al valor de la observacin especfica en esa posicin. Entonces Qi = xj. Regla 2: Si el valor obtenido para j se encuentra en el justo medio de dos nmeros enteros (es decir, si ese valor es un nmero fraccionario cuya parte decimal slo consta del dgito 5), se redondea a j por defecto y el cuartil es el promedio de los valores correspondientes a las observaciones xj y xj+1. Entonces Q i =
x j + x j +1 2

Regla 3: Si el valor obtenido para j no es un nmero entero o el valor medio entre dos nmeros enteros (es decir, si ese valor es un nmero fraccionario cuya parte decimal no consta solamente con el dgito 5), se redondea a j por defecto o exceso al nmero entero ms cercano, y el cuartel asume el valor numrico de la observacin que ocupa esa posicin. Entonces Qi = xj. Vemos que el valor de un cuartil no necesariamente va a coincidir con el de alguna observacin, lo cual depende de la cantidad N de observaciones ordenadas. Ejemplo: Suponga un conjunto de observaciones que corresponden a las tasas anuales de inters, establecidas por el BCV, para el rendimiento que reciben los trabajadores por el fideicomiso de sus prestaciones sociales.
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

70

Orden Tasa de Inters (%)

1 10

8 30

10

11

12

13

14 33

15

16

17 38

20,6 28,6 28,6 29,4 29,5 29,9

30,5 30,5 32,1 32,2 32,4

35,2 37.1

Vamos a ejecutar los siguientes pasos para hallar Q1 y Q3.


1)

Se ordenan las observaciones de menor a mayor, definiendo la cantidad de estas, siendo N = 17 en este caso.
x3 x4 x5 x6 x7 x8 30 x9 x10 x11 x12 x13 x14 33 x15 x16 x17 38

Orden Tasa de Inters (%)

x1 10

x2

20,6 28,6 28,6 29,4 29,5 29,9 b)

30,5 30,5 32,1 32,2 32,4

35,2 37.1

Se establece el valor de la posicin j que est asociada al Primer Cuartil Q1 (i = 1).


j= i ( N + 1) 1 (17 + 1) 18 = = = 4,5 4 4 4

Por la Regla 2 tenemos j = 4, y en consecuencia:


Q1 = x 4 + x 5 28,6 + 29,4 58 = = = 29 2 2 2

Interpretacin: El 25% de las personas reciben una tasa de inters menor de 29% por el fideicomiso de sus prestaciones sociales, o el 75% de las personas reciben una tasa de inters mayor a 29%.
c)

Se establece el valor de la posicin j que est asociada al Tercer Cuartil Q3 (i = 3).


j= i ( N + 1) 3 (17 + 1) 54 = = = 13,5 4 4 4

Por la Regla 2 tenemos j = 13, y en consecuencia:


Q3 = x 13 + x 14 32,4 + 33 65,4 = = = 32,7 2 2 2

Interpretacin: El 75% de las personas reciben una tasa de inters menor de 32,7% por el fideicomiso de sus prestaciones sociales, o lo que es igual, el 25% de las personas reciben una tasa de inters mayor a 32,7%.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

71

2) Cuartiles para una Distribucin de Datos Agrupados Dada una distribucin de frecuencias para datos agrupados, a travs del correspondiente polgono de frecuencias relativas acumuladas (u ojiva porcentual) se puede determinar grficamente cualquiera de los cuartiles. El valor porcentual del cuartil (25%, 50% o 75%) se ubica en el Eje Y, y desde all se traza una lnea paralela al Eje X hasta tocar la ojiva en un punto de esta, y desde all trazamos una lnea paralela al Eje Y hasta tocar el Eje X en otro punto que va a ser el cuartil buscado (Q1, Q2 o Q3, respectivamente). En el prximo ejemplo se realizar el clculo solamente para el caso de Q1, y los dems sern resueltos por el estudiante de manera anloga al procedimiento que aplicaremos aqu. Ejemplo: Las edades de los asistentes a un centro ambulatorio de Barrio Adentro en una de las parroquias caraqueas se distribuyeron en 6 grupos. Tabla 1 Edades (aos) N de asistentes 20-29 16 30-39 25 40-49 51 50-59 80 60-69 20 70-79 8 Para hallar el Primer Cuartil Q1 ejecutaremos los siguientes pasos. Partiendo de la Tabla 1, construimos una distribucin de frecuencias absolutas acumuladas para datos agrupados en k = 6 intervalos de clase que contienen un total de N = 200 observaciones.
a)

Tabla 2
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

72

N de clases 1 2 3 4 5 6

III Nmero de Edades Nmero de asistentes (aos) asistentes acumulados 20-29 16 16 30-39 25 41 40-49 51 92 50-59 80 172 60-69 20 192 70-79 8 200 Totales N = 200
N de observaciones 4

II

b)

Determinamos la cantidad aproximada

menores a Q1, y si su valor no resulta entero, se redondea con las mismas reglas aplicadas a la posicin j es el clculo de los cuarteles para observaciones ordenadas.
N 200 = = 50 4 4

En la Tabla 2, a medida que avanzamos en la Columna III (frecuencias acumuladas) siguiendo el nmero de clase, vamos sumando o acumulando crecientemente la cantidad de observaciones de cada intervalo hasta hallar el nmero j de clase tal que Fa j 1
N Fa j , por lo que el Primer Cuartil Q1 est ubicado en 4

el intervalo de clase Lij Lsj de la Columna I, siendo menores a Q1 las observaciones de este y de los otros intervalos anteriores, estando contabilizadas tales observaciones en la Columna II (frecuencias absolutas). El valor encontrado para j es uno fijo o constante de entre los k asociados a cada clase. Las condiciones anteriores se cumplen para la clase j = 3 pues Faj-1 = Fa2 = 41, Faj = Fa3 = 92, y 41 50 92. Entonces Q1 se encuentra en el intervalo Li3 Ls3 = 40 49.
c)

Recordemos que Q1 siempre va a estar dentro del intervalo Lij


N 4

Lsj. Si Faj-1 = respectivamente.

o Faj =

Si Fa j 1

N , entonces Q1 = Lij o Q1 = Lsj, 4 N N < < Fa j , entonces parte de las 4 4

observaciones menores a Q1 se encuentran las Faj-1 observaciones ubicadas entre los intervalos de clase anteriores a Lij Lsj, por lo que en este ltimo hay
N Fa 4
j 1

observaciones mayores que Lij y


73

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

menores que Q1, y las cuales son parte de las Fj observaciones pertenecientes al intervalo Lij Lsj. Por otra parte, en el intervalo Lij Lsj de tamao Ic = Lsj Lij tenemos que cada una de las Fj observaciones contenidas en ese intervalo ocupa all un espacio de tamao F unidades de longitud. j Luego, la distancia que separa a Lij y Q1 es el espacio que ocupan las
N Fa j 1 observaciones ubicadas entre ambos valores, o sea 4 N Ic Q1 Li j = Fa j -1 . Por lo tanto, la formulacin para Q1 es: 4 Fj
Ic

N Fa j -1 4 Ic Q1 = Li j + Fj

En general, existen aproximadamente

i N observaciones 4

menores que el cuartil Qi, cuya expresin correspondiente es:


i N Fa j -1 4 Ic , i = 1, 2, 3 Q i = Li j + Fj

Para nuestro ejemplo, vemos que Fa 2 < cumple que 41 < 50 < 92. Entonces hay

N < Fa 3 pues se 4

N Fa 2 = 50 41 = 9 4

observaciones entre Li3 y Q1, las cuales se encuentran en el intervalo Li3 Ls3 = 40 49 de tamao Ic = Ls3 Li3 = 49 40 = 9. El espacio ocupado en ese intervalo por cada una de las F3 = 51 observaciones es F = 51 = 0,17. Entonces la distancia entre Li3 y 3 Q1 es
N Ic Fa 2 = 1,53, y as: 4 F3
Ic 9

N Fa 2 4 Ic Q1 = Li 3 + F3

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

74

200 41 4 9 = 40 + 1,53 = 41,53 42 Q1 = 40 + 51

Interpretacin: El 25% de las personas asistentes al ambulatorio de Barrio Adentro tienen una edad promedio menor de 42 aos aproximadamente. Cundo debe usarse los Cuantiles o Fractiles en cualquiera de los casos anteriores? Estas medidas brindan informacin acerca de la concentracin y variacin de una serie de observaciones y datos, pero se necesitan varias mediciones de esa especie para tener una descripcin adecuada de la serie. En funcin de tener la menor cantidad de mediciones posibles, generalmente se usan los Cuartiles para tal propsito descriptivo.

TEMA 2
4.3 Medidas de Tendencia Central

Al estudiarse la informacin estadstica mediante los grficos cartesianos, en el comportamiento de los datos con respecto a sus respectivas frecuencias se observan valores ms comunes que otros, y en general se aprecia una tendencia de agrupacin en el vecindario de los valores ms repetidos, habiendo as mayor densidad de frecuencia en la parte central de los grficos. El problema es hallar el valor ms representativo de una serie de valores, es decir, si tenemos una cantidad que vara en el espacio o en el tiempo, se necesita obtener su grado o nivel generalmente predominante. Ese valor lleva implcita la idea de variacin, pero esta se desprecia pues slo interesa obtener el que ms se impone, representndose as una gran cantidad de valores unitarios por uno slo. Las Medidas de Tendencia Central son los valores ms representativos de una distribucin de datos y frecuencias, ubicndoseles en su zona central. Cada medida es un valor tpico descriptivo en la que un conjunto de datos muestra una tendencia bien determinada a agruparse o aglomerarse alrededor de cierto punto central. Estas medidas son la Media Aritmtica (y en particular la Media Ponderada), la Mediana, la Moda, el Eje Medio y el Rango Medio. A veces cada una de estas medidas es denominada promedio, nombre que en general se reserva para la Media Aritmtica. 1) MEDIA ARITMTICA (MEDIA O PROMEDIO)
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

75

1.1)

Media para una Distribucin de Datos Simples

Partiendo de una serie de observaciones asociada a esa distribucin, definimos la Media como la suma de todas las observaciones dividida entre la cantidad N de estas. En virtud de las propiedades de la suma, el orden de las observaciones no altera el resultado para la Media. La formulacin de la Media es:

X=

x
i =1

x 1 + x 2 + ... + x N N

La Media es un valor que equilibra los valores de las observaciones que le son mayores y menores, y es sensible a mediciones extremas que no estn equilibradas a su alrededor. Ejemplo: El gerente de un local de Mercal desea estudiar la concurrencia a la tienda, y encuentra que 295, 1.002, 941, 768, y 1.283 personas entraron a la tienda durante los pasados cinco das. El total de personas que entr al Mercal durante los cinco das anteriores es de 295 + 1.002 + 941 + 768 + 1.283 = 4.289. La Media o promedio de personas que diariamente entraron en la tienda es de 4.289 5 = 857,8, que es aproximadamente 858 personas. Identificaremos los valores a emplear en la formulacin. x1 = 295 personas x2 = 768 personas x3 = 941personas Luego: x4 = 1.002 personas x5 = 1.283 personas N = 5 observaciones o datos

X=
X =

x
i =1

x 1 + x 2 + ... + x 5 5

295 + 768 + 941 + 1.002 + 1.283 4.289 = = 857,8 858 5 5

Interpretacin: Esto significa que en promedio aproximadamente 858 personas diariamente en esos cinco das.

entraron

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

76

Diga si en el ejemplo de Mercal la media est afectada por los valores extremos. Media Ponderada: Es la suma de los productos obtenidos de cada valor ponderado por su respectiva ponderacin de acuerdo al fenmeno estudiado, dividido entre la suma de todas las ponderaciones. Las ponderaciones pueden ser las k frecuencias relativas asociadas a las frecuencias absolutas de las clases de una variable cualitativa. La formulacin es:

XP =

p
j =1 k j =1

Fj
j

= p j F j pues
j =1

p
j =1

= 100% = 1

Ejemplo: En una clase de un colegio pblico hay 20 alumnos de primer grado, 18 de segundo y 12 de tercero. Si los estudiantes de primero representan el 40%, los de segundo el 36% y los de tercero el 24% del total existente, cuntos estudiantes hay en promedio en los tres salones de clase? Cursos Primer Grado Segundo Grado Tercer Grado Total Alumnos Porcentajes 20 40%=0,40 18 36%=0,36 12 24%=0,24 50 100%=1,00

Para k = 3 categoras, identificamos los valores sealados. F1 = 20 alumnos, F2 = 18 alumnos, F3 = 12 alumnos, La Media Ponderada es:
X P = p j F j = ( 0,40 20) + ( 0,36 18) + ( 0,24 12) = 17,36 17
j =1 3

p1 = 40% = 0,40 p2 = 36% = 0,36 p3 = 24% = 0,24

Interpretacin: Aproximadamente un promedio de 17 alumnos estudian en cada uno de los tres primeros grados.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

77

En una distribucin de frecuencias para n datos simples obtenidos de N observaciones asociadas a una variable cuantitativa, las ponderaciones vienen siendo sus respectivas frecuencias absolutas. La formulacin es:

X =

f j X j
j =1

f
j =1

f
j =1

X j pues

f
j =1

=N

La Media Aritmtica de una serie de N observaciones es la misma Media Ponderada de la distribucin de frecuencias para n datos simples obtenidos de la serie mencionada. Esta ltima es ventajosa utilizarla cuando abundan numerosas observaciones reflejadas en datos con frecuencias elevadas. Ejemplo: Las edades de los integrantes de una seccin de 20 estudiantes de una seccin de estudiantes de la UBV se obtuvieron luego de aplicrseles una encuesta. Estos son las N = 20 observaciones ordenadas crecientemente por fila. x1 = 18 x6 = 23 x11 = 30 x16 = 37 x2 = 18 x7 = 26 x12 = 34 x17 = 37
20

x3 = 21 x8 = 26 x13 = 34 x18 = 37

x4 = 23 x9 = 26 x14 = 37 x19 = 37

x5 = 23 x10 = 26 x15 = 37 x20 = 40

La Media Aritmtica es:


X =
X =

x
j =1

20

x 1 + x 2 + ... + x 20 20

18 + 18 + ... + 40 590 = = 29,5 30 20 20

De esta serie de observaciones obtenemos la siguiente distribucin de frecuencias absolutas para n = 8 datos simples. X f X1 18 2 f1 X2 21 1 f2 X3 23 3 f3 X4 26 4 f4 X5 30 1 f5 X6 34 2 f6 X7 37 6 f7 X8 40 1 f8

La Media Ponderada es:

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

78

X =
X =

f
j =1

Xj =

20

f1 X 1 + f 2 X 2 + ... + f8 X 8 20

( 2 18) + (1 21) + ... + (1 40) = 590


20 20

= 29,5 30

Interpretacin: La edad promedio de cada estudiante de la seccin es de aproximadamente 30 aos. Nota: En el ejemplo de la concurrencia de personas a Mercal, si aplicamos la frmula de la Media Ponderada resulta que fj = 1, j = 1,, 5.
1.2)

Media para datos agrupados en k clases Se calcula de manera similar a la Media Ponderada, estando las N observaciones distribuidas en k intervalos de clase, para los cuales las correspondientes marcas de clase son los valores a ser ponderados con las respectivas frecuencias absolutas. La formulacin es:

X =

F
j =1

j k

Xm j =
j

F
j =1

Xm j N pues

f
j =1

F
j =1

=N

Ejemplo: A partir de la Tabla 1 (las edades de los asistentes a un centro ambulatorio de Barrio Adentro) construimos la Tabla 3 de la siguiente manera: a) Calculamos la edad promedio (marca de clase) de los lmites de edades de cada grupo (Columna II). Calculamos el nmero de asistentes acumulados (frecuencias acumuladas) en cada clase de edades (Columna IV).
b)

Calculamos el producto de la edad promedio de cada clase (Columna II) por el nmero de asistentes de dichas clases (Columna III), se suman esos valores obtenidos para cada clase (Columna V), y tal resultado se divide entre el total de asistentes, obtenindose el resultado de la Media.
c)

Tabla 3
N de I Edades II Edad III Nmero IV Nmero V Edad
79

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

clases 1 2 3 4 5 6

(aos) 20-29 30-39 40-49 50-59 60-69 70-79 Totales

Promedio 24,5 34,5 44,5 54,5 64,5 74,5

de asistentes 16 25 51 80 20 8 N = 200

de asistentes acumulados 16 41 92 172 192 200

de asistentes 392 862,5 2.269,5 4.360 1.290 596 9.770

Nmero

Promedio

La Media es:

X=
X=
X =

F
i =1

Xi

200

F1 X 1 + F2 X 2 + ... + F6 X 6 200
200

(16 24,5) + ( 25 34,5) + ( 51 44,5) + ( 80 54,5) + ( 20 64,5) + ( 8 74,5)

392 + 862,5 + 2.269,5 + 4.360 + 1.290 + 596 9.770 = = 48,85 49 200 200

Interpretacin: Cada uno de los 200 pacientes que asistieron al ambulatorio de Barrio Adentro tiene una edad promedio aproximada de 49 aos. Nota: No se puede calcular la Media Aritmtica donde existen clases abiertas (ejemplo: 70 aos y ms). Lo recomendable es usar la Mediana. En cualquier caso, la Media Aritmtica para datos agrupados puede asumir un valor igual o muy cercano al de la Media Aritmtica para la serie de observaciones de donde se extrajeron los datos agrupados. Por otra parte, se redondean esos valores para tal medida de tendencia central segn la variable empleada, como en los anteriores ejemplos sobre edades. Cundo debe usarse la Media Aritmtica en cualquiera de los casos anteriores? Debido a que su clculo se basa en todas las observaciones, cualquier valor extremo afecta mucho la media aritmtica. Se debe usar cuando no este afectada por los valores extremos. 2) MEDIANA

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

80

Es un valor MD que divide en dos grupos a una distribucin de datos, de tal manera que uno de los grupos tiene 50% de las observaciones menores a MD y el otro grupo posee 50% de las que son mayores a dicho valor. Es decir, ambos grupos tienen igual cantidad de observaciones. Esta Medida de Tendencia Central es tambin una Medida de Posicin pues por su definicin coincide con el Segundo Cuartil Q2, o sea, MD = Q2. 2.1)Mediana para una Distribucin de Datos Simples De una distribucin de n datos simples obtenemos una serie de N observaciones ordenadas de menos a mayor. Para esta serie, sea xj la observacin ms cercana a la Mediana MD de entre las que son menores a dicho valor. Dependiendo de N, el valor de MD puede o no puede coincidir con el de xj, existiendo reglas que permiten clarificar este hecho. Regla 1: Si la cantidad N de observaciones es impar, entonces la Mediana est representada por el valor numrico de la observacin correspondiente a la posicin j =
N +1 . Entonces MD = xj. 2

Ejemplo: En un hospital pblico de la ciudad de Caracas, los tiempos en minutos que necesitaron varios pacientes para ser atendidos en las diferentes consultas fueron: 50, 52, 57, 135, 78, 50, 212, 50, 120. Cul es la Mediana de los tiempos? Procederemos a ejecutar los siguientes pasos: a. Se ordenan e identifican las observaciones de menor a mayor. x1 50
b.

x2 50

x3 50

x4 52

x5 57

x6 x7 x8 x9 78 120 135 212

Se establece la posicin de la Mediana de acuerdo a la cantidad de observaciones. En nuestro caso, N = 9, y por la Regla 1 tenemos que
j= N + 1 9 + 1 10 = = =5 2 2 2

MD = xj = x5 = 57 Interpretacin: El 50% de los pacientes fueron atendidos aproximadamente en un tiempo promedio menor a 57 minutos, o que el 50% de los pacientes fueron atendidos aproximadamente en un tiempo promedio mayor a 57 minutos.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

81

Regla 2: Si la cantidad N de observaciones es par, entonces consideramos que la Mediana est entre las dos observaciones xj y xj+1 que estn en las posiciones centrales las observaciones ordenadas, siendo
N . La Mediana es la semisuma de los valores numricos de estas dos 2 x j + x j +1 observaciones. Entonces MD = . 2 j =

Ejemplo: En un hospital pblico de la ciudad de Caracas, los tiempos en minutos que necesitaron varios pacientes para ser atendidos en las diferentes consultas fueron: 50, 52, 57, 135, 78, 50, 212, 50, 60, 120. Cul es la Mediana de los tiempos? Interprete. Procederemos a ejecutar los siguientes pasos: a) x1 50
b)

Se ordenan e identifican las observaciones de menor a mayor. x2 50 x3 50 x4 52 x5 57 x6 60 x7 x8 x9 x10 78 120 135 212

Se establece la posicin de la Mediana de acuerdo a la cantidad de observaciones. En nuestro caso, N = 10, y por la Regla 2 tenemos que
j= N 10 = =5 2 2

MD =

x j + x j +1 2

x 5 + x 6 57 + 60 117 = = = 58,5 2 2 2

Interpretacin: Esto significa que el 50% de los pacientes fueron atendidos aproximadamente en un tiempo menor a 58,5 minutos en promedio, o que el 50% de los pacientes fueron atendidos aproximadamente en un tiempo mayor a 58,5 minutos en promedio. 2.2)Mediana para una Distribucin de Datos Agrupados Dada una distribucin de frecuencias para datos agrupados en k clases, a travs del correspondiente polgono de frecuencias relativas acumuladas (u ojiva porcentual) se puede determinar grficamente la Mediana, cuyo valor porcentual (que es 50%) se ubica en el Eje Y, desde all se traza una lnea paralela al Eje X hasta tocar la ojiva en un punto de esta, y luego partiendo de ese punto trazamos una lnea paralela al Eje Y hasta tocar el Eje X en otro punto que va a ser la Mediana. Ese valor viene siendo la abscisa del punto de interseccin de la ojiva porcentual hacia
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

82

arriba con la ojiva porcentual hacia abajo, asociadas respectivamente a las frecuencias relativas acumuladas hacia arriba ( Ha ) y hacia abajo ( Ha ). La manera como calcularemos a MD es similar al procedimiento efectuado para el Primer Cuartil Q1, pues ya dijimos que la Mediana es igual al Segundo Cuartil Q2. Ejemplo: Las edades de los asistentes a un centro ambulatorio de Barrio Adentro en una de las parroquias caraqueas se distribuyeron en 6 grupos. Tabla 1 Edades (aos) N de asistentes 20-29 16 30-39 25 40-49 51 50-59 80 60-69 20 70-79 8 Para hallar la Mediana ejecutaremos los siguientes pasos. Partiendo de la Tabla 1, construimos una distribucin de frecuencias absolutas acumuladas para datos agrupados en k = 6 intervalos de clase que contienen un total de N = 200 observaciones.
a)

N de clases 1 2 3 4 5 6

III Nmero de Edades Nmero de asistentes (aos) asistentes acumulados 20-29 16 16 30-39 25 41 40-49 51 92 50-59 80 172 60-69 20 192 70-79 8 200 Totales N = 200
N 2

Tabla 2 II

b)

Determinamos la cantidad aproximada

N +1 2

de

observaciones menores a MD si N es par o impar, respectivamente.


N 200 = = 100 2 2
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

83

En la Tabla 2, a medida que avanzamos en la Columna III siguiendo el nmero de clase, vamos sumando o acumulando crecientemente la cantidad de observaciones de cada intervalo hasta hallar el nmero j de clase tal que Fa j 1
N Fa j , por lo que la 2

Mediana MD est ubicada en el intervalo de clase Lij Lsj de la Columna I, siendo menores a MD las observaciones de este y de los otros intervalos anteriores, estando contabilizadas tales observaciones en la Columna II. El valor encontrado para j es uno fijo o constante de entre los k asociados a cada clase. Las condiciones anteriores se cumplen para la clase j = 4 pues Faj-1 = Fa3 = 92, Faj = Fa4 = 172, y 92 100 172. Entonces MD se encuentra en el intervalo Li4 Ls4 = 40 49.
c)

Recordemos que MD siempre va a estar dentro del intervalo


N N o Faj = , entonces MD = Lij o MD = Lsj, 2 2 N N Si Fa j 1 < < Fa j , como parte de las 2 2

Lij Lsj. Si Faj-1 = respectivamente.

observaciones menores a MD se encuentran las Faj-1 observaciones ubicadas entre los intervalos de clase anteriores a Lij Lsj, por lo que en este ltimo hay
N Fa 2
j 1

observaciones mayores que Lij y

menores que MD, y las cuales son parte de las Fj observaciones pertenecientes al intervalo Lij Lsj. Por otra parte, en el intervalo Lij Lsj de tamao Ic = Lsj Lij tenemos que cada una de las Fj observaciones contenidas en ese intervalo ocupa all un espacio de tamao F unidades de longitud. j Luego, la distancia que separa a Lij y MD es el espacio que ocupan las
N Fa 2
j 1

Ic

observaciones ubicadas entre ambos valores, o sea


Ic

MD Lij = 2 Fa j -1 F . Por lo tanto, la formulacin para MD j es: N

N Fa j -1 2 Md = Li + Ic j Fj

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

84

Para nuestro ejemplo, vemos que Fa 3 < cumple que 92 <100 < 172. Entonces hay

N < Fa 4 pues se 2

N Fa 3 = 100 92 = 8 2

observaciones entre Li4 y MD, las cuales se encuentran en el intervalo Li4 Ls4 = 50 59 de tamao Ic = Ls4 Li4 = 59 50 = 9. El espacio ocupado en ese intervalo por cada una de las F4 = 80 observaciones es MD es
Ic 9 = = 0,11. Entonces la distancia entre Li4 y F4 80

N Ic Fa 3 = 0,9, y as: 2 F4

N Fa 3 2 Ic MD = Li 4 + F4

200 92 2 9 = 50 + 0,9 = 50,9 51 MD = 50 + 80

Interpretacin de la Mediana: El 50% de las personas que asistieron al ambulatorio de Barrio Adentro tienen una edad promedio aproximadamente menor a 51 aos. Cundo debe usarse la Mediana en cualquiera de los casos anteriores? Siempre que una observacin extrema est presente, es adecuado usar la mediana en lugar de la media para describir el conjunto de observaciones o de datos agrupados. Se requiere tener ordenadas las observaciones al tratar de hallar la Mediana, la cual no se ve influenciada por los valores extremos existentes en aquellas, y se puede calcular en distribuciones abiertas, donde no se puede encontrar la Media, la cual no depende del orden de las observaciones.

3)

MODA

3.1)Moda para una Distribucin de Datos Simples De una distribucin de n datos simples, obtenemos una serie de N observaciones ordenadas de menos a mayor. Para esta serie, la Moda Mo
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

85

es el valor de aquella observacin que aparece con mayor frecuencia (el que ms se repite o el ms tpico). Si son varios valores distintos los que se repiten a la vez con una misma frecuencia mayor que las de otras observaciones, entonces la serie aqu dada es pluri-modal. Ejemplo: En un hospital pblico de la ciudad de Caracas, los tiempos en minutos que necesitaron varios pacientes para ser atendidos en las diferentes consultas fueron: 50, 52, 57, 135, 78, 50, 212, 50, 60, 120. Para hallar la Moda, procederemos a ejecutar los siguientes pasos: a) x1 50
b)

Se ordenan e identifican las observaciones de menor a mayor. x2 50 x3 50 x4 52 x5 57 x6 60 x7 x8 x9 x10 78 120 135 212

Se observa la observacin que ms se repite y ese valor es la Moda. Para nuestro ejemplo, la Moda es Mo = 50 pues ese valor es repetido tres veces por las observaciones x1, x2 y x3. Interpretacin: El mayor tiempo de espera de los pacientes es un promedio de aproximadamente 50 minutos. Si en la serie de N observaciones estas son numerosas y se repiten muchos valores, construimos la respectiva distribucin de frecuencias absolutas para n datos simples, y la moda ser el valor del dato que tenga la mayor frecuencia. Ejemplo: Las edades de los 20 integrantes de una seccin de estudiantes de la UBV se obtuvieron luego de aplicrseles una encuesta. 34 23 fila. x1 = 18 x6 = 23 x11 = 30 x16 = 37 x2 = 18 x7 = 26 x12 = 34 x17 = 37 x3 = 21 x8 = 26 x13 = 34 x18 = 37 x4 = 23 x9 = 26 x14 = 37 x19 = 37 x5 = 23 x10 = 26 x15 = 37 x20 = 40 40 37 30 26 37 23 26 34 18 37 37 21 18 37 26 37 26 23

Estos son las N = 20 observaciones ordenadas crecientemente por

De esta serie de observaciones obtenemos la siguiente distribucin de frecuencias absolutas para n = 8 datos simples. X X1 18 X2 21 X3 23 X4 26 X5 30 X6 34 X7 37 X8 40
86

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

2 f1

1 f2

3 f3

4 f4

1 f5

2 f6

6 f7

1 f8

Vemos que Mo = X7 = 37 pues ese es el dato cuya frecuencia f7 = 6 es la mayor de todas. Interpretacin: El grupo de 6 estudiantes de 37 aos cada uno es por edad el ms numeroso de la seccin. 3.2)Moda para una Distribucin de Datos Agrupados La Moda Mo es el valor alrededor del cual los datos tienden a concentrarse ms densamente. Est localizada en el intervalo de clase de mayor frecuencia, y se le denomina Intervalo Modal. Aunque ahora veremos una formulacin para la Moda, en algunos textos se le toma como la marca de clase con mayor ordenada en un polgono de frecuencia (absoluta). Sin embargo, para la Moda no siempre se tiene un valor exacto sino aproximado, el cual ser ms exacto a medida que disminuya el tamao del intervalo de clase y aumente la cantidad de observaciones O datos. Es posible que la distribucin que los agrupe sea pluri-modal. Ejemplo: Construimos la Tabla 4 de la Tabla 1 donde aparecen contabilizados los pacientes por edades atendidos en un Unidad de Barrio Adentro. Tabla 4 I II Edades Nmero de (aos) asistentes 20-29 16 30-39 25 40-49 51 50-59 80 60-69 20 70-79 8 Totales N = 200

N de clases 1 2 3 4 5 6

Procederemos a ejecutar los siguientes pasos. Primero hay que encontrar EL Intervalo Modal en el cual esta situada la Moda, siendo aquel que tiene la mxima frecuencia absoluta. En nuestro ejemplo representado por la Tabla 4, la Clase Modal es j = 4 pues la mayor frecuencia viene dada por Fj = F4 = 80 (Columna II), y el Intervalo Modal (Columna I) es Lij Lsj = Li4 Ls4 = 50 59.
a)
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

87

A partir de la Columna II calculamos el valor d1 como la diferencia entre la frecuencia absoluta Fj del Intervalo Modal y la frecuencia absoluta Fj-1 que le antecede (o sea, d1 = Fj Fj-1), y tambin determinamos el valor d2 que se obtiene como la diferencia entre la frecuencia absoluta del Intervalo Modal y la frecuencia absoluta Fj+1 que le sucede (o sea, d2 = Fj Fj+1). En particular, tenemos Fj-1 = F3 = 51, Fj+1 = F5 = 20, y por tanto d1 = 80 51= 31 y d2 = 80 20 = 60.
b)

A Intervalo Modal Lij Lsj le calculamos su longitud Ic = Lsj Lij, y con el resto de los valores mencionados anteriormente hallamos la Moda Mo con la siguiente formulacin:
c)

Mo = Li j +

d1 Ic d1 + d 2

Como Ic = Ls4 Li4 = 59 50 = 9, resulta:


Mo = Li 4 + d1 Ic d1 + d 2

Mo = 50 +

31 9 = 50 + 0,34 9 = 50 + 3,06 = 53,06 53 31 + 60

Interpretacin de la Moda: Gran parte de los asistentes al centro ambulatorio tienen una edad promedio de aproximadamente 53 aos. Cundo debe usarse la Moda en cualquiera de los casos anteriores? Cuando queremos conformarnos con tener una idea superficial de la concentracin de la distribucin, la Moda se usa slo para fines descriptivos porque vara ms entre distintas muestras que otras medidas de tendencia central. La ocurrencia de algn valor extremo no afecta a la Moda al igual que la Mediana. 4) EJE MEDIO

Es una medida de resumen que se usa para superar posibles problemas que introducen los valores extremos de las observaciones o datos. El Eje Medio EM se obtiene con la semisuma del Primer y Tercer Cuartil, procedimiento idntico tanto para datos simples o agrupados. La formulacin es:

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

88

EM =

Q1 + Q 3 2

Ejemplo: Calcularemos el Eje Medio para las tasas de inters del BCV estudiadas cuando se calcularon el Primer y Tercer Cuartil cuando tenemos una serie ordenada de observaciones. Como Q1 = 29% y Q3= 32,7%, entonces:
EM = Q1 + Q 3 29 + 32,7 61,7 = = = 30,85 2 2 2

Interpretacin: Todas las personas reciben por el fideicomiso de sus prestaciones sociales una tasa promedio aproximada de 30,85%. 5) RANGO MEDIO

El Rango Medio RM se obtiene con la semisuma del valor ms pequeo y el valor ms grande de un conjunto de N observaciones ordenadas ascendentemente, o como la semisuma del lmite inferior y el lmite superior del primer y ltimo intervalo de clase, respectivamente, cuando tenemos datos agrupados en k clases. En el primer caso, al comparar la serie de N observaciones con los n datos simples, tenemos que X1 = x1 y Xn = xN. Las correspondientes formulaciones son: Para N observaciones ordenadas o n datos simples: Para datos agrupados en k clases:
RM = x1 + x N X 1 + X n = 2 2 Li + Ls k RM = 1 2

Ejemplo: Los nmeros de visitantes durante los ltimos 10 aos a la cueva del Gucharo fueron los que se presentan a continuacin. Determine el Rango Medio del nmero de visitantes: 690, 610, 540, 690, 560,630, 690, 670, 690, 670. a) Se ordenan e identifican las observaciones de menor a mayor.

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 540 560 610 630 670 670 690 690 690 690 Se busca el menor y el mayor valor del conjunto observaciones. Para las N = 10 observaciones ya ordenadas, tenemos que x1 = 540 y xN = x10 = 690.
b)

c)

Se obtiene el Rango Medio.


89

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

RM =

x 1 + x 10 540 + 690 = = 615 2 2

Cundo debe usarse el Rango Medio en cualquiera de los casos anteriores? Cuando se procesan datos donde no se presente un valor extremo, lo que hace que se utilice poco este promedio 4.4 ACTIVIDADES (PARA OBSERVACIONES O DATOS SIMPLES) Individual Lea con cuidado los contenidos presentados en relacin a medidas de tendencia central para observaciones o datos no agrupados, y consulte la bibliografa a fin de ampliar sus conocimientos y considerar la opinin de otros autores sobre el tema. Grupal Cooperativo

Considera la tabla a continuacin y calcule el promedio, la Mediana, la Moda, el Rango Medio y El Eje Medio en el ltimo ao. Interprete cada una de las medidas. Adicionalmente, actualice la tabla y establezca diferencias a partir del clculo del promedio de Reservas Probadas de Petrleo Crudo para cada pas y por regin (Norte Amrica, Latinoamrica, .). Incluya los resultados en el portafolio.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

90

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

91

El siguiente cuadro muestra a las personas en pobreza extrema por entidad federal correspondientes al primer semestre del ao 2.004.
Entidades Federales Zulia Carabobo Miranda Lara Aragua Bolvar Distrito Capital Sucre Tchira Portuguesa Anzotegui Mrida Falcn Barinas Gurico Trujillo Monagas Apure Yaracuy Cojedes Vargas Nueva Esparta Delta Amacuro Amazonas Personas en pobreza extrema 905.332 504.884 479.470 641.034 350.651 423.549 252.287 440.327 315.286 299.222 198.597 212.517 242.757 282.831 211.126 196.845 199.024 179.149 166.633 82.257 75.408 49.713 27.201 40.293

Nota: Ordenada por el total de pobres Fuente: INE / Unidad de Medicin de Condiciones de Vida 1. Cul es la cantidad media de personas pobres por entidad federal: la Mediana, el Rango Medio, el Eje Medio? 2. Diga cul de las promedios refleja la realidad de las personas pobres extremos. 3. De acuerdo a los valores descritos en el cuadro, la Media de las personas en pobreza extrema est afectada por algunas entidades federales? Es la mejor medida? 4. Qu medidas tomara para ir disminuyendo el nmero de personas en pobreza extrema que se encuentran en las grandes entidades federales?

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

92

Durante un diagnstico realizado en una comunidad de los paramos del Estado Mrida, se aplic una encuesta con el fin de conocer la edad de los habitantes de una comunidad y encontraron los siguientes datos 77 34 18 44 63 41 84 58 38 58 54 53 52 51 59 62 54 63 56 62 36 62 26 50

Calcule: la Media, Mediana, Rango Medio, Primer Cuartil, Tercer Cuartil y Eje Medio. Comunitario Con los datos recopilados en su trabajo de campo correspondiente a Proyecto I (II), siga el siguiente tratamiento: 1. Revselos. Agrpelos ordenados de mayor a menor. 2. Calcule Media, Mediana, Rango Medio, Primer Cuartil, Tercer Cuartil y Eje Medio. Interprete los resultados y agrguelo a su portafolio. 4.5 ACTIVIDADES (PARA DATOS AGRUPADOS) Individual

Lea con cuidado los contenidos presentados en relacin a las medidas de posicin y de tendencia central para datos agrupados, y consulte la bibliografa a fin de ampliar sus conocimientos y considerar la opinin de otros autores sobre el tema.

Grupal Cooperativo Los sueldos de una muestra de la poblacin de Caracas revelaron los siguientes datos, organizados en una distribucin de frecuencias. Sueldo (Miles de Bs.) 100-199 200-299 300-399 400-499 500-599 600-699 700-799 800-899 900-999 Nmero de personas 616 125 151 80 20 48 25 7 2

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

93

Determine Media Aritmtica, Mediana, Moda, Primer Cuartil, Tercer Cuartil. Interprete las medidas anteriores. Qu sueldo menor en promedio gana el 50% de la poblacin? Compare Media Aritmtica, Mediana y Moda, y diga algunas conclusiones.

Se tiene de una muestra de los tiempos que necesitaron 42 personas de una cooperativa para ensamblar un armario. Tiempo (en minutos) 1-3 4-6 7-9 10-12 13-15 16-18 Nmero de personas 4 8 16 9 5 2

Determine e interprete la Media Aritmtica, la Mediana, la Moda y el Primer Cuartil. Busque informacin reciente de tablas de datos agrupados en el rea de hidrocarburos. Interprete la informacin y agrgala al portafolio.

TEMA 3
4.6 Medidas de Dispersin

Las Medidas de Tendencia Central carecen de significacin por s solas pues de nada vale conocer nicamente el comportamiento central de una serie de valores si se desconoce la manera como se alejan o se acercan esos valores con respecto a un valor representativo de estos y obtenido calculando la apropiada medida de tendencia central. Lo anterior implica la necesidad de caracterizar numricamente la dispersin, la cual se entiende como la manera en que los valores de una serie difieren unos de otros. La dispersin ser mayor o menor de acuerdo a la magnitud de esas diferencias. Por lo tanto, los resultados que obtenemos por las Medidas de Tendencia Central tienen mayor significado con la ayuda de las Medidas de Dispersin o Variabilidad, las cuales son complemento de aquellas y determinan la homogeneidad o heterogeneidad de los conjuntos de datos referidos a un valor de tendencia central tomado como referencia.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

94

La variabilidad no se puede eliminar pero s reducir. domesticamos al azar y aprendemos a vivir bajo incertidumbre. Las Medidas de Dispersin se dividen en dos grupos.

Controlndola

Medidas de Dispersin Absoluta: sus valores vienen expresados en las mismas unidades de medicin del conjunto de observaciones o datos a ser estudiado, y slo hacen referencia al conjunto en cuestin. Las medidas ms importantes son el Rango, la Varianza y la Desviacin Estndar. Medidas de Dispersin Relativa: sus valores se obtienen de los cocientes fraccionales entre medidas de dispersin absoluta y de tendencia central, y como ambas vienen expresadas en las mismas unidades de medicin, las medidas de dispersin relativa asumen valores abstractos o porcentuales. Este hecho nos permite comparar la dispersin en dos o ms conjuntos de datos para determinar el que tiene mayor o menor dispersin. Sin estas medidas de dispersin relativa, la comparacin sera imposible en caso de haber dos conjuntos con distintas unidades de medicin, o que tengan un mismo valor para una medida de dispersin absoluta pero habiendo a la vez distinta variabilidad de sus respectivas observaciones o datos con respecto a una medida de tendencia central. La ms importante entre las medidas de dispersin relativa es la del Coeficiente de Variacin.

1) RANGO, RECORRIDO U OSCILACIN TOTAL

AMPLITUD

TOTAL,

Se obtiene restando el valor ms bajo del valor ms alto de un conjunto de N observaciones, o restando el lmite inferior de la ultima clase menos el lmite superior de la primera clase cuando tenemos datos agrupados en k clases. En el primer caso, al comparar la serie de N observaciones con los n datos simples, tenemos que X1 = x1 y Xn = xN. Las respectivas formulaciones son: Para N observaciones ordenadas o n datos simples: Para datos agrupados en k clases: R = xN x1 = Xn X1 R = Lsk Li1

Vemos que el Rango representa la medida del mayor espacio en que se encuentran todos los valores de una distribucin. No da una idea verdadera de la concentracin de los valores, habiendo casos en los que se obtienen intervalos exagerados cuando la distribucin tiene una concentracin en un espacio reducido, y por tanto estos difieren mucho de los valores extremos.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

95

Ejemplo: Los pesos en kilogramos de una muestra de cajas de frutas de una cooperativa, listas para embarcarse a Francia son: 102, 97, 101, 106, y 103. Determine el Rango. a) Se ordenan e identifican las observaciones de menor a mayor. x1 97
b)

x2 x3 x4 x5 101 102 103 106

Se busca el menor y el mayor valor del conjunto observaciones. Para las N = 5 observaciones ya ordenadas, tenemos que x1 = 97 y xN = x5 = 106. c) Se obtiene el Rango. R = xN x1 = x5 x1 = 106 97 = 9 Interpretacin: La variacin de los pesos con respecto a todos los pesos de la caja es de 9 Kg. Cundo debe usarse el Rango en cualquiera de los casos anteriores? El Rango se usa cuando las observaciones o datos son muy escasos o demasiado dispersos, adems que esa medida es til para conocer los valores extremos o la dispersin total. Con el Rango la variabilidad se puede expresar en un slo nmero. Las desventajas de esta medida estn en que no utiliza todas las observaciones sino dos de estas, se puede ver muy afectada por alguna observacin extrema hasta el punto de perder importancia como medida de dispersin cuando los valores extremos son muy lejanos, y por otra parte para un mismo problema el Rango aumenta o queda igual con el nmero de observaciones pero no disminuye en ningn caso. 2) O TPICA VARIANZA Y DESVIACIN ESTNDAR

Para medir mejor la dispersin de los datos en trminos de su totalidad, es necesaria pero no suficiente la concepcin del rango como una sola diferencia o distancia de dos valores, siendo pertinente ampliar el alcance de esta idea a los valores restantes para que todos (y no dos) se vean reflejados o influyan en una medida de dispersin. Como no tendra sentido tomar en cuenta todas las diferencias posibles (aunque sean tomadas positivamente como distancias, obviando sus verdaderos signos) para las observaciones o datos, es ms prctico y razonable considerar las diferencias o desvos entre cada uno de estos valores y una medida de tendencia central que sirva de referencia. Se escoge la Media Aritmtica
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

96

pues es aquella medida de tendencia central que equilibra a todas las observaciones y no solamente a dos. Todas esas diferencias o desvos se promedian en su totalidad mediante expresiones cuadrticas cuya justificacin matemtica escapa al alcance de los objetivos de este Unidad. Sin embargo, esas expresiones son numricamente muy precisas y tiles para representar la dispersin y para su posterior uso en Estadstica Inferencial. Adems, son ms exactas que el simple promedio de esas diferencias, el cual es un valor que se denomina Desviacin Media, y que aparece en cualquier libro de Estadstica pero no lo estudiaremos en la presente Gua Didctica. Tal como veremos ahora, la Varianza viene dada en unidades cuadrticas, y por eso se le aplica la operacin matemtica de la raz cuadrada para obtener la Desviacin Estndar, siendo este un valor medido en las mismas unidades simples en que los datos vienen dados. 2.1) Varianza y Desviacin Estndar para una Distribucin de Datos Simples Para una serie de N observaciones ordenadas tenemos las respectivas formulaciones para la Varianza S2 y la Desviacin Estndar S que daremos a continuacin.

S2 =

(x
N j =1

X)

, S = S2 =

(x
N j =1

X)

As como coinciden la Media de una serie de N observaciones y la Media de una distribucin de frecuencias para n datos simples asociados a dichas observaciones, tambin ocurre lo mismo entre las formulaciones anteriores y las siguientes para tales datos, teniendo en cuenta que
N = f j .
j =1 n

S2 =

fj (Xi X )
j =1

, S = S2 =

f (X
n j =1 j

X)

Ejemplo: Los pesos en kilogramos de una muestra de cajas de frutas de una cooperativa, listas para embarcarse a Francia son: 102, 97, 101, 106, y 103. Determinemos la Varianza y la Desviacin Estndar.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

97

Para el clculo de esas medidas, realizaremos los siguientes pasos con los cuales vamos a construir una tabla con ciertas columnas que nos facilitarn la obtencin de estas medidas. La Columna I representa los N = 5 pesos en Kg. de las cajas de frutas. b) La Columna II contiene las desviaciones respecto a la Media, que se obtienen restando de la columna I el valor de la Media o promedio para cada valor de la columna I. La Media es:
a)

X =
X =
c)

x
j =1

x 1 + x 2 + ... + x 5 5

97 + 101 + 102 + 103 + 106 509 = = 101,8 102 Kg. 5 5

La Columna III se obtiene elevando al cuadrado cada valor de la columna II. I x x1 = 97 x2 = 101 x3 = 102 x4 = 103 x5 = 106 Total: 509 II x X
x 1 X = -5 x 2 X = -1
x3 X = 0

x4 X = 1
x5 X = 4

( x1 X ) 2 ( x2 X )2 (x X ) ( x4 X )2 (x X )
2 3 2 5

(x X )

III

= 23 =1 =0 =1 = 18

Total: 43

d)

La Varianza S2 es el resultado de dividir el total de la Columna III entre el nmero N de observaciones.

S2 =

(x
5 j =1

X)

S2 =

( 97 102) 2 + (101 102) 2 + (102 102) 2 + (103 102) 2 + (106 102) 2


5
S2 = 43 = 8,6 9 Kg2. 5

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

98

e)

Ahora hallaremos la Desviacin Estndar S.

S = S2 =

(x
5 j =1

X)

= 8,6

= 2,93 Kg. 3 Kg.

Interpretacin: La diferencia con respecto al peso promedio de 102 Kg. correspondientes a las 5 cajas es de aproximadamente 3 Kg.
2.2) Varianza

y Desviacin Estndar para una Distribucin de Datos

Agrupados Si tenemos una distribucin de frecuencias para datos agrupados en k clases, recordemos que N = F j , y la Varianza S2 y la Desviacin
j =1 k

Estndar S tienen las respectivas formulaciones:

S2 =

F j ( Xmi X )
j =1

, S = S2 =

F ( Xm
k j =1 j

X)

Ejemplo: El administrador del un hospital pblico hizo una investigacin acerca del nmero de das que 200 pacientes, escogidos al azar, se quedaron en el hospital despus de una operacin.
Estancia en el hospital (en das) 1-3 4-6 7-9 10-12 13-15 16-18 19-21 22-24 Nmero de pacientes 18 90 44 21 9 9 4 5

Para el clculo de la Varianza y la Desviacin Estndar realizaremos los siguientes pasos, con los cuales vamos a construir una tabla con ciertas columnas que nos facilitarn la obtencin de estas medidas.
a)

La Columna I representa el nmero promedio de das de estancia en el hospital por cada una de las k = 8 clases.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

99

b)

La Columna II contiene la cantidad de pacientes atendidos segn la cantidad de das que permanecieron en el hospital. La Columna III se obtiene restando el valor de la Media o promedio con cada valor de la Columna I.

c)

X =
d)

F
j =1

Xm j =

200

F1 Xm1 + F2 Xm2 + ... + F8 Xm8 = 7,71 8 das 5

La Columna IV se obtiene elevando al cuadrado cada valor de la Columna III. La Columna V se obtiene multiplicando la Columna IV por la Columna II. IV V I II III ( Xm X ) 2 F ( Xm X ) 2 Xm F Xm X Xm 1 X = -6 Xm1 = 2 F1 = 18 36 648 Xm 2 X = -3 Xm2 = 5 F2 = 90 9 810 Xm 3 X = 0 Xm3 = 8 F3 = 44 0 0 Xm 4 X = 3 Xm4 = 11 F4 = 21 9 189 Xm 5 X = 6 Xm5 = 14 F5 = 9 36 324 Xm 6 X = 9 Xm6 = 17 F6 = 9 81 729 Xm 7 X = 12 Xm7 = 20 F7 = 4 144 576 Xm 8 X = 15 Xm8 = 23 F8 = 5 225 1.125 200 4.401 La Varianza S2 es el resultado de dividir el total de la Columna V entre el nmero total de pacientes.
X)
2

e)

Intervalos de Clases 13 46 79 10 12 13 15 16 18 19 21 22 24 Total


f)

S =
2

F ( Xm
8 j =1 j

200

F1 ( Xm1 X ) + F2 ( Xm2 X ) + ... + F j ( Xm8 X )


2 2

200

S2 =
g)

648 + 810 + 0 + 189 + 324 + 729 + 576 + 1.125 4.401 = = 22 das2. 200 200

Ahora hallaremos la Desviacin Estndar S.

S = S2 =

F ( Xm
8 j =1 j

X)

200

= 22

= 4,69 5 das

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

100

Interpretacin: La diferencia respecto al nmero promedio de 8 das, correspondientes a las 200 estadas de los pacientes, es de aproximadamente 5 das. Nota: La Varianza S2 sirve para hallar la Desviacin Estndar S, y ambas se basan en los desvos de los datos con respecto a la Media. Si no existe variabilidad, entonces todos los datos coinciden con la Media y S2 = S = 0, y en otro caso S2 > 0 y S > 0. Si algunos datos estn muy alejados de la Media, entonces S2 y S tomarn valores muy elevados, o sea, son muy sensibles ante la presencia de datos extremos pues en esencia son medias o promedios de otra especie. En consecuencia, el valor de la Desviacin Estndar est en relacin directa con la dispersin de los datos, pues a mayor o menor dispersin de estos hay mayor o menor Desviacin Estndar, respectivamente. 2.3) Regla de Tchebishev

Esta regla dice que para m = 2, 3, y para un conjunto de n datos X1, , Xn, por lo menos t =

intervalo ( X m S, X + m S), es decir, dentro de m desviaciones de la Desviacin Estndar S con respecto de la Media X . La utilidad de esta regla radica en que permite determinar unos lmites para acotar o enmarcar una parte de los datos en su dispersin con respecto a la Media. Adems, tambin vlida para distribuciones de datos agrupados pues slo se requiere conocer la Media y la Desviacin Estndar para su aplicacin. Ejemplo: Para el problema de los pesos de las cajas de frutas, tenemos que los datos son: 102, 97, 101, 106, y 103. Su Media es X = 101,8 y su Desviacin Estndar es S = 2,93. Para m = 2 tenemos que por lo menos t =

1 1 2 100% de los datos se encuentran en el m

intervalo (95,94 , 106,58), es decir, ser mayores que 95,94 y menores que 106,58. Siendo que n = 5, entonces tenemos que por lo menos n t = 3,75 4 datos estn en ese intervalo, lo cual se cumple con creces pues en realidad all estn todos los datos.

3 1 = 1 2 1 0 0 % 100% 4 2

= 75% de los datos deben estar en el

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

101

Interpretacin: Hay por lo menos 4 cajas de frutas cuyos respectivos pesos son mayores a 95,94 96 Kg., y a su vez son menores que 106,58 107 Kg. 3) COEFICIENTE DE VARIACIN Tanto para datos simples como agrupados, el Coeficiente de Variacin CV es igual al cociente entre la Desviacin Estndar y la Media, y multiplicando ese cociente por cien para ser expresado en porcentaje. La formulacin es CV =

S 100%. X

Esta medida se emplea fundamentalmente con el objeto de: 1. Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades de medicin, como por ejemplo Kilogramos y Centmetros. Ejemplo: En una fbrica venezolana X la Media y Desviacin Estndar de los salarios es de Bs 102 y Bs 11, respectivamente. En una fbrica colombiana Y la Media y Desviacin Estndar de los salarios es de $ 230 y $ 54, respectivamente. Entonces: Fbrica venezolana X X = 102, SX = 11 CVX =
SX 11 100% = 100% = 10,78% X 102

Fbrica colombiana Y Y = 230, SY = 54 CVY =


SY 54 100% = 100% = 23,47% Y 230

Interpretacin: La fbrica colombiana Y tiene mayor variacin en los salarios que la fbrica venezolana X. 2. Comparar dos grupos de datos con iguales unidades de medicin, y en los que la Media y Desviacin Estndar de uno de los grupos son diferentes para el otro, pero ambos grupos pueden tener igual o similar grado de dispersin. Igualmente, pueden haber valores similares para el par de Medias y el par de Desviaciones, pero los grupos tienen muy alejados grados de dispersin. Ejemplo: En una empresa X la Media de los salarios es de Bs. 3.800 y la Desviacin Estndar es de Bs. 42. En una empresa Y la Media de los salarios es de Bs. 14.500 con una Desviacin Estndar de Bs. 130. Entonces: Empresa X X = 3.800, SX = 42 Empresa Y Y = 14.500, SY = 130
102

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

CVX =

SX 42 100% = 100% = 1,10% X 3.800

CVY =

SY 130 100% = 100% = 0,89% Y 14.500

Interpretacin: La empresa Y tiene menor variacin en los salarios que la empresa X, aunque tienen similar dispersin. 3. Determinar si cierta Media es consistente u homognea con cierta Desviacin Estndar, lo cual expresaremos en la siguiente escala. CV 0% a 10% 11% a 15% 16% a 25% 26% o ms Interpretacin Muy homogneo Homogneo Heterogneo Muy heterogneo

Ejemplo: En una seccin de educacin bsica, sea X la variable que indica las notas del curso de Matemticas, cuya Media y Desviacin Estndar son X = 12 Pts y SX = 2 Pts., respectivamente. Por otra parte, sea Y la variable que indica las notas del curso de Fsica, cuya Media y Desviacin Estndar son Y = 14 Pts. y SY = 2,5 Pts., respectivamente. Dada la similitud entre X y Y , y entre SX y SY, y puesto que en un mismo curso hay dos puntuaciones de distinta especie, cul de los dos cursos es ms consistente y cul tiene la Media ms representativa? Tenemos que: Curso de Matemticas X = 12, SX = 2 CVX =
SX 2 100 = 100 = 16,67% X 12

Curso de Fsica Y = 14, SY = 2,5 CVY =


SY 2,5 100 = 100 = 17,85% Y 14

Interpretacin: El curso de Matemticas es ms homogneo que el curso de Fsica. Se observa que CVX = CVY, por lo que la Media ms representativa es la del curso de Matemticas. Como es mayor la dispersin relativa CVY de los datos en el curso de Fsica, esto quiere decir que las calificaciones en Matemticas se haya ms concentrada alrededor de la Media en comparacin a las de la otra materia.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

103

4.7

ACTIVIDADES Individual Lea con cuidado los contenidos presentados en relacin a las medidas de dispersin para datos simples (no agrupados) y agrupados. Consulte la bibliografa a fin de ampliar sus conocimientos y considerar la opinin de otros autores sobre el tema. Grupal Cooperativo

Para cada uno de las tablas a continuacin, determine e interprete el Rango, la Varianza, la Desviacin Estndar y el Coeficiente de Variacin por cada unos de los portadores energticos (petrleo, gas natural, carbn mineral,) en sus determinadas regiones (Amrica del Sur, Central y el Caribe). As mismo, establezca una conclusin al menos acerca de la dispersin.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

104

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

105

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

106

UNIDAD V: INTRODUCCIN ESTIMACIN

LA

PROBABILIDAD,

MUESTREO

OBJETIVO: Calcular e interpretar probabilidades asociadas a un evento aleatorio dado y seleccionar una muestra de una poblacin dada como medio para estimar ciertos parmetros poblacionales. COMPETENCIAS: 1) Definir el concepto de probabilidad. 2) Calcular el tamao de un espacio muestral dado. 3) Mencionar y explicar cmo se calculan probabilidades de acuerdo a cada uno de los tres planteamientos de probabilidad. 4) Definir poblacin y muestra. 5) Mencionar y explicar los mtodos de muestreo probabilstica. 6) Construir intervalos de confianza para estimar la media y la proporcin de una poblacin. 7) Seleccionar el tamao de la muestra requerido para la estimacin de la media y de la proporcin de una poblacin. 8) Uso del paquete computacional SPSS (entre otros) para el clculo de estimadores. CONTENIDO:

TEMA 1
5.1 Qu es Probabilidad?

La Probabilidad es la posibilidad numrica de que ocurra un evento. La probabilidad de un evento es medida por valores comprendidos entre 0 y 1. Mientras mayor sea la probabilidad de que ocurra un evento, su valor asignado estar ms prximo a 1. La probabilidad de una imposibilidad es 0. Ejemplo: La probabilidad de que el sol salga maana es muy alta, es decir, muy cercana a 1; la probabilidad de que apruebes este curso sin estudiar est al otro extremo, est cercana a 0. En todas las situaciones un elemento comn a estas es la presencia de la incertidumbre. La nocin de azar se presenta cuando no se puede predecir con certeza el resultado de un determinado Fenmeno Aleatorio, siendo aquel hecho que bajo ciertas condiciones puede ocurrir o dejar de suceder, lo que conduce al estudio profundo de las ideas anteriores a travs de un rea de las Matemticas denominada Teora de la Probabilidad.
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

107

Esta rama del conocimiento es el vehculo que le permite al investigador en Estadstica usar la informacin contenida en una muestra para hacer inferencia o para describir la poblacin de la cual se ha obtenido la muestra. Supongamos que la poblacin es conocida y nos interesa calcular la probabilidad de observar una muestra particular. Exactamente lo opuesto es cierto en los problemas estadsticos cuando asumimos que la poblacin es desconocida y la muestra es conocida, y lo que deseamos es hacer inferencias acerca de la poblacin. As, la Teora de la Probabilidad acta desde la poblacin hacia la muestra, mientras que la Estadstica acta opuestamente, movindose de la muestra hacia la poblacin. 5.2 Experimento Aleatorio

Un Experimento es un proceso por medio del cual se obtiene una observacin, dato o medicin. Un Experimento Aleatorio es aquel que se caracteriza por dar resultados inciertos porque al repetirlo bajo anlogas condiciones, jams se podr predecir el resultado que se va a obtener ya que puede ocurrir ms de uno que sea posible. Supone un mayor o menor grado de incertidumbre. En el caso contrario al antes descrito estamos en presencia de un Experimento Determinista. Ejemplo: Si lanzamos una moneda al aire, el resultado puede ser cara o sello, pero no sabemos de antemano cual de ello va a salir. El proceso de lanzamiento de la moneda es un experimento aleatorio. 5.3 Espacio Muestral (de un experimento aleatorio)

Es el conjunto de todos los resultados posibles del experimento, y lo podemos denotar con la letra griega (omega) o con la letra mayscula E. Cada resultado del experimento (o elemento del Espacio Muestral) se denomina Punto Muestral. Ejemplo: En un proceso de fabricacin extraemos un artculo elegido entre los artculos fabricados y observamos si es o no es defectuoso. Si denotamos por B cuando es artculo es bueno y por D cuando es defectuoso, ambos seran los puntos maestrales y podramos tomar = {B, D}.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

108

Otro ejemplo: El espacio muestral S del experimento de lanzar un dado est dado por las seis caras de este. S = {1, 2, 3,4, 5, 6} Cada uno de los seis posibles resultados del lanzamiento viene siendo un punto muestral. As cmo existen espacios maestrales finitos, tambin existen los que son infinitos. Por ejemplo, lanzamos un dardo hacia un tablero y hay una extensin continua de puntos donde puede caer. 5.4 Suceso o Evento de un Experimento Aleatorio

Es un subconjunto del espacio muestral que se caracteriza por ser resultado de un experimento aleatorio. Se representa por una letra mayscula. Como un suceso es una coleccin especfica de puntos maestrales, un suceso particular ocurrir si ocurre cualquier punto muestral de dicho suceso. 5.5 Los Modelos de Probabilidad

En la antigedad se denominaba probable a lo que segn las apariencias puede ser declarado verdadero o cierto, por lo que la probabilidad posee grados segn su acercamiento o alejamiento de la certidumbre (certeza). Luego, la Probabilidad puede ser Subjetiva (un juicio probable) u Objetiva (un acontecimiento probable). Estas ideas de probabilidad y azar dieron origen a la Teora de la Probabilidad como disciplina de carcter matemtico. Esto permiti dar un valor numrico a la probabilidad de ocurrencia o no ocurrencia de un acontecimiento o resultado, tal como veremos luego. En el campo de la Estadstica, debido al carcter amplio y general de la Probabilidad, esta es igualmente vlida para poblaciones y muestras. Recordando las consideraciones hechas sobre ambos conceptos en el Mdulo I de la Unidad I, el clculo de Probabilidades es til para la Estadstica Inferencial. Por lo tanto, el resto de los planteamientos a estudiarse en la Unidad III estarn referidos a poblaciones. La Probabilidad ocupa un lugar importante en la toma de decisiones puesto que permite proyectar (inferir) resultados de un evento determinado. Debido a las mltiples aplicaciones que tiene la Teora de la Probabilidad en la vida cotidiana, existen cuatro modelos para su clculo:
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

109

Modelo Clsico (a priori) Modelo Emprico o de Frecuencia Relativa (a posteriori) Modelo Subjetivo 5.5.1 El Modelo Clsico Fija la probabilidad sin depender de ninguna experiencia y por lo tanto no est apoyada en ninguna inferencia inductiva. Se relaciona con los juegos de azar y las apuestas. Aqu se supone que los sucesos elementales son equiprobables. La probabilidad clsica de un evento A se determina mediante la Regla de Laplace, expresada as: P(A) = Nmero de casos posibles para el Espacio Muestral El numerador de esa expresin es la cantidad de elementos o puntos maestrales que conforman al suceso A, y el denominador es la cantidad total de elementos pertenecientes al espacio muestral . Ejemplo: Sea el experimento aleatorio de lanzar un dado una vez, el cual tiene xito si el resultado del experimento es la cara 3 y 4. Tomando el espacio muestral = {1, 2, 3, 4, 5, 6} y el evento A = {3, 4}, tenemos P(A) =
2 1 = = 0,3 =0,3333 = 33,33%. 6 3
Nmero de casos favorables para el Evento A

5.5.2 El Modelo Emprico o de Frecuencia Relativa Utiliza datos que se han observado empricamente en una investigacin estadstica, registra la frecuencia con que ha ocurrido un evento en el pasado, y estima la probabilidad de que el evento ocurra nuevamente con base a su comportamiento histrico ya investigado. Para calcular la probabilidad de un evento A aplicando este modelo, se utiliza la siguiente frmula: P(A) = Ejemplo:
Nmero de veces que ha ocurrido el evento en el pasado Nmero total de observacio nes

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

110

Alicia falt 5 veces a clases el mes pasado. Cul es la probabilidad de que falte este mes que tiene 30 das? P (Falta) =
5 = 0,16 = 0,1666 = 16,66% 30

Este modelo se usa esencialmente en distribuciones de frecuencias para datos estudiados en Estadstica, por lo que es til el siguiente resumen comparativo de conceptos estadsticos y probabilsticas, siendo que algunos de estos ltimos sern estudiados ms adelante en los prximos mdulos. Conceptos Empricos (Estadsticos) Poblacin Muestra Frecuencia relativa Variable Estadstica Histograma de Frecuencia Relativa Histograma de Frecuencia Relativa Acumulada Caractersticas Estadsticas (Estadsticos) 5.5.3 El Modelo Subjetivo Se utiliza cuando no hay datos histricos disponibles y slo se cuenta con opiniones o criterios subjetivos. Aqu la probabilidad representa una relacin entre una proposicin y un cuerpo de evidencia, pero no es una relacin puramente lgica. Es una relacin cuasilgica y el valor numrico asociado a ella representa un grado de creencia subjetiva expresada en un juicio probable. Por ejemplo, Cul es la probabilidad de que una mujer sea elegida a la Presidencia de la Repblica Bolivariana de Venezuela? En cierto modo se puede considerar el enfoque de este modelo como una generalizacin de la probabilidad obtenida a partir de una frecuencia en una serie larga de pruebas, y tambin a partir de situaciones en que la informacin que dispone un individuo es ms incompleta y precaria. Por otra parte, en un gran nmero de aplicaciones usuales de las probabilidades, ms que pensar en la repeticin de un experimento y en su frecuencia, el individuo hace comparaciones entre la situacin en que se encuentra (que no necesariamente se va a repetir) y las situaciones tpicas caracterizadas por el azar. En esa interpretacin personal de la probabilidad, en base a ciertas reglas el individuo asigna probabilidades a los sucesos elementales, y aquellas servirn para hallar las probabilidades de otros sucesos en base a las mismas reglas, y su
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

Conceptos Tericos (Probabilsticos) Espacio Muestral Suceso Probabilidad Variable Aleatoria Curva de Probabilidad Curva de Distribucin Caractersticas (Parmetros) Probabilsticas

111

interpretacin se hace planteando la analoga o comparacin entre ambos tipos de sucesos.

TEMA 2
5.6 Poblacin y Muestra

Los conceptos de Poblacin y Muestra fueron estudiados en las Secciones 1.2 y 1.3 del Unidad I de la Unidad I, al igual que las razones que justifican el uso de las muestras se analizaron en la Seccin 1.5. Una poblacin es finita si consta de un nmero finito o fijo de elementos, medidas u observaciones. Por ejemplo, tenemos el conjunto de calificaciones obtenidas en una seccin de estudiantes de la UBV que cursan Anlisis del Dato Estadstico. A diferencia de las poblaciones finitas, una poblacin infinita contiene una infinidad de elementos, al menos hipotticamente. Por ejemplo, cuando medimos el peso de los habitantes de una comunidad. A menos que se indique lo contrario, las poblaciones a ser estudiadas aqu son finitas. 5.6 Muestreo

El Muestreo es el conjunto de procedimientos que nos permite disear la muestra ms apropiada para un experimento o investigacin, garantizndose que la muestra seleccionada sea representativa de la poblacin de origen para no tener que trabajar con la totalidad de esta y controlar los errores cometidos en su estudio. Para que una muestra sea aceptable, esta debe ser representativa de la poblacin de la cual se obtuvo, y tambin debe existir la posibilidad de medir la confiabilidad de las estimaciones obtenidas de la muestra (totales, promedios, porcentajes, etc.). La muestra es representativa si posee todas las caractersticas de la poblacin en la misma proporcin en que se encuentran manifiestan en el seno de esta. Todo esto es objeto de estudio de la Teora de Muestreo. Los objetivos del muestreo son: Realizar estimaciones de valores de una poblacin a partir de las medidas obtenidas de la muestra. Calcular medidas de confiabilidad de esas estimaciones. Interpretar las estimaciones de manera precisa. Se aconseja el muestreo en los siguientes casos:
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

112

Cuando la poblacin es infinita o muy grande de tal forma que resulte muy difcil su enumeracin total. En poblaciones muy homogneas tales que la muestra represente con fidelidad a la poblacin. Cuando el proceso de investigacin de las caractersticas de una poblacin sea destructivo. Las ventajas del muestreo son: Economa y rapidez en su realizacin. Ahorro de dinero si la muestra es representativa pues en tal caso no hay necesidad de trabajar con todos los elementos de la poblacin. Ms alcance en la investigacin. Ms entrenamiento, formacin y control de personal. Mayor rapidez de procesamiento y presentacin de resultados. Menos personal y recursos. Fcil verificacin posterior en base al diseo utilizado. Ms confiabilidad de los datos obtenidos en base a la posibilidad de controlar ms fcilmente las informaciones recopiladas. Las limitaciones del muestreo son: No permite hacer clculos, tabulaciones o proyecciones con respecto a reas o pequeos grupos. Presenta el error de muestreo y otros ajenos a ese proceso. Dificultad de la tabulacin cruzada de algunas caractersticas. Se requiere una alta preparacin estadstico-matemtica de muestrista. Existe la creencia de que las investigaciones sobre la poblacin ofrecen un margen ms slido y eficiente de exactitud que los resultados obtenidos de una muestra. 5.6 Clasificacin del Muestreo

En Estadstica, un Diseo de una Muestra es un plan definitivo determinado por completo, antes de recopilar cualquier dato, con el fin de tomar posteriormente una muestra de una poblacin de referencia. Enmarcado dentro del proceso del diseo, el tipo de muestreo a desarrollar se clasifica en funcin de las caractersticas de la poblacin y del criterio de seleccin previamente determinado en una investigacin. Algunas veces se hace uso de la Teora Combinatoria para obtener determinado tipo de muestras. 1) Muestreo Probabilstico y no Probabilstico

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

113

El Muestreo no Probabilstico es aquel donde la seleccin no se hace al azar sino el criterio del investigador. A menudo suele presentar grandes sesgos y por esa razn es poco fiable. En cambio, si la seleccin de los elementos de la muestra se realiza aleatoriamente, es decir, independientemente de la opinin del investigador, entonces se est haciendo un Muestreo Probabilstico o Aleatorio, el cual es mucho ms confiable. En este caso, si la poblacin tiene N elementos y la muestra es de M elementos, la probabilidad que tiene cada elemento de la poblacin de integrar esa muestra es
M . N

Un muestro probabilstica o aleatorio puede ser sin Reemplazo, Aleatorio Simple y Sistemtico. 2) Muestreo con y sin Reemplazo Tenemos un Muestreo con Reemplazo cuando cada elemento de la poblacin puede elegirse ms de una vez. Esto ocurre cuando cada elemento seleccionado se vuelve a regresar a la poblacin de la cual se extrajo despus de anotar sus caractersticas en un instrumento al aplicarle alguna tcnica de recoleccin de informacin. Este tipo de muestreo no es probabilstico, y se aplica para poblaciones que en la prctica se consideran infinitas o inagotables. Aqu cambia la probabilidad de seleccin de cada elemento que formar la muestra. Al contrario, en una Muestra sin Reemplazo el elemento seleccionado para integrar la muestra deja de ser seleccionable al no poder elegirse ms de una vez. Es decir, una vez extrado no se regresa a la poblacin. Por lo tanto la poblacin es agotable y por supuesto finita. A este tipo de muestreo se le suele llamar Irrestrictamente Aleatorio. Para este caso, hay
M N
1

poblacin de tamao N, y la probabilidad de elegir as una muestra es


= N! ( M N )! . N!

M maneras de obtener una muestra de tamao M de una N

3) Muestreo Aleatorio Simple Es un procedimiento de muestreo probabilstico mediante el cual extraemos de una poblacin una muestra representativa de la misma, y donde cada elemento de la poblacin tiene la misma posibilidad de ser incluido en la muestra. En trminos de probabilidad, de ser N el tamao de la poblacin, ser 1/N la probabilidad de ser escogido cada elemento para formar parte de la muestra sin importar el tamao de esta. Este tipo de muestreo es el ms sencillo y usado.
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

114

4) Muestreo Sistemtico Es cuando los elementos de la poblacin estn ordenados por listas. Se elige un individuo al azar y a continuacin se eligen todos los dems a intervalos constantes hasta completar la muestra. Si el orden de los elementos es tal que los individuos prximos tienden a ser ms semejantes que los alejados, el muestreo sistemtico tiende a ser ms preciso que el aleatorio simple al cubrir ms homogneamente toda la poblacin. A veces este tipo de muestreo no es necesariamente aleatorio. El verdadero riesgo del muestreo sistemtico yace en la posible presencia de periodicidades ocultas y la obtencin de resultados sesgados o parcializados. 5) Muestreo Estratificado Es cuando nos interesa que la muestra tenga la misma composicin a la de la poblacin cuando esta se divide en clases o estratos. Esto ltimo se hace a fin de disminuir la variabilidad de la poblacin y de buscar mayor homogeneidad dentro de cada estrato. Si tenemos informacin acerca de la constitucin o composicin de una poblacin, y siendo esa informacin importante para nuestra investigacin, podemos mejorar el muestreo aleatorio por medio de la estratificacin, procedimiento que consiste en dividir a la poblacin en una cantidad de sub-poblaciones o estratos que no se mezclen y en la que en cada uno sus elementos sean los ms parecidos entre s, y luego de hacer esa distribucin se toma una muestra de cada estrato. Si para cada estrato se obtiene una muestra aleatoria simple, el procedimiento completo (primero la estratificacin y luego el muestreo aleatorio) se conoce como Muestreo Aleatorio Simple Estratificado. Esencialmente, el objetivo de la estratificacin es formar estratos de tal forma que haya una relacin entre un estrato particular y la respuesta que se busca en el estudio estadstico, y que en cada uno de los estrato separados haya tanta homogeneidad como sea posible. Ejemplo: Si en una poblacin el 20% son mujeres y el 80% hombres, se mantendr la misma proporcin en la muestra. 6) Muestreo por Conglomerados
2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

115

Se divide la poblacin total en un nmero determinado de subdivisiones relativamente pequeas y se seleccionar al azar algunos elementos de esas subdivisiones o conglomerados para incluirlos en la muestra general. Si los conglomerados son subdivisiones geogrficas, este tambin se llama Muestreo por reas. Individual Lea con cuidado los contenidos presentados en relacin a esta unidad. Consulte la bibliografa a fin de ampliar sus conocimientos y considerar la opinin de otros autores sobre el tema. Responda y explique las siguientes cuestiones (agregarlas al portafolio): Por qu es importante la inferencia estadstica?, Por qu se determina una muestra y se realiza un muestreo?, En que situaciones en ventajoso considerar el estudio estadstico a partir de una muestra?, Cul muestreo presenta mayor ventaja?.

Grupal Cooperativo

Aplique los conocimientos de esta Unidad a una situacin real relacionada con el rea de inters, desde lo local, regional y lo nacional. Incluya la descripcin estadstica descriptiva correspondiente. Esta actividad puede considerarse como un proyecto final de la unidad Curricular.

Ejemplo: Estudio estadstico descriptivo actualizado de: plantas de procesamiento gas natural, refineras, plantas petroqumicas, sistemas de gasoducto, olectucto, poliducto, o ducto de orimulsin, ubicada en la localidad, la regin y en el Pas. Este estudio incluye la parte de muestreo estadistico. Sugerencia: Para ubicar parte de esta informacin se recomienda usar el Mapa Petroenergtico de Venezuela MPV

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

116

BIBLIOGRAFA
BSICA
1.

BAUCE, G. Estadstica Aplicada: Problemario. Ediciones del Vicerrectorado Acadmico de la Universidad Central de Venezuela. Caracas, 2.004. FREUND, J. Y SIMON, G. A. Estadstica Elemental. Editorial Prentice-Hall Hispanoamericana. Mxico, 1.994. FUENLABRADA DE LA VEGA, S. Probabilidad y Estadstica. McGraw-Hill Interamericana. Mxico, 2.000. LIND, D., MASON, R., Y MARSHALL, W. Estadstica. Irwin MacGraw Hill. Mxico, 2.001. ORTEGA, J. Elementos de Probabilidad. CENAMEC. Caracas, 1.998. Sociedad Fondo Editorial

2.

3.

4.

5.

6. 7.

SOTO, A. Iniciacin a la Estadstica. Editorial Jos Mart. Caracas, 1.982. SPIEGEL, J. SCHILLER Y SRINIVASAN, R. Probabilidad y Estadstica. McGraw-Hill Interamericana. Bogot, 2.001. COMPLEMENTARIA

1.

CRMER, H. Elementos de la Teora de Probabilidades. Ediciones. Madrid, 1.968. HABER, A Y RICHARD, R. Estadstica General. Interamericano, S.A. Mxico, 1.973.

Aguilar

2.

Fondo Educativo

3.

LINCOYN, O. Introduccin a la Estadstica. McGraw-Hill Interamericana. Bogot, 1.998. MENDENHALL, W. Introduccin a la Probabilidad y la Estadstica. Wadsworth Internacional Iberoamericana. California, 1.972. RIVAS, E. Estadstica General. Ediciones de la Biblioteca de la Universidad Central de Venezuela. Caracas, 1.968. WALPOLE, R. y RAYMOND, M. Probabilidad y Estadstica. McGraw Hill Interamericana. Mxico, 1.992.
117

4.

5.

6.

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

VIRTUAL Adicionalmente a los libros antes mencionados, se recomiendan las siguientes pginas web de Internet (ao 2.007). http://www.pdvsa.com http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-uindice.html http://www.minci.gov.ve http://www.ine.gov.ve

2007: Ao de impulso de los Cinco Motores Constituyentes:Leyes habilitantes, Reforma constitucional, Moral y luces, Geometra del poder y Explosin del poder popular. La revolucin, en esencia, es educacin.

118

S-ar putea să vă placă și