MODALIDAD ABIERTA Y A DISTANCIA AUTOR (A): Econ. Miriam Alexandra Guajala Macas MATERIAL DE USO DID CTICO PARA ESTUDIANTES DE LA UNIVERSIDAD T CNICA PARTICULAR DE LOJA, PROHIBIDA SU REPRODUCCI N TOTAL O PARCIAL POR CUALQUIER MEDIO OCTUBRE 2007 - FEBRERO 2008 Reciba asesora virtual en: www.utpl.edu.ec CICLO 3 ESTADSTICA I Gua Didctica ESCUELA DE PSICOLOGA 11304 ESTADSTICA I Gua Didctica Miriam Alexandra Guajala Macas 2007, UNIVERSIDAD TCNICA PARTICULAR DE LOJA Diagramacin, diseo e impresin: EDITORIAL DE LA UNIVERSIDAD TCNICA PARTICULAR DE LOJA Call Center: 593 - 7 - 2588730, Fax: 593 - 7 - 2585977 C. P.: 11- 01- 608 www.utpl.edu.ec San Cayetano Alto s/n Loja - Ecuador Primera Edicin ISBN-978-9942-00-066-8 Reservados todos los derechos conforme a la ley. No est permitida la reproduccin total o parcial de esta gua, ni su tratamiento informtico, ni la transmisin de ninguna forma o por cualquier medio, ya sea electrnico, mecnico, por fotocopia, por registro u otros mtodos, sin el permiso previo y por escrito de los titulares del Copyright. Agosto, 2007
INTRODUCCIN OBJETIVO GENERAL .............................................................................................................. BIBLIOGRAFA ........................................................................................................................ ORIENTACIONES GENERALES ........................................................................................... PRIMER BIMESTRE OBJETIVOS ESPECFICOS .................................................................................................. CONTENIDOS .......................................................................................................................... DESARROLLO DEL APRENDIZAJE .................................................................................. SEGUNDO BIMESTRE OBJETIVOS ESPECFICOS .................................................................................................. CONTENIDOS ........................................................................................................................... DESARROLLO DEL APRENDIZAJE ................................................................................... SOLUCIONARIO .................................................................................................................... ANEXOS ................................................................................................................................... EVALUACIONES A DISTANCIAS NDICE UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 5 PRELIMINARES Gua Didctica: Estadstica I Introduccin Aprender ESTADISTICA es como aprender un nuevo idioma Para muchos estudiantes de psicologa, estudiar estadstica supone una carga de trabajo muy especial, con frecuencia poco comprendida, sin embargo, esta asignatura es bsica e indispensable para la comprensin de contenidos de materias dentro del plan de estudios como: Psicometra, Metodologa de la Investigacin y Psicologa Experimental, entre otras. La ESTADISTICA, es una ciencia que se utiliza en los diversos campos de la investigacin, con la intencin de aportar al investigador, las herramientas necesarias para fortalecer su capacidad de discernimiento entre diferentes metodologas estadsticas, sobre la base del conocimiento de sus fundamentos tericos y prcticos. En este sentido, son menos importantes las frmulas que la comprensin de los conceptos que stas encierran. Por ello se trata de evaluar esa comprensin y la capacidad para razonar correctamente con los conceptos explicados y posteriormente la resolucin de problemas prcticos que incluyan la eleccin de una tcnica, la destreza en el clculo y la correcta interpretacin de los resultados. A lo largo de la licenciatura, comprobarn la necesidad de conocer estas tcnicas para poder abordar con rigor, casi cualquier problema o campo de la psicologa, ya que la estadstica ms que recoleccin y organizacin de datos, es una forma de pensamiento til para la resolucin de situaciones prcticas y problemas cientfcos. La presente gua, pretenden brindar al estudiante los elementos ms importantes de la Estadstica Descriptiva, para lo cual el programa se divide en siete unidades. Entre las unidades principales a tratar se encuentran: El rol de la estadstica en el mtodo cientfco, organizacin y resumen de datos, medidas de posicin, medidas de dispersin, relaciones, correlaciones y regresin lineal. Finalmente, quiero expresar mis sinceros agradecimientos al Dr. Gonzalo Morales Larretegui, por su colaboracin para la realizacin de la presente gua. Seguros de su dedicacin y su afn de aprendizaje apoyndose en la gua y el texto bsico constituir el pilar principal de su formacin profesional, augurndole xitos en su vida profesional `` UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja
PRELIMINARES Gua Didctica: Estadstica I
Los objetivos generales que se plantean para la asignatura son los siguientes: 1. Lograr que el estudiante conozca los fundamentos tericos y prcticos de la Estadstica. 2. Fomentar en los futuros psiclogos una visin de la actividad investigadora basada en la objetividad y rigurosidad. 3. Aportar al estudiante de psicologa, de recursos tiles para la toma de decisiones ante situaciones de incertidumbre. 4. Despertar en los futuros profesionales un espritu crtico respecto al uso (o ms bien al mal uso) de las herramientas estadsticas aplicadas en el campo de la Psicologa. Estos objetivos de carcter general, se concretan en objetivos ms especfcos en cada bimestre, de los temas en los que se divide el programa. BASICA PAGANO, Robet R. Estadstica para las ciencias del comportamiento. Thomson. Sptima edicin. COMPLEMENTARIA Daniel Wayne W. (1993) Estadstica con Aplicaciones a las Ciencias Sociales y a la Educacin, McGraw-Hill Mxico, D. F. Infante Gil, S y Zrate de Lara, G. (1983) Mtodos Estadsticos, Editorial Trillas, Mxico, D. F. MURES, M.J. coord.- (2004): Problemas de estadstica descriptiva aplicada a las ciencias sociales. Madrid, Pearson. SPIEGEL, M.R. (2002): Estadstica, Mxico, McGraw-Hill. OMEO PERUCHA, V. y UA JUAREZ, I. (1997): Doce lecciones de Estadstica Descriptiva (Curso terico prctico), Madrid, Editorial AC. Amn, J. (1985). Estadstica para psiclogos. (2 Vols.). Madrid: Pirmide. Aron, A. y Aron, E.N. (2001). Estadstica para psicologa. Buenos Aires: Pearson. Botella, J.; Len, O.F. y San Martn, R. y Barriopedro, M.I. (2001). Anlisis de Datos en Psicologa I. Madrid: Pirmide. MacRae, S. (1995). Modelos y Mtodos para las Ciencias del Comportamiento. Barcelona: Ariel. Objetivos Generales Bibliografa UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 7 PRELIMINARES Gua Didctica: Estadstica I Solanas, A.; Salafranca, Ll.; Nuez, M.I. y Fauquet, J. (2005). Estadstica descriptiva en ciencias del comportamiento. Madrid: Thompson. Stockburger,D.W. (1997). Introductory Statistics: Concepts, Models, and Applications (WWW Version 1.0). http://www.psychstat.smsu.edu/sbk00.htm, Southwest Missouri State University. Himmel, E y E. Lagos (1980), Introduccin al mtodo cientfco. Direccin de Investigacin, Vicerrectora Acadmica, P. Universidad Catlica de Chile, 223 pp. Asensi-Artiga, V y A. Parra-Pujante (2002) El mtodo cientfco y la nueva flosofa de la ciencia Anales de Documentacin (Universidad de Murcia) 5: 9-19 La presente gua incluye algunas orientaciones generales que apoyan su actividad y posibilitan desarrollar con mayor facilidad y comprensin su trabajo. Es fundamental que usted dedique al estudio de la asignatura por lo menos cuatro horas semanales, dosifcando y distribuyendo el tiempo para el desarrollo de ejercicios, estudio y revisin de temas, consultas, realizacin de los trabajos a distancia, etc. que sern la base de un aprendizaje signifcativo y aplicacin prctica. La preparacin de la asignatura hace que se incluya resmenes de cada unidad en los que se complementa con aportes de bibliografa anexa, los cuales debe tomarlos en cuenta; se sugiere mtodos, tcnicas de estudio y ejercicios pertinentes, que son integrados no como recetas para seguirlas, sino como su nombre lo indica orientaciones y actividades recomendadas que usted ir enriqueciendo, o adaptando creativamente, para una mejor comprensin. Es importante realizar las consultas al profesor asesor o responsable de la asignatura, a travs de la comunicacin telefnica para solventar las inquietudes que se presenten en el desarrollo de sus trabajos. El horario de atencin no siempre es el de la portada por lo que solicito preguntar en cada centro universitario. La consulta con otros compaeros es recomendable, para intercambiar opiniones, pero la preparacin y redaccin propiamente dicha del trabajo, es personal. Las evaluaciones a distancia son dos en el ciclo, su desarrollo adems de ser requisito indispensable y obligatorio, califcado con seis puntos, le ayuda a estudiar de manera didctica y a consolidar el aprendizaje. La revision de los ejercicios resueltos en el libro por el autor, as como el desarrollo de las autoevaluaciones, es muy provechoso, tienen como fn ser un apoyo de estudio, (no para enviar al profesor) sino para que constate su nivel de logro, asimilacin y comprensin del tema o unidad de estudio, a la vez que le dan pautas para que pueda retroalimentar los aspectos de menor dominio. Organice los resmenes por escrito. El aprendizaje resulta ms fcil si los contenidos se abordan a travs de varias tcnicas, como estrategias que permiten agilitar el trabajo intelectual, ejercitando muchas aptitudes y sentidos que requieren una estimulacin adecuada. Orientaciones Generales UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 8 PRELIMINARES Gua Didctica: Estadstica I Es importante hacer quedar una copia del trabajo a distancia para su revisin; y, por posibles prdidas o algn inconveniente que pueda presentarse. Por lo tanto, a travs del siguiente esquema me permito resumir estas orientaciones XITOS ! Los Apuntes Los resmenes y Subrayados La lectura y Estudio Nos ayudaran A afanzar nuestros aprendisajes 1 2 UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja
PRIMER BIMESTRE Gua Didctica:Estadstica I Ensear los conceptos bsicos y las tcnicas de anlisis del enfoque descriptivo univariado: distribuciones de frecuencias, medidas de tendencia central y variabilidad y nmeros relativos. Ensear al estudiante las formas adecuadas de presentacin estadstica de la informacin con uso de cuadros y grfcos.Defnir el concepto de poblacin y muestra. Defnir que son parmetros y estadgrafos. Identifcar las reas especfcas donde se utilizan las estadsticas en unainvestigacin. Defnir las diferentes variables: Cuantitativas, cualitativas, discretas, continuas, independientes, dependientes y constante. Defnir las diferentes escalas de medicin: Nominal, ordinal, intervalo y de razones. Analizar situaciones donde se haga uso prctico de los conceptos previamente estudiados. PRIMER BIMESTRE Objetivos Especfcos UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 10 PRIMER BIMESTRE Gua Didctica: Estadstica I Si una persona gana un milln y otra nada la estadstica establece que en promedio las dos han ganado medio milln ANONIMO (detalle humorstico) En el presente captulo, conoceremos aspecto tericos conceptuales de la Estadstica como ciencia, que se utiliza en los diversos campos de investigacin, pues al igual que en todo campo o disciplina se requiere primero, de la defnicin de los conceptos bsicos que fundamentan la misma. 1.1 EL ROL DE LA ESTADSTICA EN LA APLICACIN DEL MTODO CIENTFICO. La ciencia juega hoy en da, un rol muy importante en la vida de los seres humanos, pues buena parte del secreto de la ciencia reside en la utilizacin del mtodo cientfco, como instrumento esencial que poseen los investigadores para realizar experimentos, interpretar resultados e integrarlos con los conocimientos que se construye a partir de miles de experimentos individuales. Actualmente, la estadstica empieza su avance en el terreno de la aplicacin del mtodo cientfco, cuando esta (la estadstica) ya no se limita a recopilar, contar y a veces clasifcar los datos, como se inicio en una primera poca, sino que trata tambin de ampliarse a travs del campo del anlisis e interpretacin de los mismos. La palabra ESTADSTICA, de acuerdo a un estudio realizado por Jos Mayor Gallego 1 , tiene diversas acepciones o signifcados, que aunque relacionados pueden confundirse, produciendo una impresin errnea de lo que realmente es y pretende la ciencia o disciplina denominada Estadstica. As, podemos encontrar en los medios de comunicacin usuales, datos sobre las estadsticas del paro, estadsticas de accidentes de circulacin o estadsticas de precios. Por ello, con el fn de apreciar el signifcado real de esta disciplina, defnimos a la Estadstica como la ciencia de los datos y al mtodo cientfco como un conjunto de principios y procedimientos para la bsqueda sistemtica del conocimiento. Razn por la cual, la unin de estos dos campos se convierte en la ciencia de la recoleccin y anlisis de datos para la toma de decisiones. 1.2 CICLOS ITERATIVOS DEL MTODO CIENTFICO. El ciclo iterativo del mtodo cientfco, se da como resultado del continuo aprendizaje y esta compuesto por las siguientes fases, que representamos grfcamente a continuacin: Desarrollo del Aprendizaje CAPTULO N 1: LA ESTADSTICA Y EL MTODO CIENTFICO 1 Jos Mayorga Gallego. Universidad de Sevilla - Espaa UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 11 PRIMER BIMESTRE Gua Didctica:Estadstica I GRAFICO Nro. 1 El mtodo cientfco y estadstica Estas fases, forman parte del lenguaje de la toma de decisiones en Estadstica, ya que inconscientemente la informacin recolectada en diversas actividades, la aplicamos a esta disciplina para tomar decisiones. Por ejem: Al levantarnos en la maana observamos como est el tiempo para decidir: como vestirnos o averiguamos si va a llover para decidir si llevamos paraguas, un abrigo, etc., A continuacin, realizaremos un ejemplo aplicando las fases del mtodo cientfco en un estudio estadstico: La informacin recolectada, se basa en las personas que fuman 2 . FASE 1: PLANTEO DE HIPTESIS SOBRE UNA POBLACION. Los fumadores tienen ms bajas laborales que los no fumadores En qu sentido? Mayor nmero? Tiempo medio? FASE 2: DISEO DE EXPERIMENTOS (decidir qu datos recoger) Qu individuos pertenecern al estudio (muestras) Fumadores y no fumadores en edad laboral. Criterios de exclusin Cmo se eligen? Descartamos los que padecen enfermedades crnicas? Qu datos recoger de los mismos (variables) Nmero de bajas Tiempo de duracin de cada baja Sexo? Sector laboral? Otros factores? 2 Bioestadstica. Universidad de Mgala UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 12 PRIMER BIMESTRE Gua Didctica: Estadstica I FASE 3: RECOLECCIN DE DATOS Y ANALISIS) Recoger los datos (muestreo) Estratifcado? Sistemticamente? FASE 3: OBTENCIN DE CONCLUSIONES Describir (resumir) los datos obtenidos tiempo medio de baja en fumadores y no (estadsticos) % de bajas por fumadores y sexo (frecuencias), grfcos,... Realizar una inferencia sobre la poblacin Los fumadores estn de baja al menos 10 das/ao ms de media que los no fumadores. Cuantifcar la confanza en la inferencia Nivel de confanza del 95% Signifcacin del contraste: p=2% 1.3 CONCEPTOS BSICOS Aprender estadstica es como aprender un nuevo idioma, por ello, como lo habamos mencionado en un principio, la ampliacin de los objetivos iniciales de la Estadstica, permitieron que en la actualidad se defna a esta disciplina como: La Estadstica es la ciencia que trata la teora y aplicacin de mtodos apropiados para coleccionar, representar, resumir y analizar datos, as como realizar inferencias a partir de los mismos 3 A partir de esta defnicin, podemos considerar dos partes o vertientes de la Estadstica, en lo que se refere fundamentalmente a su enfoque, esta son la: Descriptiva e Inferencia. a) Estadstica Descriptiva: Se defne como la ciencia que sistematiza, recoge, ordena y presenta los datos referentes a un asunto, fenmeno o problema de investigacin, sin pretender extender las conclusiones que puedan extraerse de los datos a otros grupos distintos o mas amplios. Se calcula a partir de los datos de una muestra o de una poblacin. Ejemplo: El nivel promedio de inteligencia obtenido mediante la prueba Stanford Binet, result ser 104 para el grupo dos de estudiantes de Psicologa. Durante los ltimos dos das se han informado un total de ocho homicidios. En una entrevista a 1100 electores, se obtuvo la siguiente informacin: el candidato del Partido Conservador obtuvo la preferencia de un 44% de los encuestados, mientras que un 45% opt por el candidato del Partido Liberal y an se mantiene un 11% indecisos. 3 MAYORGA, Gallego Jos . Introduccin a la Estadstica 2005 - 2006 UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 13 PRIMER BIMESTRE Gua Didctica:Estadstica I b) Estadstica Inferencial: Su objetivo parte de la deduccin de leyes que rigen los diferentes fenmenos estudiados, para de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones. Es decir, que para un anlisis estadstico inferencial se requiere utilizar tcnicas, procesamientos y anlisis estadsticos ms avanzados con los datos estadsticos obtenidos de la muestra, para as confrmar la veracidad de las inferencias que se haga sobre la respectiva poblacin a que corresponde la muestra. Generalmente, este tipo de anlisis emplea como herramienta bsica el clculo de probabilidades y se lleva cabo para exponer relaciones de causa y efecto, as como probar hiptesis y teoras cientfcas. Ejemplo: Los estudiantes de psicologa que obtuvieron un IQ de inteligencia sobre 120, probablemente obtendrn sobre 700 puntos en cada rea de la prueba de admisin para ingreso a la universidad. Si an hay un 11% de los electores indecisos y si la poblacin electoral es de cerca de 88 millones electores, quiere decir que an hay cerca de 10 millones de electores quienes realmente decidirn cul va a ser el candidato ganador. En el presente ciclo, estudiaremos la primera de estas vertientes, es decir, la Estadstica Descriptiva, exponiendo sus tcnicas fundamentales as como sus objetivos y metodologa. c) Poblacin: Es el grupo de objetos o individuos (Fig. 1) bajo estudio, sobre el que estamos interesados en obtener conclusiones. Generalmente en una investigacin es demasiado grande para poder abarcarlo, sin embargo cuando esta se lleva a cabo es necesario tener en cuenta algunas caractersticas esenciales para seleccionar la poblacin objeto de estudio. Estas caractersticas son: homogeneidad, tiempo y espacio, pues los miembros de la poblacin deben tener las mismas caractersticas segn las variables que se vayan a considerar en la investigacin, as como determinar si el estudio es del momento presente, si se va a estudiar a una poblacin de cinco aos atrs o si se van a entrevistar personas de diferentes generaciones y lgicamente es necesario conocer el lugar donde se ubica la poblacin de inters. Fig. 1. Poblacin UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 14 PRIMER BIMESTRE Gua Didctica: Estadstica I d) Muestra: Es un subconjunto de la poblacin (Fig. 2), que nos permite realmente hacer las observaciones (mediciones) y con ello extraer conclusiones sobre la poblacin. Existen tres tipos de muestra: Aleatoria, Estratifcada y Sistemtica, cuya seleccin depender de la calidad y cun representativo se pretenda sea el estudio de la poblacin. Fig. 2 Muestra e) Variable: Una variable es una caracterstica observable que vara entre los diferentes individuos de una poblacin y que se puede describir segn un esquema de medicin bien defnido. Las variables constituyen la unidad bsica de toda investigacin y se clasifcan en diferentes categoras segn la naturaleza o tipo de estudio. Entre stas tenemos: TABLA NRO. 1 TIPOS DE VARIABLES Clasifcacin Defnicin Variables Cualitativas Son aquellas que se expresan en forma verbal como categoras o atributos. Por ejemplo, el sexo, color, afliacin poltica, nacionalidad, motivacin, rea acadmica o profesin de una persona. Variables Cuantitativas Son las que varan en trminos de cantidad y se registran o expresan en forma numrica. Por ejemplo, edad, promedio acadmico, puntuaciones de exmenes, frecuencia de delitos, temperatura, ingresos anuales o salarios por hora. Variables Discretas Son aquellas que slo adquieren un valor absoluto o especfco que nunca cambian. Pueden ser cualitativas. Ejemplo: el sexo, nacionalidad, grupo tnico, entre otras. Variables Continuas Son variables que siempre son cuantitativas, son las que pueden asumir cualquier valor. Por ejemplo, la edad, altura, peso, ndice acadmico. UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 15 PRIMER BIMESTRE Gua Didctica:Estadstica I Variables Independientes Son las caractersticas controladas por el investigador y que se supone tendrn efectos sobre otras variables. Por ejemplo, en un estudio experimental se investiga si un nuevo medicamento mejora las condiciones del sida. A tales efectos se seleccionaron 30 pacientes, de los cules 15 reciban el nuevo medicamento (grupo experimental) y otros 15 continuaban con su tratamiento tradicional (grupo control). El nuevo medicamento viene a ser la variable independiente porque es la que los investigadores controlan. Variables Dependientes Son las caractersticas o aspectos que se alteran por consecuencia del control que ejerce el investigador sobre otras variables. Por ejemplo. En el ejercicio de las variables independientes tenemos que el nuevo medicamento es la que los investigadores controlan, y que luego examinarn sus efectos en la condicin del sida, la cul viene a ser la variable dependiente, porque es la condicin que se va alterar o quedar afectada por el nuevo medicamento. Variable Constante Se refere a una caracterstica que no vara en un grupo o poblacin en particular dentro del tiempo que se lleva a cabo la investigacin. Por ejemplo, el nmero total de sujetos en un estudio. Si la muestra es de 150 personas se mantiene igual desde que comienza el estudio hasta que fnalice el mismo. Fuente: Documento sobre conceptos bsicos de investigacin y estadsticas. Cabe indicar que algunas de estas variables, se tornan modalidades de otras variables como por ejemplo: Variables Cualitativas 4 (Si sus valores (modalidades) no se pueden asociar naturalmente a un nmero no se pueden hacer operaciones algebraicas con ellos). Nominales: Si sus valores no se pueden ordenar. Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No) Ordinales: Si sus valores se pueden ordenar. Mejora a un tratamiento, Grado de satisfaccin, Intensidad del dolor Variables Cuantitativas o Numricas (Si sus valores son numricos tiene sentido hacer operaciones algebraicas con ellos) Discretas: Si toma valores enteros Nmero de hijos, Nmero de cigarrillos, Num. de cumpleaos. Continuas: Si entre dos valores, son posibles infnitos valores intermedios. 4 Introduccin a la Estadstica. Universidad de Magala UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 1 PRIMER BIMESTRE Gua Didctica: Estadstica I Altura, Presin intraocular, Dosis de medicamento administrado, edad. f) Inferencia estadstica: Es el proceso de sacar conclusiones acerca de una poblacin basados en informacin de una muestra de esa poblacin. g) Parmetro: Es un ndice estadstico calculado a base de los datos de una poblacin y que cuantifca una caracterstica de esa poblacin. Generalmente son datos comprobados mediante registros. Ejemplo: La tasa de desempleo se ha mantenido en 18%. Es un ndice estadstico que va dirigido a describir a la poblacin. Muchos de estos ndices se obtienen mediante registros ofciales de agencias del Gobierno, tales como la tasa de mortalidad, de divorcios, entre otras 5 . h) Estadgrafo: A diferencia del parmetro es ndice es calculado a base de los datos de una muestra. i) Datos: Medidas que se realizan sobre los sujetos de un experimento. Existen diferentes modalidades de presentar ordenadamente los datos, estas son: Las tablas de frecuencias y las representaciones grfcas, dos maneras equivalentes de presentar la informacin. Las dos exponen ordenadamente la informacin recogida en una muestra. Tablas de frecuencia: Exponen la informacin recogida en la muestra, de forma que no se pierda nada de informacin (o poca). Frecuencias absolutas: Contabilizan el nmero de individuos de cada modalidad. Frecuencias relativas (porcentajes): Idem, pero dividido por el total. Frecuencias acumuladas: Slo tienen sentido para variables ordinales y numricas. Representaciones grfcas: Estas representaciones grfcas se dan para variables cualitativas y variables cuantitativas. Las representaciones grfcas que utilizamos para variables cualitativas son: diagramas de barras, diagramas de sectores y pictogramas. En cambio para las variables cuantitativas, tenemos: diagrama de barras, histogramas y diagramas integrales. Finalmente, en la fg. 3 que se muestra a continuacin, presentamos el proceso de obtencin de datos: Fig. 3. Procesamiento de obtencin de datos 5 Documento sobre conceptos bsicos de investigacin y estadsticas.2006 UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 17 PRIMER BIMESTRE Gua Didctica:Estadstica I 1.4 PLAN DE INVESTIGACIN El plan de investigacin, es un instrumento que sirve para detallar fuentes de datos, mtodos de investigacin que se utilizarn para recopilar la informacin, instrumentos de investigacin que disearn en funcin de la informacin que se necesite, plan de muestreo y mtodos de contacto que posibilitaran recabar la informacin, tal y como se presenta en la fgura 4. El contenido de cada elemento ustedes lo vern en la materia de INVESTIGACION. Fig. 4. Elementos que contiene un plan de investigacin 1.5 TIPOS DE INVESTIGACIN Al ser las estadsticas uno de los elementos bsicos de todo tipo de investigacin, trataremos de describir brevemente y ver en qu reas especfcas se utilizan las mismas. TABLA NRO. 2 TIPOS DE INVESTIGACION Clasifcacin Defnicin INVESTIGACIN DESCRIPTIVA Es el tipo de investigacin que procura determinar cual es la situacin, ver lo que hay describir tal cual es el asunto o condicin sobre un asunto o problema. INVESTIGACIN EXPERIMENTAL Es el tipo de investigacin donde el investigador manipula o controla una o ms variables para ver su efecto en otra o ms variables. INVESTIGACIN CLNICA- Es un estudio intensivo que se caracteriza por la gran variedad en el uso de medios e instrumentos de evaluacin. La muestra es muy pequea de hasta uno o dos casos. Es mayormente de carcter psicolgico y psiquitrico. INVESTIGACIN LONGITUDINAL Son investigaciones cuyos resultados se esperan a largo plazo. INVESTIGACIN HISTRICA Investigacin que trata de auscultar informacin sobre eventos y hechos ocurridos en el pasado. Constituye ser un proceso mediante el cul el investigador busca comprobar la veracidad de los informes, pruebas, testimonios y observaciones muchas veces realizadas por otros. La principal fnalidad de los estudios histricos consiste en informar lo que ocurri. UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 18 PRIMER BIMESTRE Gua Didctica: Estadstica I INVESTIGACIN ETNOGRFICA Es un tipo de investigacin cualitativa y descriptiva de un enfoque ms inductivo que atiende ms los procesos que los logros. Es esencialmente interpretativa en el sentido de que el investigador recoge los datos mediante entrevistas y diversos medios de observacin para luego interpretarlos y analizarlos de acuerdo a las teoras y principios que fundamentan el asunto o problema de estudio. Fuente: Documento de conceptos bsicos de investigacin y estadsticas Cabe indicar, que existen otras tipos de investigacin que ustedes conocern en la materia de INVESTIGACIN. Como medidor del control de lectura que lleva a cabo en base al libro y a la gua didctica, desarrolle las siguientes cuestiones de repaso. A. Srvase encerrar mediante un crculo, las respuestas correctas. 1. Al considerar algo verdadero debido a una tradicin, o a que alguna persona eminente dice que lo es, estamos utilizando el mtodo de adquisicin del conocimiento de a. Autoridad. b. Racionalismo c. Intuicin d. Cientfco 2. Al conjunto completo de individuos, objetos o datos que el investigador est interesado en estudiar se denomina a. Poblacin. b. Muestra c. Variable d. Parmetro POR FAVOR, SIRVASE REVISAR EL LIBRO BASE, PARA ACLARAR DUDAS O PROFUNDIZAR LOS CONOCIMIENTOS ADQUIRIDOS. EN EL PRESENTE CAPTULO A TRAVES DE LOS EJERCICIOS RESUELTOS QUE PROPORCIONA EL AUTOR. AUTOEVALUACIN N1 UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 1 PRIMER BIMESTRE Gua Didctica:Estadstica I 3. El valor del smbolo matemtico es a. Variable b. Constante. c. Dependiente d. Un dato 4. La variable medida por el investigador para determinar el efecto que sobre ella tienen las dems es la a. Independiente b. Dependiente. c. De Control d. Extraa 5. Un profesor lleva a cabo un experimento para determinar si el modo de presentacin afecta cuanto se recuerda de un material. Para este experimento, el investigador utiliza varios pasajes en prosa que se presentan en forma visual u oral. Se eligen cincuenta estudiantes entre los asistentes a la universidad en donde trabaja este maestro. Los estudiantes se dividen en dos grupos de 25 individuos cada uno. El primero recibe una presentacin visual de los pasajes en prosa y el segundo grupo escucha los pasajes gracias a una presentacin oral. Al fnal de sus respectivas presentaciones, se pide a los sujetos que escriban la mayor parte del material que puedan recordar. Se calcula el promedio de palabras recordadas en cada grupo y se comparan para ver si el modo de presentacin tuvo cierto efecto. El modo de presentacin es a. La variable dependiente b. La variable independiente. c. El estadstico d. La muestra 6. Un profesor lleva a cabo un experimento para determinar si el modo de presentacin afecta cuanto se recuerda de un material. Para este experimento, el investigador utiliza varios pasajes en prosa que se presentan en forma visual u oral. Se eligen cincuenta estudiantes entre los asistentes a la universidad en donde trabaja este maestro. Los estudiantes se dividen en dos grupos de 25 individuos cada uno. El primero recibe una presentacin visual de los pasajes en prosa y el segundo grupo escucha los pasajes gracias a una presentacin oral. Al fnal de sus respectivas presentaciones, se pide a los sujetos que escriban la mayor parte del material que puedan recordar. Se calcula el promedio de palabras recordadas en cada grupo y se comparan para ver si el modo de presentacin tuvo cierto efecto. El promedio de palabras recordadas por cada grupo es a. La variable dependiente b. La variable independiente c. El estadstico. d. El dato UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 20 PRIMER BIMESTRE Gua Didctica: Estadstica I 7. Un investigador quiere determinar si un implante de tipo experimental para el control natal tiene efectos colaterales sobre el peso corporal y la depresin de las mujeres. Un grupo de 1000 fminas adultas se prestan como voluntarias para el experimento. El investigador elige a 100 de estas mujeres para el estudio. La mitad de las escogidas se asignan al grupo 1 y la otra mitad al grupo 2, de modo que los datos sobre peso corporal promedio y depresin promedio sean iguales al comienzo del experimento. A las mujeres del grupo 1 se les realiza el implante, mientras que las mujeres del grupo 2 reciben un implante placebo. El peso corporal y el placebo se miden al inicio y al fnal de la prueba. Para medir la depresin se utiliza un cuestionario estndar; Al fnal del experimento se comparan el peso corporal promedio y los niveles de depresin promedio de cada grupo para determinar si el implante experimental tuvo algn efecto sobre estas variables. Para proteger a las mujeres contra un embarazo no deseado se utiliz otro mtodo de control natal que no interfera con el implante. La Poblacin es: a. El peso corporal b. El nivel de depresin c. Las mujeres que participaron en el experimento d. Las mujeres que se ofrecieron como voluntarias. 8. Un investigador quiere determinar si un implante de tipo experimental para el control natal tiene efectos colaterales sobre el peso corporal y la depresin de las mujeres. Un grupo de 1000 fminas adultas se prestan como voluntarias para el experimento. El investigador elige a 100 de estas mujeres para el estudio. La mitad de las escogidas se asignan al grupo 1 y la otra mitad al grupo 2, de modo que los datos sobre peso corporal promedio y depresin promedio sean iguales al comienzo del experimento. A las mujeres del grupo 1 se les realiza el implante, mientras que las mujeres del grupo 2 reciben un implante placebo. El peso corporal y el placebo se miden al inicio y al fnal de la prueba. Para medir la depresin se utiliza un cuestionario estndar; Al fnal del experimento se comparan el peso corporal promedio y los niveles de depresin promedio de cada grupo para determinar si el implante experimental tuvo algn efecto sobre estas variables. Para proteger a las mujeres contra un embarazo no deseado se utiliz otro mtodo de control natal que no interfera con el implante. El tamao de la muestra es: a. 2 b. 50 c. 100. d. 1000 9. La mayor parte de la investigacin de tipo antropolgica y etiolgica son a. Estudios observacionales b. Estudios correlacionales c. Observacines naturalistas. d. Estimacin de parmetros UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 21 PRIMER BIMESTRE Gua Didctica:Estadstica I 10. Gran parte de la investigacin de mercados son ejemplos de a. Estudios observacionales b. Estudios correlacionales c. Observacines naturalistas d. Estimacin de parmetros. INTERACTIVIDAD A TRAVS DEL CAMPUS VIRTUAL Ingrese peridicamente al campus virtual que se encuentra en la siguiente direccin www.utpl. edu.ec, digite su nombre de usuario y contrasea. Conteste la auto evaluacin del presente captulo y verifque sus respeustas dentro el entorno. La estadstica dice que si una persona pone la cabeza en el congelador y los pies en el horno su temperatura media ser normal ANONIMO (detalle humorstico) El presente captulo, permitir al estudiante conocer lo fundamental de matemticas, ya que la mayora de ejercicios estadsticos requieren de clculos exactos y es una de las herramientas ms adecuadas que nos sirven para todo tipo de mediciones as como todas las situaciones que se presenten. 2.1 MEDICION La medicin es la descripcin de datos en trminos de nmeros (Guilford, 1954). En un sentido general es asignar nmeros a objetos o eventos de acuerdo a reglas establecidas (Stevens, 1951). Y cuando hablamos de estadsticas o de mtodos estadsticos estamos realmente inmersos en el campo de la medicin. La medicin es fundamental para que nuestros juicios y opiniones sean precisos y validos, razn por la cual se defne como el proceso mediante el cual se asignan nmeros a los atributos o caractersticas de las personas, objetos o eventos de acuerdo a unas reglas o indicadores claramente establecidos 6 . 2.2 ESCALAS DE MEDICION Las escalas de medicin, son un esquema especfco para asignar cantidades numricas a las diferentes modalidades que presenta un carcter cualitativo, es decir, codifcar numricamente las diferentes modalidades de un atributo. CAPTULO N 2: CONCEPTOS BSICOS DE MATEMTICAS Y DE MEDICIN 6 Luis Pericchi, Ph. D. DOCUMENTO SOBRE ESTADSTICA DESCRIPTIVA
UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 22 PRIMER BIMESTRE Gua Didctica: Estadstica I Por ello, es una buena idea codifcar las variables como nmeros para poder procesarlas con facilidad en un ordenador, o asignar etiquetas a los valores de las variables para recordar qu signifcan los cdigos numricos. Ej. Sexo (Cualit: Cdigos arbitrarios) 1 = Hombre 2 = Mujer Raza (Cualit: Cdigos arbitrarios) 1 = Blanca 2 = Negra,... Felicidad Ordinal: Respetar un orden al codifcar. 1 = Muy feliz 2 = Bastante feliz 3 = No demasiado feliz As tambin, es necesario conocer que se pueden asignar cdigos a respuestas especiales como: 0 = No sabe 99 = No contesta... Y que debern ser tomadas en cuentas en el anlisis. Aunque se codifquen como nmeros, debemos recordar siempre el verdadero tipo de las variables y su signifcado, pues no todo est permitido con cualquier tipo de variable. Por tanto, estos valores numricos deben estar expresados en una escala bien defnida ya que tendrn algn signifcado dependiendo de la escala que se haya empleado, razn por la cual distinguiremos cuatro tipos de escalas de medicin: a) Escalas Nominales: Clasifcan los objetos, personas o variables en categoras cualitativamente distintas. Ejm. CARCTER: Carrera que estudia. MODALIDADES: Magisterio: 1 : Informtica: 2 : Fsica: 3 : Matemticas: 4 Cuando se trabaja con escalas de este tipo se pueden obtener los siguientes estadsticos descriptivos: frecuencias, moda, el coefciente de contingencia y la correlacin nominal b) Escalas ordinales: Clasifcan a las personas, eventos u objetos en una posicin con relacin a cierto atributo, pero sin indicar la distancia que hay entre las posiciones. Ejm. CARCTER: Nivel de estudios. MODALIDADES: Educacin bsica: 1; Educacin secundaria: 2 ; Titulacin media: 3 Titulacin superior: 4; Doctorado: 6 UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 23 PRIMER BIMESTRE Gua Didctica:Estadstica I Los estadsticos que se pueden utilizar en datos medidos en este nivel son: la mediana, los percentiles y la correlacin ordinal. c) Escalas de intervalos: A diferencia de las dos escalas anteriores, estas ordenan los objetos o eventos segn la magnitud del atributo que representan y proveen intervalos iguales entre las unidades de medida. El ejemplo clsico, de este tipo de escala es el de la temperatura, medida en grados Celsius. Por ejemplo si la temperatura de un individuo es 360 y la de otro 380, la diferencia es de 20. Pero el cociente entre las dos temperaturas carece de sentido fsico, debido al carcter arbitrario que tiene la eleccin del origen de la escala Celsius. Recordemos que en dicha escala, el cero no representa la ausencia del fenmeno estudiado, sino meramente el punto que separa el estado solido del liquido para el agua. En este tipo de escala, es posible realizar las cuatro operaciones algebraicas, debido a que los valores atribuidos a las modalidades se encuentran en correspondencia biunvoca con la secuencia de nmeros reales y, por tanto, poseen propiedades aritmticas. d) Escala de razones o cocientes: Se diferencian de las escalas de intervalos solamente porque esta escala presenta un cero natural, que indica la ausencia del fenmeno estudiado, de manera que tanto la diferencia como el cociente o razn entre dos valores tienen un signifcado real. Dos buenos ejemplos de las escalas de razones y cocientes son las medidas de la estatura y el peso. Si una columna mide seis pies es el doble de alto de otra columna que mide tres pies. Si Enrique pesa 180 libras, entonces pesa el doble que Mara quin pesa 90 libras. Las razones de los nmeros en estas escalas tienen un determinado sentido, lo que hace posible que se interpreten los valores numricos entre las cantidades obtenidas de los objetos. En esta escala se da la relacin biunvoca entre los valores que adquieren la variable y la secuencia de nmeros reales. Adems, el origen de la escala s representa la ausencia absoluta de la caracterstica que se est midiendo. A continuacin, ampliaremos un poco ms estos conceptos en la siguiente tabla: CARACTERSTICAS, EJEMPLOS Y LIMITACIONES DE LAS ESCALAS DE MEDICIN ESCALA CARACTERSTICAS USOS/EJEMPLOS LIMITACIONES Nominal Se clasifcan las personas eventos u objetos en categoras Denominaciones religiosas, aflicin politico partidista, codifcaciones en la clasifcacin de objetos, pinturas, movimientos literarios. No se pueden precisar diferencias cuantitativas entre las categoras. Ordinal Se clasifcan u ordenan las personas, objetos y eventos en determinada posicin Orden de llegada de atletas en una carrera, puntuaciones de una prueba, rangos militares, nivel de popularidad de estudiantes en una escuela. Restringida para identifcar diferencias relativas, pero no precisa diferencias en cantidad absoluta entre personas u objetos. UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 24 PRIMER BIMESTRE Gua Didctica: Estadstica I Intervalos Escala que posee unidades de igual magnitud. El punto cero de la escala es arbitrario y no refeja la ausencia del atributo. Temperaturas (Celsius y Fahrenheit), fechas del calendario, escala de inteligencia. Razones no tienen sentido ya que el punto cero es establecido convencionalmente. Razones Escala que posee un punto cero absoluto e intervalos de igual magnitud. Distancia, peso,e statura, tiempo rquerido para realizar una tarea escolar. Ninguna, excepto que su uso se supedita mayormente a medir cualidades fsicas ms que para la medicin de aspectos pscolgicos. Fuente y elaboracin: Conceptos Bsicos de Investigacin y estadsticas. 2.3 VARIABLES. En el captulo anterior, defnimos lo que era una variable, as como tambin identifcamos los diversos tipos de variables que existen. Sin embargo en el presente vamos a profundizar dos tipos de variables, consideradas importante dentro de ESTADISTICA. Fig. 5 Variables Los dos tipos de variables a estudiar son: las variables DISCRETAS Y CONTINUAS, que forman parte de la variable cuantitativa y se encuentran en una escala de medida de intervalo y razn. La forma diferente de clasifcar estas variables 7 , se da segn el nmero de valores que tengan en la escala, as por ejemplo: Variables Discretas: segn el nmero de valores es fnito (nmeros enteros). Por lo tanto se utilizaran: Todas las variables cualitativas (escala nominal) Todas las variables con escala ordinal Variables cuantitativas: las que son el resultado de contar, valores son nmeros enteros (personas en el hogar, ingresos, tamao del municipio). Variables Continuas: segn el nmero de valores en la escala es infnito (Nmeros con infnitos decimales). Por tan se utilizarn: Slo aquellas variables cuantitativas que son resultado de medir (ejemplos: altura, peso, tamao del piso, edad) 7 JARA, Pilar Introduccin a la Psicoestadstica UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 25 PRIMER BIMESTRE Gua Didctica:Estadstica I Sin embargo, en la prctica la diferencia segn el nmero de valores que tengan en la escala dentro de estas dos variables est desvanecida pues existen variables que son resultado de medir, pero redondeamos y convertimos en nmero fnito de valores enteros (edad), otras variables tericamente continuas, que convertimos en discretas como por ejemplo: escala ideolgica de izquierda a derecha, valores 1 a 7y fnalmente variables discretas que tienen muchsimos valores diferentes como: ingresos, poblacin de un municipio, etc. Como medidor del control de lectura que lleva a cabo en base al libro y a la gua didctica, desarrolle las siguientes cuestiones de repaso. A) Srvase encerrar mediante un crculo, las respuestas correctas. 1. Para los siguientes datos, X: 2, 3, 6, 8, 9, 15. X= a. 26 b. 28 c. 41 d. 43. 2. Para los siguientes datos, X: 2, 3, 6, 8, 9, 15. a. 26 b. 28 c. 41 d. 43 POR FAVOR, SIRVASE REVISAR EL LIBRO BASE, PARA ACLARAR DUDAS O PROFUNDIZAR LOS CONOCIMIENTOS ADQUIRIDOS EN EL PRESENTE CAPTULO A TRAVES DE LOS EJERCICIOS RESUELTOS QUE PROPORCIONA EL AUTOR. AUTOEVALUACIN N2 UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 2 PRIMER BIMESTRE Gua Didctica: Estadstica I 3. Para medir la variable Tipo de msica utilizamos la escala a. Nominal b. Ordinal c. Intervalos d. Razn 4. La variable se divide en varias categoras en la escala a. Nominal b. Ordinal c. Intervalos d. Razn 5. La escala en la que ordenamos los objetos medidos considerando si poseen ms, menos o la misma cantidad de la variable medida es la a. Nominal b. Ordinal c. Intervalos d. Razn 6. Aquella variable que puede asumir infnitos valores entre unidades adyacentes es a. Independiente b. Dependiente c. Continua. d. Discreta 7. La altura es un ejemplo de variable a. Independiente b. Dependiente c. Continua d. Discreta UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 27 PRIMER BIMESTRE Gua Didctica:Estadstica I 8. El valor por arriba del valor registrado, a una distancia que es igual a la mitad de la unidad de medida mnima en la escala se denomina a. Lmite real superior b. Lmite real inferior c. Lmite aparente superior d. Lmite aparente inferior 9. Si la unidad mnima de medida es de 0,1 libra, y registramos 170 libras de peso, El lmite real inferior es de a. 169,5 b. 169,95 c. 170 d. 170,5 10. Al redondear el nmero 45,0451 a dos cifras decimales nos queda a. 45 b. 45,0 c. 45,04 d. 45,05 INTERACTIVIDAD A TRAVS DEL CAMPUS VIRTUAL Ingrese perdicamente al campus virtual que se encuentra en la siguiente direccin www.utpl. edu.ec, digite su nombre de usuario y contrasea. Conteste la auto evaluacin del presente captulo y verifque sus respeustas dentro el entorno. UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 28 PRIMER BIMESTRE Gua Didctica: Estadstica I El campo de la estadstica descriptiva no tiene que ver con las implicaciones o conclusiones que se puedan deducir de conjuntos de datos. La estadstica descriptiva sirve como mtodo para organizar datos y poner de manifesto sus caractersticas esenciales con el propsito de llegar a conclusiones, por ello en este tercer captulo analizaremos la forma de organizar y presentar los datos de manera signifcativa. 3.1 DISTRIBUCION DE FRECUENCIAS Se defne a la distribucin de frecuencias, como el agrupamiento de datos en categoras mutuamente excluyentes dando el nmero de observaciones en cada categora 8 . Los pasos son los siguientes: Establecer el nmero de clases que se quiere. Determinar el intervalo o la amplitud de clase. Fijar los lmites de cada clase. Poner una marca por cada observacin que quede en cada clase. Contar en nmero de observaciones en cada clase (frecuencia de clase) La frecuencia relativa se obtiene dividiendo la frecuencia de clase entre el total de datos (n), y, La frecuencia porcentual se obtiene multiplicando la frecuencia relativa por 100. Simblicamente, una distribucin de frecuencias vendra dada por los pares (xi, ni), donde xi son los valores de la variable y ni son sus frecuencias. As mismo pueden considerarse bsicamente dos tipos de distribuciones de frecuencias: Aquellas en las que los valores de la variable no estn agrupados y las que presentan esos valores agrupados en intervalos. a) Distribucindefrecuenciasdedatosnoagrupados.- Corresponden a las variables discretas, cuyo valores observados (sin repetir) se ordena de menor a mayor en la primera columna y en la segunda se indica cuantas veces se observ dicho valor. CAPTULO N 3: DISTRIBUCIN DE FRECUENCIAS 8 SANDOVAL, Andrs. Estadstica I Universidad Panamericana UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 2 PRIMER BIMESTRE Gua Didctica:Estadstica I Ejemplo 9 : En la tabla adjunta se da la distribucin de las 500 hogares de un barrio segn el nmero de sus miembros. Esta distribucin, adems de dar los valores de la variable y sus frecuencias absolutas, recoge las relativas y las acumuladas. Se trata de la distribucin de una variable discreta con un nmero fnito de valores. b) Distribucindefrecuenciasdedatosagrupados.- Se asocia fundamentalmente con las variables continuas y trata de decidir el nmero de intervalos en los que hay que agrupar los valores de la variable as como si la amplitud o recorrido de los mismos debe ser igual. Ejemplo 10 : La distribucin del presupuesto semanal en alimentacin de un conjunto de 265 familias expresado en euros es el que fgura en la tabla siguiente: Presupuestos L i-1 -L i a i X i Familias n i f i N i F i 80-100 100-110 110-115 115-120 120-130 130-150 150-170 170-210 210-270 270-360 20 10 5 5 10 20 20 40 60 90 90 105 112.5 117.5 125 140 160 190 240 315 10 35 40 45 55 30 20 15 10 5 0.0377 0.1321 0.1509 0.1698 0.2075 0.1132 0.0755 0.0566 0.0377 0.0189 10 45 85 130 185 215 235 250 260 265 0.377 0.1698 0.3208 0.4906 0.6981 0.8113 0.8868 0.9434 0.9811 1.0000 Total 265 1 En este caso, se trata de una variable continua con sus valores agrupados en intervalos cuya amplitud es variable. Este tipo de intervalos permite tratar de forma distinta a los valores de la variable, segn donde se localice la mayor parte de las observaciones. En este sentido la amplitud de los intervalos es inversa a la frecuencia de los mismos. Esta forma de proceder evita que la mayor parte de las observaciones se concentre en un solo intervalo o en unos pocos. Tamao de los hogares N de hogares xi ni f i N i F i 1 2 3 4 5 6 7 8 9 10 40 70 110 90 48 42 40 35 20 5 0.08 0.14 0.22 0.18 0.096 0.084 0.08 0.07 0.04 0.01 40 110 220 310 358 400 440 475 495 500 0.08 0.22 0.44 0.62 0.716 0.8 0.88 0.95 0.99 1 500 1 9 SNCHEZ, Fernndez Jess. Introduccin a la Estadstica Empresarial 10 SNCHEZ, Fernndez Jess. ANLISIS DE UNA VARIABLE. UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 30 PRIMER BIMESTRE Gua Didctica: Estadstica I 3.2 PERCENTILES El percentil, es el valor bajo el cual se encuentra una proporcin determinada de la poblacin. Es una medida de posicin muy til para describir una poblacin. Es un valor tal que supera un determinado porcentaje de los miembros de la poblacin medida. Por ejemplo, en la Prueba de Estadstica el postulante que qued en el Percentil 90, quiere decir que supera al 90% de la poblacin que rindi esta prueba. En consecuencia, tcnicamente no hay reprobacin en estas pruebas. Quienes las rinden slo son ubicados en algn tramo de la escala, producto de su rendimiento particular dentro del grupo. Algunos percentiles tienen nombres especiales. El percentil 50, que separa la mitad inferior de los examinados de la mitad superior, se llama mediana. El percentil 25, que separa al cuarto inferior de los examinados del resto, se llama primer cuartil. De manera similar, el percentil 75 se llama tercer cuartil. El concepto de un percentil est estrechamente relacionado con el de un rango de percentil. El percentil 40 de un grupo es la puntuacin que tiene un rango de percentil 40 en ese grupo, el percentil 68 es la puntuacin que tiene un rango de percentil 68; y as sucesivamente. a) Rangodepercentil: El rango de percentil, compara el rendimiento de un examinado en una prueba con el rendimiento de un grupo de personas que la hayan dado. Es decir que un rango percentil no es lo mismo que el porcentaje de preguntas del examen que contest correctamente el examinado Es decir, que si el examen es fcil para el grupo, un examinado puede responder correctamente el 70 por ciento de las preguntas y recibir una puntuacin ubicada en el percentil 10 o incluso menor. Si el examen es difcil para el grupo, un examinado puede responder correctamente el 70 por ciento de las preguntas y recibir una puntuacin ubicada en el percentil 90. El concepto del rango percentil est estrechamente relacionado con el de un percentil. El percentil 40 de un grupo es la puntuacin que tiene un rango percentil de 40 en ese grupo; el percentil 68 es la puntuacin que tiene un rango percentil de 68; y as sucesivamente. 11 3.3 GRAFICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS. Los mtodos grfcos, proporcionan al investigador un conjunto de formas sencillas para examinar tanto las variables individualmente con las relaciones entre las misma. Estas tcnicas grfcas, se distinguen dependiendo del nmero de variables que se analizan a continuacin: Variablesunidimensionales: diagramas de caja, diagramas de cuantiles, diagramas unidimensionales, diagramas de tallos y hojas, histogramas. Variablesbidimensionales: diagramas cuantil cuantil, diagramas de dispersin. Variablesmultidimensionales: perfles multivariantes, caras de Chernoff, matrices de dispersin. Es necesario, acotar que los mtodos grfcos son importantes por las siguientes razones 12 : 11 Defniciones de trminos estadsticos, relacionados con los exmenes. LOG ON. LETS TALK 12 Documento sobre INTRODUCCIN AL ANLISIS EXPLORATORIO DE DATOS. Universidad de Argentina UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 31 PRIMER BIMESTRE Gua Didctica:Estadstica I No existe ninguna tcnica estadstica que sea tan poderosa y sencilla como un grfco bien escogido. Existen mtodos grfcos que permiten al investigador explorar los datos en profundidad, inspeccionar posibles relaciones o patrones, confrmar o rechazar lo esperado, y descubrir nuevos fenmenos. Estos mtodos pueden utilizarse tambin para apoyar los anlisis estadsticos clsicos. Los grfcos nos muestran toda la informacin acerca de los datos. Las medidas numricas resumen, pero en ocasiones pueden equivocar. 3.4 ANALISIS EXPLORATORIO DE DATOS. El Anlisis Exploratorio de Datos (A.E.D.) es un conjunto de tcnicas estadsticas cuya fnalidad es conseguir un entendimiento bsico de los datos y de las relaciones existentes entre las variables analizadas (Salvador M. 2003). Este anlisis, proporciona mtodos sistemticos sencillos para organizar y preparar los datos, detectar fallos en el diseo y recogida de los mismos, tratamiento y evaluacin de datos ausentes, identifcacin de casos atpicos y comprobacin de los supuestos subyacentes en la mayor parte de las tcnicas multivariantes. Por tal motivo, para determinar un anlisis exploratorio de datos, se requieren establecer las principales etapas en la investigacin estadstica como: - Establecer los objetivos de la investigacin. - Recoger y preparar los datos. - Investigas la estructura y calidad de los datos. - Anlisis inicial de datos. - Seleccin y aplicacin de un anlisis estadstico formal apropiado. - Validacin de los resultados - Interpretacin y comunicacin de los resultados. POR FAVOR, SIRVASE REVISAR EL LIBRO BASE PARA ACLARAR DUDAS O PROFUNDIZAR LOS CONOCIMIENTOS ADQUIRIDOS EN EL PRESENTE CAPTULO A TRAVES DE LOS EJERCICIOS RESUELTOS QUE PROPORCIONA EL AUTOR. UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 32 PRIMER BIMESTRE Gua Didctica: Estadstica I Como medidor del control de lectura que lleva a cabo en base al libro y a la gua didctica, desarrolle las siguientes cuestiones de repaso. A) Srvase encerrar mediante un crculo, las respuestas correctas. 1. Aquella tabla que presenta los valores de los datos y su frecuencia de aparicin se denomina a. Distribucin de frecuencias. b. Distribucin de frecuencias de datos agrupados c. Distribucin de frecuencias acumuladas d. Distribucin de frecuencias relativas 2. Lo mejor es escoger una amplitud de intervalo a. Ancho b. Angosto c. Intermedio. d. Es indiferente 3. Si el ancho del intervalo es 6 y el menor valor que tenemos en el grupo de datos es 45, entonces el lmite inferior del intervalo menor es a. 42. b. 43 c. 44 d. 45 4. Aquella distribucin que indica el porcentaje de datos que caen por debajo del lmite real superior de cada intervalo a. Porcentajes relativos b. Frecuencias acumuladas c. Frecuencias absolutas d. Porcentajes acumulados. AUTOEVALUACIN N3 UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 33 PRIMER BIMESTRE Gua Didctica:Estadstica I 5. De la siguiente distribucin de frecuencias, el porcentaje acumulado del tercer intervalo es: Intervalo de clase f 20-24 2 15-19 4 10-14 6 5-9 5 0-4 3 TOTAL 20 a. 0,3 b. 6 c. 20 d. 30. 6. En un grupo de 60 datos el percentil 50 supera a a. 10 califcaciones b. 30 califcaciones c. 50 califcaciones d. 60 califcaciones 7. El rango percentil del valor 12 en el siguiente conjunto de datos es Intervalo de clase f fa 20-24 2 20 15-19 4 18 10-14 6 14 5-9 5 8 0-4 3 3 TOTAL 20 a. 12 b. 45 c. 50 d. 55. UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 34 PRIMER BIMESTRE Gua Didctica: Estadstica I 8. El tipo de grfco de datos nominales u ordinales en el que se traza una barra para cada categora, donde la altura representa la frecuencia o nmero de miembros de esa categora es a. La grfca de barras. b. El histograma c. El polgono de frecuencias d. La curva de porcentajes acumulados 9. El siguiente grfco corresponde a una curva
a. Simtrica. b. Asimtrica positiva c. Asimtrica negativa d. Polisimtrica 10. Si las frecuencias mayores de una curva se desplazan hacia los valores menores, la curva es a. Simtrica b. Asimtrica positiva. c. Asimtrica negativa d. Polisimtrica INTERACTIVIDAD A TRAVS DEL CAMPUS VIRTUAL Ingrese peridicamente al campus virtual que se encuentra en la siguiente direccin: www.utpl. edu.ec, digite su nombre de usuario y contrasea. Conteste la auto evaluacin del presente captulo y verifque sus respuestas dentro el entorno. UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 35 PRIMER BIMESTRE Gua Didctica:Estadstica I En el presente captulo, conoceremos dos caractersticas de suma importancia, que permiten a los investigadores tomar decisiones, estas son: las medidas de tendencia central cuyo propsito es indicar con precisin el centro de un conjunto de observaciones, y las medidas de dispersin que se utilizan para obtener informacin complementaria. 4.1 MEDIDAS DE TENDENCIA CENTRAL El propsito de cualquier medida de tendencia central, es indicar con precisin el centro de un conjunto de observaciones, cuyas caractersticas se basan en 13 : Mostrar en qu lugar se ubica la persona promedio o tpica del grupo. Servir como un mtodo para comparar o interpretar cualquier puntaje en relacin con el puntaje central o tpico. Servir como un mtodo para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones. Sirve como un mtodo para comparar los resultados medios obtenidos por dos o ms grupos. Las medidas de tendencia central ms comunes son: La media aritmtica, la mediana y la moda. a) Media aritmtica: Se defne como aquel valor que resulta de dividir la suma de todas las observaciones entre el nmero de ellas., se la conoce como media o promedio. Se representa por medio de una letra M en otros casos por una X con una lnea en la parte superior. Las propiedades de la media aritmtica, se establecen en: La suma de las desviaciones de los valores de la variable respecto de la media vale cero. Es decir: La media aritmtica no vara si todas las frecuencias de su distribucin se multiplican o dividen por una constante. La suma de las desviaciones al cuadrado de los valores de la variable respecto de una constante C cualquiera se hace mnima ,cuando esa constante C coincide con la media aritmtica (Teorema de Konig): CAPTULO N 4: MEDIDAS DE TENDENCIA CENTRAL Y VARIABILIDAD 13 GRAJALES, Tevni. LAS MEDIDAS DE TENDENCIA CENTRAL UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 3 PRIMER BIMESTRE Gua Didctica: Estadstica I Si a todos los valores de una variable le sumamos una constante C, la media aritmtica queda aumentada en dicha constante. Es decir, la media se ve afecta por cambios de origen en la variable. Si todos los valores de una variable los multiplicamos por una constante C, la media aritmtica queda multiplicada por dicha constante. Es decir, la media se ve afecta por cambios de escala en la variable. Si de un conjunto de valores obtenemos dos o ms subconjuntos disjuntos, la media aritmtica de todo el conjunto se relaciona con todas las medias aritmticas de los diferentes subconjuntos disjuntos. La media es el centro de gravedad de la distribucin. 14 Cuando se calcula es la media de una poblacin, sta se representa con la letra griega , y si es la media de una muestra, sta se representa con x . As, las frmulas son como sigue: Dnde: = Media poblacional X = Representa cualquier valor particular N = Nmero de individuos en la poblacin = Indica la operacin de adicin Dnde: x = Media poblacional X = Representa cualquier valor particular n = Nmero de individuos en la poblacin = Indica la operacin de adicin Algunas caractersticas de la media aritmtica son: Todo conjunto de datos de intervalo o de razn tienen una media. Un conjunto de datos slo tiene una media. La media es til para comparar dos poblaciones. La media aritmtica es la nica medida de tendencia central en la que la suma de las desviaciones de los valores de la media ser siempre cero. Expresado simblicamente (X - x ) = 0 b) Mediana: Es la observacin central de los valores de una poblacin o muestra una vez que stos han sido ordenados de forma ascendente o descendente. Se representa como Md o Me. 14 SNCHEZ, Fernndez Jos. INTRODUCCIN A LA ESTADSTICA EMPRESARIAL UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 37 PRIMER BIMESTRE Gua Didctica:Estadstica I Algunas caractersticas de la mediana son: Todo conjunto de datos ordinales, de intervalo o de razn tienen una mediana. Un conjunto de datos slo tiene una mediana. A la mediana no le afectan valores extremadamente grandes ni extremadamente pequeos, por eso es especialmente til cuando se tienen estos valores. 15 Para determinar el valor de la Me de una distribucin hay que proceder de forma distinta segn se trate de distribuciones de frecuencias para variables discretas o continuas, pues en el primer caso los valores de la variable no estn agrupados y sus frecuencias pueden ser unitarias o mayores que la unidad, mientras que para el segundo caso los valores se presentan siempre agrupados. Las propiedades de la mediana, se identifcan en: La mediana hace mnima la suma de todas las desviaciones absolutas. La mediana se ve afecta por cambios de origen y cambios de escala. La mediana no se ve afectada si todas las frecuencias se multiplican o dividen por una misma constante. La mediana no se infuida por los valores extremos de la variable. Para el caso de distribuciones campaniformes fuertemente asimtricas, la mediana resulta un promedio mejor que la media aritmtica. Dado que en su clculo no intervienen los valores extremos hace que se pueda obtener fcilmente incluso en presencia de intervalos abiertos. El principal inconveniente de la mediana es que, para su clculo, no hace uso de toda la informacin que suministra la variable. 16 c) Moda: La moda, es el valor que aparece con ms frecuencia en un conjunto de datos. Se representa por Mo, y al igual que la mediana, tampoco tiene formula de clculo. Algunas caractersticas de la moda son: Se puede determinar la moda en grupos de datos de todos los niveles (nominales, ordinales, de intervalo y de razn). Puede existir ms de una moda para cada grupo de datos. A la moda no le afectan valores extremadamente grandes ni extremadamente pequeos, por eso es especialmente til cuando se tienen estos valores. 15 SANDOVAL, Andrs. Estadstica I. Universidad Panamericana 16 SNCHEZ, Jos ANLISIS DE UNA VARIABLE UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 38 PRIMER BIMESTRE Gua Didctica: Estadstica I Las propiedades de la moda son muy similares a las de la mediana, en el sentido de que se ve afectada por cambios de origen y de escala, no cambia cuando las frecuencias se multiplican o dividen por una constante y no se ve afectada por los valores extremos de la distribucin. Como inconveniente hay que sealar que no hace uso de toda la informacin de la tabla y que en distribuciones multimodales pierde sentido. 17 Deestastresmedidasdetendenciacentral,lamediaesreconocidacomolamejorymstildelas medidasdetendenciacentral,porlassiguientesrazones: Lospuntajescontribuyendemaneraproporcionalalhacerelcmputodelamedia. Eslamedidadetendenciacentralmsconocidayutilizada. Lasmediasdedosomsdistribucionespuedenserfcilmentepromediadasmientrasquelasmedianas ylasmodasdelasdistribucionesnosepromedian. Lamediaseutilizaenprocesosytcnicasestadsticasmscomplejasmientrasquelamedianayla modaenmuypocoscasos. 4.2 MEDIDAS DE VARIABILIDAD O DE DISPERSIN. A pesar de la gran importancia de las medidas de tendencia central y de la cantidad de informacin que aportan individualmente, es necesario conocer cun representativo es el valor de estas medidas a travs de una medida de variabilidad o de dispersin. Fig. 6. Ejemplo grfco de medida de variabilidad Las medidas de desviacin, variacin o dispersin que estudiaremos a continuacin son: Rango o amplitud, desviacin tpica y varianza. a) Rango, amplitud o recorrido: Se defne como la diferencia entre los dos valores extremos que toma la variable. Es la medida de dispersin ms sencilla y tambin, la que proporciona menos informacin. R= X MAX - X MIN 17 SNCHEZ, Fernndez Jos. INTRODUCCIN A LA ESTADSTICA EMPRESARIAL UNIVERSIDAD TCNICA PARTICULAR DE LOJA La Universidad Catlica de Loja 3 PRIMER BIMESTRE Gua Didctica:Estadstica I b) Desviacin Tpica o estndar: Se defne como la raz cuadrada de la media de los cuadrados de las desviaciones con respecto a la media de la distribucin y en otras palabras como la raz cuadrada de la varianza. Las frmulas para su clculo 18 , se pueden simplifcar entonces en las siguientes expresiones: Frmulaparaunadistribucinpoblacional: Frmulaparaunadistribucinmuestal: Cabe sealar, que la desviacin estndar es sin duda, la medida de dispersin ms importante, ya que adems sirve como medida previa al clculo de otros valores estadsticos. c) Varianza: La varianza .es una de las medidas de tendencia central ms reportadas, y se basa en la diferencia entre el valor de cada observacin y la media, es decir promeida las desviaciones respecto de la media aritmtica. Las frmulas para su clculo , se pueden simplifcar entonces en las siguientes expresiones: Cabe sealar, que cuando lo que se calcula es la varianza de una poblacin, sta se representa con la letra griega 2 (elevada al cuadrado), y cuando lo que se calcula es la varianza de una muestra se representa con la letra s2 (tambin elevada al cuadrado). As mismo, cuando mayor sea la varianza mayor ser la dispersin de la variable y menos representativa ser la media como promedio de todos los valores y viceversa. Finalmente, hay que indicar que la varianza viene expresada en las unidades de medida de la variable al cuadrado, lo que limita su interpretacin. La profundidad de analisis de esta medida se ver en estadistica inferencial.. 18 SANDOVAL, Andrs. ESTADSTICA I Universidad Panamericana