Documente Academic
Documente Profesional
Documente Cultură
INTRODUCCIN
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 2
El presente texto de Estadstica Inferencial Aplicada a la Educacin presentamos para los docentes participantes del Programa de Licenciatura en Educacin Inicial de la Facultad de Ciencias de la Educacin, de la UANCV, y al pblico lector dedicado a la investigacin como herramienta de apoyo para el proceso del trabajo de investigacin. El propsito fundamental del texto es hacer alcance sobre las nociones de estadstica inferencial, el mismo para realizar los trabajos de investigacin iniciando con etapa de planeamiento, recoleccin de datos, elaboracin de datos, presentacin de datos, y el anlisis e interpretacin de los mismos. Por lo que tiene la importancia para el desarrollo del trabajo de investigacin en el campo de la educacin, en ciencias sociales, y en otros campos afines. En efecto, el presente texto se ha organizado en cinco captulos: El primero exponemos sobre conceptos bsicos de estadstica, haciendo alcance la parte terica; en el segundo captulo contiene medidas de tendencia central y de dispersin; continuando en el tercer captulo con el muestreo estadstico; para luego pasando a la comprobacin de hiptesis; y en el ltimo captulo verificando con la prueba de chi cuadrada. Finalmente presentamos autoevaluacin y tablas respectivas. LOS DOCENTES
Pg. 3
Pg. 4
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN INDICE CAPITULO I CONCEPTOS BSICOS DE ESTADSTICA 1.1. Introduccin 1.2. Concepto de Estadstica: Descriptiva e Inferencial 1.3. La Estadstica en el proceso de investigacin 1.4. Variables Estadsticas CAPITULO II MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN 2.1. Distribucin de frecuencias 2.2. Organizacin de tablas 2.3. Representaciones grficas 2.4. Medidas de tendencia central 2.5. Medidas de dispersin 2.6. Medidas de posicin o cuantiles CAPITULO III MUESTREO ESTADISTICO 3.1. Introduccin al muestreo 3.2. Etapas de un estudio por muestreo 3.3. Tipos de muestras 3.4. Inferencia estadstica 3.5. Error estndar de la media Pg.
06 06 08 10
16 18 19 21 28 33
38 39 41 45 45
CAPITULO IV COMPROBACION DE HIPTESIS Introduccin 47 4.1. Comprobacin de hiptesis referentes a la media de una poblacin. 58 4.2. Prueba de hiptesis para dos medias de poblacin (muestras grandes) 71
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 5
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN 4.3. Comprobacin de hiptesis referentes a la proporcin de una poblacin. 74 4.4. Prueba para la comparacin de dos proporciones poblacionales. 77 4.5. Pruebas de hiptesis con muestras pequeas. 81 4.6. Prueba para la media de la poblacin (Muestras pequeas) 82 4.7. Prueba para comparar dos medias poblacionales independientes (muestras pequeas). 85 4.8. Prueba para comparar dos medias poblacionales dependientes (muestras pequeas). 90 CAPITULO V PRUEBAS DE CHI CUADRADA 5.1. Caractersticas de la distribucin 96 5.2. Pruebas de bondad y ajuste (de homogeneidad) 96 5.3. Pruebas de bondad y ajuste: frecuencias desigualmente esperadas (de independencia). 100 5.4. Limitaciones de la Ji Cuadrada 104 5.5. Anlisis de cuadros de contingencia 105 Autoevaluacin 109 Tablas 111 Bibliografa 115
Pg. 6
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN CAPITULO I CONCEPTOS BSICOS DE ESTADSTICA 1.1. Introduccin
En cuanto al origen etimolgico de la palabra estadstica existen diferentes opiniones y referencias. Para algunos viene de la voz griega STATERA que significa balanza, otros sostienen que deriva del latn STATUS que implica situacin, mientas que algunos autores afirman que procede del alemn STAAT que significa estado, porque la funcin tradicional de los gobiernos centrales y del estado es y ha sido llevar la cuenta de la cantidad de habitantes, nacimientos, defunciones, empleo y desempleo, produccin, impuestos, cantidad de empresas, costo de vida y muchas otras caractersticas de nuestra sociedad. La evolucin y el desarrollo de la estadstica en el mundo actual ha superado el significado etimolgico de la ciencia; la estadstica constituye en la actualidad un valioso instrumento de decisin en todas las situaciones de la vida, desde el hogar hasta la poltica regional, nacional y mundial; pues, muchas actividades estn relacionadas con la estadstica y muchas ocupaciones implican el uso del mtodo estadstico. 1.2. Concepto de Inferencial. Estadstica: Descriptiva e
Estadstica: es la ciencia que tiene por objeto de recolectar, organizar, resumir, presentar, analizar e interpretar datos en forma adecuada, con el fin de obtener conclusiones y para la toma de mejores decisiones sobre determinados hechos o fenmenos en
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 7
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN estudio. De acuerdo a esta definicin podemos clasificar la estadstica en: Estadstica Descriptiva: es un conjunto de mtodos para organizar, analizar y presentar datos de manera informativa. Es decir, cuando slo se analiza y describe los datos; y utiliza el mtodo deductivo en el anlisis, que se puede aplicar las generalidades a las partes; ej. Hasta tablas y grficos. Estadstica Inferencial: conjunto de mtodos utilizados para recolectar, organizar, presentar, analizar e interpretar datos de una poblacin basndose en una muestra. La inferencia estadstica utiliza el mtodo inductivo en el anlisis, que consiste en conocer la poblacin, en base a sus particularidades (muestras). 1.3.
La Estadstica investigacin.
en
el
proceso
de
A lo largo de la historia de la Ciencia han surgido diversas corrientes de pensamiento tales como: el Empirismo, el Materialismo Dialctico, el Positivismo, la Fenomenologa y el Estructuralismo, las cuales han originado diversas rutas en la bsqueda del conocimiento. Sin embargo, debido a las diferentes premisas que sustentan, desde la segunda mitad del siglo XX tales corrientes se han polarizado en dos enfoques principales: el cualitativo y el cuantitativo. As, la investigacin cientfica se divide en dos grandes enfoques: Enfoque cualitativo: utiliza recoleccin de datos sin medicin numrica para descubrir o afinar preguntas de
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 8
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN investigacin y puede o no probar hiptesis en su proceso de interpretacin. Enfoque cuantitativo: usa recoleccin de datos para probar hiptesis con base en la medicin numrica y el anlisis estadstico para establecer patrones de comportamiento.
Investigacin Cientfica
Enfoque Cualititativo Enfoque Cuantitativo
Para generar conocimiento el enfoque cuantitativo se fundamenta en el mtodo hipottico deductivo, considerando las siguientes premisas: a) Delinea teoras y de ella deriva hiptesis o supuestos. b) Las hiptesis se someten a prueba para saber si son generalizables para poblaciones especficas y en contextos dados. c) Si los resultados corroboran la hiptesis se aporta evidencia a su favor, si los resultados de diversas investigaciones aportan evidencia a favor de las hiptesis se genera confianza en la teora que las sustenta.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 9
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN La Estadstica es la herramienta principal que se utiliza para someter a prueba las hiptesis en la investigacin cuantitativa. 1.4. Variables Estadsticas
Concepto de variable. Llamamos variables a los rasgos o caractersticas que varan entre los diferentes miembros de una poblacin o muestra. Las variables se designan con las ltimas letras maysculas del abecedario: X, Y, Z; y los valores de las variables se designan con las letras minsculas: x1, x2, x3,, xn. Hay dos tipos bsicos de variables: las que se obtienen de una poblacin cualitativa y las que se obtienen de una poblacin cuantitativa. Si la variable que se estudia no se puede expresar numricamente, se le llama variable cualitativa o atributo. Algunos ejemplos de variables cualitativas son: gnero, religin, raza, tipo de automvil, lugar de nacimiento y color de ojos. Cuando estudiamos variables cualitativas nos interesa saber cuntos o en qu proporcin los miembros de una poblacin o muestra caen en cada categora. Por ejemplo qu porcentaje de los estudiantes de la UANCV son hombres?, de qu especialidades eran los docentes que rindieron el examen de nombramiento el ao pasado?, qu porcentaje de la poblacin tiene ojos azules?, qu porcentaje de la poblacin son de nivel universitario?. Si la variable que numricamente, se Algunos ejemplos de los estudiantes de se estudia se puede expresar le llama variable cuantitativa. estas variables son: las edades de una Institucin Educativa, los
Pg. 10
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN promedios obtenidos al finalizar un ao acadmico, y el nmero de hijos por familia en el Departamento de Puno. Las variables cuantitativas se clasifican a su vez en variables discretas y continuas. Las variables discretas slo pueden asumir ciertos valores (generalmente nmeros enteros) y suele haber huecos entre los valores. Por ejemplo el nmero de aulas en una Institucin Educativa (1, 2, 3, etc.), el nmero de profesores de una determinada especialidad (3, 8, 12, etc.), el nmero de estudiantes en cada grupo de Estadstica (6, 15, 30, etc.). Obsrvese que el nmero de aulas de una Institucin Educativa puede ser 3, 4 5, pero no puede ser 4.78. Hay un hueco entre los valores posibles (entre 3 y 4 por ejemplo). Las variables continuas pueden asumir cualquier valor dentro de un rango especfico. Ejemplos de variables continuas son la talla de los estudiantes del 6to. Grado o la distancia entre las ciudades de Puno y Arequipa (que, segn la exactitud con que se mida puede ser de 355 km, 355.2 km, o 355.255 km). Otros ejemplos pueden ser el peso de los alimentos que consumen los estudiantes (10.5 Kg.) o el tiempo transcurrido de llegar de su vivienda a las aulas (0.5 Horas). Todos estos datos sern expresados con decimales. Las variables continuas son, por lo regular, el resultado de medir algo y no existen huecos entre los valores posibles.
Pg. 11
Escalas de medicin Las variables tambin se pueden clasificar de acuerdo a las escalas de medicin. Las escalas de medicin indican, con frecuencia, qu clculos se pueden realizar para resumir y presentar los datos y qu pruebas estadsticas pueden llevarse a cabo. Por ejemplo, si en una bolsa de caramelos hay dulces de 4 colores. Supngase que a los amarillos se les asigna el nmero 1 para identificarlos, a los azules el 2, a los rojos el 3 y a los morados el 4. Se suman los valores asignados a los dulces de la bolsa y se divide entre el nmero de dulces y se dice que el color promedio es 3.56 significa esto que el color promedio es morado rojizo?. En este ejemplo no se han usado correctamente las escalas de medicin.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 12
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Existen cuatro niveles en la escala de medicin: a) nominal, b) ordinal, c) de intervalo, y d) de razn. El nivel ms bajo en la escala es nominal, el ms alto o el que nos da ms informaciones el de razn. a) Variables de nivel nominal. Las observaciones nicamente se pueden clasificar o contar. No hay un orden particular para cada clase. La clasificacin de los caramelos por colores puede ser un ejemplo de nivel de medicin nominal. Clasificamos los dulces slo por su color y podemos tomar primero los morados, los azules, o los de cualquier otro color; no hay un orden natural. Las categoras que se establecen son mutuamente excluyentes; es decir, un dulce no puede ser rojo y azul a la vez. Otra caracterstica de estas categoras es que son colectivamente exhaustivas; es decir, que todos los dulces deben pertenecer a una categora, en una bolsa de caramelos no puede haber un dulce que no sea rojo, ni azul, ni amarillo, ni morado, ya que slo existen esos colores. b) Variables de nivel ordinal. El siguiente nivel es el ordinal. Tiene todas las caractersticas del nivel nominal (sus categoras son mutuamente excluyentes y colectivamente exhaustivas). Adicionalmente, sus valores tienen un orden lgico natural. Por ejemplo, supngase que un profesor de estadstica es evaluado por sus alumnos al final del curso, la pregunta que se les hace es En general, como califica usted al maestro de esta clase?. Las opciones son excelente, bueno, aceptable, malo y psimo. Cada categora es ms alta o mejor que la siguiente, excelente es mejor que bueno y as sucesivamente. Sin embargo no se
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 13
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN puede distinguir la magnitud de las diferencias entre categoras. No se puede decir que la distancia entre excelente y bueno sea la misma que entre malo y psimo. Ms an, no se puede decir que una calificacin de excelente sea cuatro veces mejor que malo. Slo se puede concluir que excelente es mejor que malo, pero no se puede decir cun mejor es. c) Variables de nivel de intervalo. Este es el siguiente nivel de la escala en orden ascendente. Tiene todas las caractersticas del nivel ordinal, pero, adems la diferencia entre sus valores o categoras es de un tamao constante. Un ejemplo es la temperatura. Supngase que las temperaturas de tres das consecutivos en la Ciudad de Cusco fueron 20C, 22C y 24C. Estos datos se pueden ordenar fcilmente, pero tambin se puede calcular la distancia entre cada uno, esto es posible porque un grado centgrado es una unidad constante de medicin. Es importante notar que 0 es slo un punto en la escala de medicin, y que no representa la ausencia de valor; as, 0 no indica que no haya temperatura, slo que hace fro. d) Variables de nivel de razn. Es el nivel de medicin ms alto. Tiene todas las caractersticas del nivel de intervalo, pero, adicionalmente el punto 0 indica la ausencia del valor que se mide. Ejemplos de este nivel son: el dinero, el peso, la altura, la distancia. Supngase que una persona tiene S/. 0.00 en su estado de cuenta, eso quiere decir que no tiene dinero en esa cuenta.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 14
Escalas de medicin
Caractersticas que tiene Nomina l Son mutuamente excluyentes. Son exhaustivas. Son mutuamente excluyentes. Son exhaustivas. Establecen un orden. Son mutuamente excluyentes. Son exhaustivas. Establecen un orden. La distancia entre cada valor es igual. Son mutuamente excluyentes. Son exhaustivas. Establecen un orden. La distancia entre cada valor es igual. El cero indica la ausencia del valor que se mide, es absoluto. Caracterstica s que no tiene No establecen un orden. La distancia entre cada valor no es medible. El cero no indica la ausencia del valor que se mide, es arbitrario. Ejemplo Color Raza Sexo Estado civil Escalas de bueno, regular y malo. La temperatur a, 0 no indica que no haya temperatur a. Coeficiente de Inteligencia El dinero, S/. 0.00 indica que no hay dinero.
Ordinal
de Interval o
de Razn
Pg. 15
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN CAPITULO II MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN 2.1.
Distribucin de frecuencias.
Es un agrupamiento de datos en categoras mutuamente excluyentes dando el nmero de observaciones en cada categora. Los pasos para obtener una distribucin de frecuencia son los siguientes: 1) Determinar el nmero de clases que se quiere. Un mtodo para determinar el nmero de clases es la regla 2 a la k. Esta regla sugiere seleccionar como el nmero de clases el menor nmero (k), tal que 2 a la k sea mayor que el nmero de datos (n). 2) Determinar el intervalo o la amplitud de clase. Generalmente el tamao de la clase o del intervalo debe ser el mismo para todas las clases. Las clases juntas deben abarcar por lo menos la distancia entre el menor valor de los datos en bruto hasta el valor mayor. Expresado en la siguiente frmula:
Donde: A = intervalo de clase H = mayor valor observado L = menor valor observado k = nmero de clases
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 16
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Generalmente el resultado de la frmula se redondea a algn nmero adecuado, como por ejemplo un mltiplo de 10 o de 100. 3) Fijar los lmites de cada clase. Se trata de fijar los lmites de cada clase de modo que cada observacin se pueda colocar slo en una clase. Se deben evitar los lmites de clase que sean poco claros o que se sobrepongan. 4) Poner una marca por cada observacin que quede en cada clase. 5) Contar en nmero de observaciones en cada clase (frecuencia de clase) La frecuencia relativa se obtiene dividiendo la frecuencia de clase entre el total de datos (n). La frecuencia porcentual se obtiene multiplicando la frecuencia relativa por 100. Ejemplo: Se tiene los siguientes datos: Edades de los estudiantes de la Especialidad de Matemtica, de la UANCV. 18 25 21 26 22 18 18 17 19 23 17 21 20 23 19 20 22 18 19 19
Pg. 17
3. Empezamos a construir nuestra distribucin de frecuencias. Nro. 1 2 3 4 5 [Li Ls> 17 19 19 21 21 23 23 25 25 27 xi 18 20 22 24 26 Tarjas ///// / ///// / //// // // fi 6 6 4 2 2 20 Fi 6 12 16 18 20
2.2.
Organizacin en tablas
Para una mejor representacin de los datos obtenidos se construye una tabla de datos, lo cual simplifica toda la informacin y nos muestra de manera agradable. Se debe consideras algunos aspectos como el nmero de la tabla, titulo, cuerpo, fuente y elaboracin. Para nuestra ilustracin usaremos el cuadro frecuencias anterior. Tabla Nro. 01 Puno: Edades de los estudiantes del 4to semestre de la especialidad de Matemtica - FACE 2011 I de
Pg. 18
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Edades 17 19 19 21 21 23 23 25 25 27 TOTAL Frecuencia 6 6 4 2 2 20 Porcentaje (%) 30 30 20 10 10 100
2.3.
Representaciones grficas.
Las representaciones grficas de las distribuciones de frecuencia, se hacen por lo general con llamadas grficas de barras (en las que las clases se indican en el eje horizontal y las frecuencias de clase en el eje vertical) o con grficas de pie, especialmente utilizadas para mostrar las frecuencias porcentuales.
Grfico de Barras
Pg. 19
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Este tipo de grafica normalmente se utiliza para visualizar las frecuencias absolutas, es decir los datos numricos. Grafico circular
10% 10%
30%
1 2
20%
3
30%
4 5
Para el caso de grfico circular mayor mente lo utilizaremos para ver los porcentajes, puesto que en forma equitativa distribuye en base al crculo. Grfico de lneas
7 6 5 4 3 2 1 0 1 2 3 Grupo de edades 4 5
Frecuencia
Pg. 20
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Para casos de seguimiento, donde se requiere estudiar si se est mejorando o empeorando usaremos este tipo de grfico. Grfico de dispersin
7 6 5 4 3 2 1 0 0 1 2 3 4 5 6
Frecuencia
Grupo de edades
El caso de dispersin es para ver qu tan distantes se encuentran nuestros datos. Es importante mencionar que si bien, las representaciones grficas sirven para dar una visin rpida de la forma en que se comportan los datos, tambin pueden ser utilizadas (dependiendo de cmo se configuren) para dar una idea equivocada de la informacin que se quiere presentar. 2.4.
El propsito de cualquier medida de tendencia central es indicar con precisin el centro de un conjunto de observaciones. Algunas de las medidas de tendencia central ms comunes son la media aritmtica, la mediana y la moda.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 21
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Media aritmtica La media aritmtica es probablemente la medida de tendencia central ms importante, en tato es la ms utilizada. Tambin se le llama promedio y la vemos aplicada a diario en casi todos los espacios y medio dedicados a brindar informacin. Algunos ejemplos puedan ser el promedio de notas obtenidas por un estudiante durante un ao acadmico, el salario promedio de los empleados de una Institucin Educativa, el promedio de edades de los estudiantes de un nivel determinado, etc. Definida formalmente, la media aritmtica es la suma de todos los valores de una muestra o poblacin dividida entre el nmero de valores de la poblacin o muestra. Cuando lo que se calcula es la media de una poblacin, sta se representa con la letra griega (). Por otro lado, cuando lo que se calcula es la media de una muestra, sta se representa con ( ). As, las frmulas son como sigue: Media poblacional Dnde: = Media poblacional = Representa cualquier valor particular = Nmero de individuos en la poblacin = Indica la operacin de adicin Media muestral Dnde:
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN = Nmero de individuos en la poblacin = Indica la operacin de adicin
Algunas caractersticas de la media aritmtica son: Todo conjunto de datos de intervalo o de razn tienen una media. Un conjunto de datos slo tiene una media. La media es til para comparar dos poblaciones. La media aritmtica es la nica medida de tendencia central en la que la suma de las desviaciones de los valores de la media ser siempre cero. Expresado simblicamente ( )
Pg. 23
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Para datos agrupados Tenemos las siguientes edades de estudiantes: Nro. 1 2 3 4 5 [Li Ls> 17 19 19 21 21 23 23 25 25 27 xi 18 20 22 24 26 fi 6 6 4 2 2 20 xi * fi 108 120 88 48 52 416
Concluimos que el promedio de edades de los estudiantes de matemtica de la UANCV es de 21 aos. Mediana Algunas veces, cuando en un conjunto de datos existe uno o dos muy grandes o muy pequeos, la media aritmtica puede no ser representativa. En esos casos, el punto central de ese grupo de datos se puede describir mejor utilizando la mediana. La mediana es la observacin central de los valores de una poblacin o muestra una vez que stos han sido ordenados de forma ascendente o descendente. Para un nmero par de observaciones, la mediana es el promedio de los dos valores intermedios. Algunas caractersticas de la mediana son:
Pg. 24
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Todo conjunto de datos ordinales, de intervalo o de razn tienen una mediana. Un conjunto de datos slo tiene una mediana. A la mediana no le afectan valores extremadamente grandes ni extremadamente pequeos, por eso es especialmente til cuando se tienen estos valores.
Como primer paso tenemos que ordenar los datos de menor a mayor. 11 12 12 12 14 15 15 16 16 18
Una vez ordenado ubicamos el valor que este al centro o al medio. En nuestro caso tenemos dos valores, para lo cual se debe sumar ambos y dividir entre dos.
Pg. 25
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Tenemos los siguientes datos: Nro. 1 2 3 4 5 [Li Ls> 17 19 19 21 21 23 23 25 25 27 xi 18 20 22 24 26 fi 6 6 4 2 2 20 Fi 6 12 16 18 20
Pg. 26
[ ]
Por lo tanto se tiene una edad media de 20. Moda La moda es el valor que aparece con ms frecuencia en un conjunto de datos. La moda es especialmente til para encontrar el punto central de un grupo de datos de tipo nominal u ordinal. Algunas caractersticas de la moda son: Se puede determinar la moda en grupos de datos de todos los niveles (nominales, ordinales, de intervalo y de razn). Puede existir ms de una moda para cada grupo de datos. A la moda no le afectan valores extremadamente grandes ni extremadamente pequeos, por eso es especialmente til cuando se tienen estos valores.
Pg. 27
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN En nuestro caso se puede ver que el valor 12 es el ms que se repite. Por lo tanto la moda ser la nota 12. Para datos agrupados Tenemos: Nro. 1 2 3 4 5 [Li Ls> 17 19 19 21 21 23 23 25 25 27 xi 18 20 22 24 26 fi 6 6 4 2 2 20 Fi 6 12 16 18 20
Como en el caso de la mediana tambin tenemos que ubicar el intervalo con el que se calculara. Ahora usaremos la siguiente frmula:
( ( ( ) ( ) ) (
) ) ]
[ (
La moda es de 19 aos. 2.5.
Medidas de dispersin
Las medidas de dispersin se utilizan para obtener informacin complementaria a las medidas de tendencia central y miden la forma como se distribuyen los datos que integran una poblacin o muestra. As, el rango se basa en la localizacin de los valores mayor y menor de
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 28
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN un grupo de datos, y la varianza y la desviacin estndar en las desviaciones de cada uno de los datos que integran la poblacin o muestra con respecto de su media. Varianza La varianza es una de las medidas de tendencia central ms reportadas, y como ya se mencion, se basa en la diferencia entre el valor de cada observacin y la media. En trminos conceptuales la varianza es la media aritmtica de las desviaciones de la media elevadas al cuadrado. Cuando lo que se calcula es la varianza de una poblacin, sta se representa con la letra griega (elevada al cuadrado), y cuando lo que se calcula es la varianza de una muestra se representa con la letra (tambin elevada al cuadrado). Las frmulas para calcular cada una son como sigue: Varianza poblacional
(
( )
Varianza muestral
(Formula conceptual)
( )
Varianza muestral
(Formula operacional)
Es importante resaltar que la frmula de la varianza muestral para clculos tiene la ventaja de que no se necesita calcular la media para obtenerla.
Pg. 29
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Ejemplo: Para datos no agrupados Se tiene las notas de 10 estudiantes y se necesita calcular su varianza. 12 13 11 15 16 11 12 15 18 13
( )
Entonces: ( ) ( )
Pg. 30
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Para datos agrupados Usando los datos del ejemplo anterior tenemos: Nro. 1 2 3 4 5 [Li Ls> 17 19 19 21 21 23 23 25 25 27 xi 18 20 22 24 26 fi 6 6 4 2 2 20 fi xi 108 120 88 48 52 416 fi xi2 1944 2400 1936 1152 1352 8784
Reemplazando tenemos: ( )
Finalmente tenemos una varianza de 6,91 Desviacin estndar La varianza tiene la desventaja de que sus valores son difciles de interpretar ya que estn expresados en la unidad de medida de los datos que integran la poblacin o muestra al cuadrado (p.e. litros al cuadrado, metros al cuadrado, aos al cuadrado, etc.) Resulta obvio pensar
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 31
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN que al calcular la raz cuadrada de la varianza obtendremos valores expresados en la misma unidad de medida de que los datos que nos interesan. De este modo, una definicin formal de la desviacin estndar es la raz cuadrada positiva de la varianza. Las frmulas que se utilizan para calcularla se pueden simplificar entonces en las siguientes expresiones: Desviacin estndar poblacional: Desviacin estndar poblacional: Ejemplo: Para datos no agrupados y datos agrupados Segn el ltimo resultado obtenido tenemos: Se concluye que se tiene un Desviacin Estndar de 2,63 lo que implica que se tiene una reducida variacin.
Coeficiente de Variacin
( ) ( ( ) )
Pg. 32
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Concluimos que el C.V. = 12.64%, lo que nos indica que tenemos una variacin moderada. 2.6. Medidas de Posicin o Cuantiles Son estadgrafos que dividen a una distribucin de frecuencia de datos en otras proporciones y no solo en mitades como lo hace la mediana. Los cuantiles o cuantilas ms usados en el anlisis estadstico, son: Cuartiles, quintiles, deciles y percentiltes; los cuantiles se usan frecuentemente para describir el comportamiento de una poblacin; los valores en la distribucin de frecuencias se dan en trminos de porcentaje. Los Cuartiles Los cuartiles dividen a un conjunto de observaciones en cuatro partes iguales. Denotados por Qn, representando grficamente, tenemos que:
Q1 Q2 Q3 /------------/----------------/----------------/---------------/ Xmn 25% 25% 25% 25% Xmx
El primer cuartil al que se llama Q1 es el valor por debajo del cual se encuentra el 25% de las observaciones, iguales o menores a l, y 75% superiores a l; el segundo cuartil o Q2 es igual a la mediana; y el tercer cuartil o Q3 es el valor por debajo del cual se encuentra el 75% de las observaciones, inferiores o iguales a l, y 25% de stas superiores a l. Cuyas frmulas son:
+ c.[
] ; Donde:
Pg. 33
+ c.[ Ejemplo:
] ;y
+ c.[
Teniendo una distribucin de frecuencia X (cuadro) de los 80 trabajadores segn sus haberes. Determinar cuartiles Q1,Q2 y Q3. Haberes [ [ 90 120 120 150 150 180 180 210 210 240 240 270 270 - 300 TOTAL Nro de trabajad fi 11 13 20 17 15 3 1 n = 80 Nro acumulado de trabajad Fi 11 24 44 61 76 79 80
; entonces:
+ c.[ *
+
Pg. 34
El Q1 implica que el 25% del total de trabajadores, es decir 20 de ellos tienen haberes inferiores o iguales a 140.80 dlares y los 60 restantes, o sea el 75% de trabajadores, tienen haber superior a 140.80 dlares. ii). Clculo de Q2. Datos:
( )
; entonces:
+ c.[ *
] +
* +
Es decir, que el segundo cuartil determina que el 50% de los trabajadores ganan como mximo 174 dlares. De la misma forma se puede hallar el Q3. Quintiles Kn Son estadgrafos de posicin que dividen al total de las observaciones en cinco partes iguales, es decir, que
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 35
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN entre dos quintiles consecutivos se encuentre no ms del 20% del total de las n observaciones.
K1 K2 K3 K4 /------------/--------------/---------------/--------------/----------------/ Xmn Xmx
Las frmulas y el procedimiento tcnico para calcular las quintiles con datos agrupados es el mismo que se emplea para los cuartiles, con la nica diferencia que se divide la sumatoria de frecuencia entre 5. Su frmula es:
+ c.[
] ;
+ c.[
Deciles Dn Los deciles dividen a un grupo de datos en diez partes iguales, significa que cada decil representa el 10% de las observaciones.
D1 D2 D3 D4 D5 D6 D7 D8 D9 /-----/--------/-------/--------/--------/--------/--------/--------/-------/-------/
+ c.[
Pg. 36
; entonces:
+c.[
] + * +
Significa que el 60% de los trabajadores tienen haberes iguales o inferiores a 187.1 dlares. Percentiles. Pn Son valores que dividen la muestra ordenada en forma ascendente o descendente en 100 partes iguales, y cada percentil representa el 1% de los datos. Se aplican cuando existen numerosos valores de la variable con una alta frecuencia total. P1 P2 P3 P50..P98 P99 /----/----/------/---------------------/-----------------------/----/-----/ Cuya frmula y procedimientos es el mismo de las anteriores, con la diferencia de que se divide la sumatoria de frecuencias entre 100.
+ c.[
] ; n = 1,2,,99.
Pg. 37
El muestreo es el proceso de extraccin de una muestra; el objeto del muestreo es seleccionar una muestra que represente a toda la poblacin entera, ya que a partir de la muestra se estimar las caractersticas de la poblacin que no se conoce.
Poblacin: es un conjunto de todos los elementos (unidades de anlisis) que pertenecen al mbito espacial donde se desarrolla el trabajo de investigacin. Muestra: es una parte o subconjunto, representativo de la poblacin debidamente seleccionada. Por qu tomar una muestra en lugar de estudiar a todos los elementos de una poblacin? La principal ventaja de tomar una muestra consiste en que si el diseo muestral se ha realizado cumpliendo los requisitos de aleatoriedad una vez teniendo informacin de ella se pueden generalizar esos conocimientos a toda la poblacin, con lo que se disminuyen los costos y tiempos necesarios para la realizacin del estudio
Pg. 38
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Algunos ejemplos pueden ser los siguientes: Se desea aplicar una nueva estrategia de enseanza, realizar el estudio a toda la poblacin de estudiantes de Puno sera muy tedioso, para ello solo se selecciona una muestra de algunas Instituciones Educativas. Para determinar las intenciones de voto de una futura eleccin estudiantil es necesario tomar una muestra de los estudiantes matriculados debido al alto costo de encuestar a miles de estudiantes antes de una eleccin.
Muestra probabilstica: muestra seleccionada de tal forma que cada elemento de la poblacin tiene la misma probabilidad (distinta de cero) de ser escogidos en la muestra. Muestra no probabilstica: la eleccin de los elementos no depende de la probabilidad, sino de causas relacionadas con las caractersticas del investigador o del que hace la muestra. c) Determinacin del error de muestreo. Consiste en determinar el margen de error aceptado en el
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 39
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN clculo de la muestra. Es importante tambin considerar los errores de respuesta sistemtico y encuesta sistemtico. Error de: respuesta sistemtico. Es aquel producido intencionalmente por el sujeto estudiado. (Ejemplo. Estimacin del ingreso medio de un padre de familia). Error de: encuesta sistemtico. Es aquel que se produce de manera no intencional debido a errores en el manejo de los datos capturados, ocasionados por la falta de capacitacin o de personal calificado, por ejemplo. d) Determinacin del tamao de la muestra. La frmula estadstica para el clculo del tamao mnimo de la muestra ser:
( )
Pg. 40
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Y para calcular sub muestras, se calcula mediante la tcnica estratificada de fraccin de grupos a partir de las sub poblaciones por cada Institucin Educativa. ( ) ;
e). Seleccin de los sujetos que integrarn la muestra. Consiste en designar y contactar a los elementos que integrarn la muestra. f). Recopilacin de la informacin. Consiste en aplicar los cuestionarios o realizar los experimentos que son objeto del estudio. g). Clculo de las inferencias o estimaciones. Consiste en elaborar las pruebas estadsticas que se hayan definido en la planeacin del estudio a fin de llegar a la consecucin de los objetivos del mismo. h). Presentacin de resultados. Consiste en preparar un reporte o presentacin de modo que las conclusiones del estudio sean fcilmente utilizables para la toma de decisiones.
Pg. 41
Probabilistico
No Probabilistico
Aleatorio simpe
A jucio
Aleatorio sistemtico
Por conveniencia
Aleatorio estratificado
Por conglomerados
Muestreo aleatorio simple. Es una muestra seleccionada de modo que cada uno de los elementos o personas de la poblacin tengan las mismas posibilidades de ser incluido en la muestra. La seleccin de los individuos puede hacerse utilizando una tabla de nmeros aleatorios, una tmbola, o bien un software de computacin que cuente con esa funcin. Muestreo aleatorio sistemtico. Es la muestra que se determina y selecciona tomando un nmero de la poblacin, que corresponde al resultado de dividir la poblacin entre el tamao de la muestra. Ejemplo, si se tiene una poblacin de 9000 docentes de EBR y una muestra de 500, entonces se divide 9000 entre 500 y se
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 42
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN obtiene 18. Esto implica que tenemos que tomar de la poblacin (nmina de docentes con sus respectivos nmeros) un docente por cada 16 nmeros, hasta completar 500, que es el tamao de la muestra. K = N/n, en donde K = un intervalo de seleccin sistemtica. Muestreo aleatorio estratificado. Se divide una poblacin en subgrupos llamados estratos y se selecciona una muestra de cada uno de ellos. Muestreo por conglomerados. Se divide la poblacin en subgrupos llamados conglomerados (unidades primarias) y se selecciona una muestra aleatoria de estas, posteriormente se toma una muestra representativa de los conglomerados seleccionados. Los tipos de muestreo no probabilsticas suponen un procedimiento de seleccin informal y un poco arbitrario. Distribuciones muestrales Antes de hablar de las distribuciones muestrales es preciso conocer un concepto fundamental para su comprensin: el error de muestreo. Como ya se mencion, la caracterstica principal del muestreo aleatorio es que todos los elementos de la poblacin tengan la misma probabilidad de ser incluidos en la muestra. Para lograr esto, se puede seleccionar una muestra aleatoria simple, una muestra sistemtica, una muestra estratificada, una muestra por conglomerados o una combinacin de estos mtodos. Sin embargo lo ms probable es que la media de la muestra no sea idntica a la media de la poblacin. Asimismo, la desviacin estndar o cualquier otro parmetro que se calcule de la muestra muy probablemente no sern idnticos al clculo que se haga con base en la poblacin.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 43
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN El error de muestreo, entonces, es igual a la diferencia entre un estadstico de la muestra y el parmetro poblacional correspondiente. Supn por ejemplo que las calificaciones del primer perodo de exmenes en la materia de estadstica II de un grupo de cuatro estudiantes son de 97, 100, 99 y 85. Del mismo modo, supn que se toma una muestra aleatoria de dos estudiantes cuyas calificaciones son 97 y 99. La media de la muestra sera 98, que se obtiene mediante (97+99)/2. Otra muestra de dos calificaciones podra ser 100 y 85, con una media de 92.5. La media de todas las calificaciones (media de la poblacin) sera 95.25, que se encuentra mediante (97+100+99+85)/4. En este caso el error de muestreo de la primera muestra sera 2.75, que se obtiene mediante la siguiente frmula (la media de la poblacin menos la media de la muestra):
Donde: = media de la poblacin = media de una muestra Para la segunda muestra, el error de muestreo sera de 2.75, que se encuentra mediante (95.25 92.5). Ambas diferencias (-2.75 y 2.75) son el error que se comete al estimar la media de la poblacin mediante una media de la muestra, y estos errores de muestreo se deben al azar. El tamao de estos errores variar de una muestra a otra.
Pg. 44
3.4.
La inferencia estadstica
Como ya se ha mencionado la inferencia estadstica se refiere a obtener informacin vlida para una poblacin entera a partir del estudio o anlisis de una muestra. Un ejemplo de este tipo de inferencia son las estimaciones de parmetros de la poblacin a partir de parmetros de la muestra.
3.5.
Hasta ahora hemos hecho de cuenta que se tiene informacin de primera mano acerca de la distribucin muestral de las medias. Si as fuera sera una tarea muy simple hacer generalizaciones para una poblacin, ya que la media de las medias toma un valor que es igual a la verdadera media de la poblacin. Sin embargo, como pueden imaginarse, un investigador rara vez recoge datos sobre ms una o dos muestras. Calcular una distribucin muestral de medias requiere todo el esfuerzo (y el costo) de estudiar a cada uno de los miembros de una poblacin, con lo que perdera todo el sentido el proceso del muestreo. Entonces, si el investigador slo tiene informacin de una muestra, no tiene un conocimiento real sobre la media de las medias ni sobre la desviacin estndar de la distribucin muestral. Sin embargo s existe un buen mtodo para estimar la desviacin estndar de la distribucin muestral de medias sobre la base de los datos recogidos en una sola muestra. Esta estimacin se conoce como el error estndar de la media y se puede calcular con la siguiente frmula:
Pg. 45
Donde:
=
= =
Error estndar de la media (una estimacin de la desviacin estndar de la distribucin muestral de las medias) Desviacin estndar de una muestra Tamao de la muestra
Este clculo es conocido tambin como un estimador puntual. Estimador puntual. Valor que se calcula a partir de la informacin de la muestra y que se usa para estimar el parmetro de la poblacin.
Pg. 46
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN CAPITULO IV COMPROBACIN DE HIPTESIS Introduccin En los temas anteriores iniciamos el estudio de la inferencia estadstica. Describimos la forma de seleccionar una muestra aleatoria y, con base en sta, estimar el valor de un parmetro de la poblacin. En este tema continuaremos con el estudio de la inferencia estadstica. Sin embargo, en lugar de calcular un rango de valores dentro del cual se espera que se encuentre el parmetro de la poblacin, se realizar una prueba de hiptesis acerca de una afirmacin sobre un parmetro de la poblacin. Algunos ejemplos de afirmaciones que se podran probar utilizando pruebas de hiptesis son: El promedio de notas de los estudiantes de estadstica es de ms de 16. Una familia tpica vive en el mismo domicilio durante ms 16.5 aos. El salario inicial promedio para los egresados de las carreras de educacin es de S/. 1,200 al mes. La aplicacin de una nueva estrategia al grupo experimental es mejor que el grupo control.
De esta manera comenzaremos por establecer algunas definiciones. Hiptesis: Enunciado acerca de un parmetro de la poblacin, que se desarrolla con el propsito de realizar pruebas. Una vez que se ha establecido una hiptesis, se utilizan los datos para verificar que tan razonable es dicha
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 47
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN afirmacin. Un ejemplo puede ser el siguiente: En el sistema legal del Per, una persona es inocente hasta que se demuestre lo contrario. Un juez parte de la hiptesis de que una persona que es acusada de un crimen es inocente y sujeta esta hiptesis a comprobacin, revisando la evidencia y oyendo testimonios hasta llegar a un veredicto. Prueba de hiptesis: Procedimiento que se basa en la evidencia de las muestras y en la teora de probabilidad para determinar si la hiptesis es un enunciado razonable. Los trminos de prueba de hiptesis y probar una hiptesis se utilizan de manera indistinta. La prueba de hiptesis se inicia con una afirmacin sobre un parmetro de la poblacin: como la media de la poblacin. Como ya dijimos, esta afirmacin se conoce como hiptesis. Una hiptesis podra ser que el tiempo de desplazamiento por los estudiantes de Licenciatura en Educacin Inicial en las diferentes sedes es de 2.5 horas. No es posible ponerse en contacto con todos los participantes del programa a nivel nacional para comprobar que la media de desplazamiento sea efectivamente de 2.5 horas. El costo de localizar y encuestar a la totalidad de los participantes de Licenciatura en Educacin Inicial en las diferentes sedes del pas sera exorbitante. Para comprobar la validez de esta afirmacin ( = 2.5), es preciso elegir una muestra de la poblacin de todos los participantes, calcular la media y aceptar o rechazar la hiptesis, con base en ciertas reglas de decisiones. Resulta obvio que una media muestral de 2.5 horas de desplazamiento de los participantes provocara un rechazo de la hiptesis. Sin embargo, supn que el resultado de calcular la media de la muestra es de 2horas. Esta cifra es bastante
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 48
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN cercana a 2.5 para aceptar como razonable la afirmacin de que la media poblacional es de 2.5 horas? Se puede atribuir la diferencia de 0.5 horas entre las medias al error de muestreo, o bien esta diferencia es significativa desde el punto de vista de la estadstica? A continuacin se propone y explica un procedimiento de 5 pasos para probar una hiptesis.
Paso 1
Paso 2
Paso 4
Paso 3
No rechazar H0
Paso 5
Rechazar H0 y Aceptar H1
Paso 1. Plantear la hiptesis nula (H0) y la hiptesis alternativa (H1) El primer paso consiste en establecer la hiptesis que se prueba. Se le conoce como hiptesis nula y se le designa con H0. La letra H significa hiptesis y el subndice cero supone sin diferencia; es decir, la hiptesis nula supone que no hay diferencia entre el parmetro de la poblacin y el de la muestra.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 49
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Hiptesis nula: Una afirmacin que establece que no hay diferencia significativa entre el valor de un parmetro de la poblacin y el valor de un parmetro de la muestra. Como ejemplo tenemos que el nivel de inteligencia de los estudiantes del primer semestre es de 110 segn el test aplicado. Esto se escribira as: H0: = 110 Hablando en trminos generales, se plantea la hiptesis nula para el propsito de la prueba; es decir, para aceptarla o para rechazarla. La hiptesis nula no se rechaza a menos que los datos de la prueba proporcionen evidencia convincente de que es falsa. Es muy importante decir que si no se rechaza la hiptesis nula con base en los datos de la muestra, eso no quiere decir que la hiptesis nula sea verdadera, nicamente significa que no fue posible rechazar la hiptesis nula con base en lo datos disponibles. Por lo tanto, la hiptesis nula no se puede aceptar. Para demostrar sin lugar a dudas que la hiptesis nula es verdadera sera necesario conocer el parmetro de la poblacin; es decir, se tendra que practicar un censo para conocer el parmetro de la poblacin sobre el que se est haciendo una afirmacin. Por lo regular esto no es posible, por ello la alternativa consiste en tomar una muestra. Tambin es preciso enfatizar que generalmente una hiptesis nula comienza con o contiene la siguiente afirmacin: No existe diferencia significativa entre...
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 50
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN De esta manera el planteamiento formal de la hiptesis nula del ejemplo anterior sera el siguiente: H0: El promedio de notas alcanzado por los estudiantes de estadstica no tiene diferencia significativa con 16puntos. La hiptesis alternativa, por su parte, describe la conclusin a la que se llegar si se rechaza la hiptesis nula. Se designa con H1 y tambin se conoce como hiptesis de investigacin. La hiptesis alternativa se acepta si los datos de la muestra proporcionan evidencia estadstica suficiente para afirmar que la hiptesis nula es falsa. Hiptesis alternativa: Una afirmacin que se acepta si los datos de la muestra proporcionan evidencia suficiente de que la hiptesis nula es falsa. Un ejemplo que ayudar a clarificar lo que significan la hiptesis nula y la hiptesis alternativa es el siguiente: Un artculo reciente public que el promedio de ingreso familiar es de S/. 800.00 Para realizar una prueba estadstica sobre esta afirmacin, el primer paso consiste en determinar la hiptesis nula y la hiptesis alternativa. H0: = 800 soles H0: El promedio de ingreso familiar es de S/. 800.00 H1: 800soles H1: el promedio de ingreso familiar es de S/. 800.00
Pg. 51
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Paso 2. Seleccionar un nivel de significancia. Luego de establecer la hiptesis nula y alternativa, el siguiente paso consiste en definir el nivel de significancia. Nivel de significancia: La probabilidad de rechazar la hiptesis nula cuando es verdadera. Probabilidad de cometer el error de tipo I. El nivel de significancia se designa con , la letra griega alfa. Se le conoce tambin como nivel de riesgo. Se le conoce as porque, como se expresa en la definicin, representa el riesgo que se asume de rechazar la hiptesis nula cuando sta es verdadera. No hay un nivel de significancia que se aplique a todas las pruebas. De hecho es un valor que se deja al criterio del investigador. De manera convencional se asigna un nivel de significancia de 0.10 para encuestas polticas, de 0.05 (5 por ciento) a los proyectos de investigacin de artculos de consumo o de ciencias sociales y de 0.01 para el aseguramiento de calidad o para estudios mdicos. As, el investigador debe decidir el nivel de significancia antes de formular una decisin y de recolectar datos sobre la muestra. Para ilustrar como se puede rechazar una hiptesis nula cuando es verdadera pondremos el siguiente ejemplo: Supn que la poltica de aceptacin de embarques en un almacn de una empresa que se dedica a armar computadoras personales es que El Departamento de Control de Calidad tomar una muestra aleatoria de todos los embarques que se reciban. Si ms del 6% de
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 52
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN los artculos estn por debajo de la norma, el embarque ser rechazado. El da de hoy se recibi un lote de 4,000 tarjetas madre del proveedor Deltron. H0: El porcentaje de artculos defectuosos del embarque es 6% o menos. H1: El porcentaje de artculos defectuosos del embarque es ms de 6%. Se toma una muestra de 50 tarjetas madre y se encuentra que 4 de ellas son defectuosas, es decir un 8%. El embarque se rechaz porque exceda el valor mximo de 6% de artculos por debajo de la norma. Si ms del 6% de la totalidad del embarque estaba defectuoso, entonces la decisin de rechazarlo fue correcta. Supongamos, sin embargo, que las cuatro tarjetas seleccionadas en la muestra eran las nicas defectuosas en todo el embarque de 4,000. Entonces slo el 0.1% estaba defectuoso. En ese caso menos del 6% del embarque estaba por debajo de la norma y el rechazo del embarque fue un error. En trminos de prueba de hiptesis, se rechaz la hiptesis nula de que el embarque estaba por debajo de la norma cuando ste debi aceptarse. Al rechazar una hiptesis verdadera, se cometi un error de tipo I ( ). Error de tipo I: Rechazar la hiptesis nula, H0, cuando es verdadera.
Pg. 53
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Luego entonces, existe otro tipo de error. Error de tipo II: No rechazar la hiptesis nula, H0, cuando es falsa. La empresa cometera un error de tipo II si, sin saberlo, recibiera un embarque que contuviera el 15% de artculos defectuosos, y no obstante, lo aceptara. Cmo podra ocurrir esto? Supongamos que en un embarque similar se toma una muestra de 50 tarjetas de las cuales 2 resultan defectuosas (4%) y las 48 restantes estn en buenas condiciones. De acuerdo con la poltica de aceptacin de embarques, el lote hubiera sido aceptado. Pero, por casualidad, podra ser que las 48 tarjetas en buenas condiciones de la muestra fueran las nicas y que las 3,952 restantes estuvieran defectuosas. El siguiente cuadro resume las decisiones que el investigador puede tomar y las consecuencias posibles de stas.
Paso 3. Calcular el estadstico de prueba. Existen muchas estadsticas de prueba. En este mdulo veremos z como estadstica de prueba. En temas posteriores utilizaremos t y ji cuadrada; as como, el
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 54
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN coeficiente de correlacin lineal simple de Pearson y su frmula es: ( [ ( ) ( ) ( ) ] * ( )( ) ) ( ) +
Estadstica de prueba: Un valor que se calcula con base en informacin de la muestra, y que se utiliza para determinar si se rechaza o no la hiptesis nula. En la prueba de hiptesis para la media, la estadstica z se calcula por la siguiente frmula. Distribucin z como estadstica de prueba
Dnde: = media de la muestra = media de la poblacin = desviacin estndar de la poblacin n = tamao de la muestra z = valor estndar
Pg. 55
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Cuando no se conoce el valor de la desviacin estndar de la poblacin ( ), se puede utilizar el valor de la desviacin estndar de la muestra (S) para aproximarlo. El valor z se basa en la distribucin de muestreo de las medias de las muestras, que, como ya hemos visto, tiene una distribucin normal cuando la muestra es razonablemente grande, con una media igual a la media de la poblacin ( ) y con una desviacin estndar igual a . As es posible determinar si la diferencia entre la media de la muestra ( ) y la media de la poblacin ( ) es importante desde el punto de vista estadstico, al encontrar cuntas desviaciones estndar separan a de , utilizando la frmula anterior. Paso 4. Formular la regla de decisin. Regla de decisin: Es una afirmacin de las condiciones bajo las que se rechaza la hiptesis nula y bajo las que no se rechaza. El rea o regin de rechazo define la ubicacin de todos aquellos valores que son tan grandes o tan pequeos que la probabilidad de que ocurran bajo una hiptesis nula verdadera es bastante remota. La siguiente grfica muestra la regin de rechazo de una prueba de significancia que veremos ms a delante en este tema. Observa los siguientes puntos en el diagrama: a) El rea en la que no se rechaza la hiptesis nula est a la izquierda de 1.65. Ms adelante veremos cmo llegar a este valor. b) El rea de rechazo est a la derecha de 1.65.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 56
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN c) Se aplica una prueba de una cola. Tambin esto lo veremos ms adelante. d) Se eligi un nivel de significancia de 0.05 e) La distribucin de muestreo de z se distribuye normalmente. f) El valor 1.65, que es el valor crtico, separa las regiones en las que se rechaza y no se rechaza la hiptesis nula. Valor crtico: Punto de divisin entre la regin en que se rechaza la hiptesis nula y la regin en que no se rechaza.
Distribucin de muestreo para la estadstica z, prueba de una cola a la derecha, nivel de sig. 0.05
Paso 5. Tomar una decisin. El ltimo paso consiste en tomar la decisin de rechazar o no la hiptesis nula.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 57
Por ejemplo, con base en la grfica anterior, si al calcular el valor de z el resultado es 2.34, la hiptesis nula se rechaza. La decisin de rechazar la hiptesis nula se tom debido a que 2.34 se encuentra dentro de la regin de rechazo; es decir, ms all de 1.65. De esta manera se puede afirmar que es altamente improbable que un valor z que se calcula de este tamao (2.34) se deba a una variacin de muestreo (casualidad). En caso de que el valor calculado de z hubiera sido menor a 1.65, por ejemplo 0.71, la hiptesis nula no se habra rechazado. Se razonara entonces que un valor tan pequeo no podra atribuirse a la casualidad, es decir, a la variacin de muestreo. Como puedes observar slo es posible tomar una de dos decisiones: ya sea rechazar o no la hiptesis nula.
4.1.
Pruebas de significancia de una y dos colas Antes de ver un ejercicio prctico sobre pruebas de hiptesis, estableceremos la diferencia entre una prueba de dos colas y una de una sola. En la grfica anterior se indica que se aplica una prueba de una cola. Por lo que la regin de rechazo es solo una: la cola derecha de la distribucin, sin embargo es tambin posible que la zona de rechazo se ubique en la cola derecha. Para ilustrarlo pondremos el siguiente ejemplo.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 58
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Al departamento de nutricin de la Direccin Regional de Educacin quiere hacer un estudio sobre el peso neto de una presentacin de Galletas Fortificadas. El cereal se empaca en cajas de 453 grs., de modo que las hiptesis quedan de la siguiente manera: H0: 453 grs. H0: El peso promedio de los cereales es igual o menor a 453 gramos. H1: > 453 grs. H1: El peso promedio de los cereales es mayor a 453 gramos. Observa que el signo de desigualdad en la hiptesis alternativa seala a la derecha o parte superior de la distribucin (Este ejemplo corresponde a la grfica anterior). Asimismo observa que la hiptesis nula incluye el signo de igual. Recuerda que la condicin de igualdad siempre aparece en la hiptesis nula y nunca en la alternativa. El siguiente diagrama muestra una situacin en la que la regin de rechazo se encuentra en la parte izquierda (mnima) de la distribucin.
Pg. 59
Un ejemplo que corresponde a esta grfica puede ser el siguiente: Supongamos que el Director de una Institucin Educativa se propone disminuir la desercin escolar para lo cual implementa un nuevo sistema de orientacin al educando para lo cual considera un promedio de 10 estudiantes que se desertan por aula. Por lo tanto considera que si el promedio es inferior a 10 el nuevo mtodo no servira, caso contrario mantendr el nuevo sistema. En este caso las hiptesis nula y alternativa seran: H0: 10estudiantes H1: <10 estudiantes Una forma de determinar cul es la regin de rechazo consiste en observar la direccin del signo de desigualdad en la hiptesis alternativa (ya sea < o >). En este caso seala a la izquierda y por lo tanto la regin de rechazo es la cola izquierda o mnima de la distribucin.
Pg. 60
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN En resumen, una prueba es de una cola cuando la hiptesis alternativa establece una direccin, como: H0: El ingreso medio de las mujeres es menor o igual al ingreso medio de los hombres. H1: El ingreso medio de los hombres es mayor que el ingreso medio de las mujeres. Por lo tanto, una prueba de dos colas ser aquella en la que la hiptesis alternativa no establece una direccin, como: H0: No hay diferencia entre el ingreso medio de las mujeres y el de los hombres. H1: Existe una diferencia entre el ingreso medio de las mujeres y el de los hombres. Si se rechaza la hiptesis nula y se acepta la alternativa, en el caso de las dos colas, el ingreso medio de los hombres podr ser mayor que el de las mujeres o viceversa. Debido a que existen dos posibilidades, un rea de rechazo de 5% (por ejemplo) se divide en partes iguales entre las dos colas de la distribucin (2.5 en cada una). La siguiente grfica ilustra las dos reas de rechazo y los valores crticos. Observa que el rea total de la distribucin es de 1.000, que se encuentra por 0.95 + 0.025 + 0.025.
Pg. 61
Los registros muestran que en 50 instituciones educativas se produjo como resultado un promedio de 203 estudiantes desnutridos.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 62
Paso 1
La hiptesis nula es la media de la poblacin es 200 estudiantes desnutridos. La hiptesis alternativa es entonces la media de la poblacin es diferente de 200 estudiantes desnutridos o la media de la poblacin no es 200 estudiantes, o bien: H0: = 200 estudiantes desnutridos H1: 200 estudiantes desnutridos Se trata de una prueba de dos colas, porque la hiptesis alternativa no establece ninguna direccin. En otras palabras no afirma si el promedio es mayor o menor de 200estudiantes desnutridos.
Paso 2 Como ya se dijo, se utiliza el nivel de significancia 0.01. Este es , la probabilidad de cometer un error de tipo I. Es decir, es el riesgo de rechazar una hiptesis nula verdadera. Paso 3
La estadstica de prueba de una muestra grande es z. Transformar los datos de produccin a unidades estndar (valores z) permite no slo utilizarlos en este problema, sino tambin en otros problemas de prueba de hiptesis. La frmula, como ya vimos, es:
Pg. 63
) (
Paso 4
La regla de decisin se formula hallando los valores crticos de z con base en las tablas del porcentaje de rea bajo la curva normal (tablas de z). Como se trata de una prueba de dos colas, la mitad de 0.01, es decir 0.005, est en cada cola. Por lo tanto, el rea en la que no se rechaza la hiptesis nula, entre los dos valores crticos, es 0.99. Las tablas del porcentaje del rea bajo la curva se basan en una mitad del rea bajo la curva, o 0.5000. Luego, 0.500 0.005 es 0.4950, de modo que 0.4950 es el rea entre 0 y el valor crtico. Localiza 0.4950 en el cuerpo de la tabla. EL valor ms prximo es 0.4951. A continuacin se lee el valor crtico en la fila y columnas correspondientes a 0.4951, este es 2.58. Por lo tanto la regla de decisin es: Rechazar la hiptesis nula y aceptar la hiptesis alternativa, si el valor calculado de z no est entre 2.58 y +2.58. No rechazar la hiptesis nula si z cae entre 2.58 y +2.58.
Pg. 64
Paso 5
De acuerdo con el clculo del valor z que se hizo en el paso 3 y con la regla de decisin formulada en el paso anterior, se llega a la conclusin de que la media de la poblacin no es diferente de 200. Esto debido a que z = 1.32 no cae en la regin de rechazo y por lo tanto no se cuenta con elementos para rechazar la hiptesis nula (que dice que la media de estudiantes desnutridos es de 200 por Institucin Educativa). El resumen de los cinco pasos se muestra en la siguiente grfica.
Se comprob que el nivel de desnutridos seguir siendo de 200 estudiantes? En realidad no. Desde el punto de vista nutricional, fue no poder desaprobar la hiptesis nula. El no poder desaprobar la hiptesis nula de la que la media de la poblacin es de 200 no es lo mismo que decir que es cierta.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 65
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Como dijimos al principio, la conclusin es anloga a la del sistema judicial. Para explicarlo supn que se acusa a una persona de un delito, pero el juez la absuelve. Si se absuelve a una persona de un delito, la conclusin fue que no hubo suficientes evidencias para probar que el acusado era culpable (no que era inocente). Esto es lo que se hace en una prueba de hiptesis estadstica cuando se rechaza la hiptesis nula. La interpretacin correcta es que no fue posible desaprobar la hiptesis nula. Prueba de una cola En el ejemplo anterior, slo interesaba informar al director si hubo un cambio en el nivel nutricional de las I.E. No interesaba saber si el cambio fue un aumento o una disminucin. Para ilustrar una prueba de una cola, se cambiar la pregunta. Supn que el Director lo que quiere saber es si hubo una reduccin en el nmero de desnutridos. En otras palabras, se puede concluir que, con base en las mejoras nutricionales en la alimentacin de los estudiantes, el nmero de desnutridos fue menos a 200? Observas la diferencia en el modo en que se formula el problema. En el primer caso, se quera saber si haba una diferencia en la media de desnutridos por aula, y ahora se desea saber si hubo una reduccin. Debido a que interesan preguntas diferentes, las hiptesis tambin son diferentes. En smbolos quedara de la siguiente manera: Prueba de dos colas H0: = 200 estudiantes H1: 200 estudiantes Prueba de una cola H0: 200 estudiantes H1: < 200 estudiantes
Pg. 66
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Los valores crticos para una prueba de una cola y para una prueba de dos colas tambin son distintos, porque para una prueba de una cola todo el riesgo se encuentra en una sola direccin. Ejemplo Un estudio sobre el consumo de Gaseosas mostr que el adulto tpico consume 68 litros de gaseosas de cola al ao. Segn esta investigacin la desviacin estndar es de 11.3 litros. Una muestra aleatoria de 64 estudiantes universitarios revel que el ao pasado consumieron 64.2 litros en promedio. En el nivel de significancia de 0.05. a) Es posible concluir que existe una diferencia entre el consumo medio de los estudiantes universitarios y el de los adultos en general? b) Es posible concluir que el promedio de consumo para los estudiantes universitarios es menor que para los adultos en general?
Respuesta inciso a)
Paso 1
La hiptesis nula es la media de la poblacin es 68. La hiptesis alternativa es entonces la media de la poblacin es diferente de 68 o la media de la poblacin no es 68, o bien: H0: = 68 litros de gaseosas de cola al ao H1: 68 litros de gaseosas de cola al ao
Paso 2
Como ya se dijo, se utiliza el nivel de significancia 0.05. Este es , la probabilidad de cometer un error de tipo I.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 67
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Es decir, es el riesgo de rechazar una hiptesis nula verdadera.
Paso 3
La estadstica de prueba de una muestra grande es z. Transformar los datos del consumo de gaseosas de cola a unidades estndar (valores z) permite no slo utilizarlos en este problema, sino tambin en otros problemas de prueba de hiptesis. La frmula, como ya vimos, es:
Paso 4
La regla de decisin se formula hallando los valores crticos de z con base en las tablas del porcentaje de rea bajo la curva normal (tablas de z). Como se trata de una prueba de dos colas, la mitad de 0.05, es decir 0.025, est en cada cola. Por lo tanto, el rea en la que no se rechaza la hiptesis nula, entre los dos valores crticos, es 0.95. Las tablas del porcentaje del rea bajo la curva se basan en una mitad del rea bajo la curva, o 0.5000. Luego, 0.500 0.025 es 0.4750, de modo que 0.4750 es el rea entre 0 y el valor crtico. Localiza 0.4750 en el cuerpo de la tabla.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 68
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN A continuacin se lee el valor crtico en la fila y columnas correspondientes a 0.4750, este es 1.96. Por lo tanto la regla de decisin es: Rechazar la hiptesis nula y aceptar la hiptesis alternativa, si el valor calculado de z no est entre 1.96 y +1.96. No rechazar la hiptesis nula si z cae entre 1.96 y +1.96.
Paso 5
De acuerdo con el clculo del valor z que se hizo en el paso 3 y con la regla de decisin formulada en el paso anterior, se llega a la conclusin de que la media de la poblacin es diferente de 68. Esto debido a que z = -2.69 no cae en la regin de rechazo y por lo tanto no se cuenta con elementos para rechazar la hiptesis nula (que dice que la media de consumo de la poblacin es igual a 68 litros de gaseosas de cola). As se puede decir que la evidencia de la muestra indica que el nivel de consumo anual de gaseosas de cola es diferente para la muestra de estudiantes universitarios y para la poblacin en general. Otra forma de decirlo es que el consumo medio de gaseosas de cola para los estudiantes universitarios es diferente de 68 litros. La diferencia de 3.87 litros entre el consumo de la poblacin en general y el de los estudiantes universitarios no puede atribuirse a la casualidad.
Pg. 69
Paso 2
= 0.05
Paso 4
Rechazar la hiptesis nula y aceptar la hiptesis alternativa, si el valor calculado de z es menor que 1.65. No rechazar la hiptesis nula si z es mayor que 1.65.
Paso 5
De acuerdo con el clculo del valor z que se hizo en el paso 3 y con la regla de decisin formulada en el paso anterior, se llega a la conclusin de que el consumo medio de gaseosas de cola es menor de 68 litros. Esto debido a que z = -2.69 cae en la regin de rechazo y por lo tanto se cuenta con elementos para rechazar la hiptesis nula (que dice que la media de consumo de la poblacin es mayor o igual a 68 litros de gaseosas de cola). As se puede decir que la evidencia de la muestra indica que el nivel de consumo anual de gaseosas de cola es
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 70
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN menor para la muestra de estudiantes universitarios que para la poblacin en general. Otra forma de decirlo es que el consumo medio de gaseosas de cola para los estudiantes universitarios es menor de 68 litros.
La diferencia negativa de 3.87 litros entre el consumo de la poblacin en general y el de los estudiantes universitarios no puede atribuirse a la casualidad. 4.2.
Prueba de hiptesis para dos medias de poblacin (muestras grandes)
En esta seccin se ver al procedimiento para probar si dos medias poblacionales son iguales con base a la informacin que se tiene de dos muestras de stas; o bien, que la diferencia entre ambas medias muestrales es tan grande que se puede concluir que las medias poblacionales no son iguales. Algunas aplicaciones de este tipo de planteamiento son las siguientes:
El Docente del curso de estadstica desea saber si el promedio general de los estudiantes es igual al del semestre pasado. El Coordinador General de Licenciatura en educacin Inicial le interesa conocer el nivel de satisfaccin de los participantes en relacin a los docentes, en las sedes de Arequipa y Cusco. Se desea conocer la diferencia que existe en relacin al rendimiento acadmico de los estudiantes varones y mujeres de la especialidad de Matemtica, Computacin e Informtica.
En estos casos es preciso seleccionar una muestra aleatoria de cada poblacin y calcular su media, para
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 71
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN posteriormente, utilizando el mtodo de los cinco pasos, determinar si las medias poblacionales son iguales o existe alguna diferencia entre ellas. Por su puesto hay una diferencia en la frmula del estadstico z. Prueba de hiptesis para dos medias poblacionales
Dnde: = Media de la primera muestra = Media de la segunda muestra = Varianza de la primera muestra = Varianza de la segunda muestra = Tamao de la primera muestra = Tamao de la segunda muestra
z = Valor estndar
En el siguiente ejemplo se ilustran los detalles de los clculos e interpretacin de este tipo de pruebas. Ejemplo Se pide a cada uno de los estudiantes la opinin sobre el tiempo de libre que deberan tener entre cada curso, ya que se sabe que los docentes ingresan una vez terminada la anterior clase, sobre este aspecto existen bastantes discrepancias entre los varones y las mujeres, para lo cual se realiz un estudio teniendo como muestra 100 mujeres y 50 varones de toda la poblacin de la Facultad de Ciencias de la Educacin,
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 72
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN reportndose la siguiente informacin muestras de ambos tipos de estudiantes: Media de la muestra 5.50 minutos 5.30 minutos Desviacin estndar de la muestra 0.40 minutos 0.30 minutos basada en
A un nivel de significancia de 0.01, es razonable concluir que el tiempo libre solicitado es mayor para los varones?
Paso 1
Pg. 73
Paso 4
Rechazar la hiptesis nula y aceptar la hiptesis alternativa, si el valor calculado de z excede 2.33. No rechazar la hiptesis nula si z es menor a 2.33.
Paso 5
Debido a que el valor calculado de z (3.13) es mayor que el valor crtico (2.33), se rechaza la hiptesis nula y se acepta la de investigacin. Es decir, que con base en la informacin de las muestras se puede concluir que el tiempo libre exigido por los varones es mayor que el de las mujeres.
4.3.
Pruebas de hiptesis respecto de las proporciones Las pruebas de hiptesis que hemos visto hasta el momento se han referido nicamente a la media. Aunque, como podrn suponer, tambin se pueden hacer pruebas de hiptesis respecto de proporciones. Algunos ejemplos de situaciones en las que se puede aplicar este tipo de pruebas pueden ser los siguientes:
El Director de Servicios Profesionales de la Universidad informa que el 80% de sus egresados se insertan en el mercado laboral en
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 74
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN puestos que guardan relacin directa con su campo de estudios. El rea de biblioteca de la Universidad manifiesta que solo el 35% de estudiantes solicitan el prstamo de libros. Un Director desea saber si existen diferencias entre las proporciones de estudiantes de sexo masculino y femenino que desean estudiar en una universidad nacional.
Proporcin. Una fraccin, relacin o porcentaje que indica la parte de una poblacin o muestra que tiene una caracterstica de inters particular. Un requisito para poder aplicar la prueba de hiptesis para las proporciones es que tanto como ( ) sean al menos de 5. Recuerda que: = tamao de la muestra = proporcin de la poblacin Ejemplo El Rector de la Universidad desea conocer si los ingresantes a la universidad provienen de colegios estatales, segn estadsticas se sabes que el 80% de ingresantes a la universidad son egresados de colegios estatales. Para comprobar esta afirmacin se toma una encuesta de 2,000 estudiantes matriculados. Los resultados de la encuesta indican que 1550 de los estudiantes provienen de colegios estatales. Utiliza el procedimiento de la prueba de hiptesis para comprobar la procedencia de los estudiantes.
Pg. 75
= 0.05
Paso 3 z es la estadstica apropiada. La frmula que se aplica es: Prueba de hiptesis para una proporcin poblacional
Dnde: = proporcin de la muestra = proporcin de la poblacin = tamao de la muestra = error estndar de la proporcin de la poblacin Se calcula por ( convierte en: ) de modo que la frmula se
Pg. 76
Paso 4 Debido a que la prueba es de una cola y a que = 0.05, el valor crtico es de 1.65, as: Rechazar la hiptesis nula y aceptar la alternativa si el valor calculado de z cae a la izquierda de 1.65; de lo contrario, no rechazar la hiptesis nula. Paso 5 El valor calculado de z (-0.280) no est en la regin de rechazo, de modo que la hiptesis nula no se rechaza al nivel de significancia de 0.05. Dicho de otro modo, los estudiantes de la universidad en su mayora provienen de colegios estatales.
4.4.
de
dos
Con frecuencia el inters radica en saber si dos proporciones de poblacin son iguales. A continuacin se presentan varios ejemplos:
El Director de Recursos Humanos desea saber si existe una diferencia entre la proporcin de empleados sindicalizados que faltan ms de
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 77
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN cinco das al ao con respecto a la proporcin de empleados no sindicalizados. Se desea dotar de desayunos escolares, para lo cual se tiene una propuesta, se hace una entrevista a los alumnos para averiguar la preferencia si estn de acuerdo o no, tomando la proporcin de nios y nias. El docente de Licenciatura desea saber si existe diferencia proporcional en cuanto a las tardanzas de los participantes varones y mujeres.
Nota que en los ejemplos anteriores, y en todos los que se desea comparar proporciones, cada artculo de la muestra puede clasificarse como xito o fracaso. Es decir, no se trata de comparar mediciones (como en el caso de las medias), sino valores nominales. En este caso tambin, dado que las muestras deben ser mayores a 30 y tener una distribucin normal, se utiliza el estadstico de la distribucin normal estndar, y el valor de z se calcula por la siguiente frmula: Prueba de hiptesis poblacionales para dos proporciones
Dnde: = tamao de la primera muestra. = tamao de la segunda muestra. z = valor estndar. = proporcin de la primera muestra. = proporcin de la segunda muestra.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 78
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN = proporcin conjunta, que se calcula con la siguiente frmula: Proporcin conjunta
Dnde: = nmero de elementos que poseen la caracterstica buscada en la primera muestra. = nmero de elementos que poseen la caracterstica buscada en la segunda muestra. Ejemplo: Una editorial introdujo un texto educativo con el nombre de Raulito. Varias pruebas comparativas indican que Raulito tiene una alta aceptacin de los estudiantes. Se plantea como estrategia el estudio sobre dicho texto teniendo en cuenta la aceptacin de los docentes varones y mujeres. Se usar una prueba en la que se pedir a cada una de los profesores de la muestra analizar varios textos, entre los que se encuentra Raulito, y que indiquen cul es el que consideran mejor. Los resultados fueron los siguientes: Profesore s Mujeres Varones Prefiriero Prefiriero n n otro Raulito texto 20 80 100 100 TOTA L 100 200 Proporci n de Raulito 0.20 0.50
Pg. 79
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Se utilizar el procedimiento de prueba de hiptesis de cinco pasos.
Paso 1
H0: p1 = p2 H1: p1 p2 Paso 2 = 0.05 Paso 3 Prueba de Hiptesis para dos proporciones poblacionales
Paso 4
No rechazar la hiptesis nula, si el valor calculado de z cae entre 1.96 y +1.96. Rechazar la hiptesis nula y aceptar la hiptesis de investigacin si z no cae entre 1.96 y +1.96.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 80
Paso 5
Debido a que el valor calculado de z (-5.00) no cae entre los valores crticos (-1.96 y +1.96), se rechaza la hiptesis nula y se acepta la de investigacin. Es decir, que con base en la informacin de las muestras se puede concluir que la proporcin de los Profesores que consideran mejor el texto Raulito es distinta a la proporcin de las Profesoras.
4.5.
Pruebas de pequeas
hiptesis
con
muestras
En los casos anteriores se ha utilizado el estadstico de prueba de la distribucin estndar o z. Para emplear este estadstico es necesario conocer la desviacin estndar () de la poblacin o tener una muestra grande de ms de 30 observaciones. Sin embargo, en muchos casos no se conoce y el nmero de observaciones de la muestra es menor a 30. En estos casos, se puede utilizar la desviacin estndar de la muestra (S) para aproximar (), pero no es posible utilizar la distribucin z como estadstico de prueba. El estadstico de prueba adecuado es la t de Student, o tambin conocida como distribucin t. Cuando se utiliza la t de Student, se supone que la poblacin tiene una distribucin normal. A continuacin se mencionan algunas caractersticas de esta distribucin. Al igual que la distribucin z, es una distribucin continua. Al igual que la distribucin z, tiene forma de campana y es simtrica.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 81
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN No hay una sola distribucin t, sino una familia de distribuciones t. Todas con la misma media 0, pero con desviaciones estndar diferentes de acuerdo con el tamao de la muestra n. Existe una distribucin t para una muestra con 20 observaciones, otra distribucin tpara una muestra con 21 observaciones y as sucesivamente. La distribucin t es ms ancha y ms plana en el centro que la distribucin z, sin embargo, a medida que aumenta el tamao de la muestra, la distribucin t se aproxima a la distribucin normal estndar (z). La distribucin t de Student tiene mayor amplitud que la distribucin z. Como resultado de ello los valores crticos de t para un nivel de significancia en particular son de mayor magnitud que los valores correspondientes. En otras palabras, debido a que existe una variabilidad mayor en las medias de muestras calculadas a partir de muestras pequeas, se tiene menos confianza en las estimaciones resultantes y son menos apropiadas para rechazar la hiptesis nula.
4.6.
Pg. 82
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN En este caso, se puede sustituir la desviacin estndar de la muestra por la desviacin estndar de la poblacin, pero se tendr que utilizar la distribucin t como estadstico de prueba. A continuacin se presenta un ejemplo que servir para concretar estos conceptos. Ejemplo: El Departamento de Estadstica informa que el ingreso econmico promedio de los padres de familia es de S/. 600.00 por mes. Pero estudios hechos por otras instituciones manifiestan que el ingreso promedio es mayor. Como consecuencia de esto se toma una muestra aleatoria de 26 familias de una Institucin Educativa y se calcula una media de S/. 570.00, con una desviacin estndar de S/. 100.00 Con un nivel de significancia de 0.01, Se podra concluir que el ingreso econmico promedio familiar es menor a 600 soles?
Pg. 83
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Distribucin t como estadstico de prueba para la media de la poblacin
Dnde: = media de la muestra = media de la poblacin = desviacin estndar de la muestra = tamao de la muestra
Paso 4 Los valores crticos de t se encuentran en las tablas de la Distribucin t de Student. La columna de la izquierda tiene el encabezado de grados de libertad, gl. El nmero de grados de libertad es el nmero de observaciones de la muestra menos el nmero de muestras, escrito n1. En este caso el nmero de observaciones en la muestra es 26, por lo que hay 261 = 25 grados de libertad. Para encontrar en valor crtico, primero se localiza la lnea de los grados de libertad apropiados. Despus de determina si la prueba es de una o dos colas. En este caso se tiene una prueba de una cola. Por lo tanto se encuentra en la parte de la tabla titulada una cola. Se localiza la columna con el nivel de significancia seleccionado, que en este caso es de 0.01. Se sigue la columna titulada una cola 0.01 hasta su interseccin con la fila correspondiente a 25
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 84
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN grados de libertad. El valor es de 2.485. Como se trata de una prueba de una cola y la regin de rechazo est en la cola izquierda, el valor crtico es negativo. La regla de decisin es rechazar la hiptesis nula y aceptar la hiptesis de investigacin si el valor calculado de t es menor a 2.485 Paso 5 Dado que el valor calculado de t (-1.530) est a la derecha del valor crtico (-2.485); es decir, no est en la regin de rechazo, no se tienen elementos para rechazar la hiptesis nula. En otras palabras, no existe evidencia de que la diferencia de S/. 30.00 pesos entre la media de la poblacin y la media de la muestra sea estadsticamente significativa. Dicho de otro modo, con base en la informacin de la muestra, no se cuenta con elementos suficientes para afirmar que el ingreso econmico promedio sea menor que S/. 600.00
4.7.
En el aparatado anterior se seleccion una sola muestra aleatoria y se compar su media con el valor supuesto de la media poblacional. En este apartado se extiende esta idea a dos muestras. La interrogante que se busca responder es si ambas medias son iguales en trminos estadsticos. Se requiere de tres supuestos para realizar esta prueba:
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 85
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Las poblaciones muestreadas tienen una distribucin normal. Las dos muestras son independientes. Las desviaciones estndar de ambas poblaciones son iguales.
Como generalmente la varianza de la poblacin es desconocida, las dos varianzas muestrales deben combinarse para hacer una estimacin de la varianza poblacional. En esencia se calcula la media ponderada de las dos desviaciones estndar muestrales y se utiliza esta estimacin de la desviacin estndar de la poblacin. La siguiente frmula se emplea para combinar las varianzas de la muestra. Observa que se encuentran involucrados dos factores: el nmero de observaciones de cada muestra y las propias desviaciones estndar de cada muestra. Varianza combinada
)( (
( )
)(
Dnde: = es la varianza de la primera muestra = es la varianza de la segunda muestra El valor de t se calcula con la siguiente frmula:
Pg. 86
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Prueba de hiptesis para dos medias poblacionales independientes y pequeas
Dnde: = Media de la primera muestra = Media de la segunda muestra = Tamao de la primera muestra = Tamao de la segunda muestra = Estimacin combinada de la varianza de la poblacin
Como ya dijimos, el nmero de grados de libertad es igual al nmero de elementos muestreados menos el nmero de muestras. Debido a que hay dos muestras, existen n1 + n2 2 grados de libertad. Ejemplo:
Un Docente interesado en el tiempo de culminacin de un examen realizar un estudio en base a dos salones, dicho estudio se basa en las diferencias de tiempo en la entrega de un examen, para lo cual se plantea la pregunta: existe alguna diferencia en el tiempo de entrega de un examen de los estudiantes del 6to grado? Para evaluar el estudio se tom dos salones con muestras de 5 y 6 estudiantes. A continuacin se muestran los resultados en minutos. Para responder la pregunta planteada utiliza un nivel de significancia de 0.10.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 87
Saln 2 (minutos) 3 7 5 8 4 3
H1: 1 2
Paso 2
= 0.10
Paso 3 La t de Student se calcula en tres pasos: a) Clculo de las desviaciones estndar y de las medias de las muestras Saln 1 X1 2 4 9 3 2 20 X12 4 16 81 9 4 114 X2 3 7 5 8 4 3 30
( )
Varianza muestral
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 88
(Formula operacional)
= 2.9155 = 2.0976 = 20 / 5 = 4 = 30 / 6 = 5 b) Combinacin de las varianzas de las muestras Varianza combinada
)( ( )( ( )
( ) ( )
)(
)(
c) Determinar t
Pg. 89
Paso 4 Los grados de libertad son iguales al nmero de elementos muestreados menos el nmero de muestras. En este caso n1 + n2 2 es igual a (5 + 6) 2 = 9 grados de libertad. As los valores crticos de t para gl = 9, para una prueba de dos colas y con nivel de significancia 0.10, son +1.833 y 1.833. Entonces, la regla de decisin es no rechazar la hiptesis nula si el valor calculado de t cae entre 1.833 y + 1.833. Paso 5 La decisin es no rechazar la hiptesis nula, ya que el valor calculado de t (-0.622) cae entre los valores crticos (1.833 y +1.833). Dicho de otro modo, la evidencia de las muestras indica que no hay elementos suficientes para decir que existe una diferencia entre los tiempos de entrega de un examen en los dos salones escogidos como muestra.
Pg. 90
4.8.
En el apartado anterior se prob la diferencia entre las medias a partir de dos muestras independientes. Se compar la diferencia entre el tiempo de entrega de dos salones de clases. Las muestras eran independientes, esto significa que las muestras de los tiempos utilizando uno y otro saln no estn relacionado de modo alguno. Sin embargo, existen situaciones en las que las muestras no son independientes; es decir, las muestras estn relacionadas o son dependientes. Un ejemplo de esto puede ser el siguiente: Debido a las mltiples quejas de los padres de familia respecto a la enseanza de los profesores el Director decide realizar una evaluacin a los profesores, para lo cual recurre a dos universidades (UNA y UANCV) para que se tome un examen sobre aspectos pedaggicos, se supondra que ambas universidades haran valoraciones semejantes. Para comprobarlo, el director selecciona 10 profesores y pide tanto a laUNA como a la UANCV que hagan una evaluacin. Para cada profesor casa habr un par de evaluaciones; es decir, cada profesor tendr un valor estimado por la UNA y otro por la UANCV. Esto tambin se conoce como muestra en pares. Para la prueba de hiptesis el inters recae en la distribucin de las diferencias del valor calculado. En consecuencia, slo hay una muestra. Para decirlo de manera ms formal, se est investigando si la media de la distribucin de las diferencias es cero. La muestra se construye a partir de las diferencias entre los valores calculados por la UNA y por la UANCV para
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 91
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN cada profesor. Si las dos universidades reportan valores semejantes, algunas veces la UNA estar ms alta y otras veces ser la UANCV. Sin embargo, se espera que la media de la distribucin de las diferencias sea cero. En caso contrario, si una de las universidades constantemente reporta valores ms altos, la media ser diferente de cero. Se utiliza el smbolo para indicar la media de la poblacin de la distribucin de las diferencias. El estadstico de prueba es t y se calcula a partir de la siguiente frmula. Distribucin t como estadstico de prueba para la comprobacin de medias independientes
Para esta frmula los grados de libertad se calculan por n1 = Media de la diferencia entre las observaciones por pares o relacionadas = Desviacin estndar de la distribucin de las diferencias entre las observaciones por pares o relacionadas = Nmero de observaciones por pares La desviacin estndar de las diferencias ( ) se calcula por:
Pg. 92
( )
Como en las pruebas anteriores, se supone que la poblacin de diferencias tiene una distribucin normal. A continuacin se desarrolla el ejemplo citado:
Ejemplo:
Los resultados de las evaluaciones en puntos de las dos universidades son los siguientes: Profesor 1 2 3 4 5 6 7 8 9 10 UNA 135 110 131 142 105 130 131 110 125 149 UANCV 128 105 119 140 98 123 127 115 122 145
Con un nivel de significancia de 0.05, puede decirse que existe una diferencia entre la media de los valores calculados de los profesores?
Pg. 93
H1: d 0
Paso 2
= 0.05
Paso 3 La t de Student se calcula en tres pasos: a) Clculo de la media de la diferencia entre las observaciones por pares Valor calculado en puntos Diferencia al cuadrado ( d2 ) 49 25 144 4 49 49 16 25 9 16 386
Profesor 1 2 3 4 5 6 7 8 9 10
UNA 135 110 131 142 105 130 131 110 125 149
UANCV 128 105 119 140 98 123 127 115 122 145
Diferencia (d) 7 5 12 2 7 7 4 -5 3 4 46
Pg. 94
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN b) Calculo de la desviacin estndar de la distribucin de las diferencias entre las observaciones por pares o relacionadas Desviacin estndar de las diferencias
( )
donde:
Paso 4 Los grados de libertad son iguales al nmero de elementos muestreados menos el nmero de muestras. En este caso n11 es igual a 10 1 = 9 grados de libertad. Porque hay 10 profesores evaluados.
Pg. 95
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN As los valores crticos de t para gl = 9, para una prueba de dos colas y con nivel de significancia 0.05, son +2.262 y 2.262. Entonces, la regla de decisin es no rechazar la hiptesis nula si el valor calculado de t cae entre +2.262 y 2.262. Paso 5 La decisin es rechazar la hiptesis nula, ya que el valor calculado de t (3.305) no cae entre los valores crticos (+2.262 y 2.262). Dicho de otro modo, la evidencia de la muestra indica que hay elementos suficientes para decir que existe una diferencia entre los valores que sobre los mismos profesores hacen las universidades UNA y UANCV.
Pg. 96
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN CAPITULO V PRUEBAS DE CHI CUADRADA 5.1. Caractersticas de la distribucin
En los captulos anteriores, se ha trabajado mayormente con datos que eran de la escala de intervalo o de razn, como pesos, notas, ingreso econmico o edades. En estas pruebas hemos tenido el supuesto de que los datos provienen de distribuciones normales. En este tema veremos cmo se desarrollan pruebas de hiptesis para datos de escala ordinal o nominal, en las que no se necesita hacer ningn supuesto acerca de la forma de la distribucin de la poblacin de la que provienen los datos. Este tipo de pruebas se conocen con el nombre de pruebas no paramtricas o pruebas de distribucin libre. Esto quiere decir que se realizan a partir de datos nominales u ordinales y que las pruebas estn libres de supuestos acerca de la forma de la distribucin de la poblacin. 5.2. Pruebas de bondad homogeneidad) y ajuste (de
La prueba de bondad y ajuste es una de las pruebas no paramtricas ms utilizadas. Esta prueba se puede usar para datos de cualquier nivel. Este tipo de pruebas se utilizan para ver que tan bien se ajusta un conjunto de datos observados a un conjunto de datos esperados.
Pg. 97
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN En el primer ejemplo corresponde a frecuencias igualmente esperadas o de frecuencias homogneas. Ejemplo: El Director de una Institucin Educativa requiere contratar el personal docente de la especialidad de matemtica para el ao acadmico, se tiene 7 docentes aptos y que laboraron el ao anterior. El problema es qu docentes contratar si se redujo la cantidad de docentes a contratar. Para ello realiza una pequea encuesta a los padres de familia en relacin a la preferencia de docentes que requieren para la enseanza a sus hijos, el director considera que as se lograr la mayor satisfaccin de los padres de familia, teniendo los siguientes resultados: Profesor Nro. de Preferencias Nro. esperado Alex Ticona 13 20 Carlos Pineda 33 20 Jhon Arvalo 14 20 Oswaldo Snchez 7 20 Rafael Muoz 36 20 Elmer Delgado 17 20 TOTAL 120 120 Con base en esta informacin, se puede concluir todos los profesores tienen la misma preferencia? Si no hay una diferencia significativa entre las frecuencias observadas y las frecuencias esperadas, se supondra que las frecuencias observadas fueran iguales o aproximadamente iguales. Es decir, se esperara la misma preferencia por el profesor Alex Ticona o Elmer Delgado. En este caso cualquier
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 98
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN diferencia observada entre el conjunto de frecuencias observadas y esperadas, podra atribuirse al muestreo o a la casualidad. Como hay 120 padres de familia en la muestra, esperaramos que a cada profesor le correspondieran 20 preferencias. Sin embargo la encuesta del conjunto de frecuencias observadas indica que las preferencias de Oswaldo Snchez tienen muy poco, mientras que la de Rafa Muoz se muestra con mayor preferencia. Se debe esta diferencia de preferencia a la casualidad, o podramos concluir que hay preferencia por alguno de los profesores?
Paso 1
Paso 3
La estadstica de prueba adecuada es ji cuadrada que se designa por .
una
categora
Pg. 99
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN = Frecuencia esperada en una categora determinada Para realizar el clculo de se siguen los siguientes tres (sub) pasos: Columna 1: Determinar las diferencias entre y . La suma de estas diferencias es cero. Columna 2: Elevar al cuadrado cada una de las ) diferencias observadas entre y . Esto es ( Columna 3: Dividir los resultados de la columna 2 entre la frecuencia esperada y sumar estos valores. La suma es el valor de .
Nro. de Nmero ( Preferencias esperado 13 33 14 7 36 17 120 20 20 20 20 20 20 120 (1) ) -7 13 -6 -13 16 -3 0 ( (2) ) 49 169 36 169 256 9 2 = 2.45 8.45 1.8 8.45 12.8 0.45 34.4 ( (3) )
Paso 4
Al igual que la distribucin t, la distribucin es en realidad una familia de distribuciones, cada distribucin de la familia cambia de acuerdo al nmero de grados de libertad. Como ya dijimos, el nmero de grados de libertad en este tipo de problemas, se calcula por k 1. Dado que hay 6 categoras o profesoresk 1 = 6 1 = 5 grados de libertad.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 100
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Luego entonces, buscando en las tablas de , encontramos que el valor crtico para 5 grados de libertad con = 0.05 es 11.070. Que se encuentra localizando 5 grados de libertad en el margen izquierdo y movindose horizontalmente hasta la columna marcada con 0.05.
De esta manera, la regla de decisin es: No rechazar H0 si el valor que se encuentre para es menor que 11.070. Si el valor calculado es igual o mayor al valor crtico, se rechaza H0 y se acepta H1 Paso 5
Dado que el valor que se encontr para fue de 34.40, se rechaza la hiptesis nula y se acepta la hiptesis de investigacin. En otras palabras, la diferencia entre las frecuencias observadas y esperadas no se debe a la casualidad, sino que estas diferencias son lo suficientemente grandes para considerarlas significativas. As concluimos que es muy improbable que todos los docentes tengan la misma preferencia. 5.3. Pruebas de bondad y ajuste: frecuencias desigualmente esperadas (de independencia)
En los ejercicios anteriores se esperaba que la frecuencia de todas las variables fuera igual, como el caso de las preferencias de docentes, dnde se esperaba que todos tuvieran la misma preferencia. La
Pg. 101
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN prueba de ji cuadrada tambin se puede usar cuando las frecuencias esperadas no son iguales. El siguiente ejemplo ilustra el caso de las frecuencias desiguales y tambin proporciona un uso prctico de esta herramienta estadstica, encontrar si una experiencia local difiera de una experiencia nacional.
Ejemplo:
Un estudio nacional sobre el nmero de veces que fue hospitalizado un docente durante un lapso de dos aos revel que 40% ingres slo una vez, 20% dos veces, 14% tres, 10% cuatro, 8% cinco, 6% seis y 2% siete. Un estudio de la Direccin de Educacin de Arequipa requiere comparar la experiencia del esta demarcacin con las cifras nacionales. De este modo se toma una muestra de 400 docentes y se determina cuntas veces fueron hospitalizados, las frecuencias observadas se presentan en la siguiente tabla:
Nmero de hospitalizaciones 1 2 3 4 5 6 7
Obviamente el nmero de frecuencias locales no se puede comparar con los porcentajes nacionales, sera
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 102
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN como comparar peras con manzanas; pero los porcentajes nacionales se pueden convertir en frecuencias esperadas. Como ya se mencion, a nivel nacional 40% de los docentes que necesitaron hospitalizacin en dos aos, la necesitaron slo una vez, as que si no hubiera diferencia entre las cifras de Arequipa y las nacionales, entonces 40% de los cuatrocientos muestreados habran sido hospitalizados slo una vez durante este perodo, 20% de los 400 muestreados habran sido hospitalizados dos veces y as sucesivamente. Es decir, se esperara que la frecuencia de hospitalizaciones en Arequipa coincidiera con la frecuencia observada a nivel nacional. En la siguiente tabla se muestran las frecuencias observadas y las esperadas. Nmero Nmero Nmero de observado de esperado de hospitalizacione hospitalizacione hospitalizacione s s (fo) s (fe) 1 165 160 = 40% * 400 2 79 80 = 20% * 400 3 50 56 = 14% * 400 4 44 40 = 10% * 400 5 32 32 = 8% * 400 6 20 24 = 6% * 400 7 10 8 = 2% * 400 400 400
Una vez determinadas las frecuencias esperadas, se procede a plantear las hiptesis. Paso 1
H0: fo = fe No hay diferencia entre la experiencia local y la experiencia nacional
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 103
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN H1: fo fe S hay diferencia entre la experiencia local y la experiencia nacional Paso 2 = 0.05
Paso 3
La estadstica de prueba adecuada es ji cuadrada que se designa por Estadstico de Prueba ji cuadrada
( [
Con k 1 grados de libertad
fo 165 79 50 44 32 20 10 120
fe 160 80 56 40 32 24 8 120
(fo fe) 5 -1 -6 4 0 -4 2 0
(fo fe)2 25 1 36 16 0 16 4 2 =
(fo - fe)2 fe 0.156 0.013 0.643 0.400 0.000 0.667 0.500 2.378
Paso 4
El valor crtico se encuentra utilizando la tabla de la distribucin de ji cuadrada, considerando k 1 grados de libertad; es decir 7 1 = 6 grados de libertad y un
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 104
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN nivel de significancia de 0.05. De esta manera el valor crtico es 12.592.
La regla de decisin es entonces: No rechazar H0 si el valor que se encuentre para es menor que 12.592. Si el valor calculado es igual o mayor al valor crtico, se rechaza H0 y se acepta H1 Paso 5
Dado que el valor que se encontr para no se rechaza la hiptesis nula. fue de 2.378,
En otras palabras, la Direccin Regional de Arequipa podr concluir que la situacin local respecto a la hospitalizacin de docentes enfermos es la misma que en otras partes del pas. 5.4. Limitaciones de la ji cuadrada
La ji cuadrada puede llevar a conclusiones errneas cuando en una celda (o en varias) se tiene una frecuencia esperada demasiado pequea. Esto puede ocurrir porque las frecuencia esperadas aparecen en el denominador de la frmula, y al dividir entre un nmero muy pequeo se obtiene un cociente muy grande. Existen dos reglas generales en relacin con las celdas con frecuencias muy pequeas: a) Si slo hay dos celdas (tablas de 2 X 2), la frecuencia esperada en cada celda debe ser de 5 o ms. De otro modo no se puede utilizar la ji cuadrada.
Pg. 105
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN b) Si hay ms de dos celdas, no se debe utilizar la ji cuadrada cuando ms del 20% de las celdas tienen una frecuencia esperada menor a 5.
5.5.
En las pruebas de bondad y ajuste que vimos anteriormente, se analizaba nicamente una variable y un rasgo. Sin embargo, la prueba de ji cuadrada tambin se puede utilizar cuando se analizan dos rasgos a la vez. En estos casos, se utiliza para saber si existe alguna relacin entre estos dos rasgos.
Ejemplo:
El jefe de personal de la DREP, desea investigar sobre la opinin de satisfaccin laboral de los profesores respecto al lugar de procedencia. Dicho de otra forma, existe alguna relacin entre la satisfaccin laboral y el lugar de procedencia de los profesores? Paso 1 H0: No hay relacin entre la satisfaccin y el lugar de procedencia del profesor. H1: Hay relacin entre la satisfaccin y el lugar de procedencia del profesor. Paso 2 = 0.01 El personal de la DREP entrevist a una muestra aleatoria de 200 profesores, y con base en los
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 106
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN resultados, clasificaron su satisfaccin laboral como excelente, buena, regular e insatisfactoria. En la siguiente tabla se muestran los resultados obtenidos para esta muestra. Satisfaccin laboral Lugar de Procedencia Excelente Buena Regular Insatisfactoria Puno 27 35 33 25 Otro lugar 13 15 37 25 Total 40 50 60 50
Paso 3
La estadstica de prueba adecuada es ji cuadrada que se designa por
( [
) (
Pg. 107
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN Utilizando esta frmula se obtiene el siguiente cuadro: Satisfaccin Laboral Lugar de InsatisExcelente Buena Regular Procedencia factoria fo Puno Otro lugar Total 27 13 40 fe fo fe fo fe fo fe fo Total fe
24 35 30 33 36 16 15 20 27 24 40 50 50 60 60
Sustituyendo la frmula para el clculo de ji cuadrada y comenzando por la celda superior izquierda, tenemos:
( ) ( ) ( ) ( )
Paso 4
El valor crtico se encuentra utilizando la tabla de la distribucin de ji cuadrada. Para conocer los grados de libertad se utiliza la siguiente frmula: gl = (nmero de renglones 1) (nmero de columnas 1) gl = (r 1) (c 1)
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 108
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN En este problema: gl = (2 1) (4 1) gl = 3 El nivel de significancia, como ya se determin es = 0.01. Luego entonces, buscando en las tablas de la distribucin de ji cuadrada, se obtiene el valor crtico de 11.345. La regla de decisin es entonces: No rechazar H0 si el valor que se encuentre para es menor que 11.345. Si el valor calculado es igual o mayor al valor crtico, se rechaza H0 y se acepta H1
Paso 5 Dado que el valor que se encontr para no se rechaza la hiptesis nula. fue de 5.729,
En otras palabras, concluimos que no hay relacin entre la satisfaccin laboral y el lugar de procedencia de los profesores.
Pg. 109
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN AUTOEVALUACIN El trabajo que se presenta a continuacin debe ser remitido por el sistema virtual a la Sede Central. 1. Complete la siguiente distribucin de frecuencias, cuyos datos corresponden a puntajes obtenidos en un examen psicolgico realizado a estudiantes universitarios en la Ciudad de Juliaca.
[ Li Ls> 20 22 22 24 24 26 26 28 28 30 30 32 32 34 34 36 TOTAL
fi 4 6 6
Fi
hi 0.12
15 0.12 31 9 4 0.18
Con los datos anteriores, calcule las medidas de tendencia central, y medidas de dispersin. Realice el Cuadro estadstico y grficas. Analice los datos. 2. Se tiene una poblacin de 1000 estudiantes, para lo cual se desea obtener una muestra representativa. Se realiz un estudio piloto lo cual dio que 15 de 50 estudiantes tienen notas mayores a 14. Calcule el tamao de muestra considerando que se cometer el 5% de error en la investigacin y un error del 10% respecto a la proporcin y determine el tipo de muestreo que debe realizarse.
LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV
Pg. 110
De los siguientes datos tomados en relacin al nmero de estudiantes desaprobados en el curso de matemtica, calcule las medidas de tendencia central y las medidas de dispersin.
10
15
12
3. Una muestra aleatoria de 30 estudiantes se somete a una prueba de mecanografa, resultado un promedio de 63 palabras por minuto y una desviacin estndar de 5 palabras por minuto. Pruebe la hiptesis nula de que en general, los estudiantes no superan una velocidad de 60 palabras por minuto, utilizando un nivel de significancia del 1%. 4. Para una muestra de 30 profesores, el salario medio es de S/. 7.50 por hora, y la desviacin estndar de S/. 1.00. para una muestra aleatoria de 40 profesores de otro colegio particular, el salario medio es de S/. 7.05 por hora, y una desviacin estndar de S/. 1.20. suponga que los salarios de ambos colegios tienen una distribucin normal. Pruebe la hiptesis de igualdad a un nivel de =5%
Pg. 111
0.002 0.005 0.01 0.02 0.03 0.04 0.05 0.06 0.08 0.10 0.15 0.20 0.25
1 COLA 2.8782 2.5758 2.3263 2.0537 1.8808 1.7507 1.6449 1.5548 1.4051 1.2816 1.0364 0.8416 0.6745
2 COLAS 3.0902 2.8070 2.5758 2.3263 2.1701 2.0537 1.9600 1.8808 1.7507 1.6449 1.4395 1.2816 1.1503
Pg. 112
Pg. 113
Pg. 114
BIBLIOGRAFA CALZADA BENZA. "Mtodos Estadsticos para la Investigacin". CASA S. Jos. Inferencia Estadstica para economa y administradores. Centro de estudios Ramn Areces S.A. CORDOVA ZAMORA, Manuel. Estadstica
Aplicada.2006.Lima DE LA HORRA N. Julin. Estadstica Aplicada. Daz Santos. FERNANDEZ CHAVESTA, Jos y Juan. Estadstica Aplicada I y II.2007.Lima. LZARO CARRIN, Moiss. Inferencia
Estadstica.2007.Lima. LIND, Douglas A. y otros. Estadstica Aplicada a los Negocios y a la Economa.2007.Mxico. MITACC MEZA, Mximo. Tpicos de Estadstica Descriptiva y Probabilidad.1996.Lima. MITACC MEZA, Mximo. Tpicos de Estadstica Inferencial. s/f. Lima. MOYA C. Rufino y SARAVIA A. Gregorio.
Pg. 115
MURRAY
R.
Spiegel,
LARRY
J.
Stephens.
Estadstica.2002. Mc Graw Hill. Mxico. PEREZ LEGOAS, Lus A. Estadstica Bsica para Ciencias Sociales y Educacin.2007.Lima. RUIZ M. David. Manual de Estadstica EUME-NET. SIERRA SIERRA BRAVO. "Diccionario Prctico de
Social".2001.Edit. Paraninfo S.A. Espaa. ZEA F. Wilfredo y IBAEZ Q. Wladimir Tablas Estadsticas.
Pg. 116