Sunteți pe pagina 1din 115

ESTADSTICA ESTADSTICA ESTADSTICA ESTADSTICA

INFERENCIAL INFERENCIAL INFERENCIAL INFERENCIAL


APLICADA A LA APLICADA A LA APLICADA A LA APLICADA A LA
EDUCACIN EDUCACIN EDUCACIN EDUCACIN
UNIVERSIDAD ANDINA NSTOR
CCERES VELSQUEZ
FACULTAD DE CIENCIAS DE LA EDUCACIN


ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.2


AUTORIDADES UNIVERSITARIAS
RECTOR DE LA UANCV
Dr. Julio Vctor Huamn Meza
VICERECTOR ACADMICO
Mag. Leopoldo Cari Ortiz
VICERECTOR ADMINISTRATIVO
Dra. Udelia Butrn Zevallos
DECANO DE LA FACULTAD DE CIENCIAS DE LA
EDUCACIN
Dr. Pascual Huacasi Sucasaca
SUPERVISOR GENERAL
Dr. Pascual Huacasi Sucasaca
Autores del Texto:
Dr. Pascual Huacasi Sucasaca
Mg. Marciano Toledo Pacha
Bach. David Olaguivel Yturry
SEDE CENTRAL DE ESTUDIO:
FACULTAD DE CIENCIAS DE LA EDUCACION
Ciudad Universitaria Fono: 051-600048
Email: www.dueduancv.edu.pe

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.3




INTRODUCCIN

El presente texto de Estadstica Inferencial Aplicada a la
Educacin presentamos para los docentes participantes
del Programa de Licenciatura en Educacin Inicial de la
Facultad de Ciencias de la Educacin, de la UANCV, y
al pblico lector dedicado a la investigacin como
herramienta de apoyo para el proceso del trabajo de
investigacin.

El propsito fundamental del texto es hacer alcance
sobre las nociones de estadstica inferencial, el mismo
para realizar los trabajos de investigacin iniciando con
etapa de planeamiento, recoleccin de datos,
elaboracin de datos, presentacin de datos, y el
anlisis e interpretacin de los mismos.

Por lo que tiene la importancia para el desarrollo del
trabajo de investigacin en el campo de la educacin, en
ciencias sociales, y en otros campos afines.

En efecto, el presente texto se ha organizado en cinco
captulos: El primero exponemos sobre conceptos
bsicos de estadstica, haciendo alcance la parte
terica; en el segundo captulo contiene medidas de
tendencia central y de dispersin; continuando en el
tercer captulo con el muestreo estadstico; para luego
pasando a la comprobacin de hiptesis; y en el ltimo
captulo verificando con la prueba de chi cuadrada.
Finalmente presentamos autoevaluacin y tablas
respectivas.

LOS DOCENTES
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.4




ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.5

INDICE Pg.

CAPITULO I
CONCEPTOS BSICOS DE ESTADSTICA
1.1. Introduccin 06
1.2. Concepto de Estadstica: Descriptiva e
Inferencial 06
1.3. La Estadstica en el proceso de investigacin 08
1.4. Variables Estadsticas 10

CAPITULO II
MEDIDAS DE TENDENCIA CENTRAL Y DE
DISPERSIN
2.1. Distribucin de frecuencias 16
2.2. Organizacin de tablas 18
2.3. Representaciones grficas 19
2.4. Medidas de tendencia central 21
2.5. Medidas de dispersin 28
2.6. Medidas de posicin o cuantiles 33

CAPITULO III
MUESTREO ESTADISTICO
3.1. Introduccin al muestreo 38
3.2. Etapas de un estudio por muestreo 39
3.3. Tipos de muestras 41
3.4. Inferencia estadstica 45
3.5. Error estndar de la media 45

CAPITULO IV
COMPROBACION DE HIPTESIS
Introduccin 47
4.1. Comprobacin de hiptesis referentes a la media
de una poblacin. 58
4.2. Prueba de hiptesis para dos medias de poblacin
(muestras grandes) 71

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.6

4.3. Comprobacin de hiptesis referentes a
la proporcin de una poblacin. 74
4.4. Prueba para la comparacin de dos proporciones
poblacionales. 77
4.5. Pruebas de hiptesis con muestras pequeas. 81
4.6. Prueba para la media de la poblacin
(Muestras pequeas) 82
4.7. Prueba para comparar dos medias poblacionales
independientes (muestras pequeas). 85
4.8. Prueba para comparar dos medias poblacionales
dependientes (muestras pequeas). 90

CAPITULO V
PRUEBAS DE CHI CUADRADA
5.1. Caractersticas de la distribucin 96
5.2. Pruebas de bondad y ajuste (de homogeneidad) 96
5.3. Pruebas de bondad y ajuste: frecuencias
desigualmente esperadas (de independencia). 100
5.4. Limitaciones de la Ji Cuadrada 104
5.5. Anlisis de cuadros de contingencia 105
Autoevaluacin 109
Tablas 111
Bibliografa 115







ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.7

CAPITULO I
CONCEPTOS BSICOS DE ESTADSTICA

1.1. Introduccin

En cuanto al origen etimolgico de la palabra
estadstica existen diferentes opiniones y referencias.
Para algunos viene de la voz griega STATERA que
significa balanza, otros sostienen que deriva del latn
STATUS que implica situacin, mientas que algunos
autores afirman que procede del alemn STAAT que
significa estado, porque la funcin tradicional de los
gobiernos centrales y del estado es y ha sido llevar la
cuenta de la cantidad de habitantes, nacimientos,
defunciones, empleo y desempleo, produccin,
impuestos, cantidad de empresas, costo de vida y
muchas otras caractersticas de nuestra sociedad.

La evolucin y el desarrollo de la estadstica en el
mundo actual ha superado el significado etimolgico de
la ciencia; la estadstica constituye en la actualidad un
valioso instrumento de decisin en todas las situaciones
de la vida, desde el hogar hasta la poltica regional,
nacional y mundial; pues, muchas actividades estn
relacionadas con la estadstica y muchas ocupaciones
implican el uso del mtodo estadstico.

1.2. Concepto de Estadstica: Descriptiva e
Inferencial.

Estadstica: es la ciencia que tiene por objeto de
recolectar, organizar, resumir, presentar, analizar e
interpretar datos en forma adecuada, con el fin de
obtener conclusiones y para la toma de mejores
decisiones sobre determinados hechos o fenmenos en
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.8

estudio. De acuerdo a esta definicin podemos clasificar
la estadstica en:

Estadstica Descriptiva: es un conjunto de mtodos
para organizar, analizar y presentar datos de manera
informativa. Es decir, cuando slo se analiza y describe
los datos; y utiliza el mtodo deductivo en el anlisis,
que se puede aplicar las generalidades a las partes; ej.
Hasta tablas y grficos.

Estadstica Inferencial: conjunto de mtodos utilizados
para recolectar, organizar, presentar, analizar e
interpretar datos de una poblacin basndose en una
muestra. La inferencia estadstica utiliza el mtodo
inductivo en el anlisis, que consiste en conocer la
poblacin, en base a sus particularidades (muestras).

1.3. La Estadstica en el proceso de
investigacin.

A lo largo de la historia de la Ciencia han surgido
diversas corrientes de pensamiento tales como: el
Empirismo, el Materialismo Dialctico, el Positivismo, la
Fenomenologa y el Estructuralismo, las cuales han
originado diversas rutas en la bsqueda del
conocimiento. Sin embargo, debido a las diferentes
premisas que sustentan, desde la segunda mitad del
siglo XX tales corrientes se han polarizado en dos
enfoques principales: el cualitativo y el cuantitativo.

As, la investigacin cientfica se divide en dos grandes
enfoques:

Enfoque cualitativo: utiliza recoleccin de datos sin
medicin numrica para descubrir o afinar preguntas de
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV

investigacin y puede o no probar hiptesis en su
proceso de interpretacin.

Enfoque cuantitativo: usa recoleccin de datos para
probar hiptesis con base en la medicin numrica y el
anlisis estadstico para establecer patrones de
comportamiento.


Para generar conocimiento el enfoque cuantit
fundamenta en el mtodo hipottico deductivo,
considerando las siguientes premisas:

a) Delinea teoras y de ella deriva hiptesis o
supuestos.
b) Las hiptesis se someten a prueba para saber si
son generalizables para poblaciones especficas
y en contextos dados.
c) Si los resultados corroboran la hiptesis se
aporta evidencia a su favor, si los resultados de
diversas investigaciones aportan evidencia a
favor de las hiptesis se genera confianza en la
teora que las sustenta.
Investigacin
Cientfica
Enfoque
Cualititativo
Enfoque
Cuantitativo
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN
Pg.9
s en su
usa recoleccin de datos para
probar hiptesis con base en la medicin numrica y el
anlisis estadstico para establecer patrones de

Para generar conocimiento el enfoque cuantitativo se
deductivo,
Delinea teoras y de ella deriva hiptesis o
Las hiptesis se someten a prueba para saber si
son generalizables para poblaciones especficas
Si los resultados corroboran la hiptesis se
aporta evidencia a su favor, si los resultados de
diversas investigaciones aportan evidencia a
favor de las hiptesis se genera confianza en la
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.10

La Estadstica es la herramienta principal que se utiliza
para someter a prueba las hiptesis en la investigacin
cuantitativa.

1.4. Variables Estadsticas

Concepto de variable.

Llamamos variables a los rasgos o caractersticas que
varan entre los diferentes miembros de una poblacin o
muestra. Las variables se designan con las ltimas
letras maysculas del abecedario: X, Y, Z; y los valores
de las variables se designan con las letras minsculas:
x
1
, x
2
, x
3
,, x
n
. Hay dos tipos bsicos de variables: las
que se obtienen de una poblacin cualitativa y las que
se obtienen de una poblacin cuantitativa.

Si la variable que se estudia no se puede expresar
numricamente, se le llama variable cualitativa o
atributo. Algunos ejemplos de variables cualitativas son:
gnero, religin, raza, tipo de automvil, lugar de
nacimiento y color de ojos. Cuando estudiamos
variables cualitativas nos interesa saber cuntos o en
qu proporcin los miembros de una poblacin o
muestra caen en cada categora. Por ejemplo qu
porcentaje de los estudiantes de la UANCV son
hombres?, de qu especialidades eran losdocentes
que rindieron el examen de nombramiento el ao
pasado?, qu porcentaje de la poblacin tiene ojos
azules?, qu porcentaje de la poblacin son de nivel
universitario?.

Si la variable que se estudia se puede expresar
numricamente, se le llama variable cuantitativa.
Algunos ejemplos de estas variables son: las edades de
los estudiantes de una Institucin Educativa, los
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.11

promedios obtenidos al finalizar un ao acadmico, y el
nmero de hijos por familia en el Departamento de
Puno.

Las variables cuantitativas se clasifican a su vez en
variables discretas y continuas. Las variables discretas
slo pueden asumir ciertos valores (generalmente
nmeros enteros) y suele haber huecos entre los
valores. Por ejemplo el nmero de aulas en una
Institucin Educativa (1, 2, 3, etc.), el nmero de
profesores de una determinada especialidad (3, 8, 12,
etc.), el nmero de estudiantes en cada grupo de
Estadstica (6, 15, 30, etc.). Obsrvese que el nmero
de aulas de una Institucin Educativa puede ser 3, 4 5,
pero no puede ser 4.78. Hay un hueco entre los
valores posibles (entre 3 y 4 por ejemplo).

Las variables continuas pueden asumir cualquier valor
dentro de un rango especfico. Ejemplos de variables
continuas son la talla de los estudiantes del 6to. Grado o
la distancia entre las ciudades de Puno y Arequipa (que,
segn la exactitud con que se mida puede ser de 355
km, 355.2 km, o 355.255 km). Otros ejemplos pueden
ser el peso de los alimentos que consumen los
estudiantes (10.5 Kg.) o el tiempo transcurrido de llegar
de su vivienda a las aulas (0.5 Horas). Todos estos
datos sern expresados con decimales. Las variables
continuas son, por lo regular, el resultado de medir algo
y no existen huecos entre los valores posibles.


ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV



Escalas de medicin

Las variables tambin se pueden clasificar de acuerdo a
las escalas de medicin. Las escalas de medicin
indican, con frecuencia, qu clculos se pueden realizar
para resumir y presentar los datos y qu pruebas
estadsticas pueden llevarse a cabo. Por ejemplo, si en
una bolsa de caramelos hay dulces de 4 colores.
Supngase que a los amarillos se les asigna el nmero
1 para identificarlos, a los azules el 2, a los rojos el 3 y a
los morados el 4. Se suman los valores asignados a los
dulces de la bolsa y se divide entre el nmero de dulces
y se dice que el color promedio es 3.56 significa esto
que el color promedio es morado rojizo?. En este
ejemplo no se han usado correctamente las escalas de
medicin.

Variables
Cuantitativas
Discretas
Continuas
Cualitativas
Ordinal
Nominal
De intervalo
De razon
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN
Pg.12

Las variables tambin se pueden clasificar de acuerdo a
las escalas de medicin. Las escalas de medicin
indican, con frecuencia, qu clculos se pueden realizar
para resumir y presentar los datos y qu pruebas
plo, si en
hay dulces de 4 colores.
Supngase que a los amarillos se les asigna el nmero
1 para identificarlos, a los azules el 2, a los rojos el 3 y a
los morados el 4. Se suman los valores asignados a los
ivide entre el nmero de dulces
y se dice que el color promedio es 3.56 significa esto
que el color promedio es morado rojizo?. En este
ejemplo no se han usado correctamente las escalas de
Discretas
Continuas
Ordinal
Nominal
De intervalo
De razon
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.13

Existen cuatro niveles en la escala de medicin: a)
nominal, b) ordinal, c) de intervalo, y d) de razn. El nivel
ms bajo en la escala es nominal, el ms alto o el que
nos da ms informaciones el de razn.

a) Variables de nivel nominal. Las observaciones
nicamente se pueden clasificar o contar. No hay
un orden particular para cada clase. La
clasificacin de los caramelos por colores puede
ser un ejemplo de nivel de medicin nominal.
Clasificamos los dulces slo por su color y
podemos tomar primero los morados, los azules,
o los de cualquier otro color; no hay un orden
natural. Las categoras que se establecen son
mutuamente excluyentes; es decir, un dulce no
puede ser rojo y azul a la vez. Otra caracterstica
de estas categoras es que son colectivamente
exhaustivas; es decir, que todos los dulces
deben pertenecer a una categora, en una bolsa
de caramelos no puede haber un dulce que no
sea rojo, ni azul, ni amarillo, ni morado, ya que
slo existen esos colores.
b) Variables de nivel ordinal. El siguiente nivel es el
ordinal. Tiene todas las caractersticas del nivel
nominal (sus categoras son mutuamente
excluyentes y colectivamente exhaustivas).
Adicionalmente, sus valores tienen un orden
lgico natural. Por ejemplo, supngase que un
profesor de estadstica es evaluado por sus
alumnos al final del curso, la pregunta que se les
hace es En general, como califica usted al
maestro de esta clase?. Las opciones son
excelente, bueno, aceptable, malo y
psimo. Cada categora es ms alta o mejor
que la siguiente, excelente es mejor que
bueno y as sucesivamente. Sin embargo no se
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.14

puede distinguir la magnitud de las diferencias
entre categoras. No se puede decir que la
distancia entre excelente y bueno sea la
misma que entre malo y psimo. Ms an, no
se puede decir que una calificacin de
excelente sea cuatro veces mejor que malo.
Slo se puede concluir que excelente es mejor
que malo, pero no se puede decir cun mejor
es.

c) Variables de nivel de intervalo. Este es el
siguiente nivel de la escala en orden ascendente.
Tiene todas las caractersticas del nivel ordinal,
pero, adems la diferencia entre sus valores o
categoras es de un tamao constante. Un
ejemplo es la temperatura. Supngase que las
temperaturas de tres das consecutivos en la
Ciudad de Cusco fueron 20C, 22C y 24C.
Estos datos se pueden ordenar fcilmente, pero
tambin se puede calcular la distancia entre cada
uno, esto es posible porque un grado centgrado
es una unidad constante de medicin. Es
importante notar que 0 es slo un punto en la
escala de medicin, y que no representa la
ausencia de valor; as, 0no indica que no haya
temperatura, slo que hace fro.

d) Variables de nivel de razn. Es el nivel de
medicin ms alto. Tiene todas las
caractersticas del nivel de intervalo, pero,
adicionalmente el punto 0 indica la ausencia del
valor que se mide. Ejemplos de este nivel son: el
dinero, el peso, la altura, la distancia. Supngase
que una persona tiene S/. 0.00 en su estado de
cuenta, eso quiere decir que no tiene dinero en
esa cuenta.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.15

Escalas de medicin

Caractersticas
que tiene
Caracterstica
s que no
tiene
Ejemplo
Nomina
l
Son mutuamente
excluyentes.
Son exhaustivas.
No
establecen
un orden.

Color
Raza
Sexo
Estado civil
Ordinal Son mutuamente
excluyentes.
Son exhaustivas.
Establecen un
orden.
La distancia
entre cada
valor no es
medible.
Escalas de
bueno,
regular y
malo.
de
Interval
o
Son mutuamente
excluyentes.
Son exhaustivas.
Establecen un
orden.
La distancia
entre cada valor
es igual.
El cero no
indica la
ausencia del
valor que se
mide, es
arbitrario.

La
temperatur
a, 0no
indica que
no haya
temperatur
a.
Coeficiente
de
Inteligencia
de
Razn
Son mutuamente
excluyentes.
Son exhaustivas.
Establecen un
orden.
La distancia
entre cada valor
es igual.
El cero indica la
ausencia del
valor que se
mide, es
absoluto.
El dinero,
S/. 0.00
indica que
no hay
dinero.

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.16

CAPITULO II
MEDIDAS DE TENDENCIA CENTRAL Y DE
DISPERSIN

2.1. Distribucin de frecuencias.

Es un agrupamiento de datos en categoras mutuamente
excluyentes dando el nmero de observaciones en cada
categora.
Los pasos para obtener una distribucin de frecuencia
son los siguientes:

1) Determinar el nmero de clases que se quiere.
Un mtodo para determinar el nmero de clases
es la regla 2 a la k. Esta regla sugiere
seleccionar como el nmero de clases el menor
nmero (k), tal que 2 a la k sea mayor que el
nmero de datos (n).

2) Determinar el intervalo o la amplitud de clase.
Generalmente el tamao de la clase o del
intervalo debe ser el mismo para todas las
clases. Las clases juntas deben abarcar por lo
menos la distancia entre el menor valor de los
datos en bruto hasta el valor mayor. Expresado
en la siguiente frmula:

A =
E I
k


Donde:
A = intervalo de clase
H = mayor valor observado
L = menor valor observado
k = nmero de clases
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.17

Generalmente el resultado de la frmula se
redondea a algn nmero adecuado, como por
ejemplo un mltiplo de 10 o de 100.

3) Fijar los lmites de cada clase. Se trata de fijar
los lmites de cada clase de modo que cada
observacin se pueda colocar slo en una clase.
Se deben evitar los lmites de clase que sean
poco claros o que se sobrepongan.
4) Poner una marca por cada observacin que
quede en cada clase.
5) Contar en nmero de observaciones en cada
clase (frecuencia de clase)

La frecuencia relativa se obtiene dividiendo la frecuencia
de clase entre el total de datos (n). La frecuencia
porcentual se obtiene multiplicando la frecuencia relativa
por 100.

Ejemplo:

Se tiene los siguientes datos:
Edades de los estudiantes de la Especialidad de
Matemtica, de la UANCV.

18 21 22 18 19 17 20 19 22 19
25 26 18 17 23 21 23 20 18 19

1. Calculamos el nmero de clases o intervalos.

2
k
> 2u 2
5
= S2 > 2u

Entonces el nmero de clases ser de 5




ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.18

2. Ahora calcularemos la Amplitud

A =
26 17
S
=
9
S
= 1.8 2

3. Empezamos a construir nuestra distribucin de
frecuencias.

Nro. [L
i
L
s
> x
i
Tarjas f
i
F
i

1 17 19 18 ///// / 6 6
2 19 21 20 ///// / 6 12
3 21 23 22 //// 4 16
4 23 25 24 // 2 18
5 25 27 26 // 2 20
20

2.2. Organizacin en tablas

Para una mejor representacin de los datos obtenidos
se construye una tabla de datos, lo cual simplifica toda
la informacin y nos muestra de manera agradable.
Se debe consideras algunos aspectos como el nmero
de la tabla, titulo, cuerpo, fuente y elaboracin.

Para nuestra ilustracin usaremos el cuadro de
frecuencias anterior.

Tabla Nro. 01

Puno: Edades de los estudiantes del 4to semestre de la
especialidad de Matemtica - FACE 2011 I




ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV


Edades Frecuencia Porcentaje (%)
17 19 6 30
19 21 6 30
21 23 4 20
23 25 2 10
25 27 2 10
TOTAL 20 100
Fuente: Ficha de observacin
Elaboracin: El docente.

2.3. Representaciones grficas.

Las representaciones grficas de las distribuciones de
frecuencia, se hacen por lo general con llamadas
grficas de barras (en las que las clases se indican en el
eje horizontal y las frecuencias de clase en el eje
vertical) o con grficas de pie, especialmente utilizadas
para mostrar las frecuencias porcentuales.


Grfico de Barras




0
1

!
"
#
$
1 ! " #
F
r
e
c
u
e
n
c
i
a
Grupo de edade
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN
Pg.19
(%)
Las representaciones grficas de las distribuciones de
general con llamadas
grficas de barras (en las que las clases se indican en el
eje horizontal y las frecuencias de clase en el eje
vertical) o con grficas de pie, especialmente utilizadas

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV


Este tipo de grafica normalmente se utiliza para
visualizar las frecuencias absolutas, es decir los datos
numricos.

Grafico circular


Para el caso de grfico circular mayor mente lo
utilizaremos para ver los porcentajes, puesto que en
forma equitativa distribuye en base al crculo.


Grfico de lneas

!0%
!0%
0%
10%
10%
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN
Pg.20
Este tipo de grafica normalmente se utiliza para
visualizar las frecuencias absolutas, es decir los datos

Para el caso de grfico circular mayor mente lo
utilizaremos para ver los porcentajes, puesto que en
1

!
"
#
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.21


Para casos de seguimiento, donde se requiere estudiar
si se est mejorando o empeorando usaremos este tipo
de grfico.
Grfico de dispersin




El caso de dispersin es para ver qu tan distantes se
encuentran nuestros datos.

Es importante mencionar que si bien, las
representaciones grficas sirven para dar una visin
rpida de la forma en que se comportan los datos,
tambin pueden ser utilizadas (dependiendo de cmo se
0
1

!
"
#
$
&
1 ! " #
F
r
e
c
u
e
n
c
i
a
Grupo de edade
0
1

!
"
#
$
&
0 1 ! " # $
F
r
e
c
u
e
n
c
i
a
Grupo de edade
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.22

configuren) para dar una idea equivocada de la
informacin que se quiere presentar.

2.4. Medidas de tendencia central

El propsito de cualquier medida de tendencia central es
indicar con precisin el centro de un conjunto de
observaciones. Algunas de las medidas de tendencia
central ms comunes son la media aritmtica, la
mediana y la moda.
Media aritmtica

La media aritmtica es probablemente la medida de
tendencia central ms importante, en tato es la ms
utilizada. Tambin se le llama promedio y la vemos
aplicada a diario en casi todos los espacios y medio
dedicados a brindar informacin. Algunos ejemplos
puedan ser el promedio de notas obtenidas por un
estudiante durante un ao acadmico, el salario
promedio de los empleados de una Institucin
Educativa, el promedio de edades de los estudiantes de
un nivel determinado, etc.

Definida formalmente, la media aritmtica es la suma de
todos los valores de una muestra o poblacin dividida
entre el nmero de valores de la poblacin o muestra.
Cuando lo que se calcula es la media de una poblacin,
sta se representa con la letra griega (). Por otro lado,
cuando lo que se calcula es la media de una muestra,
sta se representa con (X

). As, las frmulas son como


sigue:

Media poblacional p =
x
N


Dnde:
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.23

p = Media poblacional
x = Representa cualquier valor particular
N = Nmero de individuos en la poblacin
= Indica la operacin de adicin

Media muestral X

=
x
n

Dnde:
X

= Media poblacional
x = Representa cualquier valor particular
n = Nmero de individuos en la poblacin
= Indica la operacin de adicin

Algunas caractersticas de la media aritmtica son:

- Todo conjunto de datos de intervalo o de
razn tienen una media.
- Un conjunto de datos slo tiene una media.
- La media es til para comparar dos
poblaciones.
- La media aritmtica es la nica medida de
tendencia central en la que la suma de las
desviaciones de los valores de la media ser
siempre cero.
Expresado simblicamente (x x ) = u

Ejemplo:

Para datos no agrupados

Se tiene las notas de 20 estudiantes:

1 1# 1 11 1# 1' 1" 1 1$ 1#
1& 11 ' 10 1! 1$ 1# ( 1" 1

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.24

x =
x
n
=
12 +1S ++14 +12
2u


x =
26S
2u
= 1S

Por lo tanto podemos concluir que el promedio de los 20
estudiantes es de 13 puntos.


Para datos agrupados

Tenemos las siguientes edades de estudiantes:

Nro. [L
i
L
s
> x
i
f
i
x
i
* f
i

1 17 19 18 6 108
2 19 21 20 6 120
3 21 23 22 4 88
4 23 25 24 2 48
5 25 27 26 2 52
20 416

x =
x

n
=
416
2u
= 2u,8 21

Concluimos que el promedio de edades de los
estudiantes de matemtica de la UANCV es de 21 aos.

Mediana

Algunas veces, cuando en un conjunto de datos existe
uno o dos muy grandes o muy pequeos, la media
aritmtica puede no ser representativa. En esos casos,
el punto central de ese grupo de datos se puede
describir mejor utilizando la mediana.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.25


La mediana es la observacin central de los valores de
una poblacin o muestra una vez que stos han sido
ordenados de forma ascendente o descendente. Para
un nmero par de observaciones, la mediana es el
promedio de los dos valores intermedios.

Algunas caractersticas de la mediana son:

- Todo conjunto de datos ordinales, de
intervalo o de razn tienen una mediana.
- Un conjunto de datos slo tiene una
mediana.
- A la mediana no le afectan valores
extremadamente grandes ni
extremadamente pequeos, por eso es
especialmente til cuando se tienen estos
valores.

Ejemplo:

Para datos no agrupados

Tenemos las siguientes notas:

1 1$ 1 11 1# 1' 1" 1 1$ 1#

Como primer paso tenemos que ordenar los datos de
menor a mayor.

11 1 1 1 1" 1# 1# 1$ 1$ 1'

Una vez ordenado ubicamos el valor que este al centro
o al medio. En nuestro caso tenemos dos valores, para
lo cual se debe sumar ambos y dividir entre dos.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.26


Hc =
14 +1S
2
=
29
2
= 14.S 1S

Entonces tenemos como media la nota de 15.

Para datos agrupados


Tenemos los siguientes datos:

Nro. [L
i
L
s
> x
i
f
i
F
i

1 17 19 18 6 6
2 19 21 20 6 12
3 21 23 22 4 16
4 23 25 24 2 18
5 25 27 26 2 20
20

Usaremos la siguiente formula

Hc = I

+A_
n
2
F
-1

_

Primeramente tenemos que ubicar un intervalo, para lo
cual dividimos:

n
2
=
2u
2
= 1u

Entonces, ubicamos el intervalo segn la siguiente
condicin:

F

> 1u 12 > 1u
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.27


Elegimos el segundo intervalo.
Reemplazamos los datos en la frmula:

Hc = 19 +2 _
1u 6
6
_

Hc = 19 +2 _
4
6
_ = 19 +1,SS = 2u,SS

Por lo tanto se tiene una edad media de 20.

Moda

La moda es el valor que aparece con ms frecuencia en
un conjunto de datos. La moda es especialmente til
para encontrar el punto central de un grupo de datos de
tipo nominal u ordinal.

Algunas caractersticas de la moda son:

- Se puede determinar la moda en grupos de
datos de todos los niveles (nominales,
ordinales, de intervalo y de razn).
- Puede existir ms de una moda para cada
grupo de datos.
- A la moda no le afectan valores
extremadamente grandes ni
extremadamente pequeos, por eso es
especialmente til cuando se tienen estos
valores.

Ejemplo:

Para datos no agrupados
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.28


Se tiene las siguientes notas:

1 1$ 1 11 1# 1' 1" 1 1$ 1#

Para el caso de la moda es solamente determinar cul
es el valor que ms se repite.
En nuestro caso se puede ver que el valor 12 es el ms
que se repite. Por lo tanto la moda ser la nota 12.

Para datos agrupados

Tenemos:

Nro. [L
i
L
s
> x
i
f
i
F
i

1 17 19 18 6 6
2 19 21 20 6 12
3 21 23 22 4 16
4 23 25 24 2 18
5 25 27 26 2 20
20

Como en el caso de la mediana tambin tenemos que
ubicar el intervalo con el que se calculara.
Ahora usaremos la siguiente frmula:

Ho = I

+A_
(

-1
)
(

-1
) +(

+1
)
_

Ho = 19 +2 _
(6 6)
(6 6) +(6 4)
_ = 19

La moda es de 19 aos.

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.29

2.5. Medidas de dispersin

Las medidas de dispersin se utilizan para obtener
informacin complementaria a las medidas de tendencia
central y miden la forma como se distribuyen los datos
que integran una poblacin o muestra. As, el rango se
basa en la localizacin de los valores mayor y menor de
un grupo de datos, y la varianza y la desviacin estndar
en las desviaciones de cada uno de los datos que
integran la poblacin o muestra con respecto de su
media.
Varianza

La varianza es una de las medidas de tendencia central
ms reportadas, y como ya se mencion, se basa en la
diferencia entre el valor de cada observacin y la media.
En trminos conceptuales la varianza es la media
aritmtica de las desviaciones de la media elevadas al
cuadrado.

Cuando lo que se calcula es la varianza de una
poblacin, sta se representa con la letra griega o
2

(elevada al cuadrado), y cuando lo que se calcula es la
varianza de una muestra se representa con la letra S
2

(tambin elevada al cuadrado). Las frmulas para
calcular cada una son como sigue:

Varianza poblacional o
2
=
(x-)
2
N


Varianza muestral S
2
=
(x-x )
2
n-1

(Formula conceptual)
Varianza muestral S
2
=
x
2
-
(x)
2
n
n-1

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.30

(Formula operacional)

Es importante resaltar que la frmula de la varianza
muestral para clculos tiene la ventaja de que no se
necesita calcular la media para obtenerla.


Ejemplo:

Para datos no agrupados

Se tiene las notas de 10 estudiantes y se necesita
calcular su varianza.
12 13 11 15 16
11 12 15 18 13

S
2
=
x
2

(x)
2
n
n 1


Entonces:

x
2
= 12
2
+1S
2
++18
2
+1S
2
= 1898

[x
2
= (1S6)
2
= 18496

Por lo tanto reemplazamos

S
2
=
1898
18496
10
1u 1
=
1898 1849,6
9


ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.31

S
2
=
48,4
9
= S,S8

Asi, verificamos que tenemos una varianza de 5,38.



Para datos agrupados

Usando los datos del ejemplo anterior tenemos:

Nro. [L
i
L
s
> x
i
f
i
f
i
x
i
f
i
x
i
2

1 17 19 18 6 108 1944
2 19 21 20 6 120 2400
3 21 23 22 4 88 1936
4 23 25 24 2 48 1152
5 25 27 26 2 52 1352
20 416 8784

S
2
=

(]
i
x
i
)
2
n
n 1


Reemplazando tenemos:

S
2
=
8784
(416)
2
20
2u 1
=
8784
173056
20
19
=
8784 86S2,8
19


S
2
=
1S1,2
19
= 6,91

Finalmente tenemos una varianza de 6,91

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.32

Desviacin estndar

La varianza tiene la desventaja de que sus valores son
difciles de interpretar ya que estn expresados en la
unidad de medida de los datos que integran la poblacin
o muestra al cuadrado (p.e. litros al cuadrado, metros al
cuadrado, aos al cuadrado, etc.) Resulta obvio pensar
que al calcular la raz cuadrada de la varianza
obtendremos valores expresados en la misma unidad de
medida de que los datos que nos interesan.

De este modo, una definicin formal de la desviacin
estndar es la raz cuadrada positiva de la varianza.

Las frmulas que se utilizan para calcularla se pueden
simplificar entonces en las siguientes expresiones:

Desviacin estndar poblacional: o = Vo
2

Desviacin estndar poblacional: S = VS
2


Ejemplo:

Para datos no agrupados y datos agrupados

S =

S
2


Segn el ltimo resultado obtenido tenemos:

S = 6,91 = 2,6S

Se concluye que se tiene un Desviacin Estndar de
2,63 lo que implica que se tiene una reducida variacin.

Coeficiente de Variacin

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.33

C. I. =
S
x
(1uu)

C. I. =
2,6S
2u,8
(1uu) = u.1264(1uu) = 12,64 %

Concluimos que el C.V. = 12.64%, lo que nos indica que
tenemos una variacin moderada.
2.6. Medidas de Posicin o Cuantiles

Son estadgrafos que dividen a una distribucin de
frecuencia de datos en otras proporciones y no solo en
mitades como lo hace la mediana. Los cuantiles o
cuantilas ms usados en el anlisis estadstico, son:
Cuartiles, quintiles, deciles y percentiltes; los cuantiles
se usan frecuentemente para describir el
comportamiento de una poblacin; los valores en la
distribucin de frecuencias se dan en trminos de
porcentaje.

Los Cuartiles

Los cuartiles dividen a un conjunto de observaciones en
cuatro partes iguales. Denotados por Q
n
,
representando grficamente, tenemos que:

Q1 Q2 Q3
/------------/----------------/----------------/---------------/
Xmn 25%
n
4
25%
2n
4
25%
3n
4
25% Xmx

El primer cuartil al que se llama Q
1
es el valor por debajo
del cual se encuentra el 25% de las observaciones,
iguales o menores a l, y 75% superiores a l; el
segundo cuartil o Q
2
es igual a la mediana; y el tercer
cuartil o Q
3
es el valor por debajo del cual se encuentra
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.34

el 75% de las observaciones, inferiores o iguales a l, y
25% de stas superiores a l.
Cuyas frmulas son:

n = Ii + c._
n]i
4
- ]i
]ii
_ ; Donde:
n = Cuortil
n
i
4
= Sumotorio Jc rccucncio Ji:iJo cntrc 4

i
= Sumotorio Jc rccucncios ontcriorcs

ii
= Frccucncio oJ]unto postcrior
Ii = Iimitc rcol incrior
c = AmplituJ o intcr:olo Jc closc

2 = Ii + c._
2]i
4
- ]i
]ii
_ ; y S = Ii + c._
3]i
4
- ]i
]ii
_

Ejemplo:

Teniendo una distribucin de frecuencia X (cuadro) de
los 80 trabajadores segn sus haberes. Determinar
cuartiles Q
1
,Q
2
y Q
3
.

Haberes
|L| Lx|
Nro de
trabajad f
i
Nro acumulado
de trabajad F
i
90 120 11 11
120 150 13 24
150 180 20 44
180 210 17 61
210 240
240 270
270 - 300
15
3
1
76
79
80
TOTAL n = 80
Fuente: Ficha de observacin
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.35

Elaboracin: El investigador.


i). Clculo de Q
1
.
Datos:
n
]
4
=
80
4
= 2u ; entonces:
1
= Ii + c._
n]i
4
- ]i
]ii
_

i
= 11
1 = 120 + 30.
_
2u 11
1S
_

ii
= 1S
1 = 120 + 30.
_
9
1S
_
Ii = 12u
1 = 120 +
20
13


c = Su
1 = 140,8 doIucs.


El Q
1
implica que el 25% del total de trabajadores, es
decir 20 de ellos tienen haberes inferiores o iguales a
140.80 dlares y los 60 restantes, o sea el 75% de
trabajadores, tienen haber superior a 140.80 dlares.

ii). Clculo de Q
2
.
Datos:

n
]
4
=
2(80)
4
= 4u ;entonces:
2
= Ii + c._
n]i
4
- ]i
]ii
_

i
= 11 +1S = 24
2 = 150 + 30.
_
4u 24
2u
_

ii
= 2u
1 = 120 + 30.
_
16
2u
_

Ii = 1Su
2 = 174 doIucs.


ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.36

c = Su

Es decir, que el segundo cuartil determina que el 50%
de los trabajadores ganan como mximo 174 dlares.
De la misma forma se puede hallar el Q
3
.


Quintiles K
n


Son estadgrafos de posicin que dividen al total de las
observaciones en cinco partes iguales, es decir, que
entre dos quintiles consecutivos se encuentre no ms
del 20% del total de las n observaciones.

K1 K2 K3 K4
/------------/--------------/---------------/--------------/----------------/
Xmn
n
5
2n
5
3n
5
4n
5
Xmx

Las frmulas y el procedimiento tcnico para calcular las
quintiles con datos agrupados es el mismo que se
emplea para los cuartiles, con la nica diferencia que se
divide la sumatoria de frecuencia entre 5. Su frmula es:

K
n
= Ii + c._
n]i
S
- ]i
]ii
_ ; y

K
4
= Ii + c._
4]i
S
- ]i
]ii
_


Deciles D
n


Los deciles dividen a un grupo de datos en diez partes
iguales, significa que cada decil representa el 10% de
las observaciones.

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.37

D1 D2 D3 D4 D5 D6 D7 D8 D9
/-----/--------/-------/--------/--------/--------/--------/--------/-------/-------/
n
10
2n
10
3n
10
4n
10

9n
10


Cuya frmula es:
n
= Ii + c._
n]i
10
- ]i
]ii
_

Ejemplo: Considerando el cuadro anterior, calcular: D
6.
Solucin:
Datos:

n
]
4
=
6(80)
10
= 48 ; entonces: 6 = Ii +c._
6]i
10
- ]i
]ii
_

i
= 11 +1S +2u = 44
6 = 180 + 30.
_
48 44
17
_

ii
= 17
6 = 180 + 30.
_
4
17
_

Ii = 18u
6 = 187.1 doIucs.


c = Su

Significa que el 60% de los trabajadores tienen haberes
iguales o inferiores a 187.1 dlares.

Percentiles. Pn

Son valores que dividen la muestra ordenada en forma
ascendente o descendente en 100 partes iguales, y
cada percentil representa el 1% de los datos. Se aplican
cuando existen numerosos valores de la variable con
una alta frecuencia total.

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.38

P
1
P
2
P
3
P
50
..P
98
P
99

/----/----/------/---------------------/-----------------------/----/-----/

Cuya frmula y procedimientos es el mismo de las
anteriores, con la diferencia de que se divide la
sumatoria de frecuencias entre 100.

P
n
= Ii + c._
n]i
100
- ]i
]ii
_ ; n = 1,2,,99.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.39

CAPITULO III
MUESTREO ESTADISTICO

3.1. Introduccin al muestreo

Una vez definida el problema a investigar, formuladas
las hiptesis, determinadas las dimensiones e
indicadores de las variables y delimitado el campo de
investigacin, se hace otra opcin antes de iniciar con el
trabajo de campo, que es el muestreo.

El muestreo es el proceso de extraccin de una
muestra; el objeto del muestreo es seleccionar una
muestra que represente a toda la poblacin entera,
ya que a partir de la muestra se estimar las
caractersticas de la poblacin que no se conoce.

Poblacin: es un conjunto de todos los elementos
(unidades de anlisis) que pertenecen al mbito espacial
donde se desarrolla el trabajo de investigacin.
Muestra: es una parte o subconjunto, representativo de
la poblacin debidamente seleccionada.

Por qu tomar una muestra en lugar de estudiar a
todos los elementos de una poblacin? La principal
ventaja de tomar una muestra consiste en que si el
diseo muestral se ha realizado cumpliendo los
requisitos de aleatoriedad una vez teniendo
informacin de ella se pueden generalizar esos
conocimientos a toda la poblacin, con lo que se
disminuyen los costos y tiempos necesarios para la
realizacin del estudio


ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.40

Algunos ejemplos pueden ser los siguientes: Se desea
aplicar una nueva estrategia de enseanza, realizar el
estudio a toda la poblacin de estudiantes de Puno sera
muy tedioso, para ello solo se selecciona una muestra
de algunas Instituciones Educativas. Para determinar las
intenciones de voto de una futura eleccin estudiantil es
necesario tomar una muestra de los estudiantes
matriculados debido al alto costo de encuestar a miles
de estudiantes antes de una eleccin.

3.2. Etapas de un estudio por muestreo

Las etapas de un estudio por muestreo son las
siguientes:

a) Planeacin del estudio. Consiste en establecer
los objetivos del estudio y la forma en que se
propone llegar a ellos.

b) Seleccin del mtodo adecuado de muestreo. Es
decir, si el muestreo ser probabilstico o no
probabilstico


Muestra probabilstica: muestra seleccionada
de tal forma que cada elemento de la poblacin
tiene la misma probabilidad (distinta de cero) de
ser escogidos en la muestra.

Muestra no probabilstica: la eleccin de los
elementos no depende de la probabilidad, sino
de causas relacionadas con las caractersticas
del investigador o del que hace la muestra.

c) Determinacin del error de muestreo. Consiste
en determinar el margen de error aceptado en el
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.41

clculo de la muestra. Es importante tambin
considerar los errores de respuesta sistemtico y
encuesta sistemtico.
Error de: respuesta sistemtico. Es aquel
producido intencionalmente por el sujeto
estudiado. (Ejemplo. Estimacin del ingreso
medio de un padre de familia).
Error de: encuesta sistemtico. Es aquel que se
produce de manera no intencional debido a
errores en el manejo de los datos capturados,
ocasionados por la falta de capacitacin o de
personal calificado, por ejemplo.

d) Determinacin del tamao de la muestra. La
frmula estadstica para el clculo del tamao
mnimo de la muestra ser:

n =
N. Zo
2
2
4. N. (E)
2
+ Zo
2
2


n = Iomoo minimo Jc lo mucstro

N = Poblocion Jc cstuJio

Z
o
2
= uddcn]unu


E = Errormximopcrmisiblc


ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.42

Y para calcular sub muestras, se calcula mediante la
tcnica estratificada de fraccin de grupos a partir de las
sub poblaciones por cada Institucin Educativa.

Sn =
N
N
. (nt) ; Sn = Submucstro
SN = Sub poblocion
N = Poblocion
nt = Hucstro totol

e). Seleccin de los sujetos que integrarn la
muestra.Consiste en designar y contactar a los
elementos que integrarn la muestra.

f). Recopilacin de la informacin. Consiste en aplicar
los cuestionarios o realizar los experimentos que
son objeto del estudio.
g). Clculo de las inferencias o estimaciones.
Consiste en elaborar las pruebas estadsticas que se
hayan definido en la planeacin del estudio a fin de
llegar a la consecucin de los objetivos del mismo.

h). Presentacin de resultados. Consiste en preparar
un reporte o presentacin de modo que las
conclusiones del estudio sean fcilmente utilizables
para la toma de decisiones.

3.3. Tipos de muestras

Existen bsicamente dos clases de muestras: muestra
probabilstico o no probabilstico.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV


Muestreo aleatorio simple. Es una muestra
seleccionada de modo que cada uno de los elementos o
personas de la poblacin tengan las mismas
posibilidades de ser incluido en la muestra. La seleccin
de los individuos puede hacerse utilizando una tabla de
nmeros aleatorios, una tmbola, o bien un software de
computacin que cuente con esa funcin.

Muestreo aleatorio sistemtico.Es la muestra que se
determina y selecciona tomando un nmero de la
poblacin, que corresponde al resultado de dividir la
poblacin entre el tamao de la muestra. Ejemplo, si se
tiene una poblacin de 9000 docentes de EBR y una
muestra de 500, entonces se divide 9000 entre 500 y se
)robabilistico
*leatorio
sim+e
*leatorio
sistem,tico
*leatorio
estratificado
)or
conglomerados
No )robabilistico
* -ucio
)or
conveniencia
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN
Pg.43

Es una muestra
seleccionada de modo que cada uno de los elementos o
las mismas
. La seleccin
de los individuos puede hacerse utilizando una tabla de
nmeros aleatorios, una tmbola, o bien un software de
la muestra que se
determina y selecciona tomando un nmero de la
poblacin, que corresponde al resultado de dividir la
poblacin entre el tamao de la muestra. Ejemplo, si se
tiene una poblacin de 9000 docentes de EBR y una
ide 9000 entre 500 y se
No )robabilistico
conveniencia
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.44

obtiene 18. Esto implica que tenemos que tomar de la
poblacin (nmina de docentes con sus respectivos
nmeros) un docente por cada 16 nmeros, hasta
completar 500, que es el tamao de la muestra.K = N/n,
en donde K = un intervalo de seleccin sistemtica.

Muestreo aleatorio estratificado. Se divide una
poblacin en subgrupos llamados estratos y se
selecciona una muestra de cada uno de ellos.

Muestreo por conglomerados. Se divide la poblacin
en subgrupos llamados conglomerados (unidades
primarias) y se selecciona una muestra aleatoria de
estas, posteriormente se toma una muestra
representativa de los conglomerados seleccionados.
Los tipos de muestreo no probabilsticas suponen un
procedimiento de seleccin informal y un poco arbitrario.

Distribuciones muestrales
Antes de hablar de las distribuciones muestrales es
preciso conocer un concepto fundamental para su
comprensin: el error de muestreo.
Como ya se mencion, la caracterstica principal del
muestreo aleatorio es que todos los elementos de la
poblacin tengan la misma probabilidad de ser incluidos
en la muestra. Para lograr esto, se puede seleccionar
una muestra aleatoria simple, una muestra sistemtica,
una muestra estratificada, una muestra por
conglomerados o una combinacin de estos mtodos.
Sin embargo lo ms probable es que la media de la
muestra no sea idntica a la media de la poblacin.
Asimismo, la desviacin estndar o cualquier otro
parmetro que se calcule de la muestra muy
probablemente no sernidnticos al clculo que se haga
con base en la poblacin.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.45

El error de muestreo, entonces, es igual a la diferencia
entre un estadstico de la muestra y el parmetro
poblacional correspondiente.

Supn por ejemplo que las calificaciones del primer
perodo de exmenes en la materia de estadstica II de
un grupo de cuatro estudiantes son de 97, 100, 99 y 85.
Del mismo modo, supn que se toma una muestra
aleatoria de dos estudiantes cuyas calificaciones son 97
y 99. La media de la muestra sera 98, que se obtiene
mediante (97+99)/2. Otra muestra de dos calificaciones
podra ser 100 y 85, con una media de 92.5. La media
de todas las calificaciones (media de la poblacin) sera
95.25, que se encuentra mediante (97+100+99+85)/4.

En este caso el error de muestreo de la primera muestra
sera 2.75, que se obtiene mediante la siguiente
frmula (la media de la poblacin menos la media de la
muestra):

Error Jc Hucstrco = p X



Donde:
p = media de la poblacin
X

= media de una muestra


Para la segunda muestra, el error de muestreo sera de
2.75, que se encuentra mediante (95.25 92.5).

Ambas diferencias (-2.75 y 2.75) son el error que se
comete al estimar la media de la poblacin mediante
una media de la muestra, y estos errores de muestreo
se deben al azar. El tamao de estos errores variar de
una muestra a otra.



ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.46

3.4. La inferencia estadstica

Como ya se ha mencionado la inferencia estadstica se
refiere a obtener informacin vlida para una poblacin
entera a partir del estudio o anlisis de una muestra. Un
ejemplo de este tipo de inferencia son las estimaciones
de parmetros de la poblacin a partir de parmetros de
la muestra.

3.5. Error estndar de la media

Hasta ahora hemos hecho de cuenta que se tiene
informacin de primera mano acerca de la distribucin
muestral de las medias. Si as fuera sera una tarea muy
simple hacer generalizaciones para una poblacin, ya
que la media de las medias toma un valor que es igual a
la verdadera media de la poblacin.

Sin embargo, como pueden imaginarse, un investigador
rara vez recoge datos sobre ms una o dos muestras.
Calcular una distribucin muestral de medias requiere
todo el esfuerzo (y el costo) de estudiar a cada uno de
los miembros de una poblacin, con lo que perdera todo
el sentido el proceso del muestreo.

Entonces, si el investigador slo tiene informacin de
una muestra, no tiene un conocimiento real sobre la
media de las medias ni sobre la desviacin estndar de
la distribucin muestral. Sin embargo s existe un buen
mtodo para estimar la desviacin estndar de la
distribucin muestral de medias sobre la base de los
datos recogidos en una sola muestra. Esta estimacin
se conoce como el error estndar de la media y se
puede calcular con la siguiente frmula:


ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.47


Error estandar de la media

o

=
S
Vn


Donde:

o

= Error estndar de la media (una estimacin de la


desviacin estndar de la distribucin muestral
de las medias)
S= Desviacin estndar de una muestra
n= Tamao de la muestra

Este clculo es conocido tambin como un estimador
puntual.

Estimador puntual. Valor que se calcula a partir de la
informacin de la muestra y que se usa para estimar el
parmetro de la poblacin.

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.48

CAPITULO IV
COMPROBACIN DE HIPTESIS

Introduccin

En los temas anteriores iniciamos el estudio de la
inferencia estadstica. Describimos la forma de
seleccionar una muestra aleatoria y, con base en sta,
estimar el valor de un parmetro de la poblacin. En
este tema continuaremos con el estudio de la inferencia
estadstica. Sin embargo, en lugar de calcular un rango
de valores dentro del cual se espera que se encuentre el
parmetro de la poblacin, se realizar una prueba de
hiptesis acerca de una afirmacin sobre un parmetro
de la poblacin. Algunos ejemplos de afirmaciones que
se podran probar utilizando pruebas de hiptesis son:

- El promedio de notas de los estudiantes de
estadstica es de ms de 16.
- Una familia tpica vive en el mismo domicilio
durante ms 16.5 aos.
- El salario inicial promedio para los egresados de
las carreras de educacin es de S/. 1,200 al mes.
- La aplicacin de una nueva estrategia al grupo
experimental es mejor que el grupo control.
-
De esta manera comenzaremos por establecer algunas
definiciones.

Hiptesis: Enunciado acerca de un parmetro de la
poblacin, que se desarrolla con el propsito de realizar
pruebas.

Una vez que se ha establecido una hiptesis, se utilizan
los datos para verificar que tan razonable es dicha
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.49

afirmacin. Un ejemplo puede ser el siguiente: En el
sistema legal del Per, una persona es inocente hasta
que se demuestre lo contrario. Un juez parte de la
hiptesis de que una persona que es acusada de un
crimen es inocente y sujeta esta hiptesis a
comprobacin, revisando la evidencia y oyendo
testimonios hasta llegar a un veredicto.

Prueba de hiptesis: Procedimiento que se basa en la
evidencia de las muestras y en la teora de probabilidad
para determinar si la hiptesis es un enunciado
razonable.

Los trminos de prueba de hiptesis y probar una
hiptesis se utilizan de manera indistinta. La prueba de
hiptesis se inicia con una afirmacin sobre un
parmetro de la poblacin: como la media de la
poblacin. Como ya dijimos, esta afirmacin se conoce
como hiptesis. Una hiptesis podra ser que el tiempo
de desplazamiento por los estudiantes deLicenciatura en
Educacin Inicial en las diferentes sedes es de 2.5horas.
No es posible ponerse en contacto con todos los
participantes del programa a nivel nacional para
comprobar que la media de desplazamiento sea
efectivamente de 2.5 horas. El costo de localizar y
encuestar a la totalidad de los participantes de
Licenciatura en Educacin Inicialen las diferentes sedes
del pas sera exorbitante. Para comprobar la validez de
esta afirmacin (p = 2.5), es preciso elegir una muestra
de la poblacin de todos los participantes, calcular la
media y aceptar o rechazar la hiptesis, con base en
ciertas reglas de decisiones. Resulta obvio que una
media muestral de 2.5 horas de desplazamiento de los
participantes provocara un rechazo de la hiptesis. Sin
embargo, supn que el resultado de calcular la media de
la muestra es de 2horas. Esta cifra es bastante
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.50

cercana a 2.5 para aceptar como razonable la
afirmacin de que la media poblacional es de 2.5 horas?
Se puede atribuir la diferencia de 0.5 horas entre las
medias al error de muestreo, o bien esta diferencia es
significativa desde el punto de vista de la estadstica?
A continuacin se propone y explica un procedimiento
de 5 pasos para probar una hiptesis.



Paso 1. Plantear la hiptesis nula (H
0
) y la hiptesis
alternativa (H
1
)

El primer paso consiste en establecer la hiptesis que se
prueba. Se le conoce como hiptesis nula y se le
designa con H
0
. La letra H significa hiptesis y el sub-
ndice cero supone sin diferencia; es decir, la hiptesis
nula supone que no hay diferencia entre el parmetro de
la poblacin y el de la muestra.

Establecer las
hiptesis
nula y alterna

Seleccionar un
nivel de
significancia
Identificar y
calcular la
estadstica de
prueba

Formular la
regla de
decisin


Tomar una
decisin
No rechazar
H
0

Rechazar H
0
y
Aceptar H
1
Paso 1
Paso 4
Paso 5
Paso 2
Paso 3
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.51

Hiptesis nula: Una afirmacin que establece que no
hay diferencia significativa entre el valor de un
parmetro de la poblacin y el valor de un parmetro de
la muestra.

Como ejemplo tenemos que el nivel de inteligencia de
los estudiantes del primer semestre es de 110 segn el
test aplicado. Esto se escribira as:

H
0
: = 110

Hablando en trminos generales, se plantea la hiptesis
nula para el propsito de la prueba; es decir, para
aceptarla o para rechazarla. La hiptesis nula no se
rechaza a menos que los datos de la prueba
proporcionen evidencia convincente de que es falsa.

Es muy importante decir que si no se rechaza la
hiptesis nula con base en los datos de la muestra, eso
no quiere decir que la hiptesis nula sea verdadera,
nicamente significa que no fue posible rechazar la
hiptesis nula con base en lo datos disponibles. Por lo
tanto, la hiptesis nula no se puede aceptar.

Para demostrar sin lugar a dudas que la hiptesis nula
es verdadera sera necesario conocer el parmetro de la
poblacin; es decir, se tendra que practicar un censo
para conocer el parmetro de la poblacin sobre el que
se est haciendo una afirmacin. Por lo regular esto no
es posible, por ello la alternativa consiste en tomar una
muestra.

Tambin es preciso enfatizar que generalmente una
hiptesis nula comienza con o contiene la siguiente
afirmacin: No existe diferencia significativa entre...
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.52

De esta manera el planteamiento formal de la hiptesis
nula del ejemplo anterior sera el siguiente:

H
0
: El promedio de notas alcanzado por los estudiantes
de estadstica no tiene diferencia significativa con
16puntos.

La hiptesis alternativa, por su parte, describe la
conclusin a la que se llegar si se rechaza la hiptesis
nula. Se designa con H
1
y tambin se conoce como
hiptesis de investigacin. La hiptesis alternativa se
acepta si los datos de la muestra proporcionan evidencia
estadstica suficiente para afirmar que la hiptesis nula
es falsa.

Hiptesis alternativa: Una afirmacin que se acepta si
los datos de la muestra proporcionan evidencia
suficiente de que la hiptesis nula es falsa.

Un ejemplo que ayudar a clarificar lo que significan la
hiptesis nula y la hiptesis alternativa es el siguiente:
Un artculo reciente public que el promedio de ingreso
familiar es de S/. 800.00 Para realizar una prueba
estadstica sobre esta afirmacin, el primer paso
consiste en determinar la hiptesis nula y la hiptesis
alternativa.

H
0
: = 800 soles
H
0
: El promedio de ingreso familiar es de S/. 800.00
H
1
: 800soles
H
1
: el promedio de ingreso familiar es de S/. 800.00





ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.53

Paso 2. Seleccionar un nivel de significancia.

Luego de establecer la hiptesis nula y alternativa, el
siguiente paso consiste en definir el nivel de
significancia.

Nivel de significancia: La probabilidad de rechazar la
hiptesis nula cuando es verdadera. Probabilidad de
cometer el error de tipo I.

El nivel de significancia se designa con , la letra griega
alfa. Se le conoce tambin como nivel de riesgo. Se le
conoce as porque, como se expresa en la definicin,
representa el riesgo que se asume de rechazar la
hiptesis nula cuando sta es verdadera.

No hay un nivel de significancia que se aplique a todas
las pruebas. De hecho es un valor que se deja al criterio
del investigador. De manera convencional se asigna un
nivel de significancia de 0.10 para encuestas polticas,
de 0.05 (5 por ciento) a los proyectos de investigacin
de artculos de consumo o de ciencias sociales y de
0.01 para el aseguramiento de calidad o para estudios
mdicos.

As, el investigador debe decidir el nivel de significancia
antes de formular una decisin y de recolectar datos
sobre la muestra.

Para ilustrar como se puede rechazar una hiptesis nula
cuando es verdadera pondremos el siguiente ejemplo:
Supn que la poltica de aceptacin de embarques en
un almacn de una empresa que se dedica a armar
computadoras personales es que El Departamento de
Control de Calidad tomar una muestra aleatoria de
todos los embarques que se reciban. Si ms del 6% de
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.54

los artculos estn por debajo de la norma, el embarque
ser rechazado.

El da de hoy se recibi un lote de 4,000 tarjetas madre
del proveedor Deltron.

H
0
: El porcentaje de artculos defectuosos del embarque
es 6% o menos.
H
1
: El porcentaje de artculos defectuosos del embarque
es ms de 6%.

Se toma una muestra de 50 tarjetas madre y se
encuentra que 4 de ellas son defectuosas, es decir un
8%. El embarque se rechaz porque exceda el valor
mximo de 6% de artculos por debajo de la norma. Si
ms del 6% de la totalidad del embarque estaba
defectuoso, entonces la decisin de rechazarlo fue
correcta.

Supongamos, sin embargo, que las cuatro tarjetas
seleccionadas en la muestra eran las nicas
defectuosas en todo el embarque de 4,000. Entonces
slo el 0.1% estaba defectuoso. En ese caso menos del
6% del embarque estaba por debajo de la norma y el
rechazo del embarque fue un error.

En trminos de prueba de hiptesis, se rechaz la
hiptesis nula de que el embarque estaba por debajo de
la norma cuando ste debi aceptarse. Al rechazar una
hiptesis verdadera, se cometi un error de tipo I ().

Error de tipo I: Rechazar la hiptesis nula, H
0
, cuando es
verdadera.



ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.55

Luego entonces, existe otro tipo de error.
Error de tipo II: No rechazar la hiptesis nula, H
0
, cuando
es falsa.

La empresa cometera un error de tipo II si, sin saberlo,
recibiera un embarque que contuviera el 15% de
artculos defectuosos, y no obstante, lo aceptara.
Cmo podra ocurrir esto?

Supongamos que en un embarque similar se toma una
muestra de 50 tarjetas de las cuales 2 resultan
defectuosas (4%) y las 48 restantes estn en buenas
condiciones. De acuerdo con la poltica de aceptacin
de embarques, el lote hubiera sido aceptado. Pero, por
casualidad, podra ser que las 48 tarjetas en buenas
condiciones de la muestra fueran las nicas y que las
3,952 restantes estuvieran defectuosas.

El siguiente cuadro resume las decisiones que el
investigador puede tomar y las consecuencias posibles
de stas.


Hiptesis nula
No rechaza
H
0
Rechaza
H
0

H
0
es verdad
Decisin
correcta
Error de tipo I
H
0
es falso Error de tipo II
Decisin
correcta


Paso 3. Calcular el estadstico de prueba.

Existen muchas estadsticas de prueba. En este mdulo
veremos z como estadstica de prueba. En temas
posteriores utilizaremos t y ji cuadrada; as como, el
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.56

coeficiente decorrelacin lineal simple de Pearson y su
frmula es:

r =
n

).

2
n

)
2
n

2
n



r = Cocicicntc Jc corrclocion lincol simplc
n = Iomoo Jc lo mucstro

= Iolor tronsormoJo poro lo :orioblc X

= Iolor tronsormoJo poro lo :orioblc n


i] = Frccucncio obsoluto conJicionoJo
= Sumotorio

Estadstica de prueba: Un valor que se calcula con base
en informacin de la muestra, y que se utiliza para
determinar si se rechaza o no la hiptesis nula.

En la prueba de hiptesis para la media, la estadstica z
se calcula por la siguiente frmula.

Distribucin z como estadstica de prueba

=
X

p
oVn


Dnde:
X

= media de la muestra
p = media de la poblacin
o = desviacin estndar de la poblacin
n = tamao de la muestra
z = valor estndar

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.57

Cuando no se conoce el valor de la desviacin estndar
de la poblacin (o), se puede utilizar el valor de la
desviacin estndar de la muestra (S) para aproximarlo.

El valor z se basa en la distribucin de muestreo de las
medias de las muestras, que, como ya hemos visto,
tiene una distribucin normal cuando la muestra es
razonablemente grande, con una media igual a la media
de la poblacin (p) y con una desviacin estndar igual a
oVn. As es posible determinar si la diferencia entre la
media de la muestra (X

) y la media de la poblacin (p)


es importante desde el punto de vista estadstico, al
encontrar cuntas desviaciones estndar separan a X


de p, utilizando la frmula anterior.

Paso 4. Formular la regla de decisin.

Regla de decisin: Es una afirmacin de las condiciones
bajo las que se rechaza la hiptesis nula y bajo las que
no se rechaza.

El rea o regin de rechazo define la ubicacin de todos
aquellos valores que son tan grandes o tan pequeos
que la probabilidad de que ocurran bajo una hiptesis
nula verdadera es bastante remota.

La siguiente grfica muestra la regin de rechazo de una
prueba de significancia que veremos ms a delante en
este tema. Observa los siguientes puntos en el
diagrama:

a) El rea en la que no se rechaza la hiptesis
nula est a la izquierda de 1.65. Ms adelante
veremos cmo llegar a este valor.
b) El rea de rechazo est a la derecha de 1.65.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV

c) Se aplica una prueba de una cola. Tambin
esto lo veremos ms adelante.
d) Se eligi un nivel de significancia de 0.05
e) La distribucin de muestreo de z se distribuye
normalmente.
f) El valor 1.65, que es el valor crtico, separa las
regiones en las que se rechaza y no se
rechaza la hiptesis nula.

Valor crtico: Punto de divisin entre la regin en que se
rechaza la hiptesis nula y la regin en que no se
rechaza.







Paso 5. Tomar una decisin.

El ltimo paso consiste en tomar la decisin de rechazar
o no la hiptesis nula.
Distribucin de muestreo para la estadstica z, prueba de una cola a la derecha,
nivel de sig. 0.05
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN
Pg.58
Se aplica una prueba de una cola. Tambin
Se eligi un nivel de significancia de 0.05
se distribuye
El valor 1.65, que es el valor crtico, separa las
regiones en las que se rechaza y no se
Punto de divisin entre la regin en que se
rechaza la hiptesis nula y la regin en que no se
El ltimo paso consiste en tomar la decisin de rechazar
, prueba de una cola a la derecha,
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.59


Por ejemplo, con base en la grfica anterior, si al
calcular el valor de z el resultado es 2.34, la hiptesis
nula se rechaza. La decisin de rechazar la hiptesis
nula se tom debido a que 2.34 se encuentra dentro de
la regin de rechazo; es decir, ms all de 1.65. De esta
manera se puede afirmar que es altamente improbable
que un valor z que se calcula de este tamao (2.34) se
deba a una variacin de muestreo (casualidad).

En caso de que el valor calculado de z hubiera sido
menor a 1.65, por ejemplo 0.71, la hiptesis nula no se
habra rechazado. Se razonara entonces que un valor
tan pequeo no podra atribuirse a la casualidad, es
decir, a la variacin de muestreo.

Como puedes observar slo es posible tomar una de
dos decisiones: ya sea rechazar o no la hiptesis nula.


4.1. Comprobacin de hiptesis referentes
a la media de una poblacin
Pruebas de significancia de una y dos colas

Antes de ver un ejercicio prctico sobre pruebas de
hiptesis, estableceremos la diferencia entre una prueba
de dos colas y una de una sola.

En la grfica anterior se indica que se aplica una prueba
de una cola. Por lo que la regin de rechazo es solo
una: la cola derecha de la distribucin, sin embargo es
tambin posible que la zona de rechazo se ubique en la
cola derecha. Para ilustrarlo pondremos el siguiente
ejemplo.

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.60

Al departamento de nutricin de la Direccin Regional
de Educacin quiere hacer un estudio sobre el peso
neto de una presentacin de Galletas Fortificadas. El
cereal se empaca en cajas de 453 grs., de modo que las
hiptesis quedan de la siguiente manera:

H
0
: 453 grs.
H
0
: El peso promedio de los cereales es igual o menor a
453 gramos.
H
1
: > 453 grs.
H
1
: El peso promedio de los cereales es mayor a 453
gramos.

Observa que el signo de desigualdad en la hiptesis
alternativa seala a la derecha o parte superior de la
distribucin (Este ejemplo corresponde a la grfica
anterior). Asimismo observa que la hiptesis nula incluye
el signo de igual. Recuerda que la condicin de igualdad
siempre aparece en la hiptesis nula y nunca en la
alternativa.

El siguiente diagrama muestra una situacin en la que la
regin de rechazo se encuentra en la parte izquierda
(mnima) de la distribucin.










ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV


Un ejemplo que corresponde a esta grfica puede ser el
siguiente: Supongamos que el Director de una
Institucin Educativa se propone disminuir la desercin
escolar para lo cual implementa un nuevo sistema de
orientacin al educando para lo cual considera un
promedio de 10 estudiantes que se desertan por aula.
Por lo tanto considera que si el promedio es inferior a 10
el nuevo mtodo no servira, caso contrariomantendr el
nuevo sistema. En este caso las hiptesis nula y
alternativa seran:

H
0
: 10estudiantes
H
1
: <10 estudiantes

Una forma de determinar cul es la regin de rechazo
consiste en observar la direccin del signo de
desigualdad en la hiptesis alternativa (ya sea < o >).
En este caso seala a la izquierda y por lo tanto la
regin de rechazo es la cola izquierda o mnim
distribucin.

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN
Pg.61

Un ejemplo que corresponde a esta grfica puede ser el
siguiente: Supongamos que el Director de una
Institucin Educativa se propone disminuir la desercin
escolar para lo cual implementa un nuevo sistema de
orientacin al educando para lo cual considera un
promedio de 10 estudiantes que se desertan por aula.
Por lo tanto considera que si el promedio es inferior a 10
el nuevo mtodo no servira, caso contrariomantendr el
nuevo sistema. En este caso las hiptesis nula y
Una forma de determinar cul es la regin de rechazo
consiste en observar la direccin del signo de
desigualdad en la hiptesis alternativa (ya sea < o >).
En este caso seala a la izquierda y por lo tanto la
regin de rechazo es la cola izquierda o mnima de la
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.62

En resumen, una prueba es de una cola cuando la
hiptesis alternativa establece una direccin, como:

H
0
: El ingreso medio de las mujeres es menor o igual al
ingreso medio de los hombres.
H
1
: El ingreso medio de los hombres es mayor que el
ingreso medio de las mujeres.

Por lo tanto, una prueba de dos colas ser aquella en la
que la hiptesis alternativa no establece una direccin,
como:

H
0
: No hay diferencia entre el ingreso medio de las
mujeres y el de los hombres.
H
1
: Existe una diferencia entre el ingreso medio de las
mujeres y el de los hombres.

Si se rechaza la hiptesis nula y se acepta la alternativa,
en el caso de las dos colas, el ingreso medio de los
hombres podr ser mayor que el de las mujeres o
viceversa. Debido a que existen dos posibilidades, un
rea de rechazo de 5% (por ejemplo) se divide en partes
iguales entre las dos colas de la distribucin (2.5 en
cada una).

La siguiente grfica ilustra las dos reas de rechazo y
los valores crticos. Observa que el rea total de la
distribucin es de 1.000, que se encuentra por 0.95 +
0.025 + 0.025.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV


Prueba de la media de la poblacin: muestra
grande, desviacin estndar de la poblacin
conocida.

Un ejemplo en que se aplican los 5 pasos descritos
anteriormente puede ser el siguiente:

Un estudio sobre desnutricin infantil muestra como
resultado que los estudiantes tienen una media histrica
de 200 estudiantes desnutridos y una desviacin
estndar de 16 desnutridos. El Director de la Regin de
Educacin de Puno quiere saber si cual el cambio en
relacin al nmero de estudiantes desnutridos a nivel de
una Institucin Educativa. Dicho de otra forma, el
nmero de estudiantes desnutridos de una I. E. es
diferente de 200 nios, con un nivel de significancia de
0.01?

Los registros muestran que en 50 instituciones
educativas se produjo como resultado un promedio
de 203 estudiantes desnutridos.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN
Pg.63

Prueba de la media de la poblacin: muestra
grande, desviacin estndar de la poblacin
Un ejemplo en que se aplican los 5 pasos descritos
Un estudio sobre desnutricin infantil muestra como
resultado que los estudiantes tienen una media histrica
de 200 estudiantes desnutridos y una desviacin
estndar de 16 desnutridos. El Director de la Regin de
quiere saber si cual el cambio en
relacin al nmero de estudiantes desnutridos a nivel de
una Institucin Educativa. Dicho de otra forma, el
nmero de estudiantes desnutridos de una I. E. es
diferente de 200 nios, con un nivel de significancia de
Los registros muestran que en 50 instituciones
educativas se produjo como resultado un promedio
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.64

Paso 1

La hiptesis nula es la media de la poblacin es 200
estudiantes desnutridos. La hiptesis alternativa es
entonces la media de la poblacin es diferente de 200
estudiantes desnutridos o la media de la poblacin no
es 200 estudiantes, o bien:

H
0
: = 200 estudiantes desnutridos
H
1
: 200 estudiantes desnutridos

Se trata de una prueba de dos colas, porque la
hiptesis alternativa no establece ninguna direccin. En
otras palabras no afirma si elpromedio es mayor o
menor de 200estudiantes desnutridos.

Paso 2

Como ya se dijo, se utiliza el nivel de significancia
0.01. Este es , la probabilidad de cometer un error
de tipo I. Es decir, es el riesgo de rechazar una
hiptesis nula verdadera.
Paso 3

La estadstica de prueba de una muestra grande es z.
Transformar los datos de produccin a unidades
estndar (valores z) permite no slo utilizarlos en este
problema, sino tambin en otros problemas de prueba
de hiptesis. La frmula, como ya vimos, es:





ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.65

Distribucin z como estadstica de prueba

=
X

p
oVn

= (2uS 2uu) (16 VSu)
= 1.S2
Paso 4

La regla de decisin se formula hallando los valores
crticos de z con base en las tablas del porcentaje de
rea bajo la curva normal (tablas de z). Como se trata
de una prueba de dos colas, la mitad de 0.01, es decir
0.005, est en cada cola. Por lo tanto, el rea en la que
no se rechaza la hiptesis nula, entre los dos valores
crticos, es 0.99.

Las tablas del porcentaje del rea bajo la curva se
basan en una mitad del rea bajo la curva, o 0.5000.
Luego, 0.500 0.005 es 0.4950, de modo que 0.4950
es el rea entre 0 y el valor crtico. Localiza 0.4950 en el
cuerpo de la tabla. EL valor ms prximo es 0.4951.
A continuacin se lee el valor crtico en la fila y
columnas correspondientes a 0.4951, este es 2.58. Por
lo tanto la regla de decisin es:

Rechazar la hiptesis nula y aceptar la hiptesis
alternativa, si el valor calculado de z no est entre 2.58
y +2.58. No rechazar la hiptesis nula si z cae entre
2.58 y +2.58.




ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV

Paso 5

De acuerdo con el clculo del valor z que se hizo en el
paso 3 y con la regla de decisin formulada en el paso
anterior, se llega a la conclusin de que la media de la
poblacin no es diferente de 200.

Esto debido a que z = 1.32 no cae en la regin de
rechazo y por lo tanto no se cuenta con elementos para
rechazar la hiptesis nula (que dice que la media de
estudiantes desnutridos es de 200 por Institucin
Educativa).

El resumen de los cinco pasos se muestra en la
siguiente grfica.


Se comprob que el nivel de desnutridosseguir siendo
de 200 estudiantes? En realidad no. Desde el punto de
vista nutricional, fue no poder desaprobar la hiptesis
nula. El no poder desaprobar la hiptesis nula de la que
la media de la poblacin es de 200 no es lo mismo que
decir que es cierta.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN
Pg.66
que se hizo en el
paso 3 y con la regla de decisin formulada en el paso
anterior, se llega a la conclusin de que la media de la
Esto debido a que z = 1.32 no cae en la regin de
elementos para
rechazar la hiptesis nula (que dice que la media de
estudiantes desnutridos es de 200 por Institucin
El resumen de los cinco pasos se muestra en la

Se comprob que el nivel de desnutridosseguir siendo
de 200 estudiantes? En realidad no. Desde el punto de
no poder desaprobar la hiptesis
El no poder desaprobar la hiptesis nula de la que
la media de la poblacin es de 200 no es lo mismo que
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.67

Como dijimos al principio, la conclusin es anloga a la
del sistema judicial. Para explicarlo supn que se acusa
a una persona de un delito, pero el juez la absuelve. Si
se absuelve a una persona de un delito, la conclusin
fue que no hubo suficientes evidencias para probar que
el acusado era culpable (no que era inocente). Esto es
lo que se hace en una prueba de hiptesis estadstica
cuando se rechaza la hiptesis nula. La interpretacin
correcta es que no fue posible desaprobar la hiptesis
nula.

Prueba de una cola

En el ejemplo anterior, slo interesaba informar al
director si hubo un cambio en el nivel nutricional de las
I.E. No interesaba saber si el cambio fue un aumento o
una disminucin.
Para ilustrar una prueba de una cola, se cambiar la
pregunta. Supn que el Director lo que quiere saber es
si hubo una reduccin en el nmero de desnutridos.
En otras palabras, se puede concluir que, con base en
las mejoras nutricionales en la alimentacin de los
estudiantes, el nmero de desnutridos fue menos a 200?

Observas la diferencia en el modo en que se formula el
problema. En el primer caso, se quera saber si haba
una diferencia en la media de desnutridos por aula, y
ahora se desea saber si hubo unareduccin.
Debido a que interesan preguntas diferentes, las
hiptesis tambin son diferentes. En smbolos quedara
de la siguiente manera:

Prueba de dos colas Prueba de una cola
H
0
: = 200 estudiantes H
0
: 200 estudiantes
H
1
: 200 estudiantes H
1
: < 200 estudiantes
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.68

Los valores crticos para una prueba de una cola y para
una prueba de dos colas tambin son distintos, porque
para una prueba de una cola todo el riesgo se encuentra
en una sola direccin.

Ejemplo

Un estudio sobre el consumo de Gaseosas mostr que
el adulto tpico consume 68 litros de gaseosas de cola al
ao. Segn esta investigacin la desviacin estndar es
de 11.3 litros. Una muestra aleatoria de 64 estudiantes
universitarios revel que el ao pasado consumieron
64.2 litros en promedio. En el nivel de significancia de
0.05.

a) Es posible concluir que existe una diferencia
entre el consumo medio de los estudiantes
universitarios y el de los adultos en general?
b) Es posible concluir que el promedio de
consumo para los estudiantes universitarios es
menor que para los adultos en general?
Respuesta inciso a)

Paso 1

La hiptesis nula es la media de la poblacin es 68. La
hiptesis alternativa es entonces la media de la
poblacin es diferente de 68 o la media de la poblacin
no es 68, o bien:
H
0
: = 68 litros de gaseosas de cola al ao
H
1
: 68 litros de gaseosas de cola al ao

Paso 2

Como ya se dijo, se utiliza el nivel de significancia 0.05.
Este es , la probabilidad de cometer un error de tipo I.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.69

Es decir, es el riesgo de rechazar una hiptesis nula
verdadera.
Paso 3

La estadstica de prueba de una muestra grande es z.
Transformar los datos del consumo de gaseosas de cola
a unidades estndar (valores z) permite no slo
utilizarlos en este problema, sino tambin en otros
problemas de prueba de hiptesis. La frmula, como ya
vimos, es:

Distribucin z como estadstica de prueba

=
X

p
oVn


= (64.2 68) (11.S V64)

= 2.69
Paso 4

La regla de decisin se formula hallando los valores
crticos de z con base en las tablas del porcentaje de
rea bajo la curva normal (tablas de z). Como se trata
de una prueba de dos colas, la mitad de 0.05, es decir
0.025, est en cada cola. Por lo tanto, el rea en la que
no se rechaza la hiptesis nula, entre los dos valores
crticos, es 0.95.
Las tablas del porcentaje del rea bajo la curva se
basan en una mitad del rea bajo la curva, o 0.5000.
Luego, 0.500 0.025 es 0.4750, de modo que 0.4750
es el rea entre 0 y el valor crtico. Localiza 0.4750 en el
cuerpo de la tabla.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.70

A continuacin se lee el valor crtico en la fila y
columnas correspondientes a 0.4750, este es 1.96. Por
lo tanto la regla de decisin es:
Rechazar la hiptesis nula y aceptar la hiptesis
alternativa, si el valor calculado de z no est entre 1.96
y +1.96. No rechazar la hiptesis nula si z cae entre
1.96 y +1.96.
Paso 5

De acuerdo con el clculo del valor z que se hizo en el
paso 3 y con la regla de decisin formulada en el paso
anterior, se llega a la conclusin de que la media de la
poblacin es diferente de 68.
Esto debido a que z = -2.69 no cae en la regin de
rechazo y por lo tanto no se cuenta con elementos para
rechazar la hiptesis nula (que dice que la media de
consumo de la poblacin es igual a 68 litros de
gaseosas de cola).
As se puede decir que la evidencia de la muestra indica
que el nivel de consumo anual de gaseosas de cola es
diferente para la muestra de estudiantes universitarios y
para la poblacin en general.
Otra forma de decirlo es que el consumo medio de
gaseosas de cola para los estudiantes universitarios es
diferente de 68 litros.
La diferencia de 3.87 litros entre el consumo de la
poblacin en general y el de los estudiantes
universitarios no puede atribuirse a la casualidad.

Respuesta inciso b)

Paso 1
H
0
: 68 litros de gaseosas de cola al ao
H
1
: <68 litros de gaseosas de cola al ao

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.71

Paso 2
= 0.05
Paso 3

Distribucin z como estadstica de prueba
=
X

p
oVn


= (64.2 68) (11.S V64)

= 2.69

Paso 4

Rechazar la hiptesis nula y aceptar la hiptesis
alternativa, si el valor calculado de z es menor que
1.65. No rechazar la hiptesis nula si z es mayor que
1.65.
Paso 5

De acuerdo con el clculo del valor z que se hizo en el
paso 3 y con la regla de decisin formulada en el paso
anterior, se llega a la conclusin de que el consumo
medio de gaseosas de cola es menor de 68 litros.

Esto debido a que z = -2.69 cae en la regin de rechazo
y por lo tanto se cuenta con elementos para rechazar la
hiptesis nula (que dice que la media de consumo de la
poblacin es mayor o igual a 68 litros de gaseosas de
cola).

As se puede decir que la evidencia de la muestra indica
que el nivel de consumo anual de gaseosas de cola es
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.72

menor para la muestra de estudiantes universitarios que
para la poblacin en general.
Otra forma de decirlo es que el consumo medio de
gaseosas de cola para los estudiantes universitarios es
menor de 68 litros.

La diferencia negativa de 3.87 litros entre el
consumo de la poblacin en general y el de los
estudiantes universitarios no puede atribuirse a la
casualidad.

4.2. Prueba de hiptesis para dos medias de
poblacin (muestras grandes)

En esta seccin se ver al procedimiento para probar si
dos medias poblacionales son iguales con base a la
informacin que se tiene de dos muestras de stas; o
bien, que la diferencia entre ambas medias muestrales
es tan grande que se puede concluir que las medias
poblacionales no son iguales. Algunas aplicaciones de
este tipo de planteamiento son las siguientes:

El Docente del curso de estadstica desea saber
si el promedio general de los estudiantes es igual
al del semestre pasado.
El Coordinador General de Licenciatura en
educacin Inicial le interesa conocer el nivel de
satisfaccin de los participantes en relacin a los
docentes, en las sedes de Arequipa y Cusco.
Se desea conocer la diferencia que existe en
relacin al rendimiento acadmico de los
estudiantes varones y mujeres de la especialidad
de Matemtica, Computacin e Informtica.

En estos casos es preciso seleccionar una muestra
aleatoria de cada poblacin y calcular su media, para
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.73

posteriormente, utilizando el mtodo de los cinco pasos,
determinar si las medias poblacionales son iguales o
existe alguna diferenciaentre ellas. Por su puesto hay
una diferencia en la frmula del estadstico z.

Prueba de hiptesis para dos medias poblacionales

=
X

1
X

1
2
n
1
+

2
2
n
2

Dnde:
X

1
= Media de la primera muestra
X

2
= Media de la segunda muestra
S
1
2
= Varianza de la primera muestra
S
2
2
= Varianza de la segunda muestra
n
1
= Tamao de la primera muestra
n
2
= Tamao de la segunda muestra
z = Valor estndar

En el siguiente ejemplo se ilustran los detalles de los
clculos e interpretacin de este tipo de pruebas.

Ejemplo

Se pide a cada uno de los estudiantes la opinin sobre
el tiempo de libre que deberan tener entre cada curso,
ya que se sabe que los docentes ingresan una vez
terminada la anterior clase, sobre este aspecto existen
bastantes discrepancias entre los varones y las mujeres,
para lo cual se realiz un estudio teniendo como
muestra 100 mujeres y 50 varones de toda la poblacin
de la Facultad de Ciencias de la Educacin,
reportndose la siguiente informacin basada en
muestras de ambos tipos de estudiantes:
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.74


Estudiantes
Media de la
muestra
Desviacin
estndar de
la muestra
Tamao de
la muestra
Varones 5.50
minutos
0.40 minutos 50
Mujeres 5.30
minutos
0.30 minutos 100

A un nivel de significancia de 0.01, es razonable
concluir que el tiempo libre solicitado es mayor para los
varones?

Paso 1
H
0
:
1

2

H
1
:
1
>
2

Paso 2
= 0.01
Paso 3
Prueba de hiptesis para dos medias
poblacionales

=
X

1
X

1
2
n
1
+

2
2
n
2


=
S.S S.S

0.40
2
50
+
0.30
2
100

=
u.2
u.u64


ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.75

= S.1S
Paso 4

Rechazar la hiptesis nula y aceptar la hiptesis
alternativa, si el valor calculado de z excede 2.33. No
rechazar la hiptesis nula si z es menor a 2.33.
Paso 5

Debido a que el valor calculado de z (3.13) es mayor
que el valor crtico (2.33), se rechaza la hiptesis nula y
se acepta la de investigacin. Es decir, que con base en
la informacin de las muestras se puede concluir que el
tiempo libre exigido por los varones es mayor que el de
las mujeres.

4.3. Comprobacin de hiptesis referentes a
la proporcin de una poblacin

Pruebas de hiptesis respecto de las proporciones

Las pruebas de hiptesis que hemos visto hasta el
momento se han referido nicamente a la media.
Aunque, como podrn suponer, tambin se pueden
hacer pruebas de hiptesis respecto de proporciones.
Algunos ejemplos de situaciones en las que se puede
aplicar este tipo de pruebas pueden ser los siguientes:

El Director de Servicios Profesionales de la
Universidad informa que el 80% de sus
egresados se insertan en el mercado laboral en
puestos que guardan relacin directa con su
campo de estudios.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.76

El rea de biblioteca de la Universidad manifiesta
que solo el 35% de estudiantes solicitan el
prstamo de libros.
Un Director desea saber si existen diferencias
entre las proporciones de estudiantes de sexo
masculino y femenino que desean estudiar en
una universidad nacional.

Proporcin. Una fraccin, relacin o porcentaje que
indica la parte de una poblacin o muestra que tiene una
caracterstica de inters particular.

Un requisito para poder aplicar la prueba de hiptesis
para las proporciones es que tanto nP como n(1 P)
sean al menos de 5. Recuerda que:

n = tamao de la muestra
P = proporcin de la poblacin

Ejemplo

El Rector de la Universidad desea conocer si los
ingresantes a la universidad provienen de colegios
estatales, segn estadsticas se sabes que el 80% de
ingresantes a la universidad son egresados de colegios
estatales. Para comprobar esta afirmacin se toma una
encuesta de 2,000 estudiantes matriculados.
Los resultados de la encuesta indican que 1550 de los
estudiantes provienen de colegios estatales.
Utiliza el procedimiento de la prueba de hiptesis para
comprobar la procedencia de los estudiantes.



Solucin

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.77

Paso 1
H
0
: P 0.80
H
1
: P < 0.80

Paso 2
= 0.05
Paso 3
z es la estadstica apropiada.
La frmula que se aplica es:

Prueba de hiptesis para una proporcin
poblacional

=
p P
o


Dnde:
p = proporcin de la muestra
P = proporcin de la poblacin
n = tamao de la muestra
o

= error estndar de la proporcin de la poblacin



Se calcula por P(1 P)n de modo que la frmula se
convierte en:

Prueba de hiptesis para una proporcin
poblacional

=
p P

(1-)
n


ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.78

=
u.77S u.8u

0.80(1-0.80)
2000


= u.28u


Paso 4

Debido a que la prueba es de una cola y a que = 0.05,
el valor crtico es de 1.65, as:

Rechazar la hiptesis nula y aceptar la alternativa si el
valor calculado de z cae a la izquierda de 1.65; de lo
contrario, no rechazar la hiptesis nula.

Paso 5

El valor calculado de z (-0.280) no est en la regin de
rechazo, de modo que la hiptesis nula no se rechaza al
nivel de significancia de 0.05.

Dicho de otro modo, los estudiantes de la universidad en
su mayora provienen de colegios estatales.

4.4. Prueba para la comparacin de dos
proporciones poblacionales.

Con frecuencia el inters radica en saber si dos
proporciones de poblacin son iguales. A continuacin
se presentan varios ejemplos:

El Director de Recursos Humanos desea saber si
existe una diferencia entre la proporcin de
empleados sindicalizados que faltan ms de
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.79

cinco das al ao con respecto a la proporcin de
empleados no sindicalizados.
Se desea dotar de desayunos escolares, para lo
cual se tiene una propuesta, se hace una
entrevista a los alumnos para averiguar la
preferencia si estn de acuerdo o no, tomando la
proporcin de nios y nias.
El docente de Licenciatura desea saber si existe
diferencia proporcional en cuanto a las tardanzas
de los participantes varones y mujeres.

Nota que en los ejemplos anteriores, y en todos los que
se desea comparar proporciones, cada artculo de la
muestra puede clasificarse como xito o fracaso. Es
decir, no se trata de comparar mediciones (como en el
caso de las medias), sino valores nominales.
En este caso tambin, dado que las muestras deben ser
mayores a 30 y tener una distribucin normal, se utiliza
el estadstico de la distribucin normal estndar, y el
valor de z se calcula por la siguiente frmula:

Prueba de hiptesis para dos proporciones
poblacionales

=
p
1
p
2

(-1

)
n
1
+

(-1

)
n
2


Dnde:
n
1
= tamao de la primera muestra.
n
2
= tamao de la segunda muestra.
z = valor estndar.
p
1
= proporcin de la primera muestra.
p
2
= proporcin de la segunda muestra.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.80

p

= proporcin conjunta, que se calcula con la siguiente


frmula:

Proporcin conjunta

p

=
Numcro totol Jc cxitos
Numcro totol Jc los mucstro
=
X
1
+X
2
n
1
+n
2


Dnde:

X
1
= nmero de elementos que poseen la caracterstica
buscada en la primera muestra.
X
2
= nmero de elementos que poseen la caracterstica
buscada en la segunda muestra.


Ejemplo:

Una editorial introdujo un texto educativo con el nombre
de Raulito. Varias pruebas comparativas indican que
Raulito tiene una alta aceptacin de los estudiantes.
Se plantea como estrategia el estudio sobre dicho texto
teniendo en cuenta la aceptacin de los docentes
varones y mujeres. Se usar una prueba en la que se
pedir a cada una de los profesores de la muestra
analizar varios textos, entre los que se encuentra
Raulito, y que indiquen cul es el que consideran
mejor.

Los resultados fueron los siguientes:

Profesore
s
Prefiriero
n
Raulito
Prefiriero
n otro
texto
TOTA
L
Proporci
n de
Raulito
Mujeres 20 80 100 0.20
Varones 100 100 200 0.50
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.81

Se utilizar el procedimiento de prueba de hiptesis de
cinco pasos.

Paso 1
H
0
: p
1
= p
2

H
1
: p
1
p
2

Paso 2
= 0.05
Paso 3

Prueba de Hiptesis para dos proporciones
poblacionales

=
p
1
p
2

(1-

)
n
1
+

(1-

)
n
2


=
u.2u u.Su

0.40(1-0.40)
100
+
0.40(1-0.40)
200


= u.Su u.u6

= S.uu
Paso 4

No rechazar la hiptesis nula, si el valor calculado de z
cae entre 1.96 y +1.96. Rechazar la hiptesis nula y
aceptar la hiptesis de investigacin si z no cae entre
1.96 y +1.96.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.82

Paso 5

Debido a que el valor calculado de z (-5.00) no cae entre
los valores crticos (-1.96 y +1.96), se rechaza la
hiptesis nula y se acepta la de investigacin. Es decir,
que con base en la informacin de las muestras se
puede concluir que la proporcin de los Profesores que
consideran mejor el texto Raulito es distinta a la
proporcin de las Profesoras.

4.5. Pruebas de hiptesis con muestras
pequeas

En los casos anteriores se ha utilizado el estadstico de
prueba de la distribucin estndar o z. Para emplear
este estadstico es necesario conocer la desviacin
estndar () de la poblacin o tener una muestra grande
de ms de 30 observaciones.

Sin embargo, en muchos casos no se conoce y el
nmero de observaciones de la muestra es menor a 30.
En estos casos, se puede utilizar la desviacin estndar
de la muestra (S) para aproximar (), pero no es posible
utilizar la distribucin z como estadstico de prueba. El
estadstico de prueba adecuado es la t de Student, o
tambin conocida como distribucin t.

Cuando se utiliza la t de Student, se supone que la
poblacin tiene una distribucin normal. A continuacin
se mencionan algunas caractersticas de esta
distribucin.

- Al igual que la distribucin z, es una distribucin
continua.
- Al igual que la distribucin z, tiene forma de
campana y es simtrica.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.83

- No hay una sola distribucin t, sino una familia
de distribuciones t. Todas con la misma media 0,
pero con desviaciones estndar diferentes de
acuerdo con el tamao de la muestra n. Existe
una distribucin t para una muestra con 20
observaciones, otra distribucin tpara una
muestra con 21 observaciones y as
sucesivamente.
- La distribucin t es ms ancha y ms plana en el
centro que la distribucin z, sin embargo, a
medida que aumenta el tamao de la muestra, la
distribucin t se aproxima a la distribucin normal
estndar (z).
- La distribucin t de Student tiene mayor amplitud
que la distribucin z. Como resultado de ello los
valores crticos de t para un nivel de significancia
en particular son de mayor magnitud que los
valores correspondientes. En otras palabras,
debido a que existe una variabilidad mayor en las
medias de muestras calculadas a partir de
muestras pequeas, se tiene menos confianza
en las estimaciones resultantes y son menos
apropiadas para rechazar la hiptesis nula.


4.6. Prueba para la media de la poblacin
(muestras pequeas)

Supn que se quiere comparar la media de la
muestra con una media poblacional supuesta,
y que el nmero de observaciones de la
muestra es menor a 30. Supn tambin, que
es posible afirmar que la poblacin tiene una
distribucin aproximada a la normal, pero que
si desviacin estndar no se conoce.

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.84

En este caso, se puede sustituir la desviacin estndar
de la muestra por la desviacin estndar de la
poblacin, pero se tendr que utilizar la distribucin t
como estadstico de prueba. A continuacin se presenta
un ejemplo que servir para concretar estos conceptos.
Ejemplo:

El Departamento de Estadstica informa que el ingreso
econmico promedio de los padres de familia es de S/.
600.00 por mes. Pero estudios hechos por otras
instituciones manifiestan que el ingreso promedio es
mayor. Como consecuencia de esto se toma una
muestra aleatoria de 26 familias de una Institucin
Educativa y se calcula una media de S/. 570.00, con una
desviacin estndar de S/. 100.00 Con un nivel de
significancia de 0.01, Se podra concluir que el ingreso
econmico promedio familiar es menor a 600 soles?

Se utilizar el procedimiento de cinco pasos para la
prueba de hiptesis.

Paso 1
H
0
: 600 soles
H
1
: <600 soles

Paso 2
= 0.01
Paso 3





ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.85

Distribucin t como estadstico de prueba para la
media de la poblacin

t =
X

p
SVn

Dnde:
X

= media de la muestra
p = media de la poblacin
S = desviacin estndar de la muestra
n = tamao de la muestra

t =
S7u 6uu
100
V26


t = 1.SS
Paso 4

Los valores crticos de t se encuentran en las tablas de
la Distribucin t de Student. La columna de la izquierda
tiene el encabezado de grados de libertad, gl. El
nmero de grados de libertad es el nmero de
observaciones de la muestra menos el nmero de
muestras, escrito n1. En este caso el nmero de
observaciones en la muestra es 26, por lo que hay 261
= 25 grados de libertad. Para encontrar en valor crtico,
primero se localiza la lnea de los grados de libertad
apropiados. Despus de determina si la prueba es de
una o dos colas. En este caso se tiene una prueba de
una cola. Por lo tanto se encuentra en la parte de la
tabla titulada una cola. Se localiza la columna con el
nivel de significancia seleccionado, que en este caso es
de 0.01. Se sigue la columna titulada una cola 0.01
hasta su interseccin con la fila correspondiente a 25
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.86

grados de libertad. El valor es de 2.485. Como se trata
de una prueba de una cola y la regin de rechazo est
en la cola izquierda, el valor crtico es negativo.
La regla de decisin es rechazar la hiptesis nula y
aceptar la hiptesis de investigacin si el valor calculado
de t es menor a 2.485

Paso 5

Dado que el valor calculado de t (-1.530) est a la
derecha del valor crtico (-2.485); es decir, no est en la
regin de rechazo, no se tienen elementos para
rechazar la hiptesis nula.

En otras palabras, no existe evidencia de que la
diferencia de S/. 30.00 pesos entre la media de la
poblacin y la media de la muestra sea estadsticamente
significativa.

Dicho de otro modo, con base en la informacin de la
muestra, no se cuenta con elementos suficientes para
afirmar que el ingreso econmico promedio sea menor
que S/. 600.00

4.7. Prueba para comparar dos medias
poblacionales independientes (muestras
pequeas)

En el aparatado anterior se seleccion una sola muestra
aleatoria y se compar su media con el valor supuesto
de la media poblacional. En este apartado se extiende
esta idea a dos muestras. La interrogante que se busca
responder es si ambas medias son iguales en trminos
estadsticos. Se requiere de tres supuestos para realizar
esta prueba:

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.87

- Las poblaciones muestreadas tienen una
distribucin normal.
- Las dos muestras son independientes.
- Las desviaciones estndar de ambas
poblaciones son iguales.

Como generalmente la varianza de la poblacin es
desconocida, las dos varianzas muestrales deben
combinarse para hacer una estimacin de la varianza
poblacional. En esencia se calcula la media ponderada
de las dos desviaciones estndar muestrales y se utiliza
esta estimacin de la desviacin estndar de la
poblacin.

La siguiente frmula se emplea para combinar las
varianzas de la muestra. Observa que se encuentran
involucrados dos factores: el nmero de observaciones
de cada muestra y las propias desviaciones estndar de
cada muestra.

Varianza combinada

S

2
=
(n
1
1)(S
1
2
) +(n
2
1)(S
2
2
)
(n
1
+n
2
) 2


Dnde:
S
1
2
= es la varianza de la primera muestra
S
2
2
= es la varianza de la segunda muestra
El valor de t se calcula con la siguiente frmula:





ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.88

Prueba de hiptesis para dos medias poblacionales
independientes y pequeas

t =
X

1
X

2
S

1
n
1
+
1
n
2



Dnde:
X

1
= Media de la primera muestra
X

2
= Media de la segunda muestra
n
1
= Tamao de la primera muestra
n
2
= Tamao de la segunda muestra
S

2
= Estimacin combinada de la varianza de la
poblacin

Como ya dijimos, el nmero de grados de libertad
es igual al nmero de elementos muestreados
menos el nmero de muestras. Debido a que hay
dos muestras, existen n
1
+ n
2
2 grados de libertad.

Ejemplo:

Un Docente interesado en el tiempo de culminacin de
un examen realizar un estudio en base a dos salones,
dicho estudio se basa en las diferencias de tiempo en la
entrega de un examen, para lo cual se plantea la
pregunta: existe alguna diferencia en el tiempo de
entrega de un examen de los estudiantes del 6to grado?
Para evaluar el estudio se tom dos salones con
muestras de 5 y 6 estudiantes. A continuacin se
muestran los resultados en minutos. Para responder la
pregunta planteada utiliza un nivel de significancia de
0.10.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.89


Saln 1
(minutos)
Saln 2
(minutos)
2 3
4 7
9 5
3 8
2 4
3
Paso 1
H
0
:
1
=
2

H
1
:
1

2

Paso 2
= 0.10

Paso 3

La t de Student se calcula en tres pasos:

a) Clculo de las desviaciones estndary de las
medias de las muestras

Saln 1 Saln 2
X
1
X
1
2
X
2
X
2
2

2 4 3 9
4 16 7 49
9 81 5 25
3 9 8 64
2 4 4 16
20 114 3 9
30 172

Varianza muestral S
2
=

2
-
()
2
n
n-1

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.90


(Formula operacional)
S
1
= 2.9155
S
2
= 2.0976
X

1
= 20 / 5 = 4
X

2
= 30 / 6 = 5

b) Combinacin de las varianzas de las muestras

Varianza combinada

S

2
=
(n
1
1)(S
1
2
) +(n
2
1)(S
2
2
)
(n
1
+n
2
) 2


S

2
=
(S 1)(2.91SS)
2
+(6 1)(2.u976)
2
(S +6) 2


S

2
= 6.222

c) Determinar t



Prueba de hiptesis para dos medias poblacionales
independientes y pequeas

t =
X

1
X

2
S

1
n
1
+
1
n
2



ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.91

t =
4 S
6.222
1
5
+
1
6



t = u.622

Paso 4

Los grados de libertad son iguales al nmero de
elementos muestreados menos el nmero de muestras.
En este caso n
1
+ n
2
2 es igual a (5 + 6) 2 = 9 grados
de libertad.

As los valores crticos de t para gl = 9, para una prueba
de dos colas y con nivel de significancia 0.10, son
+1.833 y 1.833.

Entonces, la regla de decisin es no rechazar la
hiptesis nula si el valor calculado de t cae entre 1.833
y + 1.833.

Paso 5

La decisin es no rechazar la hiptesis nula, ya que el
valor calculado de t (-0.622) cae entre los valores
crticos (1.833 y +1.833).
Dicho de otro modo, la evidencia de las muestras indica
que no hay elementos suficientes para decir que existe
una diferencia entre los tiempos de entrega de un
examen en los dos salones escogidos como muestra.


ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.92

4.8. Prueba para comparar dos medias
poblacionales dependientes (muestras
pequeas)

En el apartado anterior se prob la diferencia entre las
medias a partir de dos muestras independientes. Se
compar la diferencia entre el tiempo de entrega de dos
salones de clases. Las muestras eran independientes,
esto significa que las muestras de los tiempos utilizando
uno y otro saln no estnrelacionado de modo alguno.
Sin embargo, existen situaciones en las que las
muestras no son independientes; es decir, las muestras
estn relacionadas o son dependientes. Un ejemplo de
esto puede ser el siguiente:
Debido a las mltiples quejas de los padres de familia
respecto a la enseanza de los profesores el Director
decide realizar una evaluacin a los profesores, para lo
cual recurre a dos universidades (UNA y UANCV) para
que se tome un examen sobre aspectos pedaggicos,
se supondra que ambas universidades haran
valoraciones semejantes. Para comprobarlo, el director
selecciona 10 profesores y pide tanto a laUNA como a la
UANCV que hagan una evaluacin. Para cada profesor
casa habr un par de evaluaciones; es decir, cada
profesor tendr un valor estimado por la UNA y otro por
la UANCV. Esto tambin se conoce como muestra en
pares.

Para la prueba de hiptesis el inters recae en la
distribucin de las diferencias del valor calculado. En
consecuencia, slo hay una muestra. Para decirlo de
manera ms formal, se est investigando si la media de
la distribucin de las diferencias es cero.

La muestra se construye a partir de las diferencias entre
los valores calculados por la UNA y por la UANCV para
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.93

cada profesor. Si las dos universidades reportan valores
semejantes, algunas veces la UNA estar ms alta y
otras veces ser la UANCV. Sin embargo, se espera
que la media de la distribucin de las diferencias sea
cero. En caso contrario, si una de las universidades
constantemente reporta valores ms altos, la media ser
diferente de cero.

Se utiliza el smbolo p
d
para indicar la media de la
poblacin de la distribucin de las diferencias. El
estadstico de prueba es t y se calcula a partir de la
siguiente frmula.

Distribucin t como estadstico de prueba para la
comprobacin de medias independientes

t =
J

S
d
Vn


Para esta frmula los grados de libertad se calculan por
n 1
J

= Media de la diferencia entre las observaciones por


pares o relacionadas
S
d
= Desviacin estndar de la distribucin de las
diferencias entre las observaciones por pares o
relacionadas
n= Nmero de observaciones por pares
La desviacin estndar de las diferencias (S
d
) se
calcula por:






ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.94

Desviacin estndar de las diferencias

S
d
=

J
2

(d)
2
n
n 1


Como en las pruebas anteriores, se supone que la
poblacin de diferencias tiene una distribucin
normal. A continuacin se desarrolla el ejemplo
citado:


Ejemplo:

Los resultados de las evaluaciones en puntos de las dos
universidades son los siguientes:

Profesor UNA UANCV
1 135 128
2 110 105
3 131 119
4 142 140
5 105 98
6 130 123
7 131 127
8 110 115
9 125 122
10 149 145


Con un nivel de significancia de 0.05, puede decirse
que existe una diferencia entre la media de los valores
calculados de los profesores?


ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.95

Paso 1

H
0
:
d
= 0
H
1
:
d
0

Paso 2

= 0.05

Paso 3

La t de Student se calcula en tres pasos:
a) Clculo de la media de la diferencia entre las
observaciones por pares


Valor calculado en puntos

Profesor UNA UANCV
Diferencia
( d )
Diferencia
al
cuadrado
( d
2
)
1 135 128 7 49
2 110 105 5 25
3 131 119 12 144
4 142 140 2 4
5 105 98 7 49
6 130 123 7 49
7 131 127 4 16
8 110 115 -5 25
9 125 122 3 9
10 149 145 4 16
46 386
J

= 4.6u

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.96

b) Calculo de la desviacin estndar de la
distribucin de las diferencias entre las
observaciones por pares o relacionadas

Desviacin estndar de las diferencias

S
d
=

J
2

(d)
2
n
n 1


S
d
=

S86
(46)
2
10
1u 1


S
d
= 4.4u2
c) Determinar t

Distribucin t como estadstico de prueba para la
comprobacin de medias independientes

t =
J

S
d
Vn


t =
4.6
4.402
V10
donde: t = S.SuS

Paso 4

Los grados de libertad son iguales al nmero de
elementos muestreados menos el nmero de muestras.
En este caso n
1
1 es igual a 10 1 = 9 grados de
libertad. Porque hay 10 profesores evaluados.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.97

As los valores crticos de t para gl = 9, para una prueba
de dos colas y con nivel de significancia 0.05, son
+2.262 y 2.262.
Entonces, la regla de decisin es no rechazar la
hiptesis nula si el valor calculado de t cae entre +2.262
y 2.262.

Paso 5

La decisin es rechazar la hiptesis nula, ya que el valor
calculado de t (3.305) no cae entre los valores crticos
(+2.262 y 2.262).

Dicho de otro modo, la evidencia de la muestra indica
que hay elementos suficientes para decir que existe una
diferencia entre los valores que sobre los mismos
profesores hacen las universidadesUNA y UANCV.











ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.98

CAPITULO V
PRUEBAS DE CHI CUADRADA

5.1. Caractersticas de la distribucin

En los captulos anteriores, se ha trabajado mayormente
con datos que eran de la escala de intervalo o de razn,
como pesos, notas, ingreso econmico o edades. En
estas pruebas hemos tenido el supuesto de que los
datos provienen de distribuciones normales.

En este tema veremos cmo se desarrollan pruebas de
hiptesis para datos de escala ordinal o nominal, en las
que no se necesita hacer ningn supuesto acerca de la
forma de la distribucin de la poblacin de la que
provienen los datos.

Este tipo de pruebas se conocen con el nombre de
pruebas no paramtricas o pruebas de distribucin libre.
Esto quiere decir que se realizan a partir de datos
nominales u ordinales y que las pruebas estn libres de
supuestos acerca de la forma de la distribucin de la
poblacin.


5.2. Pruebas de bondad y ajuste (de
homogeneidad)

La prueba de bondad y ajuste es una de las pruebas no
paramtricas ms utilizadas. Esta prueba se puede usar
para datos de cualquier nivel. Este tipo de pruebas se
utilizan para ver que tan bien se ajusta un conjunto de
datos observados a un conjunto de datos esperados.

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.99

En el primer ejemplo corresponde a frecuencias
igualmente esperadas o de frecuencias homogneas.

Ejemplo:

El Director de una Institucin Educativa requiere
contratar el personal docente de la especialidad de
matemtica para el ao acadmico, se tiene 7 docentes
aptos y que laboraron el ao anterior. El problema es
qu docentes contratar si se redujo la cantidad de
docentes a contratar. Para ello realiza una pequea
encuesta a los padres de familia en relacin a la
preferencia de docentes que requieren para la
enseanza a sus hijos, el director considera que as se
lograr la mayor satisfaccin de los padres de familia,
teniendo los siguientes resultados:

Profesor Nro. de Preferencias Nro. esperado
Alex Ticona 13 20
Carlos Pineda 33 20
Jhon Arvalo 14 20
Oswaldo Snchez 7 20
Rafael Muoz 36 20
Elmer Delgado 17 20
TOTAL 120 120

Con base en esta informacin, se puede concluir todos
los profesores tienen la misma preferencia?

Si no hay una diferencia significativa entre las
frecuencias observadas y las frecuencias esperadas, se
supondra que las frecuencias observadas fueran
iguales o aproximadamente iguales. Es decir, se
esperara la misma preferencia por el profesor Alex
Ticona o Elmer Delgado. En este caso cualquier
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.100

diferencia observada entre el conjunto de frecuencias
observadas y esperadas, podra atribuirse al muestreo o
a la casualidad.
Como hay 120 padres de familia en la muestra,
esperaramos que a cada profesor le correspondieran 20
preferencias. Sin embargo la encuesta del conjunto de
frecuencias observadas indica que las preferencias de
Oswaldo Snchez tienen muy poco, mientras que la de
Rafa Muoz se muestra con mayor preferencia. Se
debe esta diferencia de preferencia a la casualidad, o
podramos concluir que hay preferencia por alguno de
los profesores?

Paso 1

H
0
: f
o
= f
e

H
1
: f
o
f
e

Paso 2
= 0.05
Paso 3

La estadstica de prueba adecuada es ji cuadrada que
se designa por X
2
.

Estadstico de Prueba ji cuadrada

X
2
= _
(

)
2

_

Con k 1 grados de libertad, donde:
k = Nmero de categoras

= Frecuencia observada en una categora


determinada
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.101

= Frecuencia esperada en una categora determinada


Para realizar el clculo de X
2
se siguen los siguientes
tres (sub) pasos:

Columna 1: Determinar las diferencias entre

. La
suma de estas diferencias es cero.
Columna 2: Elevar al cuadrado cada una de las
diferencias observadas entre

. Esto es (

)
2


Columna 3: Dividir los resultados de la columna 2 entre
la frecuencia esperada y sumar estos valores. La suma
es el valor de X
2
.
Paso 4

Al igual que la distribucin t, la distribucin X
2
es en
realidad una familia de distribuciones, cada distribucin
de la familia cambia de acuerdo al nmero de grados de
libertad.

Como ya dijimos, el nmero de grados de libertad en
este tipo de problemas, se calcula por k 1. Dado que
hay 6 categoras o profesoresk 1 = 6 1 = 5 grados de
libertad.
Profesor
Nro. de
Preferencias
Nmero
esperado
(

)
(1)
(

)
2

(2)
(

)
2


(3)
Ticona 13 20 -7 49 2.45
Pineda 33 20 13 169 8.45
Arvalo 14 20 -6 36 1.8
Snchez 7 20 -13 169 8.45
Muoz 36 20 16 256 12.8
Delgado 17 20 -3 9 0.45
TOTAL 120 120 0
2
= 34.4
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.102

Luego entonces, buscando en las tablas de X
2
,
encontramos que el valor crtico para 5 grados de
libertad con = 0.05 es 11.070. Que se encuentra
localizando 5 grados de libertad en el margen izquierdo
y movindose horizontalmente hasta la columna
marcada con 0.05.

De esta manera, la regla de decisin es: No
rechazar H
0
si el valor que se encuentre para X
2
es
menor que 11.070. Si el valor calculado es igual o
mayor al valor crtico, se rechaza H
0
y se acepta H
1


Paso 5

Dado que el valor que se encontr para X
2
fue de 34.40,
se rechaza la hiptesis nula y se acepta la hiptesis de
investigacin.

En otras palabras, la diferencia entre las frecuencias
observadas y esperadas no se debe a la casualidad,
sino que estas diferencias son lo suficientemente
grandes para considerarlas significativas. As
concluimos que es muy improbable que todos los
docentes tengan la misma preferencia.

5.3. Pruebas de bondad y ajuste: frecuencias
desigualmente esperadas (de
independencia)

En los ejercicios anteriores se esperaba que la
frecuencia de todas las variables fuera igual, como el
caso de las preferencias de docentes, dnde se
esperaba que todos tuvieran la misma preferencia. La
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.103

prueba de ji cuadrada tambin se puede usar cuando las
frecuencias esperadas no son iguales.

El siguiente ejemplo ilustra el caso de las frecuencias
desiguales y tambin proporciona un uso prctico de
esta herramienta estadstica, encontrar si una
experiencia local difiera de una experiencia nacional.

Ejemplo:

Un estudio nacional sobre el nmero de veces que fue
hospitalizado un docente durante un lapso de dos aos
revel que 40% ingres slo una vez, 20% dos veces,
14% tres, 10% cuatro, 8% cinco, 6% seis y 2% siete.

Un estudio de la Direccin de Educacin de Arequipa
requiere comparar la experiencia del esta demarcacin
con las cifras nacionales. De este modo se toma una
muestra de 400 docentes y se determina cuntas veces
fueron hospitalizados, las frecuencias observadas se
presentan en la siguiente tabla:


Nmero de
hospitalizaciones
Nmero de
docentes (f
o
)
1 165
2 79
3 50
4 44
5 32
6 20
7 10
400

Obviamente el nmero de frecuencias locales no se
puede comparar con los porcentajes nacionales, sera
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.104

como comparar peras con manzanas; pero los
porcentajes nacionales se pueden convertir en
frecuencias esperadas. Como ya se mencion, a nivel
nacional 40% de los docentes que necesitaron
hospitalizacin en dos aos, la necesitaron slo una vez,
as que si no hubiera diferencia entre las cifras de
Arequipa y las nacionales, entonces 40% de los
cuatrocientos muestreados habran sido hospitalizados
slo una vez durante este perodo, 20% de los 400
muestreados habran sido hospitalizados dos veces y
as sucesivamente. Es decir, se esperara que la
frecuencia de hospitalizaciones en Arequipa coincidiera
con la frecuencia observada a nivel nacional. En la
siguiente tabla se muestran las frecuencias observadas
y las esperadas.

Nmero de
hospitalizacione
s
Nmero
observado de
hospitalizacione
s (f
o
)
Nmero
esperado de
hospitalizacione
s (f
e
)
1 165 160 = 40% * 400
2 79 80 = 20% * 400
3 50 56 = 14% * 400
4 44 40 = 10% * 400
5 32 32 = 8% * 400
6 20 24 = 6% * 400
7 10 8 = 2% * 400
400 400

Una vez determinadas las frecuencias esperadas,
se procede a plantear las hiptesis.

Paso 1
H
0
: f
o
= f
e
No hay diferencia entre la experiencia local y la
experiencia nacional
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.105

H
1
: f
o
f
e
S hay diferencia entre la experiencia local y la
experiencia nacional

Paso 2
= 0.05
Paso 3

La estadstica de prueba adecuada es ji cuadrada que
se designa por X
2


Estadstico de Prueba ji cuadrada
X
2
= _
(

)
2

_

Con k 1 grados de libertad


Nmero de
hospitalizaciones
f
o
f
e

(f
o
-
f
e
)
(f
o
-
f
e
)
2

(f
o
- f
e
)
2
f
e

1 165 160 5 25 0.156
2 79 80 -1 1 0.013
3 50 56 -6 36 0.643
4 44 40 4 16 0.400
5 32 32 0 0 0.000
6 20 24 -4 16 0.667
7 10 8 2 4 0.500
TOTAL 120 120 0
2
= 2.378
Paso 4

El valor crtico se encuentra utilizando la tabla de la
distribucin de ji cuadrada, considerando k 1 grados
de libertad; es decir 7 1 = 6 grados de libertad y un
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.106

nivel de significancia de 0.05. De esta manera el valor
crtico es 12.592.

La regla de decisin es entonces: No rechazar H
0
si
el valor que se encuentre para X
2
es menor que
12.592. Si el valor calculado es igual o mayor al
valor crtico, se rechaza H
0
y se acepta H
1

Paso 5

Dado que el valor que se encontr para X
2
fue de 2.378,
no se rechaza la hiptesis nula.

En otras palabras, la Direccin Regional de Arequipa
podr concluir que la situacin local respecto a la
hospitalizacin de docentes enfermos es la misma que
en otras partes del pas.

5.4. Limitaciones de la ji cuadrada

La ji cuadrada puede llevar a conclusiones errneas
cuando en una celda (o en varias) se tiene una
frecuencia esperada demasiado pequea. Esto puede
ocurrir porque las frecuencia esperadas aparecen en el
denominador de la frmula, y al dividir entre un nmero
muy pequeo se obtiene un cociente muy grande.
Existen dos reglas generales en relacin con las celdas
con frecuencias muy pequeas:

a) Si slo hay dos celdas (tablas de 2 X 2), la
frecuencia esperada en cada celda debe ser de 5
o ms. De otro modo no se puede utilizar la ji
cuadrada.
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.107

b) Si hay ms de dos celdas, no se debe utilizar la ji
cuadrada cuando ms del 20% de las celdas
tienen una frecuencia esperada menor a 5.



5.5. Anlisis de cuadros de contingencia

En las pruebas de bondad y ajuste que vimos
anteriormente, se analizaba nicamente una variable y
un rasgo. Sin embargo, la prueba de ji cuadrada tambin
se puede utilizar cuando se analizan dos rasgos ala vez.
En estos casos, se utiliza para saber si existe alguna
relacin entre estos dos rasgos.

Ejemplo:

El jefe de personal de la DREP, desea investigar sobre
la opinin de satisfaccin laboral de los profesores
respecto al lugar de procedencia. Dicho de otra forma,
existe alguna relacin entre la satisfaccin laboral y el
lugar de procedencia de los profesores?
Paso 1

H
0
: No hay relacin entre la satisfaccin y el lugar de
procedencia del profesor.
H
1
: Hay relacin entre la satisfaccin y el lugar de
procedencia del profesor.

Paso 2
= 0.01

El personal de la DREP entrevist a una muestra
aleatoria de 200 profesores, y con base en los
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.108

resultados, clasificaron su satisfaccin laboral como
excelente, buena, regular e insatisfactoria. En la
siguiente tabla se muestran los resultados obtenidos
para esta muestra.


Satisfaccin laboral

Lugar de
Procedencia
Excelente Buena Regular Insatisfactoria
Puno 27 35 33 25
Otro lugar 13 15 37 25
Total 40 50 60 50

Paso 3

La estadstica de prueba adecuada es ji cuadrada que
se designa por X
2



Estadstico de Prueba ji cuadrada
X
2
= _
(

)
2

_
P! "#$#"%! &' (!%")%$"*' #+'%!,-' '% ).*&*/ &
'*g)*%$.% (0!1)&2

Frecuencia esperada de una celda

=
(totol Jc lo ilo) - (totol Jc lo columno)
IIAI


ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.109

Utilizando esta frmula se obtiene el siguiente cuadro:


Satisfaccin Laboral
Lugar de
Procedencia
Excelente Buena Regular
Insatis-
factoria
Total

f
o
f
e
f
o
f
e
f
o
f
e
f
o
f
e
f
o
f
e

Puno
27 24 35 30 33 36 25 30 120 120
Otro lugar
13 16 15 20 27 24 25 20 80 80
Total
40 40 50 50 60 60 50 50 200 200

Sustituyendo la frmula para el clculo de ji cuadrada y
comenzando por la celda superior izquierda, tenemos:

X
2
=
(27 24)
2
24
+
(SS Su)
2
Su
+ +
(27 24)
2
24
+
(2S 2u)
2
2u


X
2
= S.729

Paso 4

El valor crtico se encuentra utilizando la tabla de la
distribucin de ji cuadrada.

Para conocer los grados de libertad se utiliza la
siguiente frmula:

gl = (nmero de renglones 1) (nmero de columnas
1)

gl = (r 1) (c 1)
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.110

En este problema:

gl = (2 1) (4 1)

gl = 3

El nivel de significancia, como ya se determin es =
0.01. Luego entonces, buscando en las tablas de la
distribucin de ji cuadrada, se obtiene el valor crtico de
11.345.

La regla de decisin es entonces: No rechazar H
0
si el
valor que se encuentre para X
2
es menor que 11.345. Si
el valor calculado es igual o mayor al valor crtico, se
rechaza H
0
y se acepta H
1



Paso 5

Dado que el valor que se encontr para X
2
fue de 5.729,
no se rechaza la hiptesis nula.

En otras palabras, concluimos que no hay relacin entre
la satisfaccin laboral y el lugar de procedencia de los
profesores.






ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.111


DISTRI!UCIN NOR"AL ESTNDAR Z
TA!LA DE VALORES CR#TICOS

1 COLA 2 COLAS
0.002 2.8782 3.0902
0.005 2.5758 2.8070
0.01 2.3263 2.5758
0.02 2.0537 2.3263
0.03 1.8808 2.1701
0.04 1.7507 2.0537
0.05 1.6449 1.9600
0.06 1.5548 1.8808
0.08 1.4051 1.7507
0.10 1.2816 1.6449
0.15 1.0364 1.4395
0.20 0.8416 1.2816
0.25 0.6745 1.1503







ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.112

TA!LA $%S$uden$

1
G. L. 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.995
1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032

6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169

11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947

16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845

21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787

26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779
27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.113

Ta&'a Di$ri&uci(n de C)i%cuadrado

G.L. 0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
7 12,02 14,07 16,01 18,48 20,28
8 13,36 15,51 17,53 20,09 21,95
9 14,68 16,92 19,02 21,67 23,59
10 15,99 18,31 20,48 23,21 25,19
11 17,28 19,68 21,92 24,73 26,76
12 18,55 21,03 23,34 26,22 28,30
13 19,81 22,36 24,74 27,69 29,82
14 21,06 23,68 26,12 29,14 31,32
15 22,31 25,00 27,49 30,58 32,80
16 23,54 26,30 28,85 32,00 34,27
17 24,77 27,59 30,19 33,41 35,72
18 25,99 28,87 31,53 34,81 37,16
19 27,20 30,14 32,85 36,19 38,58
20 28,41 31,41 34,17 37,57 40,00
21 29,62 32,67 35,48 38,93 41,40
22 30,81 33,92 36,78 40,29 42,80
23 32,01 35,17 38,08 41,64 44,18
24 33,20 36,42 39,36 42,98 45,56
25 34,38 37,65 40,65 44,31 46,93
26 35,56 38,89 41,92 45,64 48,29
27 36,74 40,11 43,19 46,96 49,65
28 37,92 41,34 44,46 48,28 50,99
29 39,09 42,56 45,72 49,59 52,34
30 40,26 43,77 46,98 50,89 53,67
40 51,81 55,76 59,34 63,69 66,77
50 63,17 67,50 71,42 76,15 79,49
60 74,40 79,08 83,30 88,38 91,95
70 85,53 90,53 95,02 100,43 104,21
80 96,58 101,88 106,63 112,33 116,32
90 107,57 113,15 118,14 124,12 128,30
100 118,50 124,34 129,56 135,81 140,17

ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.114


BIBLIOGRAFA
CALZADA BENZA. "Mtodos Estadsticos para la
Investigacin".
CASA S. Jos. Inferencia Estadstica para economa
y administradores. Centro de estudios Ramn
Areces S.A.
CORDOVA ZAMORA, Manuel. Estadstica
Aplicada.2006.Lima
DE LA HORRA N. Julin. Estadstica Aplicada. Daz
Santos.
FERNANDEZ CHAVESTA, Jos y Juan. Estadstica
Aplicada I y II.2007.Lima.
LZARO CARRIN, Moiss. Inferencia
Estadstica.2007.Lima.
LIND, Douglas A. y otros. Estadstica Aplicada a los
Negocios y a la Economa.2007.Mxico.
MITACC MEZA, Mximo. Tpicos de Estadstica
Descriptiva y Probabilidad.1996.Lima.
MITACC MEZA, Mximo. Tpicos de Estadstica
Inferencial. s/f. Lima.
MOYA C. Rufino y SARAVIA A. Gregorio.
Probabilidades e Inferencia Estadstica.2007.L
ESTADSTICA INFERENCIAL APLICADA A LA EDUCACIN

LICENCIATURA EN EDUCACIN INICIAL FACE - UANCV Pg.115


MURRAY R. Spiegel, LARRY J. Stephens.
Estadstica.2002. Mc Graw Hill. Mxico.
PEREZ LEGOAS, Lus A. Estadstica Bsica para
Ciencias Sociales y Educacin.2007.Lima.
RUIZ M. David. Manual de Estadstica EUME-NET.
SIERRA BRAVO. "Diccionario Prctico de
Estadstica".
SIERRA BRAVO. "Tcnicas de Investigacin
Social".2001.Edit. Paraninfo S.A. Espaa.
ZEA F. Wilfredo y IBAEZ Q. Wladimir Tablas
Estadsticas.

S-ar putea să vă placă și