Sunteți pe pagina 1din 128

REPBLICA BOLIVARIANA DE VENEZUELA

UNIVERSIDAD PRIVADA DR. RAFAEL BELLOSSO CHACN


VICERECTORADO DE INVESTIGACIN Y POSTGRADO
DECANATO DE INVESTIGACIN Y POSTGRADO
MAESTRA EN INFORMTICA EDUCATIVA

INTERPRETACIN DE PRUEBAS ESTADISTICAS PARAMTRICAS Y NO


PARAMTRICAS - GRUPO N 4
MAESTRANTES:

MOSCOTE PEA ALEIDA


PALOMINO GALINDO SANDRA
TORRES RODRIGUEZ CLARIBEL
Maracaibo, Enero 2016 .

INTRODUCCIN
Al obtener uno datos estadsticos, se hace necesario aplicar algunas
pruebas o mtodos, que ayuden conseguir unos resultados, es por esto
que en esta oportunidad se presentan y estudian de manera detallada las
pruebas estadsticas paramtrica y no paramtricas.
Las pruebas anteriormente mencionadas permiten obtener uno datos
sobre un evento o situacin especifica, que darn las bases para obtener
unos resultados, los cuales sern aplicados, segn el tipo de investigacin
que se est desarrollando. En este trabajo se analizarn algunas pruebas
estadsticas, tales como, Prueba del valor z de la distribucin normal,
Prueba t de Student para datos no relacionados (independientes), Prueba
ji2 de Pearson para dos y ms muestras independientes, Prueba de
McNemar para muestras dependientes, Prueba de U Mann-Whitney para
dos muestras independientes, Prueba de Wilcoxon de rangos sealados y
pares igualados para dos muestras dependientes.

CONCEPTOS BSICOS
Hiptesis estadstica : Es una proposicin o

supuesto sobre los parmetros de una o ms


poblaciones.
Hiptesis nula, representada por Ho, es la
afirmacin sobre una o ms caractersticas de
poblaciones que al inicio se supone cierta (es decir, la
"creencia a priori").
La hiptesis alternativa, representada por Ha, es
la afirmacin contradictoria a Ho, y sta es la
hiptesis del investigador.

EJEMPLOS DE AS HIPOTESIS

Ha: La desintegracin familiar de los

padres provoca baja autoestima en los


hijos
Ho: La desintegracin familiar de los
padres no provoca baja autoestima en
los hijos

EJEMPLOS DE LAS HIPOTESIS


Ha: El nivel de ansiedad de los

estudiantes de primer semestre de la


URBE, disminuye despus de recibir
charlas de motivacin
Ho: No existen diferencias en el nivel
de ansiedad de los estudiantes de
primer semestre de la URBE despus
de recibir charlas de motivacin

CONTRASTE DE HIPTESIS
Es un procedimiento para juzgar si una propiedad
que se supone en una poblacin es compatible con lo
observado en una muestra de dicha poblacin.
Mediante esta teora, se aborda el problema
estadstico
considerando
una
hiptesis
determinada y una hiptesis alternativa , y se
intenta dirimir cul de las dos es la hiptesis
verdadera, tras aplicar el problema estadstico a un
cierto nmero de experimentos.

TIPOS DE ERRORES (1)


Al realizar un contraste de hiptesis se pueden
cometer uno de los dos errores siguientes:
1.

Tipo 1
Se rechaza la hiptesis
nula H0 cuando es cierta

1.

Tipo 2
Se acepta la hiptesis nula
Ho, cuando es falsa

PARAMTROS

Un parmetro es un nmero que resume la gran


cantidad de datos que pueden derivarse del estudio de
una variable estadstica.
El clculo de este nmero est bien definido,
usualmente
mediante
una
frmula matemtica obtenida a partir de datos de la
poblacin.
Los parmetros estadsticos son una consecuencia
inevitable del propsito esencial de la estadstica: crear
un modelo lo mas exacto posible de la realidad.

SUPUESTOS DE LAS ESTADISTICAS


PARAMTRICAS
La distribucin poblacional de la variable

dependiente es normal: el universo tiene una


distribucin normal
El nivel de la medicin de la variable dependiente es
por intervalo o razn.
Cuando dos o mas poblaciones son estudiadas estas
tienen una varianza homognea
Las poblaciones en cuestin tienen una dispersin
similar en sus distribuciones.
Muestras iguales (n>30)

DEFINICIN
La Pruebas Paramtricas, son aquellas en las cuales su
clculo implica una estimacin de parmetros de la
poblacin con base en muestras estadsticas.
Ventajas:
1. Mas poder de eficiencia
2. Mas sensible a los rasgos de los datos recolectados
3. Menos probabilidades de errores
Desventajas:
1. Ms complicadas de calcular
2. Limitaciones en los tipos de datos que se pueden
calcular

PRINCIPALES PRUEBAS ESTADISTICAS


PARMETRICAS
1.

2.
3.
4.
5.
6.

Prueba del valor z de la distribucin normal


Estadstico F de Snedecor para el anlisis de la
homocedasticidad
Prueba t de student para datos relacionados
Prueba t de Student para datos no relacionados
Prueba t de Student para dos muestras
independientes con varianza no homognea
Test de Bartlett de homogeneidad para modelos no
equilibrados.

PRUEBA DEL VALOR Z DE LA DISTRIBUCIN NORMAL

1. La distribucin es simtrica, es decir igual


comportamiento a la derecha como a la izquierda .
2. La media aritmtica, la mediana y la moda son
iguales y pasan e ser el punto ms alto del polgono
de frecuencia. El coeficiente de asimetra es igual a
cero.

Ejercicio 1
Un fabricante ofrece bateras que tienen una duracin
promedio de 4000 horas. Un comprador adquiere 36
pilas y encuentra que la duracin promedio es 3600
horas. El comprador piensa que fue engaado pues la
duracin de la pila fue inferior a la ofrecida por el
fabricante.
La desviacin tpica de estas pilas es 985 horas
A nivel del 5% se quiere saber si el fabricante est
ofreciendo un producto de menor calidad.

Pasos para solucionar el ejercicio


Se establecen las hiptesis
Ho: = 4000 horas
Ha: < 4000 horas

(Hiptesis nula)
(Hiptesis alternativa)

2.Se establece el nivel de significacin , que corresponde al 5%

( = 0,05)

3. Se busca el valor de Z
Frmula utilizada:

Datos:

S = 985
n=36
= 3600

36004000
985
36

= 2,43

4. Se haya el valor crtico


Teniendo en cuenta que el valor de significacin es 0,05, entonces el
valor crtico para pruebas de un extremo es 1,645. (Ver tabla anexa)
Valor crtico

Para pruebas de un
extremo
Para pruebas de dos
extremos

1%
(0,01)

5%
(0,05)

10%
(0,1)

2,33

1,645

1,28

-2,33

-1,645

-1,28

2,58

1,96

1,645

-2,58

-1,96

- 1,645

Se toma el valor negativo porque la hiptesis establece que : < 4000

5. Se establece la zona de rechazo

Zona de aceptacin

Zona de
rechazo
-1,645

6. Ubicamos el valor de Z obtenido en el grfico

Zona de aceptacin
Zona de
rechazo

-2,43

-1,645

RESULTADOS

Dado que el valor obtenido de Z qued dentro de la


zona de rechazo, se rechaza la hiptesis nula ( =
4000 horas) y se acepta la hiptesis alternativa, por
tanto el productor est vendiendo pilas con una
duracin inferior a la garantizada.

Ejercicio 2
Una mquina est programada para empacar
en promedio bolsas de 16 onzas de caf. Se
toman muestras aleatorias de 36 paquetes
resultando una media de 14,4 onzas y una
desviacin tpica de 5,3 onzas.
Al nivel del 1% podra afirmar que la
empresa no est cumpliendo con lo indicado
en el paquete.

Pasos para solucionar el ejercicio


Se establecen las hiptesis
Ho: = 16 onzas
Ha: 16 onzas

(Hiptesis nula)
(Hiptesis alternativa)

2.Se establece el nivel de significacin , que corresponde al 1%

( = 0,1)

3. Se busca el valor de Z
Frmula utilizada:

Datos:

S = 5,3 onzas
n= 36 paquetes
= 14,4

14,416
5,3
36

= 1,81

4. Se haya el valor crtico


Teniendo en cuenta que el valor de significacin es 0,01, entonces el
valor crtico para pruebas de dos extremos es 2,58 y -2.58.
Valor crtico

Para pruebas de un
extremo
Para pruebas de dos
extremos

1%
(0,01)

5%
(0,05)

10%
(0,1)

2,33

1,645

1,28

-2,33

-1,645

-1,28

2,58

1,96

1,645

-2,58

-1,96

- 1,645

Se toman ambos valores porque la hiptesis establece que : 16 onzas, es


decir puede ser >16 < -16

5. Se establece la zona de rechazo

Zona de aceptacin

Zona de
rechazo
-1,645

-2,58

2,58

RESULTADOS

Dado que el valor obtenido de Z qued fuera de la


zona de rechazo, se acepta la hiptesis nula ( = 16
onzas) por tanto la empresa est cumpliendo con lo
pactado.

Estadstico F de Snedecor para el anlisis de la


homocedasticidad

El estadstico F de Snedecor para la homocedasticidad


analiza la homogeneidad de varianzas entre dos
muestras.
Pone a prueba la hiptesis nula de que las dos
muestras son homocedsticas, por tanto, la aceptacin
de
la
hiptesis
alternativa
supone
la
heterocedasticidad.

Ejemplo 1
Dado el conjunto de varianzas debe
determinarse utilizando Estadstico F de
Snedecor
debe
establecerse
la
homogeneidad de las varianzas de las
muestras.
Ho: Los valores de las varianzas son
homogneas
Ha: Los valores de las varianzas no son
homogneas

M1
43
29
48
41
44
30
45

M6
34
35
42
37
42
30
33

27
23
49
46
35
42
38
35
35
36
30
39
34
48
27
34
36
36

29
22
37
46
43
41
33
28
29
26
40
32
38
44
21
47
36
39

Prueba de comparacin de la homogeneidad de


las varianzas aplicando Ms Excel
Se utiliza la herramienta anlisis de datos y se escoge
la opcin: Prueba F para varianzas de dos muestras

Resultados obtenidos
Prueba F para varianzas de dos muestras

Variable 1

Variable 2

Media
Varianza
Observaciones

37,2
52,16666667
25

35,36
50,40666667
25

Grados de libertad
F
P(F<=f) una cola

24
1,034916016
0,466848543

24

Valor crtico para F (una cola)

1,983759568

Dado que la probabilidad del estadstico F (0,46) es


mayor que alfa (0.05), la hiptesis nula es verdadera,
por tanto la hiptesis puesta a prueba es verdadera.
Las varianzas son homogneas.

Prueba t de student
En estadstica, es cualquier prueba en la que el
estadstico utilizado tiene una distribucin t de
Student.
Se aplica cuando la poblacin estudiada sigue una
distribucin normal pero el tamao nuestra es
demasiado pequeo (n<30) como para que el
estadstico en el que est basada la inferencia est
normalmente distribuido, utilizndose una estimacin
de la desviacin tpica en lugar del valor real.

Prueba t de Student para datos relacionados


(dependientes)
La prueba estadstica t de Student para muestras
dependientes es una extensin de la utilizada para
muestras independientes. De esta manera, los
requisitos que deben satisfacerse son los mismos,
excepto la independencia de las muestras; es decir, en
esta prueba estadstica se exige dependencia entre
ambas, en las que hay dos momentos uno antes y otro
despus. Con ello se da a entender que en el primer
perodo, las observaciones servirn de control o
testigo, para conocer los cambios que se susciten
despus de aplicar una variable experimental.

Ejemplo I
Un grupo de 10 mujeres se sometieron a una dieta para bajar
de peso. Se registr sus pesos en libras antes y despus de
terminada la dieta, los resultados se presentan en la siguiente
tabla
Antes
137

Despus
132

130
124
138
149
140
168
152

121
126
130
147
141
159
147

Ho: No hay diferencia en el peso de las mujeres


antes y despus de haber hecho la dieta
Ha: Hay diferencia en el peso de las mujeres
antes y despus de haber hecho la dieta
El nivel de confianza es del 95%

Solucin del Ejercicio utilizando la herramienta


Microsoft Excel
1.

Verifique que se encuentre instalado la


herramienta estadstica: anlisis de datos.
Men datos - anlisis de datos

2. Haga clic en anlisis de datos y seleccione prueba t para medias de dos


muestras emparejadas

3. Haga clic en aceptar y seleccione el rango de celdas donde


estn las variables a evaluar, correspondiente a la tabla
mostrada en el ejercicio.

Dado que el nivel de confianza es de 95% entonces el valor de alfa es de


0,05

Resultado del proceso arrojado por excel

Prueba t para medias de dos muestras emparejadas

Media
Varianza
Observaciones
Coeficiente de correlacin de
Pearson
Diferencia hipottica de las
medias
Grados de libertad
Estadstico t
P(T<=t) una cola
Valor crtico de t (una cola)
P(T<=t) dos colas
Valor crtico de t (dos colas)

Variable 1
Variable 2
142,25
137,875
191,0714286 163,553571
8
8
0,949739123
0
7
2,8509581
0,012327298
1,894578605
0,024654596
2,364624252

Las muestras son


relacionadas o
emparejas porque
son los mismos
sujetos antes y
despus de la prueba

Anlisis de Resultados
Del cuadro anterior debemos observar el valor de p
P(T<=t) dos colas

0,024654596

Ahora bien, para establecer la veracidad de la


hiptesis establecida debemos tener en cuenta lo
siguiente:
El valor de p entonces se rechaza la hiptesis
nula
Si el valor de p > entonces se acepta la hiptesis
nula

Conclusin del Ejercicio


Dado que el valor de P es 0,024654596 es menor que
el valor de significancia ( ) que es 0,05, porque en
el ejercicio se estableci el nivel de confianza en
95%, entonces se rechaza la hiptesis nula y por
tanto se acepta la hiptesis alterna.

Queriendo decir con esto que hay diferencias entre


el peso de las mujeres estudiadas antes y despus
de haberse sometido a la dieta.

Prueba t de Student para datos no relacionados


(independientes)
Las

pruebas t desapareadas o de muestras


independientes, se utilizan cuando se obtienen dos
grupos de muestras aleatorias, independientes e
idnticamente distribuidas a partir de las dos
poblaciones a ser comparadas. Por ejemplo, supngase
que estamos evaluando el efecto de un tratamiento
mdico, y reclutamos a 100 sujetos para el estudio. Luego
elegimos aleatoriamente 50 sujetos para el grupo en
tratamiento y 50 sujetos para el grupo de control.

En este caso, obtenemos dos muestras independientes y

podramos utilizar la forma desapareada de la prueba t.

Ejemplo 1
Tenemos dos grupos: un grupo de sexo
masculino y un grupo de sexo femenino con 25
sujetos cada uno existe estadsticamente
diferencias entre el promedio de edad en
cuanto al sexo?
Ho:

no existe diferencia estadstica


significativa en el promedio de edad en
cuanto al sexo con un 95% del nivel de
confianza

Ha: si existe una diferencia significativa en el

promedio de edad en cuanto al sexo con un


95% de nivel de confianza

masculino

femenino

37
33
37
37
26
59
20
54
52
44
61
35
62
17
55
16
53
46
37
20
25
57
17
25
53

40
19
23
15
11
30
39
27
26
12
32
31
29
19
39
40
32
49
45
35
35
28
19
18
35

Anlisis de datos utilizando MS Excel


En el cuadro de dilogo de anlisis de datos se
selecciona la herramienta:
Prueba t para dos muestras suponiendo
varianzas iguales

Resultado del proceso arrojado por excel

Prueba t para dos muestras suponiendo varianzas iguales


Variable 1
Media
Varianza

39,12
25,00

Varianza agrupada

171,03

Grados de libertad
Estadstico t
P(T<=t) una cola

0,00

48,00
2,70
0,00473111

Valor crtico de t (una cola)

1,6772242

P(T<=t) dos colas

0,009462

Valor crtico de t (dos colas)

29,12

237,53 104,526667

Observaciones
Diferencia hipottica de las medias

Variable 2

2,01063476

25

Las muestras no son relacionadas o


emparejas
porque
son
dos
poblaciones diferentes que tienen
varianzas iguales.

Anlisis de Resultados
Del cuadro anterior debemos observar el valor de p
P(T<=t) dos colas

0,009462

Conclusin
Dado que el valor de P (0,009462) es menor que el valor

de significancia ( = 0,05), entonces se rechaza la hiptesis


nula y por tanto se acepta la hiptesis alterna.
Es decir que si existe una diferencia significativa en el
promedio de edad en cuanto al sexo, con un 95% de nivel
de confiabilidad

Prueba t de Student para dos muestras independientes con


varianza no homognea

En caso en se dispone de dos grupos de observaciones


independientes
con
diferentes
varianzas,
la
distribucin de los datos en cada grupo no puede
compararse nicamente en trminos de su valor
medio.
Bajo la suposicin de que las dos poblaciones siguen
una distribucin normal y tienen igual varianza se
espera que la razn de varianzas sea constante

Ejemplo 1
Masculino Femenino
76,82
63,24
66,36
64,64
70,45
66,82
49,55
51,98
46,82
60,91
76,82
51,82
73,64
60,91
71,82
50,91
60
51,45
49,55
54,87
42,27
61,23
64,09
58,24
60,45
45,45
64,09
59,04
71,36
57,73
75,91
55,91
67,73
61,82
46,36
59,09
57,73
62,27
68,64
54,09
79,09
66,82
75,91
46,82
76,36
52,15
42,73
50,07
51,82
53,75

Tenemos dos grupos: un grupo de sexo masculino y un grupo de


sexo femenino con 25 sujetos cada uno existe estadsticamente
diferencias entre el promedio de peso en cuanto al sexo?
Ho: No existe diferencias estadsticamente significativa en el
promedio de peso en kilogramo entre los dos grupos evaluados,
con 95% de confiabilidad
Ha: si existe diferencias estadsticamente significativa en el
promedio de peso en kilogramo entre los dos grupos evaluados,
con 95% de confiabilidad

Comprobacin de la homogeneidad de las


varianzas
Ho: Los valores de las varianzas son homogneas
Ha: Los valores de las varianzas no son homogneas
Prueba F para varianzas de dos muestras

Media
Varianza
Observaciones
Grados de libertad
F
P(F<=f) una cola
Valor crtico para F
(una cola)

Variable 1
63,4548
143,380443
25
24
4,03341757
0,00056052

Variable 2
56,8812
35,5481277
25
24

1,98375957

Dado que la probabilidad del estadstico F (0,0005) es menor que alfa


(0.05), la hiptesis nula es falsa, por tanto las varianzas no son
homogneas.

Anlisis de datos utilizando MS Excel


En el cuadro de dilogo de anlisis de datos se
selecciona la herramienta:
Prueba t para dos muestras suponiendo
varianzas desiguales de acuerdo con la prueba F

Resultado del proceso arrojado por Excel


Prueba t para dos muestras suponiendo varianzas desiguales
Variable 1
Media
Varianza
Observaciones
Diferencia hipottica de las medias
Grados de libertad

Variable 2

63,4548

56,8812

143,380443

35,54812767

25

25

0
35

Estadstico t

2,45715997

P(T<=t) una cola

0,00955177

Valor crtico de t (una cola)

1,68957246

P(T<=t) dos colas

0,01910354

Valor crtico de t (dos colas)

2,03010793

Anlisis de Resultados
Del cuadro anterior debemos observar el valor de p
P(T<=t) dos colas

0,01910354

Conclusin
Dado que el valor de P (0,01910354) es menor que el
valor de significancia ( = 0,05), entonces se rechaza la
hiptesis nula y por tanto se acepta la hiptesis alterna.

Por tanto: Si existe diferencias estadsticamente


significativa en el promedio de peso en kilogramo entre
los dos grupos evaluados, con 95% de confiabilidad

Test de Bartlett de homogeneidad para modelos


no equilibrados
En las pruebas paramtricas como la de t student y el
anlisis de varianza de Fischer se exige como requisito
previo la homogeneidad de las varianzas. Esta tcnica
es un valioso auxiliar para decidir la homogeneidad o
heterogeneidad del error estadstico.
La prueba de Ji cuadrado de Bartlett permite saber si
la discrepancia entre varianza fue dada por el azar o
por otros factores de error no deseados por el
investigador.

Ejemplo 1
Un investigador realiz un estudio para mostrar que
los niveles de ansiedad de las personas obesas que
asisten de manera constante a tratamiento para
control de peso corporal es mayor que el de los obesos
que no asisten a tratamiento.
Se desea saber si las varianzas de los grupos son
homogneas o no

Planteamiento de hiptesis
Ha: El investigador al observar los valores de las

varianzas de los dos grupos percibe que son


diferentes entre si, pero ignora si las fuentes del
error son las mismas. La hiptesis se refiere a que las
varianzas son diferentes.
Ho: Las diferencias observadas entre las varianzas se
deben al azar, por lo tanto son iguales y
probablemente la fuente de error es la misma.
Para todo valor de probabilidad igual o menor de 0,05
se acepta Ha y se rechaza Ho

Valores de las tablas

Con tratamiento Sin tratamiento


65

50

60

40

75

60

80

40

70

55

65

45

60

50

65

50

80

55

70

50

70

55

65

55

65

70

75

60

Frmula

2 1
1
1+

( ( 1))

ln 2

+1
3( 1)( )

Esta frmula vamos a resolverla por


partes, usando Excel, hasta evaluarla toda.

Pasos para solucionar el ejercicio


1.

Hallamos la varianza 2 de cada grupo de datos,


usando Excel.
=VAR(B2:B15) = 42, 99
=VAR(C2:C15) = 64,42

Pasos para solucionar el ejercicio


2. Hallamos los valores de n-1 de cada muestra donde n es el
nmero de personas de cada grupo. Estos valores pueden ser
diferentes en cada grupo.
n-1 = 14-1=13
n-1 = 14-1=13
3. Multiplicamos la varianza de cada grupo por los valores n-1
y se suman los resultados
2 (n-1) = 1396,4

4. Hallamos la sumatoria de los valores n-1


( 1) = 13 + 13 = 26

5. Dividimos la suma obtenida en el paso 3 con la suma


obtenida en el paso 4
2 ( 1)
= 53,70
1

6. Hallamos el logaritmo natural del valor obtenido en


el paso 5

ln

2 (1)
1

= ln (53,70) = 3,98

7. Multiplicamos el valor obtenido en el paso 6 por el


valor del paso 4
ln

2 (1)
1

( 1)

= 3,98 * 26 = 103,57

8. Hallamos el logaritmo natural de cada una de las


varianzas ln 2

9. Multiplicamos cada valor obtenido por sus


respectivos valores de n-1
ln 2 (n-1)
10. Sumamos los resultados obtenidos en el punto 9
( )( ) = ,

11. Efectuamos la diferencia de los valores del punto 7 con


los valores del punto 10
ln

2 ( 1)
1

( 1)

ln( 2)( 1) = 103.57 103.45

= 0,52

12. Calculamos el resultado de la frmula, donde K=2 (k es


el numero de grupos participantes en la prueba) y N es el
nmero total de participantes N=28
+1
2+1
3
1
=
=
=
= 0.038
3( 1)( ) 3(1)(28 2) 3(26) 20
13. Hallamos el valor del denominador sumando 1 al
resultado anterior 0,038+1 = 1,038

14. Hallamos la 2 de Bartlett dividiendo el valor obtenido


en el paso 11 (0,52) entre el valor obtenido en el paso 13
(1,038)

2 = 0,508

15. Hallamos el 2 de la tabla correspondiente


Grado de libertad = k-1 = 2-1 = 1
Nivel significancia = 0,05
Utilizando la tabla de valores crticos de la distribucin
JI cuadrada obtenemos que le valor 2 = 3,841

RESULTADOS
Dado que el valor de 2 obtenido en la tabla
(3,841) es mayor que el 2 calculado entonces se
rechaza la hiptesis alterna y se acepta la
hiptesis nula

Interpretacin:
Existe homogeneidad de las varianzas, es decir
aun cuando los valores de error estadstico
difieren entre si, el procedimiento seala que es
un efecto aleatorio.

DEFINICIN
Estn basadas en un modelo que especifica
condiciones generales de la distribucin de la cual fue
obtenida la muestra. En ellas se supone que las
observaciones son independientes y que la variable de
estudio es continua.
Se utilizan para probar diferentes hiptesis sobre la
poblacin que las pruebas paramtricas no pueden
hacer.
La pruebas no paramtricas pueden ser aplicados a
datos en una escala ordinal y otras pueden ser
aplicadas a datos en una escala nominal.

VENTAJAS
tiles para trabajar muestras poblacionales muy

pequeas .
Utilizan menos suposiciones acerca de los datos y
pueden ser mas relevantes a una situacin particular.
Sirven para tratar datos calificativos o categricos, es
decir aquellos que son medidos en una escala
nominal.
Son ms fciles de aprender o aplicar y su
interpretacin suele ser ms directa.

DESVENTAJAS
Con estos mtodos se tiende a perder informacin

porque los datos numricos exactos son reducidos a


una forma cualitativa.
Por lo general la prueba no paramtrica necesita

evidencia ms fuerte antes de rechazar una hiptesis


nula.

CUANDO SE UTILIZAN?
Cuando los datos puntualizan a las escalas nominal u

ordinal.
Se utiliza solo la frecuencia.
Poblaciones pequeas.
Cuando se desconocen los parmetros media, moda, etc.
Cuando los datos son independientes.
Cuando se quiere contrastar o comparar hiptesis.
Investigaciones de tipo social. (Muestras pequeas no
representativas >5).
Cuando se requiere de establecer el nivel de confianza o
significatividad en las diferencias.
Cuando la muestra es seleccionada no
probabilsticamente.

CLASIFICACIN DE LAS PRUEBAS NO


PARAMTRICAS
Para escala nominal:
Leyes de la probabilidad y prueba binomial
Prueba ji2 de Pearson para una muestra
Prueba ji2 de Pearson para dos y ms muestras
independientes
Prueba de bondad del ajuste mediante ji2
Prueba ji2 de proporciones para tres o ms muestras
independientes
Prueba de probabilidad exacta de Fischer y Yates
Prueba de McNemar para muestras dependientes
Prueba Q de Cochran para tres o ms muestras dependientes
Anlisis secuencial

Para escala ordinal:


Prueba de Kolmogorov-Smirnov para una muestra
Prueba de U Mann-Whitney para dos muestras
independientes
Prueba de Wilcoxon de rangos sealados y pares
igualados para dos muestras dependientes
Anlisis de varianza de una entrada de KruskalWallis para ms de dos muestras independientes
Anlisis de varianza de doble entrada por rangos de
Friedman para ms de dos muestras dependientes

ELECCIN DE LA PRUEBA NO PARAMTRICA

CONCEPTOS
Tabla de contingencia: Tabla donde se organizan los

datos y contiene una combinacin de columnas y filas


que generan unas casillas o celdas.
Hiptesis Nula (Ho) : Es aquella en que se afirma que las
dos variables analizadas son independientes la una de la
otra.
Hiptesis Alternativa (Ha): Es aquella en la que se
asegura que las variables analizadas son dependientes o
tienen relacin.
Frecuencia esperada (fe): Es la frecuencia con que se
espera que ocurra un suceso de acuerdo a las reglas de
probabilidades.

JI CUADRADO DE PEARSON
A travs de esta prueba se determina si dos variables
estn relacionadas o no.
Para la aplicacin de esta prueba se realiza lo
siguiente:
1. Se definen las hiptesis
2. Se hace la tabla de contingencia
3. Calculamos el Ji Cuadrado de Pearson
4. Se halla el punto crtico o valor terico
5. Establecemos la conclusin

EJEMPLO

Se realiza la siguiente conjetura:


Claribel conjetura que la perdida de la asignatura de
Estadstica en los estudiantes de la Maestra en
Informtica Educativa , est relacionada con su
desempeo en el manejo de Excel.

HIPTESIS
Ho : La prdida de la asignatura de Estadstica es

independiente del desempeo de los estudiantes en


el manejo de Excel.
Ha: La perdida de la asignatura de Estadstica no es

independiente del desempeo de los estudiantes en


el manejo de Excel.

Realizacin de tablas de contingencia


TABLA DE CONTINGENCIA CON LOS VALORES
OBSERVADOS

TABLA DE CONTINGENCIA DE LOS VALORES


ESPERADOS:
Para calcular los valores de esta tabla, aplicamos
23 22
1 =
=
= 12,05

42
Valor 1

Calculamos el Ji Cuadrado de Pearson, aplicando la


siguiente frmula:

Se obtiene:

Grado de libertad

V= (2-1) (2-1) = 1

Nivel de significancia
Es el error que se puede cometer al rechazar la hiptesis

nula siendo verdadera.

Por lo general se trabaja con un nivel de significancia de

0.05, que indica que hay una probabilidad del 0.95 de


que la hiptesis nula sea verdadera.

Usaremos para el desarrollo del ejercicio este nivel de

significancia, es decir, 0.05

Obtenemos el valor el parmetro p, de la siguiente


manera:
p = 1- nivel de significancia
p = 1- 0.05
p= 0.95

Con estos dos datos , nos vamos a la tabla de


distribucin de Ji cuadrado de Pearson y obtenemos el
valor del punto crtico.

Comparamos el valor del Ji cuadrado calculado con el valor


del punto crtico

Si el valor del Ji cuadrado calculado es menor o igual al


valor del punto critico, se acepta la hiptesis nula (Ho)
y en caso contrario se rechaza.

3,353 < 3,842


Entonces en nuestro ejemplo la hiptesis nula es
aceptada : La prdida de la asignatura de Estadstica
es independiente del desempeo de los estudiantes en
el manejo de Excel.

PRUEBA DE WILCOXON PARA MUESTRAS


DEPENDIENTES

Este modelo estadstico corresponde a un equivalente


de la prueba t de Student, pero se aplica en mediciones
en escala ordinal para muestras dependientes.
En esta prueba se comparan medianas, se trabajan
sobre rangos de orden y son menos potentes que la t
student para datos apareados.

Pasos a seguir para aplicar la prueba


Calculamos la diferencias en cada elemento de las

muestras para las dos variables a estudiar ( se eliminan


los que tengan diferencias nulas).
Ordenamos estas diferencias prescindiendo de los signos.
Asignamos un rango de orden a las mismas
Se corrigen ligaduras
Sumamos los rangos segn los signos que tengan las
diferencias y obtenemos los estimadores.
T(+)= Suma de rangos correspondientes a diferencias
positivas.
T(-)= Suma de rangos correspondientes a diferencias
negativas.
Estadstico de contraste .. T= min ( T(+) ; T(-) )

Ejemplo 1

Se desea indagar la incidencia de la alimentacin


estudiantil en una institucin educativa de la ciudad
de Riohacha en el peso de los estudiantes del grado
once. Para la cual se tom una muestra de 10
estudiantes a los cuales se les peso al inicio del ao
escolar y luego al final del mismo ao.

La informacin se organiza en la siguiente tabla:

Planteamiento de la hiptesis

Hiptesis Nula (Ho): No habr incidencia de la


alimentacin estudiantil en el peso de los estudiantes
al inicio del ao con respecto al peso de final del ao.
Hiptesis Alterna (Ha): La incidencia de la
alimentacin estudiantil en el peso de los estudiantes
al inicio del ao es menor al peso que tienen al final
del ao.
Nivel de significancia
Para todo valor menor o igual a 0.05 se acepta Ha y se
rechaza Ho.

Calculando las diferencias


en los datos tenemos:

Ordenando las diferencias


de menor a mayor
tenemos:

Asignamos rangos de orden


descartando los que tengan
diferencias nulas:

Se corrigen ligaduras:

Sumamos los rangos segn el signo que tenga la


diferencia y obtenemos:
T(+)= 42,5
T(-)= 2,5
T = min( T(+) ; T(-))= 2,5

Comparando el resultado obtenido T = min( T(+) ; T(-))= 2,5 con


n= 10 y un nivel de significancia de 0,05
Y buscando en una tabla de Wilcoxon,
vemos que:
Si el valor experimental queda dentro
del intervalo aceptamos la hiptesis
nula y si queda fuera la rechazamos.

El valor obtenido queda fuera del


Intervalo y por tanto se rechaza la Ho.

Se acepta la Ha :
La incidencia de la alimentacin estudiantil en el peso
de los estudiantes al inicio del ao es menor al peso
que tienen al final del ao.

PRUEBA DE MCNEMAR
PARA MUESTRAS DEPENDIENTES
La prueba de McNemar para muestras dependientes, se utiliza
cuando las muestras son dos y resultan dependientes. EL tipo de
escala es nominal.
Dicha prueba estadstica es un equivalente de la prueba t de
Student para muestras dependientes y slo aplicable cuando
existen dos momentos: antes y despus.
Cuando en el momento experimental hay diversos momentos de
cambio con base en uno previo, convendr utilizar la prueba Q de
Cochran. Ambos procedimientos se distribuyen igual que la ji
cuadrada, por lo que el estadstico calculado se simboliza como ji
cuadrada.

Pasos:

1. Arreglar los datos en funcin


de una tabla de contingencias
2 X 2.

La ecuacin es
la siguiente:

2.
Aplicacin de la ecuacin de
McNemar
3. Calcular los grados de libertad,
que como es obligado para este
procedimiento,
siempre sern
iguales a uno.
4. Comparar el valor estadstico
calculado para valores crticos de ji
cuadrada.
5. Decidir si se acepta o rechaza la
hiptesis.

La prueba de McNemar se utiliza para decidir si puede o no


aceptarse que determinado ''tratamiento'' induce un cambio en la
respuesta dicotmica o dicotomizada de los elementos sometidos
al mismo, y es aplicable a los diseos del tipo ''antes-despus'' en
los que cada elemento acta como su propio control.

Los resultados correspondientes a una muestra de n elementos se


disponen en una tabla de frecuencias 2 x 2 para recoger el
conjunto de las respuestas de los mismos elementos antes y
despus. El aspecto general de dicha tabla, en la que los signos +
y - se utilizan para representar las diferentes respuestas, es el
siguiente:

En las celdas de la tabla, A es el nmero de elementos cuya


respuesta es la misma, -; B es el nmero de elementos cuya
respuesta es - antes del ''tratamiento'' y + despus de ste; C
es el nmero de elementos que han cambiado de + a- ; y D es
el nmero de elementos que mantienen la respuesta +.

Por tanto, b+c es el nmero total de elementos cuyas respuestas han


cambiado, y son los nicos que intervienen en el contraste. La hiptesis
nula es que el ''tratamiento'' no induce cambios significativos en las
respuestas, es decir, los cambios observados en la muestra se deben
al azar, de forma que es igualmente probable un cambio de + a - que
un cambio de - a +. As pues, si H0 es cierta, de los b+c elementos
cuya respuesta ha cambiado es de esperar que (b+c)/2 hayan pasado
de + a -, y (b+c)/2 hayan pasado de - a +. En otras palabras, si H0 es
cierta, la frecuencia esperada en las correspondientes celdas es
(a+b)/2.
La hiptesis alternativa puede ser no direccional, cuando postula que la
probabilidad de un cambio de + a - tiene distinta probabilidad que un
cambio de - a +, o direccional, cuando predice que un cambio de - a +
es ms (o menos) probable que un cambio de + a -.

El estadstico de prueba que permite contrastar si


existen
diferencias
significativas
entre
las
frecuencias esperadas y las observadas es:

Oi= frecuencia observada en la i-sima celda


Ei = frecuencia esperada en la i-sima celda si H0
es cierta
k = nmero de celdas

Para contrastar la significacin de los cambios interesan slo las


celdas que recogen cambios, por tanto el estadstico puede
expresarse como

Si H0 es cierta, el estadstico tiene distribucin aproximadamente chicuadrado con 1 grado de libertad. La aproximacin es ms precisa si
se realiza la correccin de continuidad de Yates, quedando el
estadstico:

La hiptesis nula, de que ambos tipos de cambio son igualmente


probables, se rechaza si el valor del estadstico se encuentra en la
regin crtica.

Cuando la frecuencia esperada (b+c)/2 es pequea la


aproximacin de la distribucin del estadstico de prueba a
la chi-cuadrado no es buena y, en tal caso, el SPSS no
calcula el estadstico anterior, sino que realiza la prueba
binomial.
El contraste se plantea en este caso de la siguiente forma:
supongamos que c<b; en este caso la hiptesis nula es
que c es un valor de una variable X con
distribucin binomial de parmetros n = b + c y
=0,5. El
nivel de significacin para una prueba de dos colas es
y se rechazar H0 para niveles de significacin iguales o
superiores a ste.
Si la hiptesis alternativa es direccional el nivel de
significacin a partir del cual se rechazar H0 es la mitad
del nivel de significacin bilateral.

EJEMPLO
Un investigador en medicina preventiva observa que los
empleados en una fbrica padecen frecuentemente un cuadro
diarreico, motivo de gran ausencia. Todos los empleados comen en
el comedor de la fbrica como goce de una prestacin laboral. El
investigador supone que el comn denominador de la causa de la
diarrea es el sitio de ingestin de alimentos, es decir, existe una
higiene inadecuada en la preparacin de la comida; sin embargo,
la higiene personal de los empleados no es suficiente para atribuir
toda la culpa al personal de la cocina. Por lo tanto, elige una
muestra al azar de 50 individuos, de los cuales resulta que 34 de
ellos presentan un cuadro diarreico frecuente y 16 no lo padecen.
As, sugiere que, bajo vigilancia, se apliquen medidas de higiene
personal, consistentes en exhaustivo lavado de manos antes de
ingerir alimentos, en un perodo de dos semanas.

Al finalizar el tratamiento, obtiene los resultados


siguientes: de los 34 sujetos con un cuadro diarreico
frecuente, despus del tratamiento de lavado de manos,
16 lograron hacer desaparecer el proceso intestinal y 18
persistieron con evacuaciones diarreicas; a su vez, el
grupo de 16 personas asintomticas, cuatro de ellas
presentaron diarrea a pesar del lavado de manos y 12 se
mantuvieron en las mismas condiciones.
Eleccin de la prueba estadstica.
El modelo experimental tiene dos muestras dependientes

Planteamiento de la hiptesis.
Hiptesis alterna (Ha). El lavado de manos, como medida preventiva y factor de
higiene personal, presenta cambios significativos de enfermedad diarreica en los
empleados que asisten al comedor de la fbrica en estudio.
Hiptesis nula (Ho). Las diferencias que se observan en las frecuencias de cambio
por el lavado de manos se deben al azar.
Nivel de significacin.

Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Resultado de la contingencia 2 X 2.

Aplicacin de la prueba estadstica.

Clculo de los grados de libertad (gl).


gl = 1.
El estadstico X2 de McNemar se compara con los valores crticos de ji cuadrada.
Con un grado de libertad, se observa que 3.84 corresponde a una probabilidad de
0.05, mientras que el clculo corresponde a una probabilidad menor que 0.05.

Decisin.

En razn de que el valor de X2 calculado tiene una probabilidad menor que 0.05, cae en el
nivel de significancia, por lo tanto, se acepta Ha y se rechaza Ho.
Interpretacin.
El lavado de manos ejerci significativos cambios en la enfermedad diarreica de los
empleados de la fbrica, lo cual significa que la higiene personal deficiente contribuye de
manera notoria en la frecuencia del proceso intestinal, causa del ausentismo.
La aplicacin de la prueba estadstica no cancela la participacin de la higiene defectuosa
en la preparacin de los alimentos por parte del personal de la cocina, pues 4/16
empleados, que haban estado asintomticos y bajo exhaustivo lavado de manos antes de
comer, manifestaron diarrea; sin embargo, la prueba estadstica revela que la higiene
personal participa de manera ms significativa que el defecto en la preparacin de la
comida.

Prueba U DE MANN-WHITNEY
Es una prueba no paramtrica con la cual se
identifican diferencias entre dos poblaciones
basadas en el anlisis de dos muestras
independientes, cuyos datos han sido medidos al
menos en una escala de nivel ordinal.
La prueba calcula el llamado estadstico U, cuya
distribucin para muestras con ms de 20
observaciones se aproxima a la distribucin
normal.

Esta prueba estadstica es til cuando las mediciones


se pueden ordenar en escala ordinal (es decir,
cuando los valores tienden a una variable continua,
pero no tienen una distribucin normal) y resulta
aplicable cuando las muestras son independientes.

Este procedimiento es una buena alternativa cuando


no se puede utilizar la prueba t de Student, en razn
de no cumplir con los requisitos que esta prueba
exige.

La frmula es la siguiente:

+
+

= +

Donde:
U1 y U2 = valores estadsticos de U Mann-Whitney.
n1 = tamao de la muestra del grupo 1.
n2 = tamao de la muestra del grupo 2.
R1 = sumatoria de los rangos del grupo 1.
R2 = sumatoria de los rangos del grupo 2.

PASOS

Determinar el tamao de las muestras (n1 y n2). Si n1 y n2 son

menores que 20, se consideran muestras pequeas, pero si son


mayores que 20, se consideran muestras grandes.
Arreglar los datos en rangos del menor al mayor valor. En caso de
que existan ligas o empates de rangos iguales, se debern detectar
para un ajuste posterior.
Calcular los valores de U1 y U2, de modo que se elija el ms
pequeo para comparar con los crticos de U Mann-Whitney de la
tabla de probabilidades asociadas con valores pequeos como los
de U en la prueba de Mann-Whitney.
En caso de muestras grandes, calcular el valor Z, pues en estas
condiciones se distribuye normalmente.
Decidir si se acepta o rechaza la hiptesis.

Ejemplo para muestras pequeas:

Un experimentador utiliza dos mtodos para ensear a leer a un grupo de


10 nios de 6 aos, quienes ingresan por primera vez a la escuela. El
experimentador quiere demostrar que el procedimiento ideado por l es
ms efectivo que el tradicional; para ello, mide el desempeo en la lectura
en funcin de la fluidez, comprensin, anlisis y sntesis.
El plan experimental preliminar consiste en elegir al azar tanto una
muestra de 10 nios como el mtodo por utilizar.
Eleccin de la prueba estadstica.
El modelo experimental tiene dos muestras independientes. Las
mediciones revelan que no se satisfacen los requisitos para utilizar una
media aritmtica, en razn de que uno de los valores en cada muestra se
aleja demasiado de las dems; por lo tanto, no corresponde a una escala de
intervalo, de manera que se decide usar una escala ordinal.

Planteamiento de la hiptesis.
Hiptesis alterna (Ha). Las calificaciones de ejecucin de lectura, segn el
mtodo de enseanza del experimentador son ms altas y diferentes que las
observadas en el mtodo tradicional.
Hiptesis nula (Ho). Las diferencias observadas entre las calificaciones de
ejecucin de lectura mediante los dos mtodos se deben al azar.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se
rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza
Ha.

DOS MTODOS DIFERENTES APLICADOS A DOS


GRUPOS DE NIOS.
Metodo aplicado
Tradicional

80 85

Inventado por el investigador

95

25

100 93

70

90

110

45

Aplicacin de la prueba estadstica.


Se ordenan los valores en forma conjunta
25

45

70

80

85

90

93

95

100

110

Se asigna un rango de orden a cada valor


25

45

70

80

85

90

93

95

100

110

10

Asignamos valores
Se corrigen las ligaduras

(Se aplica en caso de encontrarse calificaciones repetidas)


Se organiza la informacin, teniendo en cuenta el valor
asignado a cada nmero en la tabla anterior
Por ejemplo, el valor asignado a la calificacin 90 es el 6
Metodo Aplicado

NOTA OBTENIDAS

Grupo 1
Tradicional

80
(4)

85
(5)

25
(1)

70
(3)

90
(6)

R 1=19

Grupo 2
Inventado por el
investigador

95
(8)

100
(9)

93
(7)

110
(10)

45
(2)

R 2=36

Calculamos los valores de U

= +

1 = 5 5 +

5 5+1
2

= +

19 = 25 + 15 19 =19

5 5+1
2 = 5 5 +
36 = 4
2

Calculamos los valores de U


De los dos valores de U calculados, se elige el ms pequeo (4) y
se comparan con los valores crticos de U Mann-Whitney, de la
tabla de probabilidades asociadas con valores pequeos como los
de U en la prueba de Mann-Whitney.
Estas tablas puede encontrarse en:
http://es.slideshare.net/rserrato7/tablas-de-probabilidad.
Pag 32,33 y 34.
En caso de que el valor de U calculado no se localice en las tablas
correspondientes, se transformar en la frmula siguiente:
U = n1n2 - U
En esta frmula, U' corresponde al valor ms alto.

Probabilidad del valor de U


El valor de la columna U que es 4 se intersecta con el

valor de la columna 5, en donde n2=5, obtenindose


el valor 0.0048

Decisin.

A la probabilidad del valor U de Mann-Whitney, calculado


anteriormente, corresponde 0.048, el cual es ms pequeo
que el nivel de significancia; por lo tanto, se acepta Ha y se
rechaza Ho.
Interpretacin.

Entre las calificaciones de la ejecucin de lectura


mediante los dos mtodos de enseanza existe una
diferencia significativa a un nivel de probabilidad de
error menor que 0.05; es decir, aun cuando las muestras
son pequeas, las calificaciones ms altas mediante el
mtodo diseado por el experimentador sealan ms
efectividad, con la probabilidad de equivocarse de 0.048
para aceptarlo.

CONCLUSIN
Al realizar un recorrido y desarrollar algunas de las
pruebas paramtricas y no paramtricas, permiti
comprender los diferentes procedimientos que se
deben aplicar a cada una de ellas. Se pudo mirar de
manera clara y sencilla, los momentos y situaciones
en los cuales se pueden utilizar estas pruebas, con el
propsito de obtener unos resultados estadsticos.

BIBLIOGRAFIA
https://www.youtube.com/watch?v=xFafiUGrvtA
https://www.youtube.com/watch?v=UQmiVsU7AeY
File:///C:/Users/usuario/Documents/Pruebas%20param%C3%A9tricas
%20Mary%20y%20Lina.html
http://www.raydesign.com.mx/psicoparaest/index.php?option=com_content&view=arti
cle&id=230:descripcionpara&catid=52:pruebaspara&Itemid=61
https://bay175.mail.live.com/mail/ViewOfficePreview.aspx?messageid=
mgzJpa-apZ5RG5egAiZMIGSA2&folderid=flinbox&attindex=0&cp

EJERCICIO 1
1.

Un investigador realiz un estudio para mostrar que


existe una diferencia estadsticamente significativa en
el promedio de edad con relacin al sexo de los
individuos.
El grupo de estudio tiene las siguientes edades
SEXO

EDAD

Masculino

37

37

35

26 59

Femenino

40 29 23

25

15

33

20 54

30 39 27

52

44

26 32

Es necesario determinar si las varianzas son homogneas


utilizando el Test de Bartlett.

EJERCICIO 2
En una universidad se estudiaron los archivos de enfermera
obtenindose los siguientes resultados:
Variable: Aparicin de lcera
Variable:
Sexo

lcera

No lcera

Hombre

10

282

Mujer

24

168

Total

Total

Aplique el Test de Ji cuadrado de Pearson para establecer si


existe o no relacin entre la aparicin de lceras y el sexo del
estudiante.
El nivel de significacin es del 0.05

EJERCICIO 3
Supongamos que se lee en una publicacin que el
consumo de carne en dos ciudades difiere
significativamente. Para contrastar si hay diferencias se
anota el consumo en kg durante un periodo determinado
en una muestra de 10 Vallenatos y otra de 5 Riohacheros,
encontrndose los siguientes resultados:
Halle el valor de U utilizando el Test de Mann-Whithney
Consumo de carne en Kg
Vallenatos

16 11

14 21 18 34 22 7

Riohacheros

12 17

10 15

13 24

GRACIAS

S-ar putea să vă placă și