Documente Academic
Documente Profesional
Documente Cultură
INTRODUCCIN
Al obtener uno datos estadsticos, se hace necesario aplicar algunas
pruebas o mtodos, que ayuden conseguir unos resultados, es por esto
que en esta oportunidad se presentan y estudian de manera detallada las
pruebas estadsticas paramtrica y no paramtricas.
Las pruebas anteriormente mencionadas permiten obtener uno datos
sobre un evento o situacin especifica, que darn las bases para obtener
unos resultados, los cuales sern aplicados, segn el tipo de investigacin
que se est desarrollando. En este trabajo se analizarn algunas pruebas
estadsticas, tales como, Prueba del valor z de la distribucin normal,
Prueba t de Student para datos no relacionados (independientes), Prueba
ji2 de Pearson para dos y ms muestras independientes, Prueba de
McNemar para muestras dependientes, Prueba de U Mann-Whitney para
dos muestras independientes, Prueba de Wilcoxon de rangos sealados y
pares igualados para dos muestras dependientes.
CONCEPTOS BSICOS
Hiptesis estadstica : Es una proposicin o
EJEMPLOS DE AS HIPOTESIS
CONTRASTE DE HIPTESIS
Es un procedimiento para juzgar si una propiedad
que se supone en una poblacin es compatible con lo
observado en una muestra de dicha poblacin.
Mediante esta teora, se aborda el problema
estadstico
considerando
una
hiptesis
determinada y una hiptesis alternativa , y se
intenta dirimir cul de las dos es la hiptesis
verdadera, tras aplicar el problema estadstico a un
cierto nmero de experimentos.
Tipo 1
Se rechaza la hiptesis
nula H0 cuando es cierta
1.
Tipo 2
Se acepta la hiptesis nula
Ho, cuando es falsa
PARAMTROS
DEFINICIN
La Pruebas Paramtricas, son aquellas en las cuales su
clculo implica una estimacin de parmetros de la
poblacin con base en muestras estadsticas.
Ventajas:
1. Mas poder de eficiencia
2. Mas sensible a los rasgos de los datos recolectados
3. Menos probabilidades de errores
Desventajas:
1. Ms complicadas de calcular
2. Limitaciones en los tipos de datos que se pueden
calcular
2.
3.
4.
5.
6.
Ejercicio 1
Un fabricante ofrece bateras que tienen una duracin
promedio de 4000 horas. Un comprador adquiere 36
pilas y encuentra que la duracin promedio es 3600
horas. El comprador piensa que fue engaado pues la
duracin de la pila fue inferior a la ofrecida por el
fabricante.
La desviacin tpica de estas pilas es 985 horas
A nivel del 5% se quiere saber si el fabricante est
ofreciendo un producto de menor calidad.
(Hiptesis nula)
(Hiptesis alternativa)
( = 0,05)
3. Se busca el valor de Z
Frmula utilizada:
Datos:
S = 985
n=36
= 3600
36004000
985
36
= 2,43
Para pruebas de un
extremo
Para pruebas de dos
extremos
1%
(0,01)
5%
(0,05)
10%
(0,1)
2,33
1,645
1,28
-2,33
-1,645
-1,28
2,58
1,96
1,645
-2,58
-1,96
- 1,645
Zona de aceptacin
Zona de
rechazo
-1,645
Zona de aceptacin
Zona de
rechazo
-2,43
-1,645
RESULTADOS
Ejercicio 2
Una mquina est programada para empacar
en promedio bolsas de 16 onzas de caf. Se
toman muestras aleatorias de 36 paquetes
resultando una media de 14,4 onzas y una
desviacin tpica de 5,3 onzas.
Al nivel del 1% podra afirmar que la
empresa no est cumpliendo con lo indicado
en el paquete.
(Hiptesis nula)
(Hiptesis alternativa)
( = 0,1)
3. Se busca el valor de Z
Frmula utilizada:
Datos:
S = 5,3 onzas
n= 36 paquetes
= 14,4
14,416
5,3
36
= 1,81
Para pruebas de un
extremo
Para pruebas de dos
extremos
1%
(0,01)
5%
(0,05)
10%
(0,1)
2,33
1,645
1,28
-2,33
-1,645
-1,28
2,58
1,96
1,645
-2,58
-1,96
- 1,645
Zona de aceptacin
Zona de
rechazo
-1,645
-2,58
2,58
RESULTADOS
Ejemplo 1
Dado el conjunto de varianzas debe
determinarse utilizando Estadstico F de
Snedecor
debe
establecerse
la
homogeneidad de las varianzas de las
muestras.
Ho: Los valores de las varianzas son
homogneas
Ha: Los valores de las varianzas no son
homogneas
M1
43
29
48
41
44
30
45
M6
34
35
42
37
42
30
33
27
23
49
46
35
42
38
35
35
36
30
39
34
48
27
34
36
36
29
22
37
46
43
41
33
28
29
26
40
32
38
44
21
47
36
39
Resultados obtenidos
Prueba F para varianzas de dos muestras
Variable 1
Variable 2
Media
Varianza
Observaciones
37,2
52,16666667
25
35,36
50,40666667
25
Grados de libertad
F
P(F<=f) una cola
24
1,034916016
0,466848543
24
1,983759568
Prueba t de student
En estadstica, es cualquier prueba en la que el
estadstico utilizado tiene una distribucin t de
Student.
Se aplica cuando la poblacin estudiada sigue una
distribucin normal pero el tamao nuestra es
demasiado pequeo (n<30) como para que el
estadstico en el que est basada la inferencia est
normalmente distribuido, utilizndose una estimacin
de la desviacin tpica en lugar del valor real.
Ejemplo I
Un grupo de 10 mujeres se sometieron a una dieta para bajar
de peso. Se registr sus pesos en libras antes y despus de
terminada la dieta, los resultados se presentan en la siguiente
tabla
Antes
137
Despus
132
130
124
138
149
140
168
152
121
126
130
147
141
159
147
Media
Varianza
Observaciones
Coeficiente de correlacin de
Pearson
Diferencia hipottica de las
medias
Grados de libertad
Estadstico t
P(T<=t) una cola
Valor crtico de t (una cola)
P(T<=t) dos colas
Valor crtico de t (dos colas)
Variable 1
Variable 2
142,25
137,875
191,0714286 163,553571
8
8
0,949739123
0
7
2,8509581
0,012327298
1,894578605
0,024654596
2,364624252
Anlisis de Resultados
Del cuadro anterior debemos observar el valor de p
P(T<=t) dos colas
0,024654596
Ejemplo 1
Tenemos dos grupos: un grupo de sexo
masculino y un grupo de sexo femenino con 25
sujetos cada uno existe estadsticamente
diferencias entre el promedio de edad en
cuanto al sexo?
Ho:
masculino
femenino
37
33
37
37
26
59
20
54
52
44
61
35
62
17
55
16
53
46
37
20
25
57
17
25
53
40
19
23
15
11
30
39
27
26
12
32
31
29
19
39
40
32
49
45
35
35
28
19
18
35
39,12
25,00
Varianza agrupada
171,03
Grados de libertad
Estadstico t
P(T<=t) una cola
0,00
48,00
2,70
0,00473111
1,6772242
0,009462
29,12
237,53 104,526667
Observaciones
Diferencia hipottica de las medias
Variable 2
2,01063476
25
Anlisis de Resultados
Del cuadro anterior debemos observar el valor de p
P(T<=t) dos colas
0,009462
Conclusin
Dado que el valor de P (0,009462) es menor que el valor
Ejemplo 1
Masculino Femenino
76,82
63,24
66,36
64,64
70,45
66,82
49,55
51,98
46,82
60,91
76,82
51,82
73,64
60,91
71,82
50,91
60
51,45
49,55
54,87
42,27
61,23
64,09
58,24
60,45
45,45
64,09
59,04
71,36
57,73
75,91
55,91
67,73
61,82
46,36
59,09
57,73
62,27
68,64
54,09
79,09
66,82
75,91
46,82
76,36
52,15
42,73
50,07
51,82
53,75
Media
Varianza
Observaciones
Grados de libertad
F
P(F<=f) una cola
Valor crtico para F
(una cola)
Variable 1
63,4548
143,380443
25
24
4,03341757
0,00056052
Variable 2
56,8812
35,5481277
25
24
1,98375957
Variable 2
63,4548
56,8812
143,380443
35,54812767
25
25
0
35
Estadstico t
2,45715997
0,00955177
1,68957246
0,01910354
2,03010793
Anlisis de Resultados
Del cuadro anterior debemos observar el valor de p
P(T<=t) dos colas
0,01910354
Conclusin
Dado que el valor de P (0,01910354) es menor que el
valor de significancia ( = 0,05), entonces se rechaza la
hiptesis nula y por tanto se acepta la hiptesis alterna.
Ejemplo 1
Un investigador realiz un estudio para mostrar que
los niveles de ansiedad de las personas obesas que
asisten de manera constante a tratamiento para
control de peso corporal es mayor que el de los obesos
que no asisten a tratamiento.
Se desea saber si las varianzas de los grupos son
homogneas o no
Planteamiento de hiptesis
Ha: El investigador al observar los valores de las
50
60
40
75
60
80
40
70
55
65
45
60
50
65
50
80
55
70
50
70
55
65
55
65
70
75
60
Frmula
2 1
1
1+
( ( 1))
ln 2
+1
3( 1)( )
ln
2 (1)
1
= ln (53,70) = 3,98
2 (1)
1
( 1)
= 3,98 * 26 = 103,57
2 ( 1)
1
( 1)
= 0,52
2 = 0,508
RESULTADOS
Dado que el valor de 2 obtenido en la tabla
(3,841) es mayor que el 2 calculado entonces se
rechaza la hiptesis alterna y se acepta la
hiptesis nula
Interpretacin:
Existe homogeneidad de las varianzas, es decir
aun cuando los valores de error estadstico
difieren entre si, el procedimiento seala que es
un efecto aleatorio.
DEFINICIN
Estn basadas en un modelo que especifica
condiciones generales de la distribucin de la cual fue
obtenida la muestra. En ellas se supone que las
observaciones son independientes y que la variable de
estudio es continua.
Se utilizan para probar diferentes hiptesis sobre la
poblacin que las pruebas paramtricas no pueden
hacer.
La pruebas no paramtricas pueden ser aplicados a
datos en una escala ordinal y otras pueden ser
aplicadas a datos en una escala nominal.
VENTAJAS
tiles para trabajar muestras poblacionales muy
pequeas .
Utilizan menos suposiciones acerca de los datos y
pueden ser mas relevantes a una situacin particular.
Sirven para tratar datos calificativos o categricos, es
decir aquellos que son medidos en una escala
nominal.
Son ms fciles de aprender o aplicar y su
interpretacin suele ser ms directa.
DESVENTAJAS
Con estos mtodos se tiende a perder informacin
CUANDO SE UTILIZAN?
Cuando los datos puntualizan a las escalas nominal u
ordinal.
Se utiliza solo la frecuencia.
Poblaciones pequeas.
Cuando se desconocen los parmetros media, moda, etc.
Cuando los datos son independientes.
Cuando se quiere contrastar o comparar hiptesis.
Investigaciones de tipo social. (Muestras pequeas no
representativas >5).
Cuando se requiere de establecer el nivel de confianza o
significatividad en las diferencias.
Cuando la muestra es seleccionada no
probabilsticamente.
CONCEPTOS
Tabla de contingencia: Tabla donde se organizan los
JI CUADRADO DE PEARSON
A travs de esta prueba se determina si dos variables
estn relacionadas o no.
Para la aplicacin de esta prueba se realiza lo
siguiente:
1. Se definen las hiptesis
2. Se hace la tabla de contingencia
3. Calculamos el Ji Cuadrado de Pearson
4. Se halla el punto crtico o valor terico
5. Establecemos la conclusin
EJEMPLO
HIPTESIS
Ho : La prdida de la asignatura de Estadstica es
42
Valor 1
Se obtiene:
Grado de libertad
V= (2-1) (2-1) = 1
Nivel de significancia
Es el error que se puede cometer al rechazar la hiptesis
Ejemplo 1
Planteamiento de la hiptesis
Se corrigen ligaduras:
Se acepta la Ha :
La incidencia de la alimentacin estudiantil en el peso
de los estudiantes al inicio del ao es menor al peso
que tienen al final del ao.
PRUEBA DE MCNEMAR
PARA MUESTRAS DEPENDIENTES
La prueba de McNemar para muestras dependientes, se utiliza
cuando las muestras son dos y resultan dependientes. EL tipo de
escala es nominal.
Dicha prueba estadstica es un equivalente de la prueba t de
Student para muestras dependientes y slo aplicable cuando
existen dos momentos: antes y despus.
Cuando en el momento experimental hay diversos momentos de
cambio con base en uno previo, convendr utilizar la prueba Q de
Cochran. Ambos procedimientos se distribuyen igual que la ji
cuadrada, por lo que el estadstico calculado se simboliza como ji
cuadrada.
Pasos:
La ecuacin es
la siguiente:
2.
Aplicacin de la ecuacin de
McNemar
3. Calcular los grados de libertad,
que como es obligado para este
procedimiento,
siempre sern
iguales a uno.
4. Comparar el valor estadstico
calculado para valores crticos de ji
cuadrada.
5. Decidir si se acepta o rechaza la
hiptesis.
Si H0 es cierta, el estadstico tiene distribucin aproximadamente chicuadrado con 1 grado de libertad. La aproximacin es ms precisa si
se realiza la correccin de continuidad de Yates, quedando el
estadstico:
EJEMPLO
Un investigador en medicina preventiva observa que los
empleados en una fbrica padecen frecuentemente un cuadro
diarreico, motivo de gran ausencia. Todos los empleados comen en
el comedor de la fbrica como goce de una prestacin laboral. El
investigador supone que el comn denominador de la causa de la
diarrea es el sitio de ingestin de alimentos, es decir, existe una
higiene inadecuada en la preparacin de la comida; sin embargo,
la higiene personal de los empleados no es suficiente para atribuir
toda la culpa al personal de la cocina. Por lo tanto, elige una
muestra al azar de 50 individuos, de los cuales resulta que 34 de
ellos presentan un cuadro diarreico frecuente y 16 no lo padecen.
As, sugiere que, bajo vigilancia, se apliquen medidas de higiene
personal, consistentes en exhaustivo lavado de manos antes de
ingerir alimentos, en un perodo de dos semanas.
Planteamiento de la hiptesis.
Hiptesis alterna (Ha). El lavado de manos, como medida preventiva y factor de
higiene personal, presenta cambios significativos de enfermedad diarreica en los
empleados que asisten al comedor de la fbrica en estudio.
Hiptesis nula (Ho). Las diferencias que se observan en las frecuencias de cambio
por el lavado de manos se deben al azar.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Resultado de la contingencia 2 X 2.
Decisin.
En razn de que el valor de X2 calculado tiene una probabilidad menor que 0.05, cae en el
nivel de significancia, por lo tanto, se acepta Ha y se rechaza Ho.
Interpretacin.
El lavado de manos ejerci significativos cambios en la enfermedad diarreica de los
empleados de la fbrica, lo cual significa que la higiene personal deficiente contribuye de
manera notoria en la frecuencia del proceso intestinal, causa del ausentismo.
La aplicacin de la prueba estadstica no cancela la participacin de la higiene defectuosa
en la preparacin de los alimentos por parte del personal de la cocina, pues 4/16
empleados, que haban estado asintomticos y bajo exhaustivo lavado de manos antes de
comer, manifestaron diarrea; sin embargo, la prueba estadstica revela que la higiene
personal participa de manera ms significativa que el defecto en la preparacin de la
comida.
Prueba U DE MANN-WHITNEY
Es una prueba no paramtrica con la cual se
identifican diferencias entre dos poblaciones
basadas en el anlisis de dos muestras
independientes, cuyos datos han sido medidos al
menos en una escala de nivel ordinal.
La prueba calcula el llamado estadstico U, cuya
distribucin para muestras con ms de 20
observaciones se aproxima a la distribucin
normal.
La frmula es la siguiente:
+
+
= +
Donde:
U1 y U2 = valores estadsticos de U Mann-Whitney.
n1 = tamao de la muestra del grupo 1.
n2 = tamao de la muestra del grupo 2.
R1 = sumatoria de los rangos del grupo 1.
R2 = sumatoria de los rangos del grupo 2.
PASOS
Planteamiento de la hiptesis.
Hiptesis alterna (Ha). Las calificaciones de ejecucin de lectura, segn el
mtodo de enseanza del experimentador son ms altas y diferentes que las
observadas en el mtodo tradicional.
Hiptesis nula (Ho). Las diferencias observadas entre las calificaciones de
ejecucin de lectura mediante los dos mtodos se deben al azar.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se
rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza
Ha.
80 85
95
25
100 93
70
90
110
45
45
70
80
85
90
93
95
100
110
45
70
80
85
90
93
95
100
110
10
Asignamos valores
Se corrigen las ligaduras
NOTA OBTENIDAS
Grupo 1
Tradicional
80
(4)
85
(5)
25
(1)
70
(3)
90
(6)
R 1=19
Grupo 2
Inventado por el
investigador
95
(8)
100
(9)
93
(7)
110
(10)
45
(2)
R 2=36
= +
1 = 5 5 +
5 5+1
2
= +
19 = 25 + 15 19 =19
5 5+1
2 = 5 5 +
36 = 4
2
Decisin.
CONCLUSIN
Al realizar un recorrido y desarrollar algunas de las
pruebas paramtricas y no paramtricas, permiti
comprender los diferentes procedimientos que se
deben aplicar a cada una de ellas. Se pudo mirar de
manera clara y sencilla, los momentos y situaciones
en los cuales se pueden utilizar estas pruebas, con el
propsito de obtener unos resultados estadsticos.
BIBLIOGRAFIA
https://www.youtube.com/watch?v=xFafiUGrvtA
https://www.youtube.com/watch?v=UQmiVsU7AeY
File:///C:/Users/usuario/Documents/Pruebas%20param%C3%A9tricas
%20Mary%20y%20Lina.html
http://www.raydesign.com.mx/psicoparaest/index.php?option=com_content&view=arti
cle&id=230:descripcionpara&catid=52:pruebaspara&Itemid=61
https://bay175.mail.live.com/mail/ViewOfficePreview.aspx?messageid=
mgzJpa-apZ5RG5egAiZMIGSA2&folderid=flinbox&attindex=0&cp
EJERCICIO 1
1.
EDAD
Masculino
37
37
35
26 59
Femenino
40 29 23
25
15
33
20 54
30 39 27
52
44
26 32
EJERCICIO 2
En una universidad se estudiaron los archivos de enfermera
obtenindose los siguientes resultados:
Variable: Aparicin de lcera
Variable:
Sexo
lcera
No lcera
Hombre
10
282
Mujer
24
168
Total
Total
EJERCICIO 3
Supongamos que se lee en una publicacin que el
consumo de carne en dos ciudades difiere
significativamente. Para contrastar si hay diferencias se
anota el consumo en kg durante un periodo determinado
en una muestra de 10 Vallenatos y otra de 5 Riohacheros,
encontrndose los siguientes resultados:
Halle el valor de U utilizando el Test de Mann-Whithney
Consumo de carne en Kg
Vallenatos
16 11
14 21 18 34 22 7
Riohacheros
12 17
10 15
13 24
GRACIAS