Sunteți pe pagina 1din 19

UNIVERSIDAD TÉCNICA DE MACHALA

FACULTAD DE CIENCIAS SOCIALES


CARRERA DE PSICOLOGÍA CLÍNICA
MÉTODOS ESTADÍSTICOS II

PRUEBA DE HIPÓTESIS

En un estudio estadístico por lo general se busca responder con cierta confianza ciertas preguntas y/o
tomar decisiones. En este contexto, la persona que hace el estudio puede tener a priori ciertas
creencias o hipótesis que desea comprobar. Por ejemplo:

• Los dos proveedores del material x tienen el mismo nivel de calidad.


• El porcentaje de cierto ingrediente afecta el resultado de la mezcla.
• El tiempo de espera de esta operación es de tres horas en promedio.
• La variación del proceso se redujo con los cambios realizados.

Una prueba de hipótesis (o prueba de significancia) es un procedimiento para probar una hipótesis
sobre una propiedad de una población.

A continuación se presenta el procedimiento para el desarrollo de una prueba de hipótesis:

• Planteamiento de una hipótesis estadística


• Establecimiento del nivel de significancia de la prueba
• Selección y ejecución de la prueba estadística
• Lectura del p-valor
• Toma de la decisión
• Redacción de la conclusión

A continuación se describen estos pasos:

1. PLANTEAMIENTO DE UNA HIPÓTESIS ESTADÍSTICA

Una Hipótesis estadística es una afirmación sobre los valores de los parámetros de una
población o proceso, que puede probarse a partir de la información contenida en una muestra
representativa que se obtiene de la población. Por ejemplo, la afirmación “este proceso produce
menos de 8% de defectuosos” se puede plantear estadísticamente, en términos de la proporción p
desconocida de artículos defectuosos que genera el proceso:

H0: p = 0.08 (la proporción de defectuosos es 0.08)


H1: p < 0.08 (la proporción es menor a 0.08)

A la expresión H0: p = 0.08 se le conoce como hipótesis nula y H1: p < 0.08 se le llama hipótesis
alternativa.

La hipótesis nula (H0) es una afirmación de que el valor de un parámetro poblacional (proporción,
media o desviación estándar) es igual a algún valor declarado y que se considera válida para
desarrollar el procedimiento de prueba. La forma simbólica de la hipótesis nula debe utilizar =,
aunque en ocasiones también se utilizan los operadores menor o igual a (≤) o mayor o igual a (≥).

1
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
El término nulo se usa para indicar que no hay cambio, o que no hay efecto o no hay diferencia. La
prueba de hipótesis se realiza suponiendo que el parámetro es igual a un valor específico.

La hipótesis alternativa (H1, Ha o HA) es una afirmación de que el parámetro tiene un valor que
difiere en alguna forma de la hipótesis nula y que se aceptará sólo si los datos muestrales proporcionan
evidencia de que la hipótesis nula es falsa. La forma simbólica de la hipótesis alternativa debe usar
uno de los siguientes símbolos: <, >, ≠. Esta es la hipótesis que se quiere comprobar, es la hipótesis
del investigador.

En general, la estrategia a seguir para probar una hipótesis consiste en suponer que la hipótesis nula
es verdadera, y que en caso de ser rechazada por la evidencia que aportan los datos, se estará
aceptando la hipótesis alternativa. El investigador que utilice una prueba de hipótesis para respaldar
su afirmación, debe redactarla de modo que se convierta en la hipótesis alternativa, y se pueda
expresar utilizando sólo los símbolos <, > o ≠. No puede sostener una afirmación de un parámetro
que signifique igualdad (=) a un valor específico.

En el ejemplo de las proporciones, la afirmación que se desea probar (la proporción es menor a 0.08)
se aceptará como cierta sólo en caso de rechazar la hipótesis nula (la proporción de defectuosos es
0.08).

Ahora supongamos que la afirmación a probar es “este proceso produce 8% de defectuosos”. Observe
que la afirmación señala que su falsedad se da tanto si se observan menos de 8% de defectuosos como
si se observan más de 8% de defectuosos. En este sentido, el planteamiento estadístico debe ser:

H0: p = 0.08 (la proporción de defectuosos es 0.08)


H1: p ≠ 0.08 (la proporción diferente a 0.08)

Este primer paso de las pruebas de hipótesis (PH) termina con la representación matemática de las
hipótesis. A continuación se presenta tres ejemplos de hipótesis de investigación con sus respectivas
hipótesis estadísticas.

Ejemplo 1

Hipótesis de investigación: Un investigador tiene la hipótesis de que el rendimiento medio (t/ha) de


la variedad de soya INIAP-310 en la granja Santa Inés de la UTMACH es mayor a 2,5 t/ha. Observe
que en esta investigación interviene un solo grupo de estudio.

Hipótesis estadísticas:

H0: El rendimiento medio de la variedad de soya INIAP-310 es menor o igual a 2,5 t/ha.
H0: μ ≤ 2,5 t/ha

H1: El rendimiento medio de la variedad de soya INIAP-310 es mayor a 2,5 t/ha.


H1: μ > 2,5 t/ha

Ejemplo 2

Hipótesis de investigación: Un investigador tiene la hipótesis de que, el rendimiento académico


expresado en el promedio de calificaciones de los estudiantes de la Facultad de Ingeniería Civil es
inferior al de la Facultad de Ciencias Sociales. Observe que en esta investigación intervienen dos
grupos de estudio: las calificaciones de la FIC y de la FCS.

2
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
Hipótesis estadísticas:

H0: El rendimiento académico de los estudiantes de la FIC es mayor o igual que el de la FCS.
H0: μ1 ≥ μ2

H1: El rendimiento académico de los estudiantes de la FIC es menor que el de la FCS.


H1: μ1 < μ2

Ejemplo 3

Hipótesis de investigación: Un investigador plantea que, el tiempo que demoran los estudiantes de
la UTMACH en graduarse después de haber aprobado todas las asignaturas del pensum académico
se encuentra influenciado por la modalidad de graduación (trabajo de titulación, examen complexivo,
publicaciones en revistas indexadas), por lo tanto cada modalidad tiene diferente tiempo de
graduación. Observe que en esta investigación intervienen más de dos grupos de estudio: las tres
modalidades de graduación.

Hipótesis estadísticas:

H0: El tiempo de graduación por trabajo de titulación es igual que el de examen complexivo
y que el de publicación en revistas indexadas.
H0: μ1 = μ2 = μ3 = μ

H1: El tiempo de graduación de por lo menos una modalidad de graduación es distinto de los
demás.
H1: μi ≠ μ

Probar una hipótesis consiste en investigar, con base en la evidencia contenida en una muestra
seleccionada de manera adecuada, si lo afirmado por la hipótesis nula es verdad o no, y en caso de
ser falso, se toma como verdadera la alternativa HA. La estrategia para probar la hipótesis parte del
supuesto de que H0 es verdadera, y si los resultados de la investigación contradicen en forma
suficiente dicho supuesto, entonces se rechaza H0 y se “acepta” la hipótesis alternativa. En caso de
que los resultados de la investigación no demuestren claramente la falsedad de H0, ésta no se rechaza.
Es decir, la hipótesis nula es verdadera mientras no se demuestre lo contrario.

2. ESTABLECIMIENTO DEL NIVEL DE SIGNIFICACIA DE LA PRUEBA

El nivel de significancia estadística equivale a la máxima cantidad (magnitud) de error que el


investigador está dispuesto a aceptar para dar por válida la hipótesis planteada. Se denota por la letra
del alfabeto griego Alfa (α). El complemento del nivel de significancia se denomina “nivel de
confiabilidad”.

El nivel de significancia α para una prueba de hipótesis es el valor de probabilidad utilizado como
punto de corte para determinar cuándo la evidencia muestral es suficientemente significativa contra
la hipótesis nula. Las opciones típicas para α son 0.05, 0.01 y 0.10; siendo 0.05 la más común.

Por su naturaleza, el nivel de significancia α es la probabilidad de rechazar erróneamente la hipótesis


nula cuando es verdadera:

3
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
Nivel de significancia α = P (rechazar H0 cuando es verdadera)

Cuando se prueba una hipótesis nula, llegamos a la conclusión de rechazarla o no rechazarla. Nuestras
conclusiones a veces son correctas y en ocasiones son incorrectas, incluso si aplicamos todos los
procedimientos de manera adecuada, hay una probabilidad de asumir una conclusión equivocada. En
la selección del nivel de significancia (α) se aplican los conceptos relacionados con dos tipos de
errores y los distinguimos llamándolos errores tipo I y tipo II.

Error tipo I: Es el error de rechazar la hipótesis nula cuando en realidad es verdadera. El símbolo α
(alfa) se usa para representar la probabilidad de un error tipo I.

Error tipo I: α = P(rechazar H0 cuando H0 es verdadera)

Error tipo II: Es el error de no rechazar la hipótesis nula cuando en realidad es falsa. El símbolo β
(beta) se usa para representar la probabilidad de un error tipo II.

Error tipo II: β = P(No rechazar H0 cuando H0 es falsa)

LA HIPÓTESIS NULA ES LA HIPÓTESIS NULA ES


CONCLUSIÓN PRELIMINAR
VERDADERA FALSA
Rechazar H0 Error tipo I: Decisión correcta
Rechazar H0 verdadera
P(error tipo I) = α
No se rechaza H0 Decisión correcta Error tipo II:
No rechazar H0 falsa.
P(error tipo II) = β

SUGERENCIA MNEMOTÉCNICA PARA ERRORES TIPO I Y TIPO II

Recuerde las palabas “Renueva” y “Nora no fue”, use las consonantes de esas palabras para
recordar que un error tipo I es RNV: Rechazar Nula Verdadera (hipótesis), y un error tipo II es
NRNF: No Rechazar Nula Falsa (hipótesis).

Recomendaciones:

• Si las consecuencias del Error tipo I no son muy severas, seleccione el mayor α que pueda tolerar.
• Si las consecuencias del Error tipo I son muy severas seleccione valores más pequeños de α.
• Las opciones típicas para α son 0.05, 0.01 y 0.10; siendo 0.05 la más común.
• Utilice un tamaño de muestra n tan grande como sea razonable, con base en consideraciones de
tiempo, costo y otros factores relevante.

3. SELECCIÓN Y APLICACIÓN DE LA PRUEBA ESTADÍSTICA

Como parte del análisis global de los datos debe incluirse el análisis descriptivo de los datos, es
necesario que los investigadores resuman cada una de las variables estudiadas en medidas de
tendencia central y de dispersión, tomando en cuenta la escala de medición de las variables y su
distribución. De esta forma, las variables cualitativas habitualmente se presentan como frecuencia
simples y proporciones (o porcentajes). El promedio como medida de tendencia central y la

4
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
desviación estándar (o desviación típica) como medida de dispersión solo aplica con variables
cuantitativas continuas y que tengan distribución normal; en variables cuantitativas discontinuas o
continuas que no tienen dispersión normal se deben expresar como mediana y rango intercuartilar
(también es correcto el valor mínimo y el valor máximo), respectivamente1.

Las pruebas disponibles para la comparación de grupos son numerosas. Flores, et.al. proponen una
guía para la selección de la prueba estadística adecuada, en relación con los objetivos del estudio, los
tipos de variables, distribución y muestra y se presenta a continuación:

Prueba estadística de acuerdo con los objetivos del estudio y la escala de medición de las
variables

OBJETIVOS TIPO DE ESTADÍSTICO DE


VARIABLES DISTRIBUCIÓN
DEL ESTUDIO MUESTRAS PRUEBA

Cuantitativas Relacionadas t de Student


discretas y Normal
continuas Independientes t de Student
Comparar 2
promedios
Cuantitativas Relacionadas Wilcoxon
discretas y No normal
continuas Independientes U Mann Whitney

Cuantitativas Relacionadas ANOVA de 2 vías


discretas y Normal
continuas Independientes ANOVA de una vía
Comparar 3 o
más grupos
Cuantitativas Relacionadas Friedman
discretas y No normal
continuas Independientes Kruskal-Wallis

Cualitativas Relacionadas McNemar


Comparar 2
nominales y
grupos
ordinales Independientes Chi-cuadrada*

Cualitativas Relacionadas Q de Co chran


Comparar 3 o
nominales y
más grupos
ordinales Independientes Chi cuadrada

Coef. correlación de
Cuantitativas Normal independientes
Correlación de 2 Pearson
discretas y
variables Coef. correlación de
continuas No normal independientes
Spearman

1
FLORES, E. FLORES, E., MIRANDA, M. Y VILLASÍS, M. 2017. El protocolo de investigación VI: cómo elegir la prueba
estadística adecuada. Estadística inferencial. Revista Alergia México. 2017 64(3):364-370.

5
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
Además de otros estadísticos, SPSS calcula por defecto el estadístico de prueba cuando el
investigador selecciona el tipo de test, por ejemplo, calculará t de Student cuando el investigador
seleccione la opción para comparar medias, o Chi cuadrado cuando ejecute el procedimiento para el
grado de asociación entre variables categóricas en tablas cruzadas.

El estadístico de prueba es una fórmula que permite calcular un número a partir de los datos y la
hipótesis nula. La magnitud de este número permite discernir si se rechaza o no la hipótesis nula H 0.
Al conjunto de posibles valores del estadístico de prueba que llevan a rechazar H0 se le llama región
crítica o región de rechazo para la prueba, y a los posibles valores donde no se rechaza H0 se les
llama región o intervalo de aceptación.

Dependiendo de la afirmación que esté siendo probada, la región crítica podría estar en las dos colas
extremas, en la cola izquierda o en la cola derecha. La ubicación de la región o intervalo de rechazo
depende de si la hipótesis es bilateral o unilateral. Una hipótesis es bilateral cuando la hipótesis
alternativa (H1) es del tipo “no es igual” (≠); y es unilateral cuando la alternativa es del tipo “mayor
que” (>) o “menor que” (<).

Cuando es bilateral, la región de rechazo está repartida de manera equitativa entre ambas colas de la
distribución del estadístico de prueba. Pero si la hipótesis es unilateral, la evidencia en contra de la
hipótesis nula se ubica en un sólo lado de la distribución, esto es, la región de rechazo sólo se
concentra en una de las colas.

Prueba de cola derecha:


La región crítica se
encuentra en color verde en
CONFIABILIDAD
la región extrema (cola)
derecha debajo de la curva.
El signo utilizado en H1 es
>.

Prueba de cola izquierda:


La región crítica se
encuentra en la región
CONFIABILIDAD
extrema (cola) izquierda
debajo de la curva. El signo
utilizado en H1 es <.

6
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
Prueba de dos colas: La
región crítica se encuentra en
CONFIABILIDAD las dos regiones extremas
(colas) debajo de la curva. El
signo utilizado en H1 es ≠.

4. LECTURA DEL P-VALOR


Además, del estadístico de prueba que entrega por defecto, SPSS da la posibilidad de calcular muchos
otros estadísticos. También entrega como resultado el p-valor, que se expresa en términos de
probabilidad, en consecuencia varía entre 0 y 1.

p-valor

de H0
de H0

El p-valor, también conocido como value-p, valor-p, es el área bajo la curva (distribución de
referencia) que está más allá del valor del estadístico de prueba.

7
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
En este gráfico se observa de color verde el área que corresponde a la Región de rechazo, Alfa (α),
equivalente al 5% (0,05) del área bajo la curva. La línea azul entrecortada es el lugar donde está el
estadístico de prueba y de allí en adelante, en color amarillo, está el área que corresponde al p-valor.

Se observa en este gráfico que la zona de rechazo está repartida a ambos lados de la curva, en
consecuencia, tanto el valores de Alfa (α) como el p-valor se dividen entre dos y se ubican a cada
lado, esta prueba de hipótesis será de dos colas, su H0 lleva el signo = y su H1, el signo ≠.

5. TOMAR LA DECISIÓN

La decisión se encuentra relacionada con el p-valor calculado en la prueba estadística y el nivel de


significación fijado por el investigador.

Si el p-valor es menor al α establecido se rechaza H0 y se “acepta” H1.

Estadístico de prueba
p. ej. T Student

p-valor

0,034

p-valor

Región de rechazo Región de aceptación


Nivel de significancia
de H0 (α = 0,05)
de H0

8
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
Si el p-valor es mayor al α establecido, se “acepta” H0 y se rechaza H1.

Estadístico de prueba
p. ej. T Student

p-valor
0,106

Región de rechazo Región de aceptación p-valor

de H0 Nivel de significancia de H0
(α = 0,05)

A la hora de tomar la decisión de rechazar o no una hipótesis, se debe poner mucha atención al tipo
de p-valor que entrega como resultado el SPSS y al tipo de hipótesis que estamos contrastando: si es
de un solo lado (prueba unilateral) o de dos lados (bilateral).

SPSS entrega un resultado de significación bilateral en pruebas de comparación de medias, esto


quiere decir que por defecto ha asumido una prueba de dos colas y que las hipótesis serían:

H0: μ1 = μ2
H1: μ1 ≠ μ2

Si las hipótesis del caso que estamos tratando también son de una prueba bilateral, sólo hay que
contrastar el p-valor que devuelva SPSS con el valor alfa (α). Si el p-valor es > α, se “acepta” la H0,
por lo tanto, se rechaza H1.

Pero, si el caso que estamos tratando es una prueba de una sola cola, cuya Hipótesis alternativa tiene
el signo mayor que (<) o menor que (>), debemos dividir entre 2 el p-valor, porque éste es por defecto
bilateral en SPSS y nuestra prueba es unilateral.

En conclusión, antes de contrastarlo con el valor alfa (α), hay que dividir para 2 el p-valor en una
Prueba de medias si nuestra prueba es de un solo lado (unilateral), porque SPSS da un p-valor de
significación bilateral.

En otros casos, como en pruebas de Análisis de varianza (ANOVA), el resultado que entrega SPSS
es sencillamente un p-valor, de significación unilateral.

6. REDACTAR LA CONCLUSIÓN

Después de haber tomado la decisión de rechazar o no la hipótesis nula, se debe reorganizar las ideas
para expresarlas en un lenguaje común, no matemático. Se debe redactar la conclusión respecto de
las variables utilizadas en el análisis, es recomendable indicar el porcentaje de confiabilidad.

¿Aceptar o no rechazar? Se recomienda decir que “no se rechaza la hipótesis nula” en vez de decir
que “se acepta la hipótesis nula”. El término aceptar es engañoso, porque implica incorrectamente

9
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
que la hipótesis nula ha sido probada, pero nunca podemos probar una hipótesis nula. La frase “no se
rechaza” dice más correctamente que la evidencia disponible no es suficientemente fuerte como para
justificar el rechazo de la hipótesis nula.

Negativos múltiples Las conclusiones finales pueden incluir hasta tres términos negativos. (Ejemplo:
“No hay evidencia suficiente para justificar el rechazo de la afirmación de que no hay diferencia entre
0.5 y la proporción poblacional”). Para conclusiones tan confusas, es mejor volver a expresarlas para
que sean comprensibles. En lugar de decir que “no hay evidencia suficiente para justificar el rechazo
de la afirmación de que no hay diferencia entre 0.5 y la proporción poblacional”, un mejor enunciado
sería este: “Hasta que se obtenga evidencia más sólida, se continúa asumiendo que la proporción
poblacional es igual a 0.5”2.

Ejemplo 1

Se obtuvo un p-valor = 0,075 y el alfa es de 0,05. Dado que el p-valor obtenido (0,075) es mayor al
alfa predefinido (0,05) se “acepta” H0, o sea, no se rechaza la hipótesis nula y se rechaza la hipótesis
del investigador.

Conclusión: con una confiabilidad del 95%, se concluye que no hay suficiente evidencia para
rechazar la afirmación de que el rendimiento académico de los estudiantes de la Facultad de Ingeniería
Civil es igual al de la Facultad de Ciencias Sociales de la UTMACH. El rendimiento académico es
igual en los estudiantes de ambas facultades.

Ejemplo 2

Se obtuvo un p-valor = 0,031 y el α = 0,05. Dado que el p-valor obtenido (0,031) es menor al alfa
predefinido (0,05) se rechaza H0, o sea, no se rechaza la hipótesis alternativa o del investigador.

Conclusión: con una confiabilidad del 95% se concluye que hay suficiente evidencia para rechazar
la afirmación de que el rendimiento de la variedad de banano introducida es igual al obtenido como
promedio en la granja Santa Inés. El rendimiento de ambas variedades de banano es distinto.

Ejemplo 3

Se obtuvo un p-valor = 0,002 y el α = 0,10. Dado que el p-valor obtenido (0,002) es menor al alfa
predefinido (0,10) se rechaza H0, o sea, no se rechaza la hipótesis alternativa o del investigador.

Conclusión: con una confiabilidad del 90% se concluye que hay suficiente evidencia para rechazar
la afirmación de que el tiempo de graduación por trabajo de titulación es igual que el de examen
complexivo y que el de publicación en revistas indexadas. El tiempo de graduación de por lo menos
una modalidad de graduación es distinto que el de los demás.

2
Triola, M. 2018. Estadística. 12° Ed. Editorial Pearson Educación. México. Pág. 298 – 306.

10
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
EJERCICIOS DE APLICACIÓN DEL PROCEDIMIENTO DE PRUEBA DE HIPÓTESIS

Ejemplo 1

Un investigador tiene la hipótesis de que, el rendimiento académico expresado en el promedio de


calificaciones de los estudiantes de la Facultad de Ingeniería Civil es inferior al de la Facultad de
Ciencias Sociales. Comprobar al 95%.

H : µ Rendimiento académico FIC ≥ µ Rendimiento académico FCS


0

1. Planteamiento de H : µ Rendimiento académico FIC < µ Rendimiento académico FCS


1
hipótesis H : µ1 ≥ µ2
0
H : µ1 < µ2
1

2. Establecimiento del
nivel de significancia Nivel de Significancia (alfa) α = 0,05
de la prueba

3. Seleccionar la
Comparación de medias (SPSS)
prueba estadística y
Estadístico de prueba: Prueba t Student para muestras independientes
ejecutarla

p-valor (sig. bilateral) = 0,074


4. Lectura del p-valor
p-valor (unilateral) = 0,037

5. Tomar la decisión Se rechaza H0

Con un 95% de confiabilidad se concluye que el rendimiento académico de


6. Redactar la
los estudiantes de la Facultad de Ingeniería Civil es inferior al de la Facultad
conclusión
de Ciencias Sociales.

11
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
Ejemplo 2

Un investigador tiene la hipótesis de que, el nivel de estrés de los trabajadores de una empresa
disminuye luego de tomar unas vacaciones. Verificar este supuesto con una confiabilidad del 95%.

H0: Nivel estrés después de vacaciones ≥ Nivel estrés antes de vacaciones


1. Planteamiento de H : Nivel estrés después de vacaciones < Nivel estrés antes de vacaciones
1
hipótesis H0: µ2 ≥ µ1
H : µ2 < µ1
1

2. Establecimiento del
nivel de significancia Nivel de Significancia (alfa) α = 0,05
de la prueba

3. Seleccionar la
Comparación de medias (SPSS)
prueba estadística y
Estadístico de prueba: t Student para muestras relacionadas
ejecutarla

p-valor (sig. bilateral) = 0,278


4. Lectura del p-valor
p-valor (unilateral) = 0,139

5. Tomar la decisión No se rechaza H0

No hay suficientes evidencias para rechazar la idea de que el nivel de estrés


de los trabajadores se mantiene igual antes y después de tomar unas
6. Redactar la
vacaciones. El nivel estrés no cambia con las vacaciones, es posible que la
conclusión
causa del estrés esté asociada a otra variable que no ha sido considerada en
este estudio.

12
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
Ejemplo 3
Estudios realizados por la firma ABX sostienen que, a nivel mundial, el tiempo medio que los
adolescentes dedican a estudiar, fuera de las horas de escuela, es menos que 1,0 horas diaria. Se
requiere comprobar este comportamiento en los adolescentes de la ciudad de Machala con un nivel
de significación del 10%.

1. Planteamiento de
hipótesis

2. Establecimiento del
nivel de significancia Nivel de Significancia =
de la prueba

3. Seleccionar la
prueba estadística y
ejecutarla

p-valor (sig. bilateral) =


4. Lectura del p-valor
p-valor (sig. unilateral) =

5. Tomar la decisión

6. Redactar la
conclusión

13
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
Ejemplo 4
Estudios realizados por la firma ABX sostienen que, a nivel mundial, el tiempo medio que los
adolescentes dedican a estar en redes sociales es de 2,5 horas diarias. Se requiere comprobar este
comportamiento en los adolescentes de la ciudad de Machala con un nivel de significación del 5%.

1. Planteamiento de
hipótesis

2. Establecimiento del
nivel de significancia Nivel de Significancia (bilateral) =
de la prueba

3. Seleccionar la
prueba estadística y
ejecutarla

4. Lectura del p-valor p-valor (sig. Bilateral) =

5. Tomar la decisión

6. Redactar la
conclusión

14
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA

Existen diferentes pruebas estadísticas en el análisis inferencial, por lo que, es necesario conocer, de
manera práctica la forma de seleccionar la prueba estadística acorde con los objetivos del estudio, el
diseño de investigación, el tipo de variables y el tipo de distribución de los datos: normal o no normal.

Diseño de investigación.- Es el primer aspecto para la selección de una prueba estadística. Cuando
solamente existe un grupo de estudio y el objetivo de la investigación únicamente es especificar una
o más características de dicha población, el tipo de estudio se denomina descriptivo, por lo que, como
su nombre lo indica, solo es necesario emplear estadística descriptiva.

Por su parte, los estudios comparativos se llevan a cabo con más de 2 grupos, como ejemplo podemos
mencionar los que tratan de evaluar la utilidad de una intervención, como los ensayos clínicos
controlados o aquellos en los que se buscan factores de riesgo (o estudios de causalidad), como el
diseño de casos y controles. Se debe tomar en cuenta que en los estudios comparativos pueden existir
2 o más grupos, usualmente uno de ellos se constituye en referente independiente (testigo), contra el
que los demás grupos comparan el efecto de la manipulación de alguna variable. En este caso también
se cuenta el análisis de los cambios de las variables de resultado, antes y después de una maniobra o
tratamiento.

Escala de medición de las variables .- Otro aspecto trascendente cuando se planea un análisis
estadístico es la escala de medición y los tipos de variables. Las pruebas estadísticas son diferentes
de acuerdo con los tipos de variables, por eso es necesario reconocer si las variables de interés son

15
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
cualitativas o cuantitativas, si pertenecen al primer grupo, pueden ser nominales u ordinales, si
pertenecen al segundo, discretas o continuas.

Las diferentes pruebas estadísticas se dividen en dos grandes conjuntos: las paramétricas y las no
paramétricas. Tomando en cuenta la escala de medición de las variables, al conjunto de pruebas
estadísticas paramétricas les corresponde las cuantitativas continuas; mientras que para las variables
cualitativas (ya sean nominales u ordinales) y las cuantitativas discontinuas se incluyen las pruebas
estadísticas no paramétricas.

Además, un requisito indispensable para seleccionar una prueba paramétrica es la distribución de los
datos. Para determinar el tipo de distribución existen diferentes métodos visuales y pruebas
estadísticas. De comprobarse que los datos no siguen una distribución normal, los investigadores
deberán elegir una de las pruebas no paramétricas.

Pruebas estadísticas y distribución normal

Los datos que tienen una distribución


aproximadamente normal se
caracterizan por una distribución de
frecuencias que comienzan bajas,
luego aumentan a frecuencias altas y
luego disminuyen a frecuencias
bajas.

La distribución es aproximadamente
simétrica: las frecuencias que
preceden a la frecuencia máxima
deben ser aproximadamente una
imagen especular de aquellas que
siguen de la frecuencia máxima.

Cuando una distribución normal se grafica como histograma tiene una forma de “campana” similar
la figura siguiente:

16
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
En la distribución de probabilidad normal uniforme encontramos estas dos propiedades importantes:

1. El área bajo la gráfica de una distribución de probabilidad continua es igual a 1.


2. Existe una correspondencia entre área y probabilidad, por lo que es posible determinar
probabilidades identificando las áreas correspondientes en la gráfica.

Cualquier distribución normal particular está determinada por dos parámetros: la media poblacional
(µ) y la desviación estándar de la población (s). Una vez que se tienen los valores específicos para µ
y s, es posible graficar la ecuación.

Muchos métodos estadísticos requieren que los datos


muestrales provengan de una población con distribución
aproximadamente normal. Al intentar determinar si una
colección de datos tiene una distribución que es
aproximadamente normal, podemos inspeccionar
visualmente un histograma para ver si tiene
aproximadamente una forma de campana, también es
posible identificar valores atípicos, además de usar una
gráfica cuantilar normal.

a. Histograma: Construya un histograma. Si el


histograma se aparta dramáticamente de una forma
de campana, concluya que los datos no tienen una
distribución normal.

b. Valores atípicos: Identifique los valores atípicos. Si


hay más de uno de estos valores, concluya que los
datos podrían no tener una distribución normal. (Un
so lo valor atípico podría ser un error o resultado de
una variación aleatoria, pero tenga cuidado, porque
incluso un solo valor atípico puede tener un efecto
dramático en los resultados).

17
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
c. Gráfica cuantilar normal: Si el histograma es
básicamente simétrico y el número de valores
atípicos es 0 o 1, utilice la tecnología para
generar una gráfica cuantilar normal.
Aplique los siguientes criterios para
determinar si la distribución es normal. Estos
criterios se pueden utilizar de forma poco
flexible para muestras pequeñas, pero deben
usarse más estrictamente para muestras
grandes.

La distribución de la población es normal si el


patrón de los puntos está razonablemente
cerca de una línea recta y los puntos no
muestran algún patrón sistemático que no sea
un patrón lineal. La distribución de la
población no es normal si se aplica una o dos
de las siguientes condiciones:

• Los puntos no se encuentran razonablemente cerca de una línea recta.


• Los puntos muestran algún patrón sistemático que no es un patrón en línea recta.

Las siguientes imágenes muestran histogramas de datos junto con las gráficas cuantilares normales
correspondientes.

Normal: El primer caso muestra un histograma de puntuaciones de IQ que están cerca de tener una
forma de campana, por lo que el histograma sugiere que las puntuaciones de IQ tienen una
distribución normal. La gráfica cuantilar normal correspondiente muestra puntos que están
razonablemente cerca de un patrón en línea recta, y los puntos no muestran ningún otro patrón
sistemático diferente de una línea recta. Es seguro asumir que estas puntuaciones de IQ provienen de
una población con distribución normal.

Uniforme: El segundo caso muestra un histograma de datos que tiene una distribución uniforme
(plana). La gráfica cuantilar normal correspondiente sugiere que los puntos no se distribuyen
normalmente. Aunque el patrón de puntos está razonablemente cerca de un patrón lineal, hay otro
patrón sistemático diferente del lineal. Concluimos que estos valores muestrales son de una población
que tiene una distribución que no es normal.

18
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020
Asimétrica: El tercer caso muestra un histograma de la cantidad de lluvia (en pulgadas) en Boston
para cada lunes durante un año. La forma del histograma es asimétrica hacia la derecha, no en forma
de campana. La gráfica cuantilar normal correspondiente muestra puntos que no están en absoluto
cerca de un patrón lineal. Estas cantidades de lluvia provienen de una población que tiene una
distribución que no es normal.

Además de estos métodos, que podríamos llamarlos visuales, se puede aplicar otros métodos
analíticos, como el test de Kolmogorov-Smirnov y el de ShapiroWilk.

El test de Kolmogorov-Smirnov (con la corrección Lilliefors), conocido como KS, se utiliza para
contrastar si un conjunto de datos se ajusta o no a una distribución normal. Es similar al test de
Shapiro Wilk, pero la principal diferencia está en el número de muestras. Mientras que es
recomendable utilizar el test de Kolmogorov-Smirnov cuando se tiene más de 50 observaciones, el
test de Shapiro Wilk se puede utilizar con hasta 50 datos. Antes de realizar alguno de estos el test, es
necesario conocer cuál es el contraste de hipótesis que se va a realizar.

• Alfa (α) = 0,05


• H0: los datos proceden de una distribución normal
• H1: los datos no proceden de una distribución normal

Toma de decisión:

• Sig(p valor) > alfa: No rechazar H0 (normal).


• Sig(p valor) < alfa: Rechazar H0 (no normal)

19
DOCUMENTO DE APROYO PARA MÉTODOS ESTADÍSTICOS II
Wilson Rojas Preciado agosto / 2020

S-ar putea să vă placă și