Documente Academic
Documente Profesional
Documente Cultură
Nombre de la institución
Logo
Programa
Nombre completo del estudiante
Nombre completo del docente
Lugar
Fecha
Pruebas paramétricas
Las pruebas paramétricas son una herramienta estadística que se utiliza para el
análisis de los factores de la población. Esta muestra debe cumplir ciertos requisitos
como el tamaño, ya que mientras más grande sea, más exacto será el cálculo.
El test de bondad de ajuste chi cuadrado puede ser utilizado para trabajar tanto con
distribuciones discretas como, por ejemplo, la Distribución de Poisson o la
Distribución Binomial como así también con distribuciones continuas (por ejemplo,
Distribución Normal, Distribución Exponencial, etc). Esto a diferencia de las pruebas
de bondad de ajuste Kolmogorov Smirnov y Anderson Darling que sólo pueden ser
utilizados para trabajar con distribuciones continuas.
Una desventaja potencial del test de chi cuadrado es que requiere una muestra
suficientemente grande de modo que la aproximación de chi cuadrado sea válida.
Cabe destacar que existe otro test chi cuadrado llamado test chi cuadrado para
independencia. Frecuentemente los 2 test chi cuadrado son confundidos pero en
realidad son diferentes:
El test de bondad de ajuste chi cuadrado ajusta una variable categórica a una
distribución.
El test chi cuadrado para independencia compara dos conjunto de datos para ver si
existe relación entre ellas.
Básicamente, el test de bondad de ajuste chi cuadrado se basa en qué tan buen
ajuste se alcanza entre la frecuencia de ocurrencia de las observaciones en una
muestra observada y las frecuencias esperadas que se obtienen a partir de la
distribución hipotética (teórica).
En el caso del test de bondad de ajuste chi cuadrado las hipótesis nula H0 e hipótesis
alternativa H1 son:
H0: Los datos se ajustan a una distribución normal con media 𝜇 = 3.5 y desviación
estándar 𝜎 = 0.7
Donde dicha hipótesis será evaluada para un nivel de significancia (denotado por 𝛼
alfa definido por el evaluador (comúnmente se consideran valores de alfa de 1%,
5% o 10%). Adicionalmente el test de chi cuadrado permite obtener un valor p (o p-
value) el cual dependerá de los grados de libertad considerados y el nivel de
significancia establecido. Si el valor p es menor al nivel de significancia se puede
rechazar la hipótesis nula.
Paso 1: Preparar una tabla que tenga las siguientes columnas. Se recomienda hacer
uso de Excel para facilitar los cálculos que se explicarán en los próximos pasos.
Paso 2: Completar la información de la columna Categoría con cada uno de los 12
signos del zodiaco proporcionados anteriormente, incluyendo en la columna
Observado Oi los valores proporcionados en el enunciado.
Paso 3: Calcular el valor esperado para cada categoría. Si los signos del zodiaco
estuviesen uniformemente distribuidos entre los 256 artistas visuales, cada
categoría debería tener: 256/12=21,333.
Paso 4: Calculamos la diferencia entre el valor observado y el valor esperado para
cada categoría.
Consideremos que deseamos evaluar la hipótesis nula (es decir, que los signos del
zodiaco están distribuidos uniformemente entre los artistas visuales) para un nivel
de significancia de un 5%: \alpha=0,05 (arbitrario) que es equivalente a un nivel de
confianza de un 95%. En este caso los grados de libertad son 11 (el total de
categorías menos 1).
Concepto de aleatoriedad.
Aleatorio se asocia a todo proceso cuyo resultado no es previsible más que en razón
de la intervención del azar. El término aleatoriedad se usa a menudo como sinónimo
con un número de propiedades estadísticas medibles, tales como la carencia de
tendencias o correlación.
Teoría de corridas.
Ejemplo
M, H, H, H, H, M,
Una prueba de corridas con dos tipos de ocurrencias tiene los siguientes símbolos:
r= número de corridas
Prueba de corridas de una sola muestra
B,A,B,B,B,A,A,A,B,B,A,B,B,B,B,A,A,A,A,B,A,B,A,A,B,B,B,A,A,B,A,A,A,A,B,B,A,
B,B,A,A,A,A,B,B,A,B,B,B,B,A,A,B,B,A,B,A,A,B,B
Valores de la prueba:
n1= 29
n2= 31
r= 29
Distribución de muestreo del estadístico r
Una prueba de corridas de una sola muestra, está basada en la idea de que muy
pocas o demasiadas corridas muestran que los elementos no fueron elegidos
aleatoriamente.
Prueba de Rachas
Analizar
Pruebas no paramétricas
Rachas
El cuadro de diálogo que se abre es el siguiente:
En Contrastar variables se traslada la variable y en Punto de corte se indica el o los puntos de corte
que se quieren considerar.
El botón Opciones presenta las opciones ya vistas correspondientes a la gestión de los valores
missing y a la descripción de los datos: Descriptivos y Cuartiles.
8. Conclusión y decisión
Aceptar Ho: Con un nivel de confianza del 5%
se encontró que la marca de café es
independiente del sexo de la persona. Por lo
que se recomienda elaborar un sólo tipo de
anuncio.
Kolmogoro La prueba de La prueba de 1. se identifica la muestra Determinar si los valores de la primera columna se
Kolmogorov es Kolmogorov es de la población.
v-smirnov 2. se plantea una prueba de
conforman a una distribución normal:
considerada para una prueba no
hipótesis.
el análisis de una paramétrica que 3. se extraen de la muestra
muestra un se emplea para las variables necesarias
procedimiento de probar el grado 4. se calcula la frecuencia
observada
bondad de de concordancia 5. se calcula la frecuencia
ajuste, es decir, entre la observada relativa
permite la distribución de 6. se prosigue a calcula las
medición del datos empíricos frecuencias observada
relativa acumulada y la
grado de de la muestra y frecuencia esperada
concordancia alguna relativa acumulada
existente entre la distribución 7. se procede a calcular el
distribución de un teórica ESTADISTICO DE
PRUEBA (D) de cada
conjunto de datos específica.
intervalo,
y una distribución D = (FOR Acum - FER
teórica Acum)
específica. 9. se busca en la tabla de
acuerdo al tamaño de la
muestra y un alfa (α), el
valor que nos permitirá
rechazar o aceptar la
hipótesis.
10. Si el estimador de la
prueba (D) es menor que el
valor que se encontró en la
tabla entonces se acepta la
hipótesis Ho (hipótesis
nula) planteada antes de
estudiar la muestra, de lo
contrario se acepta la
hipótesis alternativa Ha.
De los Permite Se aplica a • Se determina el Una compañía turística desea comprobar la calidad de
signos contrastar la datos pareados signo de la diferencia uno de sus productos de excursiones para
hipótesis de en una muestra entre los dos datos de exportación, que se promociona con un promedio de
igualdad entre y se basa en cada pareja, pero 8200 dólares en el mercado internacional. Para ello se
dos medianas signos positivos previamente se ha consideraron 16 paquetes de excursiones en el
poblacionales. y negativos, los establecido un orden mercado internacional con la finalidad de obtener el
Puede ser usada cuales en la muestra que precio en dólares al que fueron ofertados. Los
para saber si una sustituyen a los está constituida por resultados obtenidos se mostrarán en la siguiente
variable tiende a valores las parejas, es decir, tabla:
ser mayor que cuantitativos. cuál es el primer dato
otra. También es La prueba debe y cuál es el segundo
útil para probar la su nombre al dato, de acuerdo con
tendencia que uso de los el contexto del Pruebe que el precio promedio en dólares de una
sigue una serie signos + y - para problema o la excursión en el mercado internacional es menor al
de variables establecer una naturaleza de la promocionado alfa 5%.
ordinales diferencia en información. Al aplicar la prueba del signo, anotamos un signo
positivas, o para función de • Se determina el valor positivo por cada dato con valor que exceda los 8200
una valoración dirección, no en de “n”, es decir, el dólares
rápida de un magnitud de un número de parejas y un signo negativo por cada dato con valor menor de
estudio par de cuyas diferencias 8200 dólares, con lo que se obtienen los siguientes
exploratorio. observaciones, exhiben un signo, con resultados:
en la medición lo cual se establece
en lugar de que aquellas parejas
cantidades, con igual valor tienes
como es en el una diferencia de
caso cero; luego entonces El número de ensayos válidos para este análisis es de
paramétrico no deben ser n=14, ya que dos se descartaron al no dar un signo,
consideradas en el sino cero, por ser del mismo valor que el
conteo de los signos. proporcionado al 8200 dólares.
• Se formula el El número de signos positivos x será el estadístico de
planteamiento de la prueba, luego x = 4
hipótesis. B (X≤4; 14, .50)=.0898 por tablas, puesto que es
• Se aplica la prueba de un extremo izquierdo.
aproximación a una Alfa 5%
distribución normal En estos momentos ya es posible comenzar a dar
con el resto de los respuesta a lo solicitado, es decir, la prueba de una
pasos de una prueba diferencia para el promedio poblacional.
de hipótesis, cuando n Siguiendo los pasos de toda prueba de hipótesis, se
es de más de 20 pares tiene el algoritmo siguiente:
ordenados. H0 µ = 8200 el precio promedio de la excursión en el
mercado internacional es el promocionado.
H1 µ < 8200 el precio promedio es menor al
promocionado.
Regla de decisión: H0 se rechaza si P(X≤4≤Alfa) .
Ahora, como P(X ≤4) =.0898 y es mayor a alfa .0500
⇒ H0, se acepta.
Conclusión: Existe evidencia significativa establece
que el precio promedio de la excursión en el mercado
internacional es el promocionado.
De corridas Una corrida es Una prueba de Se le asignara más o Si tenemos una secuencia de números de tal manera
Corridas es un menos como en la que a cada uno de los números siga otro mayor la
una secuencia de
método que nos prueba del signo. secuencia dada será ascendente (arriba).
ocurrencias ayuda a evaluar
el carácter de
idénticas aleatoriedad de Si cada número va seguido por otro menor, la
una secuencia secuencia será descendente (abajo)
precedidas y
de números
seguidas de estadísticament Pasos para evaluar una prueba de corridas:
e
ocurrencias
independientes Ejemplo Paso 1:
diferentes. y números
uniformemente Se tienen los siguientes números aleatorios
distribuidos.
59,12,19,05,59,58,83,18,36,00,61,47,24,41,42,98,23,
Es decir dado 67,84,43,29,71,88,74,60,10,46,23,15,11,78,3
una serie de
números 1,11,91,99,57,28,18,32,21,12,95,38,76,07,96,33,63,1
determinar si 0,05
son o no
aleatorios. De acuerdo al método (prueba de corridas arriba y
Se utiliza con abajo) se evaluará 59<12, como no lo es se le signará
frecuencia para un signo -. Seguiremos comparando 12<19, ya que si
investigaciones lo es se le asigna un signo +.
de mercado, se
usa un muestra -+-+-+-+-+--+++-++--++---+---+--+
de n clientes +---+--+-+-+-+--
para que Consulta del ejemplo en el siguiente enlace
indiquen su https://prezi.com/s5dlkuvrozou/prueba-de-corridas/
preferencia
entre 2
productos puede
ser entre dos
marcas de
cereales,
detergentes,
refrescos, etc.
Prueba de Es una prueba de El contraste de El procedimiento
rachas independencia o rachas permite Prueba de Rachas
de aleatoriedad verificar la contrasta si es
que permite hipótesis nula de aleatorio el orden de
determinar si el que la muestra aparición de los
número de es aleatoria, es valores de una
rachas (R) decir, si las variable. Se puede
observado en sucesivas utilizar para
una determinada observaciones determinar si la
muestra de son muestra fue extraída
tamaño n es lo independientes. de manera aleatoria.
suficientemente Este contraste
grande o lo se basa en el Una racha es una
suficientemente número de secuencia de
pequeño para rachas que observaciones
poder rechazar la presenta una similares, una
hipótesis de muestra. Una sucesión de símbolos
independencia (o racha se define idénticos
aleatoriedad) como una consecutivos. Consulta completa en el siguiente enlace
entre las secuencia de Ejemplo: + + – – – + – http://wpd.ugr.es/~bioestad/guia-spss/practica-6/
observaciones. • valores – + + + + – – – (6
Una racha es una muéstrales con rachas). Una muestra
secuencia de una con un número
observaciones de característica excesivamente
un mismo común grande o
atributo o precedida y excesivamente
cualidad. Una seguida por pequeño de rachas
serie de datos en valores que no sugiere que la
los que hay presentan esa muestra no es
muchas o pocas característica. aleatoria.
rachas permite
concluir que Para obtener una
estas no han Prueba de Rachas se
ocurrido por azar. selecciona, en el
menú principal,
Analizar/Pruebas no
paramétricas/Cuadros
de diálogo
antiguos/Rachas…
Wilcoxon Permite Dicha prueba 1. El tamaño de las Un analista financiero desea comparar el rendimiento
muestras será denotado
contrastar la fue diseñada respectivamente a partir de
en dividendos de ciertas emisiones negociadas en la
hipótesis de para detectar cómo fueron bolsa de valores durante los dos años consecutivos
igualdad entre cualquier clase proporcionadas o elegidas últimos. Para ello, se seleccionan muestras de ocho y
dos medianas de diferencia las muestras. diez papeles para cada año, respectivamente, en
2. El tamaño de las
poblacionales. entre dos orden cronológico, con los resultados presentados en
muestras será denotado
Paralela a la grupos; algunas respectivamente a partir de la siguiente tabla:
prueba de ellas son: cómo fueron
paramétrica de ubicación, proporcionadas o elegidas
las muestras.
contraste t para dispersión, 3.Poner por rangos
muestras forma, o las tres. combinados todos los datos
relacionadas. Es posible de ambas muestras, desde
usarla cuando el menor hasta el mayor, es
decir, al dato menor se le
se ha logrado asigna el rango 1, al
una medición de siguiente en aumento el
la información rango 2 y así
en cuando sucesivamente
4.El valor de prueba para la
menos escala
prueba de Wilcoxon de
ordinal y se suma de rangos es sólo la Comenzaremos determinando los rendimientos de
desea probar suma de los rangos dividendos, en seguida los rangos combinados de los
que dos asignados a los n1 datos de rendimientos de dividendos y por último el resto de la
la muestra más pequeña, lo información, de acuerdo con el procedimiento
muestras
que es denotado por Sn1.
mutuamente 5.Para muestras de igual anteriormente descrito, en la siguiente tabla:
independientes tamaño es posible
se han tomado o seleccionar cualquier
muestra para la
no de la misma determinación
población o de de Sn1
poblaciones 6.Ahora, como
idénticas. matemáticamente se sabe
que la suma de los primeros
n enteros positivos
consecutivos
se obtiene por la expresión
general n(n+1)/2
7.Cuando en las muestras Recordemos que el rendimiento de dividendos se
sus tamaños n1 y n2, por
separado, son menores o encuentra establecido por la razón entre los
iguales a 10, se suele dividendos y el precio por acción.
Usar una tabla de valores Si al analista financiero le interesa en forma específica
críticos de la suma de la comparación de la mediana de producción de
rangos de Wilcoxon.
8. Para muestras de dividendos, más bien que sólo las diferencias que
tamaño grande, n1 y n2 por hubiera en la generación de los rendimientos de
dividendos, se
separado son estrictamente debe suponer que la distribución de los rendimientos
mayores a 10.
de los dividendos en ambas poblaciones, de las cuales
El
Estadístico para la prueba se tomaron muestras aleatorias, habrán de ser
Sn1 tiene un idénticas, excepto quizá por las diferencias en
comportamiento ubicación como
aproximado de una
distribución normal.
son las medianas.
9.La prueba de hipótesis Por lo anterior y para saber la prueba que se realizará,
para dos medianas M1 y M2 calculemos las medianas de los rendimientos de los
de la población sería de un dividendos para cada una de las muestras, para lo
extremo o de dos extremos
cual hay que seguir el procedimiento de un listado,
acercándonos a la posición central a partir de los
extremos, que en ambos casos serán dos valores los
que se ubiquen en ellas, por ser las dos muestras en
cantidad un número par.
Consulta completa en el siguiente enlace
http://libroweb.alfaomega.com.mx/book/868/free/data/cap12.pdf
U de mann Es equivalente a La prueba se • Ordenar por rangos Supóngase que la junta de gobierno de una
Withneyde la prueba de usa para combinados todas las universidad desea demostrar que las puntuaciones
suma de rangos constatar si dos puntuaciones en promedio que los estudiantes obtuvieron en una
de Wilcoxon y a muestras orden creciente, es prueba de aptitudes académicas, aplicada por un
la prueba de dos independientes decir, hay que organismo externo, en dos ramas de todas las que
grupos de han sido considerar de corrido ofrece en las diversas carreras que se imparten en esa
Kruskal-Wallis. seleccionadas ambos datos de las casa de estudios, son diferentes. La junta conserva
Es la alternativa de la misma dos muestras. bases de datos con los resultados de esas pruebas de
no paramétrica a población o de • Indicar al lado de los alumnos en todas las ramas de su sistema
la comparación poblaciones cada valor del rango educativo. Se seleccionan aleatoriamente dos
de dos diferentes que un símbolo muestra de igual tamaño de 15 alumnos
promedios poseen el mismo relacionado con la pertenecientes cada una a cada rama por analizar, los
independientes a comportamiento, característica que datos que se obtuvieron se presentan en la tabla
través de la t de bajo una corresponde a cada siguiente:
Student. distribución de muestra, ya que es lo Consulta completa en el siguiente enlace
probabilidad, es que se desea
decir, que sus relacionar del
medias son problema a resolver y
iguales. La probar.
prueba, a • Después, se
diferencia de la obtiene la suma de
de Wilcoxon, no rangos para cada
se fundamenta muestra.
en muestras • El valor de prueba U
pareadas, es resulta al usar los
decir, muestras valores de los
en las que se tamaños de las
obtienen dos muestras n1 y n2
observaciones mientras la suma de
para el mismo rangos de los
individuo o elementos de la
fenómeno. Es primera o segunda
otra de las muestras están
pruebas no denotadas por R1 y
paramétricas R2, respectivamente,
poderosas, según el tipo de
aunque es la prueba de un extremo
alternativa a la Para verificar la
prueba del obtención de la suma
signo, ya que de rangos y de los
con ella no se valores de prueba se
pierde debe cumplir la
información al siguiente
utilizar la relación:U1+U2=n1n2
ordenación por
rangos
combinados.
http://libroweb.alfaomega.com.mx/book/868/free/data/cap12.pdf
Bibliografía