Sunteți pe pagina 1din 19

Estadstica Inferencial

Rodrigo Asn Inostroza


Estadstica Inferencial:
Extrapola informacin desde una base de datos
a un universo mayor.
Procedimientos:
Estimacin de punto.
Estimacin de intervalo.
Pruebas de hiptesis (ej: Chi cuadrado, t).
Como lo hace?
Implica: a partir de estadsticos calculados a
partir de la muestra, decir cosas de un universo
no estudiado.
Universo: desconocido
Muestra: conocida
Ejemplo:
Problema investigacin: hay diferencias de gnero en los
ingresos de los profesionales de ciencias sociales, a iguales
tipos de trabajos?.
Se obtiene una muestra probabilstica de 400 profesionales. En
ella la media de ingresos de los hombres es 900.000 pesos y la
de las mujeres 800.000, diferencia 100.000.
A partir de dicha diferencia encontrada en la muestra... qu se
puede decir del universo?.
Solucin: estadstica inferencial.

Como trabaja la estadstica
inferencial?
Se apoya en dos leyes de la probabilidad:
Ley de los grandes nmeros:
Si se obtienen una muestra aleatorea de tamao n de un
universo, el valor del promedio de dicha muestra se
aproximar al promedio del universo si n tiende a infinito.
Teorema del lmite central.
Si se obtienen infinitas muestras aleatorias de tamao
grande de un universo, la distribucin de las medias de las
muestras se aproximar a una distribucin:

|
.
|

\
|
n
u N
o
,
Entonces?
1) En una distribucin normal no podemos determinar
exactamente la probabilidad de un determinado
resultado, pero si de un rea de resultados:
2) Se formula una Hiptesis Nula:
Es la hiptesis que se pone a prueba en un anlisis
estadstico.
Normalmente es la que queremos rechazar.
Normalmente habla de que no hay relacin entre las
variables.
En este caso: diferencia de ingresos entre hombres y mujeres
en el universo es 0.
3) Se supone a la Hiptesis nula como correcta.
4) Podemos entender nuestra muestra como un ejemplo
del conjunto infinito de muestras posibles de un
universo con hiptesis nula correcta (distribucin de
probabilidad para hip nula correcta).
Es probable nuestra muestra?


5) Calcular probabilidad de, si hiptesis nula es
correcta, haber obtenido nuestra muestra o una an ms
extrema.
Muestra dif 100 mil
Diferencia 0
Decisin?


Si nuestra muestra es probable... Argumento a favor de
hiptesis nula.
Para que nuestra muestra sea probable tiene que parecerse a
Hip nula, implica poca diferencia.
Si nuestra muestra no es probable. Tres opciones:
Muestreo mal realizado... Descartable luego de revisar
procedimientos.
Simple casualidad, se obtuvo muestra muy improbable (pero
no imposible) a pesar de que hiptesis nula es correcta...
Puede ser pero es improbable.
Hiptesis nula es incorrecta, por eso nuestra muestra parece
extraa, pero nolo es realmente, lo que est mal es la
hiptesis nula.
En resumen:


Comparamos nuestra muestra con una distribucin de
probabilidad construida a partir de hiptesis nula
correcta.
Medimos esa comparacin en trminos de probabilidad
de haber obtenido esa muestra o una ms extraa an.
Esa probabilidad se llama p.
Si p es menor que un valor definido de antemano
(llamado alfa), significa que sera una muestra poco
probable dada la hiptesis nula.
En resumen (cont.):


Usualmente alta es 0,05, lo que es igual a 5%.
Implica que usualmente si nuestra muestra tiene 5% de
menos probabilidades de haber sido escogida de un
universo con hiptesis nula incorrecta... Rechazamos la
hiptesis Nula.
Problema: podemos estar cometiendo un error... Podra
ser que por azar hayamos obtenido esa muestra y hip
nula igual sea correcta.
Eso se llama error tipo 1, y hay que vivir con ello.
Tipos de operaciones estadsticas:


Estimacin de punto:
Muy simple, apoyndose en ley de los grandes
nmeros, si se obtiene una muestra grande, la mejor
estimacin del valor de una variable en el universo
(parmetro), es valor del estadstico.
Esto es correcto si estadstico:
Es un estimador eficiente (poca varianza).
No tiene sesgo. Ejemplo de sesgo:
El mejor estimador de o
2
es:
1
) (
2
2
1

n
x x
S
i
n
Y no
n
x x
S
i

=
2
2
) (


Estimacin de intervalo:
Implica estimar un intervalo en que es probable se
encuentre el valor del parmetro, y no slo el punto
ms probable.
Es ms seguro, pues se pueden hacer afirmaciones
sobre el valor del parmetro dada cierta
probabilidad.
Se pueden calcular para muchos estadsticos, pero es
ms usual respecto de la media y la proporcin.
Ejemplo: Existe un 95% de confianza en que la media de
ingresos de los chilenos est entre 400.000 y 450.000 pesos.
Ejemplo: Existe un 99% de confianza de que el candidato
Juanito obtenga entre el 35 y el 40% de los votos.


Clculo de intervalos de confianza:
Formula para la media:
n
S
z x -
2
o
Formula para la proporcin:
n
q p
z p
-
-
2

o
Estimacin de punto
Heterogeneidad del
universo
% de confianza, traducido
a puntuacin z


En simple:
Alrededor del estimador de punto se construye un
intervalo (+ -).
El ancho del intervalo depende de traduccin a
puntaje Z de confianza que se quiera tener:
1,96 para 95% de confianza.
2 para 95,5% de confianza.
De la heterogeneidad del universo (desviacin
estandar de la distribucin de muestreo).


Ejemplo:
Se obtiene la siguiente muestra:
n= 500 casos.
p= 54%.
Formula para intervalo de confianza con 95% confianza.

n
q p
z p
-
-
2

o
500
46 54
96 , 1 % 54
-
-
37 , 4 % 54
Implica: hay 95% de confianza en que el candidato obtendr
entre 49,63% y 58,37%.


Pruebas de Hiptesis para dos variables:
Se seleccionan de acuerdo a tres criterios:
Nivel de medicin de la primera variable.
Nivel de medicin de la segunda variable.
Tamao de la muestra.
Para muestras grandes (ms de 100 casos) se utilizan
pruebas paramtricas (suponen distribucin normal).
En la prxima tabla estn en azul.
Para muestras pequeas (menos de 100 casos) se
utilizan pruebas no paramtricas (no suponen
distribucin normal). En la prxima tabla estn en rojo.



Funcionan bajo la misma mecnica. Pasos:
Formulacin de hiptesis. Siempre se pone a
prueba hiptesis nula: no relacin entre variables,
independencia.
Seleccin de la prueba a utilizar en funcin de
tamao de muestra y tipo de variables.
Obtencin de puntuacin del estadstico.
Obtencin de significacin.
Si significacin es menor que 0,05 se rechaza
hiptesis nula. De lo contrario no se rechaza.
Interpretacin.

Pruebas de hiptesis ms frecuentes por nivel de medicin Pruebas de hiptesis ms frecuentes por nivel de medicin
Nominal Ordinal

Intervalar
Nominal
dicotmica
Chi cuadrada Chi cuadrada t de student
U de Mantt-Whitney
Nominal no
dicotmica
Chi cuadrada

Chi cuadrada

ANOVA

Ordinal
----

Chi cuadrada
Significacin de Tau
b de Kendall
Significacin de r de
Spearman
ANOVA
Kruskall- Wallis
Intervalar
---- ----
Significacin de r de
Pearson
Significacin de r de
Spearman

S-ar putea să vă placă și