Sunteți pe pagina 1din 27

Universidad de Chile

Escuela de Gobierno y Gestin Pblica


ESTADISTICA APLICADA
Sesin Introductoria
Estadstica Aplicada
Cul es la diferencia entre estadstica bsica y estadstica
aplicada?
Estructura del curso
Repaso de Estadstica Bsica
Cul es la diferencia entre estadstica
bsica y estadstica aplicada?
Censo vs. Muestra
Ejemplo: Cmo son los ingresos de los Chilenos?
Encuesta Nacional de Empleo (ENE), encuesta trimestral complementaria
de ingresos
Encuesta de Caracterizacin Socio Econmica Nacional (CASEN)
Incluye el Censo preguntas sobre ingreso?
Porque no?
Costoso en recursos
Demoroso
Validez de la informacin (capacitacin de los encuestadores)
Se necesita informacin con mayor periodicidad
Solucin: Tomar muestras
De lo particular a lo general

MUESTRA POBLACION

Estadstico Proceso deductivo Parmetro


Estructura del curso
1. Introduccin a la Inferencia Estadstica
Probabilidad y conceptos asociados
2. Distribuciones de probabilidad de variable discreta
Esperanza matemtica y desviacin estndar distribuciones de
var. discretas
Binomial, Poisson e Hipergeomtrica
3. Distribuciones de probabilidad de variable continua
Esperanza matemtica y desviacin estndar distribuciones de
var. continua
Normal y t de student
4. Teora del Muestreo
Distribuciones de muestreo
Error estndar de estimacin
Estructura del curso
5. Test de Hiptesis
Metodologa para prueba de hiptesis
Test de hip. sobre medias y proporciones
Test de hip. sobre diferencia de medias y proporciones
6. Anlisis de Regresin y Correlacin Lineal Mltiple
Modelo de regresin mltiple
Estimacin de parmetros por Mnimos cuadrados
Test de hiptesis en modelos de regresin
Prediccin
Regresin con variables explicativas categricas
Estructura del curso
7. Anlisis de la Varianza
ANOVA
Test F
Interpretacin de F
Temas Relacionados
8. Modelos de regresin con modelos de variable dependiente
dicotmica
LOGIT
Repaso de estadstica bsica
Estadstica
Herramienta para el anlisis de informacin
Diverso mbito de aplicacin
Clasificaciones de variables
Cuantitativas vs. Cualitativas
Continuas vs. Discretas
Escala de medida: Nominales, Ordinales, Escalares
Estadstica bsica = Estadstica
descriptiva
Describir grandes volmenes de informacin mediante
Tablas que resumen la informacin
Tablas de distribucin de frecuencia
Tablas de contingencia (crosstab)
o bien representar grandes volmenes de informacin
grficamente
Distintos tipos de variables requieren distintos tipos de grficos
Estadstica bsica = Estadstica
descriptiva
o bien un conjunto manejable de indicadores
Estadgrafos de posicin
Estadgrafos de dispersin
Estas son nuestras herramientas ms utilizadas
Sujetos y variables
Sujetos: Unidad bsica sobre la cual la informacin es
recolectada (unidad de anlisis)
Ej: personas, hogares, pases,
Variables: Una caracterstica observable (medible) en cada
sujeto
Ej: Edad, sexo, preferencia poltica, PGB,
Los datos cuantitativos consisten de una o ms variables
medida para varios sujetos.
La cantidad de sujetos estudiados es el tamao muestral,
generalmente se denota n
Ejemplo de una matriz de
datos
Id Edad SEXO EDUC OCUPACION Ingreso
1 67 2 9 1 319.287
2 8 1 2 2 170.470
3 23 2 2 5 167.222
4 37 1 12 4 14.528
5 53 1 10 2 203.641
6 3 1 15 2 1.163.571
7 2 1 10 2 333.418
8 55 1 13 4 1.063.160
9 40 2 15 2 1.143.366
10 8 2 13 6 561.416
11 59 2 14 5 70.344
12 37 2 4 2 341.159
13 11 1 7 6 533.142
14 22 1 10 6 1.021.693
Ejemplos
Analizaremos una muestra de 112 personas se San Jos de
Maipo encuestadas para la encuesta CASEN versin 2011
Centraremos nuestro anlisis sobre las siguientes variables:
NUMPER: Nmero de integrantes del hogar
Ingreso autnomo individual (yautaj)
Tambin usaremos la base de datos de la prueba SIMCE 2008
para cuartos bsicos
Distribuciones de frecuencia
El Objetivo de las estadstica descriptivas es sumarizar,
resumir, caracterizar una variable

Distribucin de frecuencia de una variable: Es la lista de


valores de la variable que existen en una muestra, junto con la
cantidad de repeticiones (frecuencia) con que cada valor
ocurre

Esto generalmente se presenta en tablas de distribucin de


frecuencias
Distribuciones de frecuencias
Podemos tratar de resumir la distribucin entera de la
muestra (distribucin de frecuencias)
En una tabla: Tabla de distribucin de frecuencias
O Grficamente: Grficos de distribucin de frecuencias,
histogramas
o generando una nica medida de resumen de la variable
Midiendo tendencia central
Midiendo variablidad
Tabla de frecuencias para
NUMPER
Tabla de distribucin de
frecuencias: colegios por regin
(SIMCE)
REGION Total
Regin de Aisn del General Carlos Ibaez del Campo 52
Regin de Antofagasta 133
Regin de Arica y Parinacota 58
Regin de Atacama 98
Regin de Coquimbo 488
Regin de la Araucana 889
Regin de Los Lagos 753
Regin de los Ros 390
Regin de Magallanes y de la Antrtica Chilena 55
Regin de Tarapac 104
Regin de Valparaso 775
Regin del Biobo 1130
Regin del Libertador General Bernardo O' Higgins 470
Regin del Maule 628
Regin Metropolitana 1803
Total general 7826
Grfico de histograma
NUMPER
Grfico de barras para colegios
2000
(SIMCE)
1800
1600
1400
1200
1000
800
600
400
200
0

2000
1800
1600
1400
1200
1000
800
600
400
200
0
Tabla de Distribucin de Frecuencias
para variables continuas (YAUTAJ)
Valor de la Frecuencia Frecuencia
variable absoluta relativa
25550 2 3,1%
76580 1 1,6%
80000 1 1,6%
82160 2 3,1%
91140 1 1,6%
98000 1 1,6%
100000 2 3,1%
102000 1 1,6%
102700 1 1,6%
109400 1 1,6%
110000 1 1,6%
115000 1 1,6%
Resumiendo variables con
muchos valores
Las tablas de distribucin de frecuencias y los grficos de barra
funcionan mejor para una pequea cantidad de valores
observados de la variable (variables en escalas de medida
nominal, ordinal o variables discretas)
Cuando los valores son muchos (especialmente en el caso de
variables continuas) se necesitan modificaciones
Solucin: resumir la informacin para valores de la variables
agrupados
Tablas de distribucin de frecuencias con intervalos
Histogramas en lugar de grficos de barras
Distribucin de frecuencias
para YAUTAJ (2)
Histograma para YAUTAJ
Histograma de puntajes
promedio SIMCE lenguaje

Histograma
300

250

200
Frecuencia

150

100

50

Clase
Skewness (asimetra)
La distribucin de frecuencias de los
ingresos autnomos presenta algunos
ingresos (pocos) muy por encima de los de
la mayora
La Distribucin tiene una larga cola hacia la
derecha
Se dice entonces que tiene asimetra positiva
Anlisis de variables por separado
vs. Anlisis de asociaciones
Preguntas sobre asociaciones de variables
Tienen hombres y mujeres la misma esperanza de vida?
Cmo se relacionan las notas del test de lectura con las notas
del test de matemticas en la prueba SIMCE?
Dos variables estn asociadas si los valores conocidas de una
(variable explicativa) ayudan a predecir valores de la otra
(variable respuesta)

Preguntas sobre una variable a la vez


Ej: Cul es la esperanza de vida de los chilenos? Qu tipo de
base de datos se requiere?
Cul es el desempeo de los colegios de la RM en la prueba
SIMCE Qu tipo de base de datos se requiere?
Descripcin vs. inferencia
Descripcin estadstica: creando medidas que
sumaricen informacin de los datos observados
Qu porcentaje de los alumnos obtiene notas por
sobre 200 puntos en la prueba SIMCE de
matemticas? Qu tipo de base de datos se requiere?

Inferencia estadstica: Generalizando informacin a partir


de una muestra de datos observados hacia la poblacin
Ej: Qu porcentaje de los ciudadanos mayores de 18
aos apoya la gestin del Gobierno, basados en una
encuesta realizada sobre 1000 personas? Qu tipo de
base de datos se requiere?

S-ar putea să vă placă și