Sunteți pe pagina 1din 7

Trabajo Inferencia

Estadstica

Parte 1: Stata (Base de datos: SIMCE)


1. Entregue estadstica descriptiva relativa a la base de datos. Esta debe
ser til (por ejemplo, no sirve el promedio de una variable categrica).
Explique y analice las tablas de resultado.
Clasificacin y anlisis de la poblacin que rindi el SIMCE
a) Variables Cualitativas

tab atemed: Este comando permite representar una variable cualitativa que indica
si el estudiante que rindi el SIMCE tiene seguro mdico o no. Se distingue como
variable
Tiene seguro
Freq.
Percent
Cum. dicotmica
ya mdico (1 = S)
que toma
0
95
47.50
47.50 los valores
1
1
105
52.50
100.00 y 0, que
Total
200
100.00
representan S y No, respectivamente.

De la tabla se desprende la siguiente informacin:


Un 47,5% de los estudiantes que rindieron el SIMCE no tiene seguro mdico
contra un 52,5% que s tiene.
De un total de 200 estudiantes que rindieron el SIMCE, 95 no tiene seguro
mdico, y 105 estudiantes s tienen.

b) Variables Cuantitativas

sum escma: Este comando permite representar una variable que indica los aos de
escolaridad completos de la Madre del estudiante que rindi el SIMCE.

Variable

Obs

Mean

Std. Dev.

Min

Max

escma

200

7.26

2.943761

16

De la tabla se desprende la siguiente informacin:


En promedio los aos de escolaridad de las Madres de los estudiantes es de
7.26 aos.
La desviacin estndar (promedio de las desviaciones respecto al media) es
de 2.94 aos, es decir, en promedio la diferencia de aos de escolaridad de la
poblacin de Madres (con respecto a la media) es de 2.94 aos.
La Madre que menos estudi tuvo 4 aos de estudios.
La Madre que ms estudi tuvo 16 aos de estudios.
La diferencia de aos entre la Madre que tuvo ms estudios con que la

Madre que tuvo menos estudios es de 12 aos. (Rango: 12 aos entre


el mnimo y mximo).

sum escpa: Este comando permite representar una variable que indica los aos de
escolaridad completos del Padre del alumno que rindi el SIMCE.

Variable

Obs

Mean

Std. Dev.

Min

Max

escpa

200

8.75

3.672183

19

De la tabla se desprende la siguiente informacin:


El promedio de los aos de escolaridad de los Padres de los estudiantes es de
8.75 aos.
La desviacin estndar es de 3.67 aos, es decir, en promedio la diferencia
entre aos de escolaridad de la poblacin de Padres (con respecto a la media)
es de 3.64 aos.
El Padre que menos estudi tuvo 3 aos de estudios.
El Padre que ms estudi tuvo 19 aos de estudios.
La diferencia de aos entre el Padre que tuvo ms estudios con el Padre que
tuvo menos estudios es de 16 aos. (Rango: 16 aos entre el mnimo y
mximo).

sum ingresof: Indica el ingreso familiar del estudiante que rindi el SIMCE, est
expresada en miles de pesos.

Variable

Obs

Mean

Std. Dev.

Min

Max

ingresof

200

578.565

270.1275

139

1297

De la tabla se desprende la siguiente informacin:


El promedio del ingreso familiar los estudiantes que rindieron el SIMCE es de
578,565 miles de pesos.
La desviacin estndar es de 270,1275 miles de pesos; es decir, en promedio,
es diferencia (o desviacin) entre el ingreso familiar de la poblacin de
estudiantes (respecto a la media).
La familia que tuvo el ingreso familiar ms bajo corresponde a $139.000

pesos.
La familia que tuvo el ingreso familiar ms alto corresponde a $1.297.000
pesos.
La diferencia entre el ingreso familiar ms alto, y el ingreso familia ms bajo es
de $1.158.000 pesos. (Rango)

sum numfam: Indica el nmero de personas que integran la familia del estudiante
que rindi el SIMCE.

Variable

Obs

Mean

Std. Dev.

Min

Max

numfam

200

6.185

2.765686

11

De la tabla se desprende la siguiente informacin:


El promedio de personas que integran la familia de la poblacin de estudiantes
que rindieron el SIMCE es de 6,185 personas por familia.
La familia que tiene el nmero ms bajo de personas corresponde a 3
personas.
La familia que integra el nmero ms alto de personas contiene a 11 personas.

sum ocio: Indica el nmero de horas dedicadas al ocio por parte del estudiante que
rindi el SIMCE.

Variable

Obs

Mean

Std. Dev.

Min

Max

ocio

200

6.135

3.811748

12

De la tabla se desprende la siguiente informacin:


El promedio de horas que los estudiantes que rindieron el SIMCE dedica al
ocio es de 6.135 horas.
El estudiante que dedic menos horas al ocio registr 0 horas.
El estudiante que dedic ms horas al ocio registr 12 horas.
La diferencia de horas entre el estudiante que dedic menos horas y el
estudiante que dedic el mximo de horas fue de 12.

sum rendi: Esta variable indica el puntaje obtenido en el SIMCE de matemticas del
estudiante.

Variable

Obs

Mean

Std. Dev.

Min

Max

rendi

200

182.93

88.17494

11

411

De la tabla se desprende la siguiente informacin:


El promedio de puntaje obtenido en el SIMCE de matemticas fue de 182,93
puntos.
La desviacin estndar fue de 88,17 puntos.
El alumno que obtuvo menor puntaje registr 11 puntos.
El alumno que obtuvo mayor puntaje registr 411 puntos.
Rango: 400 puntos.

2. Muestre si hay diferencia en rendimiento para aquellos alumnos que


vienen de familias con ingresos por sobre la mediana, versus aquellos
con familia bajo la mediana. Seale la significancia de la diferencia.
El primer paso ser obtener el ingreso familiar mediano, es decir, el percentil 50 de la variable.
Para esto utilizamos el comando tabstat ingresof, s(median), el cual no mostrar lo
siguiente:

El ingreso mediano familiar ser de 523,5 miles de pesos.


El siguiente paso ser crear una variable en funcin del ingreso mediano, es decir, crearemos
una variable que distinga entre las familias que estn bajo y sobre el ingreso mediano.
Utilizamos el comando gen medianingresof=1 if ingresof>523.5, de esta forma, las familias
que tengan un ingreso familiar por sobre la mediana tomarn el valor 1. Para diferenciar el
otro conjunto familiar que estar por debajo del ingreso mediano debemos modificar la variable
creada con el comando replace medianingresof=0 if ingresof<523.5 y as las familias que
estn por debajo la mediana del ingreso tomarn el valor 0 (variable dicotmica).
De esta forma pudimos crear una variable que diferenciara el ingreso familiar sobre y bajo la
mediana.
Etiquetamos la variable con el siguiente comando label define medianingresof 0 "Bajo
mediana" 1 "Sobre mediana" y label values medianingref medianingref, as los valores 1 y
0 quedarn con las etiquetas respectivas al ingreso familiar respecto de la mediana. Finalmente
escribimos la descripcin de la variable con el comando label var medianingref "Ingreso
Familiar Bajo y Sobre mediana"

Formulamos Hiptesis:
H0: 1 = 2 "No existen diferencias significativas en el rendimiento medio en el simce de
matemticas de los alumnos de ambos grupos"
H1: 1 2 "Existen diferencias significativas en el rendimiento medio en el simce de
matemticas de los alumnos de ambos grupos"
Supuestos:
1) Muestreo Aleatorio
2) Observaciones Independientes
3) Distribucin Normal
4) Prueba de homogeneidad de Varianzas
H0: var1 = var2 "No existen diferencias significativas en las varianzas de ambos grupos"
H1: var1 var2 "Existen diferencias significativas en las varianzas de ambos grupos"

Utilizamos el comando sdtest rendi, by(medianingresof) para hacer la prueba de


homogeneidad de varianzas:

0.0088<0.05; P valor menor a nivel de significancia por lo tanto rechazamos la hiptesis nula y
concluimos a un nivel de confianza del 95% que existen diferencias significativas en las
varianzas de ambos grupos; por lo tanto son heterogneas.
Ahora realizamos la prueba T student Welch para la diferencia de medias de muestras
independientes con varianzas heterogneas.
Definimos un nivel de confianza del 95% y utilizamos el siguiente comando: ttest rendi,
by( medianingresof) w

0.0000<0.05; P valor menor a nivel de significancia por lo tanto rechazamos la hiptesis nula y
concluimos a un nivel de confianza del 95% que existen diferencias significativas en el
rendimiento medio de ambos grupos en la poblacin; en favor del grupo sobre la mediana.
Intervalo de confianza para diferencia de medias 95%: {-135.4856 ; -98.67438}

S-ar putea să vă placă și