Documente Academic
Documente Profesional
Documente Cultură
Contenido
CAPTULO I. INTRODUCCIN AL STATA .............................................................................. 3
1.
2.
3.
4.
3.1.
3.2.
3.3.
2.
3.
4.
2.
Tipos de grficos................................................................................................................. 21
2.1.
Histograma .................................................................................................................. 21
2.2.
2.3.
2.4.
2.5.
Pie ................................................................................................................................. 25
2.6.
Barras............................................................................................................................ 26
2.
Estimacin del MRL por el mtodo de Mnimos Cuadrados Ordinarios (MCO) ..... 28
A continuacin, nos aparecer una ventana de editor en blanco, donde podemos elaborar
nuestro primer archivo do-file.
Estos archivos son muy importantes por los siguientes motivos:
a. Permite registrar una de serie de comandos, la cual representa todo el
procedimiento de nuestro trabajo.
Por ltimo, tambin se utilizan los smbolos de comentarios con fines decorativos.
2. Estructura de un Do-file
Generalmente, al momento de comenzar a programar en un do-file del Stata, es
recomendable mantener el siguiente esquema de trabajo:
Siguiendo esta estructura del do-file, procedemos como primer paso a construir una
plantilla de trabajo.
El primer comando que utilizaremos en esta plantilla de trabajo es limpiar informacin
que podra estar utilizndose (como bases de datos, etiqueta, matrices, escalares, etc.) que
se haya trabajado previamente con el comando clear.
Con respecto a las formas de poder ejecutar los comandos, se puede hacer a travs del
icono
del archivo Do-file o presionando los teclados Ctrl+D una vez que sombremos el
comando queramos correr.
Una vez realizada esta accin, se reflejar los resultados en la ventana Result View del
Stata.
Luego, se debe cambiar la ruta o directorio de trabajo, ya que cuando se inicia una sesin
en Stata, por defecto se trabaja en la carpeta en donde se encuentra instalado el software.
Para saber cul es la ruta de trabajo activa se puede ver la parte inferior izquierda del
entorno del STATA.
Dentro de nuestra carpeta de trabajo Clase 1 existe una carpeta denominada Bases en
el cual trabajaremos esta primera sesin. Para acceder a la nueva ruta de trabajo nos
ubicamos en la carpeta Bases y copiamos la ruta que se encuentra en la parte superior de
la ventana:
STATA cuenta con bases de datos dentro de su sistema como ejemplos aplicativos, para
cargarlos se utiliza el comando sysuse. Un ejemplo, es cargar la base de datos auto.dta,
donde cabe resaltar que todas las bases de datos en formato del Stata se guardan con la
versin .dta.
En la parte inferior izquierda del entorno del STATA se apreciar las variables que
contiene la base de datos auto.dta.
3.2.
La manera de editar manualmente una base de datos a travs del dofile es a travs del
comando input.
Para realizar esta accin, hay que limpiar la base de datos utilizada en la anterior seccin
de la siguiente manera. Luego, usamos el comando input, seguido del nombre de las
variables y a partir de la siguiente lnea de comando se comienza a digitar los datos,
finalmente se debe terminar con la palabra end.
3.3.
STATA cuenta con una herramienta que permite convertir base de datos de SPSS, Matlab,
Gauss, SAS, Excel, etc. al formato *.dta a travs del software STAT/TRANSFER.
Para acceder a este software basta con hacerle clic y posteriormente nos saldr una
ventana de dialogo solicitndonos la siguiente informacin:
Input File Type: Indicamos el tipo de archivo en la cual se encuentra nuestra base
de datos original.
Output File Type: Indicamos el tipo de archivo al cual deseamos que la base de
datos se convierta.
Para nuestro caso ilustrativo, contamos con la base de datos de la Encuesta de Hogares
(ENAHO) en formato de SPSS llamada Enaho01-2014-100.savque se encuentra en nuestra
carpeta de trabajo, el cual queremos convertirlo a un archivo de base de datos del STATA
con el mismo nombre y que se guarde en la misma carpeta de trabajo.
Para desarrollar esta aplicacin realizamos los siguientes pasos:
a. Abrimos la ventana de dilogo del STAT/TRANSFER.
b. En la seccin Input File Type hacemos clic a la barra desplegable y elegimos el
formato SPSS Data File ya que se debe un archivo de base de datos del SPSS.
Como se puede ver en la lnea de sintaxis, despus de la coma ( , ) viene las opciones del
comando, en este caso es replace lo que significa que si se vuelve a ejecutar esta sintaxis el
Stata guardar la base de datos nuevamente de la que ya existe.
Observar la base de a travs del comando browse, el cual nos permite ver la base de
datos sin poder modificarla. En cambio, existe otro comando denominado edit que
nos permite ver la base de datos pudiendo modificarlo.
A esta nueva variable se puede introducir etiquetas para una mejor descripcin. Si
queremos colocar una etiqueta al nombre de la variable utilizamos el comando label
variable, y si se quiere etiquetar los valores de la variable primero se debe definir una
etiqueta con label define y luego se utiliza el comando label value para utilizar la etiqueta
creada en los valores de la variable, tal y como se muestra a continuacin:
Una vez creada la variable internet se puede hacer una tabla simple de frecuencia con el
comando tabulate para saber cuntos hogares tienen internet. En este caso, de un total de
39 767 hogares entrevistadas, el 15,84% tienen internet.
Otra forma de generar variables es empleando en comando egen. Este comando es una
extensin del anterior, que permite utilizar expresiones que incluyan funciones ms
complejas del STATA, como es el caso de: medias, mximos, mnimos, desviacin
estndar, promedios mviles, variables estandarizadas, etc.
A manera de ejemplo se puede calcular una variable que capture el valor promedio,
mximo y mnimo del pago de alquiler de una vivienda (p106).
A partir de las etiquetas de los valores se comienza a clasificar y agrupar con el fin de
luego formas los grupos de recodificacin de la siguiente manera:
A partir de esta pequea base se requiere tener informacin a nivel de familia, donde se
registre el promedio de aos de edad de los nios, el peso mximo, y el nmero de nios
hombres. As, que la lnea de sintaxis sera el siguiente:
Por otro lado, cuando se trabaje con bases de datos de forma panel (un grupo de
individuos que se recogen informacin en un periodo de tiempo), esta puede tener dos
formas: larga y ancha. El comando reshape nos permite transponer una base de datos
panel de forma larga (long) a una de forma ancha (wide) y viceversa. Como se muestra a
continuacin:
Por ejemplo, cargamos otra base de datos llamada ingfam.dta, que contiene informacin
sobre el ingreso de 3 individuos en tres aos (1996, 1997 y 1998).
Como se observar, esta base tiene formato wide, y lo que se quiere en transponerlo a
formato long. Para ello, hay que identificar bien dos cosas: la parte del nombre de la
variable que se repite y que a su vez sirve como una semilla (ingfam), y la variable que
identifique al individuo que se colocar en la opcin i(codfam), por ltimo se coloca un
nuevo nombre a la variable temporal j(tiempo).
Para ello, abrimos una nueva base de datos denominada base1.dta el cual estar activa y
ser nuestra base master. Adems, en nuestra carpeta de trabajo existe otra base llamada
base2.dtael cual estar inactiva (base using) y ser aadida a la primera base. Ambas
bases de datos contiene informacin de las notas de alumnos (en la primera base existe 3
alumnos y en la segunda existen 4 alumnos) en los cursos de micro, macro y economa,
adems de su sexo el turno horario.
En el segundo tipo de fusin para aadir variables, se utiliza el merge para fusionar bases
de datos de manera vertical. De la misma manera que en el primer caso, tambin existir
una base master y una base using.
Para este ejemplo, se usaran dos bases de datos que ya fueron fusionados de manera
vertical base12.dta y base34.dta, el primero ser la base using y la segunda la base
master. Ambas bases contienen informacin de alumnos, por lo cual ser un fusin de
individuo contra individuo (1:1).
histogram: Histogramas
Histograma
Para observa otras tipos de grficos y comandos relacionados a estos, se recomienda escribir en la venta de comandos help
graph other.
estos ingresos con el fin de reducir la varianza. Adems, comparamos con la distribucin
para observar si se guardan caractersticas similares, tal y como se muestra
.2
.4
Density
.6
.8
continuacin:
2.2.
6
lningtot
10
Los diagramas de dispersin de puntos (scatter plot) se accede a travs del comando graph
twoway scatter. Por ejemplo, queremos ver la relacin que guardan el ingreso laboral total
6
4
2
lningtot
10
20
40
60
edad ( en aos )
80
100
No obstante, se puede ajustar un lnea recta (lfit) a este grfico, y al mismo tiempo ajustar
por una relacin cuadrtica (qfit), para ver si existe rendimientos decrecientes en los
10
ingresos laborales.
20
40
60
edad ( en aos )
lningtot
Fitted values
2.3.
80
100
Fitted values
El comando graph matrix nos muestra un til anlisis multivariado. Este comando otorga
una grfica compacta de la relacin entre un nmero de variables por pareja,
permitindole al analista observar los signos de no linealidad, outliers o cluester que
puedan afectar al modelamiento estadstico. Este tipo de grfico tambin es til si se
quiere observar la influencia de una lista de variables explicativas a una variable
dependiente.
Por ejemplo, si se quiere ver grficamente la relacin de un conjunto de factores que
pueden influir en los ingresos laborales de la persona, como es el caso de la edad (p108),
las horas de trabajo (p209t) y el nivel educativo (p109b), se puede ealizar de la siguiente
manera:
50
100
10
10
lningtot
5
0
100
edad (
en aos
)
50
0
100
total de
horas
trabajadas
50
0
10
aos de
estudios
0
0
2.4.
10
50
100
Caja y bigote
La grfica de caja y bigote brinda informacin acerca del centro, amplitud, simetra y
outliers con solo un vistazo. Para obtener este grfico, se debe empelar el comando graph
box.
Si seguimos analizando la distribucin de los ingresos laborales con un grfico de caja y
6
4
2
lningtot
10
Si se quiere el mismo grfico pero de manera horizontal, se debera usar el comando graph
hbox.
2.5.
6
lningtot
10
Pie
Este estilo es muy popular en las presentaciones de grficas, siempre y cuando tengan
pocos valores para trabajar. El comando bsico del grfico de pastel es graph pie.
Si se quiere saber la distribucin de las personas por nivel educativo (p109a) que fue
recodificada a una menor cantidad de niveles (sin nivel, primaria, secundaria, superior)
que lleva como nuevo nombre niveduc, se puede obtener utilizando el comando
mencionado con la opcin over() para que los pedazos del pie lo conformen los cuatro
niveles educativos:
Sin nivel
Secundaria
2.6.
Primaria
Superior
Barras
1,500
1440.19
500
1,000
1083
mean of ingtot
p 50 of ingtot
S que quiere las barras de manera horizontal basta con usar el comando graph hbar.
significancia
individual,
para
saber
si
las
regresoras
obtenidos
influyen
En el caso del ejemplo, se puede apreciar que para la variable mpg tiene un valor de tcalculado igual a