Documente Academic
Documente Profesional
Documente Cultură
Moda: Es el valor de la variable que más veces aparece en el conjunto de datos. Se aplica
a variables de cualquiera nivel de medición. La utilizamos más que nada en medidas de
variables cualitativas (ordinales y nominales) cual es la categoría modal de una variable.
Media: Es el promedio, es la sumatoria de los valores de la variable dividida el número de
casos. Solo se puede aplicar a un nivel de medición de razón o de intervalo. Considera a
todos los valores de la variable.
Mediana: Es la medida más estable que la media, es el valor de la variable que deja por
encima y por debajo al 50% de los casos. También es de posición porque tiene valores
ordenados de mayor a menor. La fórmula nos indica el lugar que ocupa:
Número de casos o N+1 / 2 (es sobre dos porque divide a la mitad la medición)= (la
mediana va a estar en el lugar 8)
● Medidas de posición:
❖ Cuartiles: divide en porciones de 4 partes iguales. Cada cuartil va a tener 25% de los
casos. Se ordena de mayor a menor y se divide en porciones.
❖ Deciles: lo divido en 10 partes iguales, van a tener los 10% de los casos.
❖ Quintiles: lo hago en 5 partes iguales, 20% de los casos.
❖ Percentil:
Pregunta de parcial: ¿Cuáles son los 5 números que resumen la distribución?
= El mínimo ; el cuartil uno ; la mediana ; el cuartil 3 ; el máximo
Esto se representa con los diagramas de caja.
2.Desviación estándar:
S √E(xi − x(con la rayita arriba)2 : n − 1
Incompleto o menos 2 2 4
Completo o más 6 10 16
Total 8 12 20
Esto me permite confirmar o rechazar mi hipótesis, si mi variable independiente influenciará
sobre mi otra variable.
Los porcentajes se calculan en el sentido de la variable independiente y se comparan en el
sentido de la variable dependiente. La diferencia entre los dos valores porcentuales tiene
que tener un valor negativo y otro positivo. Cuando hay diferencia porcentual, hay relación
por lo tanto es una lectura asimétrica, si no hubiese diferencia sería simetrica. Existen
coeficientes que miden la fuerza en la relación, el coeficiente que voy a elegir depende del
nivel de medición de las variables y el número de categorías, como por ejemplo el CHI2
(mide si esa la diferencia porcentual que veo es estadísticamente significativa o no, es decir,
que esa relación qué vemos, se debe a que hay relación entre variables)frecuencias
observadas.
Cuando veo relación entre variables utilizo dependiendo del nivel de medición: en las
cualitativas uso la asociación y en las cuantitativas, la correlación.
Partimos de una tabla, y hay tres formas de lectura:
● Hacer la diferencia porcentual que se calcula en el sentido de la variable
independiente y se comparan en el sentido de la variable dependiente y esto me va
a decir si son o no relaciones.
Fórmulas:
Los errores estarán en Y (eje vertical) A más correlación menos error.
La media es:
__ __
x y
Correlación: R
Sy
2. b = r Sx Esto me da el coeficiente de regresión. Cuánto cambia Y cuando X cambia
1.
3. a = y(con la rayita arriba) − b.x(con la rayita arriba) . Esto me permite saber la
ordenada al origen.
SPSS
Ver qué tipo de archivo genera el spss: .sav - cuando hacemos un procesamiento automático el spss
abre una ventana (llamada output, o resultados) es una interface distinta al .sav. Y se guarda
distinto: .spo . Osea cuando abris un archivo .spo, tenemos que saber qué abrimos resultados de
análisis de una matriz de datos.
Pero hay otro tipo de archivo que tiene este software que se llama archivo de sintaxis y se genera
así: vamos a analizar, estadísticos descriptivos, frecuencia y en vez de poner aceptar clickeamos en
pegar, se abre otro tipo de ventana: sintaxis; qué esa ventana está escrita en un lenguaje de
computación (Beisik) y se guarda con .sps. Es decir qué cuando veamos un archivo de .sps, es un
archivo de sintaxis.
Rótulo es lo mismo qué etiqueta.
Clase 2 - 27/03/2019
importar datos
En el punto, vamos a archivo, abrir datos. todos los archivos, leer todas la variable de datos y
aceptar.
Utilizó la variable número, que corresponde al número de formulario.
El TIPO, es lo que corresponde a la celda, si va a ser número es númerica.
Anchura: cantidad de caracteres.
Para hacer un punto así:Hacer la distribución de frecuencia de 5 variables. Vamos a analizar,
estadísticos descriptivos: frecuencias. Seleccionar variables y hago click y tengo mi tabla de
frecuencia. El primer cuadro es de resumen, la de abajo me da la tabla de frecuencias de variables,
en donde tenemos listada las categorías de variables. Si voy nuevamente a análisis, estadísticos
descriptivos frecuencias y pegar me da la ventana de sintaxis con lenguaje de programación. Para
resolver el ejercicio pego la sintaxis abajo de la pregunta y luego la tabla generada.
Cómo calcular las medidas de tendencia central y de dispersión apropiadas para x (3) variables:
Vamos a analizar, estadisticos descriptivos, frecuencias, estadistico. Marcamos media, mediana,
moda (medidas de tendencia central) y desviación típica. Continuar y sacamos lo de mostrar graficos,
ponemos pegar. Nos aparece la ventana de sintaxis y ponemos ejecutar comando (play)
Cómo calcular cuartiles y percentiles para 3 variables:
Vamos a analizar, estadisticos descriptivos, frecuencias, estadistico. Marcamos cuartiles, percentiles
(ponemos números al azar: 25, 30. 35, 40, 45…). continuar, pegar. Ejecutar comando y listo. ¿Cómo
interpreto los datos que me tira la máquina?
El valor del percentil 75 es 3800, es decir que el 75% de los padres gana ese monto o menos
3.d. Realizar gráficos de sectores, barras e histogramas apropiados para 3 variables.
EJERCICIO Nº 1
Utilice la base de datos de EPH de personas. Recodifique la variable edad, teniendo en cuenta los
siguientes tramos:
· Menores de 15 años.
· De 15 años a 30 años
· De 31 años a 45 años.
· De 46 años a 60 años
· Más de 60 años
Cuando quiero comparar dos variables (edad) y ocupacion, en una ph nos va a dar
muchos datos imposible de analizar entonces voy a recategorizarlo. Vamos a pasar
de miles de varables a cinco. como hacemos esto? vamos a transormar y recodiicar
en distintas variables siempre conviene crear una variable nueva, eso se llama
recodificar en distinta variable. Nos damos cuenta qué es de escala porque tiene
una regla, y los circulos son nominales, y las ordinales tienen barras.
1.2 Etiquetar -usando el lenguaje de comandos- la nueva variable y sus
valores.
Primer paso etiquetar la nueva variable, vamos a tranformar, recodificar en distinta
variable y se nos abre un cuadro de comando en la cual vamos a elegir una
variable, en este caso es la edad. Ahí le cambiamos el nombre, por “edad_rec”,
hacemos click en cambiar y ponemos pegar, qué nos va a dar el lenguaje de
sintaxis. El segundo paso, para sus valores vamos a sintaxis y escribimos lo
siguiente:
*Etiquetado de la variable
variable labels edad_rec "Edad recodificada".
*Etiquetado de los valores o categorias de la variable.
value labels edad_rec
1 "menores de 15"
2 "de 15 a 30"
3 "de 31 a 45"
4 "de 46 a 60"
5 "más de 60".
Ponemos ejecutar y nos va a aparecer en el SPSS las etiquetas de los valores.
¿Cómo la interpretamos? Sirve para pasar de una variable de escala a una ordinal
que nos permita interpretar las variables.
Hacemos la tabla de frecuencias, que nos va a permitir ver estos valores de manera
más gráfica entonces ahí pasamos a interpretar. (reveer la carpeta)
Ejercicio 2 Mediante el comando IF, cree una variable SEXINGRE y codifíquela según un
cuadro. consiste en crear una tipología de unidad de análisis del data set. Consiste en hacer
una segmentación. Crear cinco tipologias de ingresos dependiendo del sexo. Para eso es
necesario crear una nueva variable, para cada caso un valor.
Vamos a usar el comando IF qué es otro tipo de comando: si pasa qué el hombre gana menos
de 8000 es 1”
Vamos a ir a transformar y luego en calcular variable, y se abre un cuadro de diálogo. El
ejercicio dice que la variable se va a llamar Sexingre asique en variable de destino pongo ese
nombre y lo primero que hago es poner 0 en expresión numérica y pegar. Seleccione el
lenguaje de comando y ejecutar.
El siguiente paso es encontrar a todos los varones qué ganen menos de 8000
entonces vengo a transformar calcular variables, apretamos IF o si… y colocamos:
ch04 = 1 & p47t < 8000 /// ch04 significa sexo, = a 1 qué es el tipo (HOMBRE 1
MUJER 2) & p47t qué son sus ingresos < qué significa menor a 8000. y así con
todos los casos.
Primero una tabla de frecuencia, osea voy a sintaxis y pongo fre estado. ejecutar y
en resultados te aparece una tabla de frecuencia.
Luego utilizo esto: PEA: ocupados + desocupados.
Tasa de empleo: población ocupada/ población total
Tasa de actividad: PEA/ población total
Tasa de desocupación: población desocupada/ PEA
Tasa de subocupación: población subocupada/ PEA.
Clase 17/04
Seguimos en el tp2.
Vamos a trabajar sobre el punto 4 y 5. creación y transformación de variables.
Elabore las condiciones lógicas, que permitan identificar los siguientes
universos:
4.1 Personas mayores de 65 años.
4.2 Mujeres mayores de 65 años.
4.3 Mujeres y Hombres desocupados, en edad de trabajar (14 a 60 años).
4.4 Mujeres jefes de hogar, mayores de 35 años que no trabajan o son inactivas.
4.5 Hombres y Mujeres jefes de hogar, mayores de 18 años que trabajan
actualmente.
4.6 Hombres jefes de hogar desocupados, niños de 0 a 5 años y adultos mayores
de 65 años.
4.7 Personas de entre 20 y 24 años con educación superior universitaria
incompleta.
Vamos al SPSS. transormar, calcular variable hacemos una nueva variable : v4.1
expresion numerica 0.
Operadores relacionales
LT
GT
NE
LE
GE
Operaciones lógicos
Y &
Clase 8/5 Terminamos el tp2 y continuamos con el tp3, en el cual vamos a aprender:
● Como crear un nivel de índice socioeconómico
● Darle distinta ponderación a las variables
● Utilizar técnica de análisis bivariado diferencia de medias para una numérica
y una categórica.
● dos categóricas: tabla de contingencia
● dos numéricas: correlacion y regresion.
Para medir variables complejas (porque tiene varias dimensiones) como el nivel de
xenofobia, o nivel socioeconómico podemos utilizar medidas como índice o escalas.
Vamos a aprender acerca el índice.
Para el primer punto vamos al data baset, tranformar y calcular variable
Recodificar en distintas variables: valores nuevos y antiguosv
Clase 5/06/19
¿Qué porcentaje de los varones son cónyuges? 12,1%
¿Que porcentaje de las jefas son mujeres? 43.3%
¿Que porcentaje de los casos son cónyuges y mujeres? 31.3%