Sunteți pe pagina 1din 25

Escuela de Sociologa

ESTADSTICAS I
Sesin 4

30 de agosto de 2015

Prof. Gabriel Otero


gabriel.otero@mail.udp.cl

Sesin anterior
1) Proceso de Operacionalizacin
a) Conceptos
b) Dimensiones
c) Indicadores
d) Atributos
2) La medicin de una variable
a) Exhaustividad
b) Exclusividad
c) Precisin

CONSTRUCCIN DE DATOS
Cmo trabajamos con datos?

Sesin 4 Construccin de datos


1) La encuesta y recoleccin de datos
2) Matriz de datos
3) Codificacin
4) Introduccin al SPSS

5) Datos perdidos
6) Preguntas de respuestas mltiples

Problema de
Investigacin
Datos

Objetivos de
Investigacin

Preguntas de
Investigacin

Medicin

Marco Terico
Operacionalizacin
Hiptesis
Identificacin
de Variables

La encuesta y recoleccin de datos


Los datos se pueden recopilar de mltiples formas, pero en las

ciencias sociales, generalmente, lo hacemos a travs de


encuestas.
La encuesta es un instrumento de recoleccin de datos, que
se presenta en la forma de cuestionario estandarizado,
estructurado, para obtener informacin de distinta ndole:
caractersticas sociodemogrficas (sexo, edad, estado civil,
etc.), actitudes frente a determinados fenmenos sociales
(aborto, marihuana, lucro en la educacin, situacin econmica
del pas), confianza en las instituciones, redes sociales de las
personas, entre otra.
Luego de tener los datos es necesario organizarlos
pero, cmo lo hacemos?

La encuesta y recoleccin de datos


1) Las preguntas de las encuesta se traspasan a la base de
datos como variables.
Cada variable corresponde a una columna en la base de

datos.
Una pregunta puede estar representada por ms de una
variable en la base de datos.
El proceso de traducir las preguntas de la encuesta en
variables es un proceso complejo y delicado: la codificacin.

La encuesta y recoleccin de datos


2) Las respuestas recogidas de las personas, gracias a una
encuesta, se traspasan a la base de datos como datos.
Cada persona corresponde a una fila en la base de datos.
Cada casilla representa la respuesta del individuo para esa

variable en particular (dato).

Base o matriz de datos


Las matrices de datos nos permiten incorporar, ordenar

y clasificar la informacin que hemos recogido sobre


nuestra unidad de anlisis (personas, hogares,
instituciones, pases, etc.), a partir de las variables
empricas que definimos en la operacionalizacin.
Las matrices de datos presentan un conjunto de casillas
en las cuales se introducen, numricamente, los datos
recopilados sobre las variables de inters.
Numricamente?... Entonces, qu ocurre con las
variables cualitativas, que no se definen naturalmente en
trminos numricos?

Codificacin
Cuando tenemos los datos (informacin) codificar las

categoras (atributos) de las variables como valores


numricos para poder procesarlas con facilidad en programas
estadsticos.
Es conveniente asignar etiquetas a los valores de las
variables para recordar qu significan los cdigos
numricos.
Generalmente los valores de las variables van de 1 hasta
la cantidad de categoras que tenga la variable.
Categoras de la
variable sexo

Valores/cdigos
Numricos de la variable

Etiquetas de los valores


numricos de la variable

MUJER

MUJER

HOMBRE

HOMBRE

EJEMPLO 1: Codificacin de categoras


Cun de acuerdo o en desacuerdo est usted con el aborto

cuando est en peligro la vida de la madre?


Categoras de la variable

Valores/cdigos
Numricos de la variable

Etiquetas de los valores


numricos de la variable

MUY DE ACUERDO

MUY DE ACUERDO

DE ACUERDO

DE ACUERDO

NI DE ACUERDO NI EN
DESACUERDO

NI DE ACUERDO NI EN
DESACUERDO

EN DESACUERDO

EN DESACUERDO

MUY EN DESACUERDO

MUY EN DESACUERDO

Ser necesario codificar los valores de las variables


cuantitativas en nmeros?

Algunas consideraciones
Aunque se codifiquen como nmeros, debemos

recordar siempre el verdadero tipo de las variables y su


significado cuando vayamos a usar programas de clculo
estadstico.
No todo est permitido con cualquier tipo de variable.
A veces se pueden asignar cdigos numricos a
respuestas especiales como No sabe o No Responde.
Estas situaciones debern ser tenidas en cuenta en el
anlisis en algunos casos podrn considerarse como
datos perdidos.

SPSS
Statistical Package for the Social Sciences

Ventanas ms importantes
Vista de Variables
Vista de Datos
Editor de Sintaxis
Vista de Resultados

Vista de Variables

Vista de Datos

Editor de Sintaxis

Vista de Resultados

Datos perdidos
Son casillas, en la matriz de datos, que no contienen

informacin o cuya informacin no es clara:


Sin informacin (casilla en blanco)
No respuesta
No aplica
Respuesta inapropiada

Importa mucho saber qu proporcin (porcentaje)

representan respecto del total de datos.


En general, no se grafican ni se incluyen en tablas. Sin

embargo, cuando representan ms del 5% o 10% se


debe dar cuenta de su existencia de formas va a
depender del investigador y el anlisis que haga.

Respuestas mltiples
Generalmente, las preguntas slo contemplan una

alternativa de respuesta posible.


Hay ocasiones donde tenemos preguntas de respuestas
mltiples. Son preguntas donde se puede contestar ms
de una alternativa de respuesta, sin jerarquizarlas.
Cada respuesta representa una variable distinta en la
matriz de datos, de modo que el total de variables para
esta pregunta depender del caso que tenga un mayor
nmero respuestas.
Estas preguntas se analizan de forma distinta lo
veremos ms adelante.

EJEMPLO 2: Preguntas de respuestas mltiples


(p1) Por favor, mencione las 3 reas en las que, por su

importancia, debera enfocarse el gobierno de Michelle Bachelet.


Categoras de
posibles respuestas

Valores/cdigos
Numricos de la variable

Etiquetas de los valores


numricos de las 3 VARIABLES

DELINCUENCIA

DELINCUENCIA

SALUD

SALUD

EDUCACIN

EDUCACIN

MEDIO AMBIENTE

MEDIO AMBIENTE

CORRUPCIN

CORRUPCIN

POBREZA

POBREZA

DESEMPLEO

DESEMPLEO

Se crean tres variables de iguales caractersticas: p1_1, p1_2, p1_3

Para terminar preguntas vs. variables


No olvidar que una pregunta, no siempre equivale a una

sola variable.
Para saber cuntas variables presenta el cuestionario de
una encuesta, debemos pensar en cuntas respuestas
posibles tiene.
Entonces, cada respuesta posible del cuestionario tiene
que verse reflejada en una variable.

EJEMPLO 3: Preguntas vs. Variables


(p2) Por favor, indqueme si conoce o no personas que tengan los
siguientes oficios
Etiqueta corta

Variables (oficios)

SI

NO

P2_1

Obrero de la construccin

P2_2

Cocinero

P2_3

Chofer de taxi o colectivo

P2_4

Profesor de colegio

P2_5

Contador

P2_6

Arquitecto

P2_7

Mdico

P2_8

Abogado

VARIABLES: tenemos 8 variables a partir de una pregunta general.

Entonces
1) La encuesta y recoleccin de datos
2) Matriz de datos
3) Codificacin
4) Introduccin al SPSS

5) Datos perdidos
6) Preguntas de respuestas mltiples

BIBLIOGRAFA
Agresti, A., & Franklin, C. A. (2007). Statistics: the art and science

of learning from data. Captulo N1


Bryman, A., & Cramer, D. (2005). Quantitative Data Analysis with
SPSS Release 12 and 13. Captulo N2.
Field, A. P. (2009). Discovering statistics using SPSS. Captulo
N3.
Pardo Merino, A., & Ruiz, M. . (2002). SPSS 11: gua para el
anlisis de datos. Madrid: McGraw-Hill, Interamericana de Espaa.
Prez Lpez, C. (2005). Tcnicas estadsticas con SPSS 12:
aplicaciones al anlisis de datos. Madrid [etc]: Pearson.
Ritchey, F. (2008). Estadstica para las Ciencias Sociales. Mxico:
McGrawll Hill.

S-ar putea să vă placă și