Sunteți pe pagina 1din 12

Escuela Nacional de Estadística e Informática - Arequipa

CREACION DE UNA MATRIZ DE DATOS

DEFINICIONES BÁSICAS

Población:

Definición 1: El conjunto de personas, animales o cosas que son objeto de nuestro estudio.
Definición 2: es la que está formada por la totalidad de las observaciones en las cuales se tiene cierto
interés.
Elemento o Unidad Estadística: Son las personas, animales o cosas que forman la población.

Población finita: cuando el número de elementos que la forman es numerable, se puede contar, por ejemplo
el número de alumnos de la universidad, cantidad de empleados de una fábrica, etc.-
Población infinita: cuando el número de elementos que la forman es incontable o tan grande que puede
considerarse infinito. Como por ejemplo, si se realizara un estudio estadístico sobre los productos que hay en
el mercado, producción de un torno, etc.

Ejemplos de poblaciones son:


Todos los estudiantes de una universidad.
Todos los votantes inscriptos en un país.
Todas las familias que viven en una ciudad.
Todas las acciones que se cotizan en una bolsa de valores.
Todas las reclamaciones que recibe en un año una compañía de seguros.
Todas las cuentas pendientes de cobro de un comercio.
Todas las boletas de ventas correspondientes a un año de un comercio que hay que auditar.
Etc.

Elemento u Unidad Estadística: Los elementos de una población poseen una serie de cualidades, propiedades
o rasgos comunes que se denominan en estadística CARACTERES ó VARIABLES.
Ejemplo: Si tenemos un estudio sobre personal de la administración pública provincial, todos los empleados
poseen una serie de características:
Edad.
Estado civil.
Número de hijos.
Nivel de instrucción alcanzado.-
Antigüedad en el trabajo.
Tarea que realiza.-
Remuneración que recibe.
Etc…
Estas características pueden tomar valores diferentes, en el ejemplo anterior los miembros de la
administración pública podrían tener diferentes edades, diferentes estados civiles, etc; por ello se les llama
también VARIABLES.

CLASIFICACION DE VARIABLES

1
Profesor: Alejandro Berrocal
Escuela Nacional de Estadística e Informática - Arequipa

Estas Características o Variables pueden tomar valores diferentes, en el ejemplo anterior los miembros de la
administración pública podrían tener diferentes edades, diferentes estados civiles, etc.
De acuerdo al tipo de datos que pueden tomar:

VARIABLES CUALITATIVAS O CATEGORICAS: Son aquellas que por su propia naturaleza no se pueden medir y
se describen mediante palabras. Su principal utilidad es la clasificación, a cada valor q puede tomar la variable
se le llama Categoría. Ejemplo: el sexo, nacionalidad, raza, color de pelo, estado de ánimo, tipo de trabajo,
etc.
Las variables Cualitativas pueden ser de dos tipos:

VARIABLES CUALITATIVAS NOMINALES: La escalas nominales o de clasificación consisten en clasificar


objetos reales según ciertas características, tipologías o nombres, dándoles una denominación o
símbolo, sin que implique ninguna relación de orden, distancia o proporción entre esos objetos.
Ejemplos: sexo, distrito donde vive.
VARIABLES CUALITATIVAS ORDINALES: Con esta escala se establecen posiciones relativas de objetos
o individuos en relación a una característica, sin que se reflejen distancias entre ellos. Hay un sentido
de mayor (>) menor (<).
Ejemplos: nivel de instrucción, grado académico.

VARIABLES CUANTITATIVAS: Son aquellas que se describen mediante números, provienen de contar o medir.
Por ejemplo: número de hijos, puntajes de un test, edad, el peso, la altura, ingreso de una empresa, salario de
una persona, minutos de demora en recorrer una distancia, tiempo en elaborar una determinada pieza de
producción, etc.

Habiendo repasado los conceptos anteriores ahora procederemos a crear una matriz de datos en SPSS para
una investigación a los miembros afiliados a un club, donde se requieren saber los siguientes datos:
Género, Estado Civil, Nivel de Instrucción, Edad e Ingresos Mensuales.

CREACION DE UNA MATRIZ DE DATOS CON SPSS.

Luego de Abrir SPSS tenemos la siguiente ventana la cual se le conoce como ventana de Editor de Datos, dentro
de esta ventana nos ubicamos en la parte inferior en el lado izquierdo donde tenemos dos fichas, una con el
nombre Vista de Datos y otra con el nombre Vista de Variables.

2
Profesor: Alejandro Berrocal
Escuela Nacional de Estadística e Informática - Arequipa

Para comenzar a crear nuestra Matriz de Datos primero debemos definir las variables que vamos a necesitar,
para ello nos ubicamos en la vista de variables.

En esta vista cada fila representa una variable, cada columna corresponde a una propiedad de esa variable.

Comenzamos creando la variable Género, para ello nos ubicamos en la primera casilla, la que está en la
primera columna “Nombre” y en la primera fila y seguimos los siguientes pasos.
Paso1: Escribimos el nombre de nuestra variable, en este caso “Genero”.
Paso2: Pasamos a la siguiente columna “Tipo” y hacemos click sobre los botones con tres puntos, a
continuación nos aparece la siguiente ventana

3
Profesor: Alejandro Berrocal
Escuela Nacional de Estadística e Informática - Arequipa

En esta ventana en el lado izquierdo elegimos el tipo de datos que va a almacenar esta variable

En la zona izquierda elegimos la alternativa Numérico.

La variable Género que estamos definiendo es una variable categórica que representa en genero de una
persona “Masculino” o “Femenino”, sus respuestas son palabras por lo cual podríamos elegir la alternativa
“Cadena” (Texto), pero para un mejor manejo estadístico vamos a codificar (asignar números a las categorías)
las categorías de esta variable de la siguiente manera:
- 1 para Masculino, cuando alguna persona responda que es de sexo masculino, almacenaremos el
número uno.
- 2 para Femenino, cuando alguna persona responda que es de sexo femenino, almacenaremos el
número dos.

En la zona de la derecha indicamos la Anchura y los decimales.

En Anchura indicamos la cantidad de dígitos que vamos a necesitar para esta variable, en nuestro caso solo
vamos almacenar los números 1 y 2 (1 para Masculino y 2 para Femenino), por lo cual siempre necesitaremos
solo un digito, con un digito podemos almacenar hasta 10 respuestas, desde cero hasta nueve, con dígitos
hasta 100 respuestas desde cero hasta noventa y nueve.
En Posiciones Decimales indicamos cuantos decimales a necesitar, en nuestra caso cero, ya q solo
almacenamos los números enteros uno o dos.

4
Profesor: Alejandro Berrocal
Escuela Nacional de Estadística e Informática - Arequipa

Luego hacemos click en aceptar.

Paso3: Pasamos a la columna Etiqueta y aquí escribimos una breve descripción de nuestra variable, o si se
trata de una encuesta la pregunta que estamos respondiendo. Esta etiqueta es la que aparecerá más adelante
cuando elaboremos nuestras tablas de frecuencias. En nuestro caso escribiremos “Genero”
Paso4: Vamos a la columna “Valores” y hacemos click sobre el botón con tres puntos q tenemos ahí.
Nos aparece la siguiente ventana:

En esta ventana realizamos la codificación de las respuestas (categorías), el número uno para masculino y dos
para femenino. Nos ubicamos en la casilla Valor y escribimos el número 1 luego en la casilla Etiqueta y
escribimos Masculino, luego hacemos click en el botón Añadir. Hacemos lo mismo para “Femenino”.

Al final debe quedarnos de esta manera.

Luego hacemos click en aceptar para terminar la codificación.

5
Profesor: Alejandro Berrocal
Escuela Nacional de Estadística e Informática - Arequipa

Paso5: Nos ubicamos en la columna Medida, hacemos click sobre la flecha hacia abajo y elegimos el tipo de
variable con la que estamos trabajando, en nuestro caso la variable Género es Nominal.

Nuestra variable Género al final debe quedar de la siguiente manera:

Para continuar con la siguiente variable nos ubicamos al inicio de la segunda fila, continuamos con la siguiente
variable Estado Civil.

Paso1: Nos ubicamos en la columna “Nombre” e indicamos el nombre para esta variable, en nuestro caso
“Estado.Civil” los nombres no pueden contener espacios en blanco, si queremos un nombre con más de una
palabra podemos de separarlas con un punto.

Paso2: Nos ubicamos en la columna “Tipo” e indicamos el tipo de datos que almacenaremos, en nuestro caso
para la variable estado civil tenemos cuatro alternativas: Soltero Casado Viudo y Divorciado, para un mejor
manejo estadístico las codificaremos: 1 Soltero, 2 Casado, 3 Viudo, 4 Divorciado.
Por lo cual en el lado izquierdo elegimos la alternativa “Numérico”
En la derecha indicamos Anchura 1 y Decimales 0, con un digito almacenamos hasta 10 respuestas, y no
necesitamos decimales.

Paso3: Pasamos a la columna “Etiqueta” y escribimos una breve descripción de la variable en este caso “Estado
Civil”

Paso4: Pasamos a la columna “Valores” e indicamos las codificaciones:

6
Profesor: Alejandro Berrocal
Escuela Nacional de Estadística e Informática - Arequipa

Paso5: Pasamos a la columna “Medida” e indicamos el tipo de variable en nuestro caso la variable Estado Civil
es Nominal

La vista de Variables debe verse de la siguiente manera:

Pasamos a la siguiente variable Nivel de Instrucción:

Paso1: Nos ubicamos en la columna “Nombre” e indicamos el nombre para esta variable, en nuestro caso
“Nivel.Instruccion”.

Paso2: Nos ubicamos en la columna “Tipo” e indicamos el tipo de datos que almacenaremos, en nuestro caso
para la variable nivel de instrucción tenemos cuatro alternativas: Primaria, Secundaria, Superior Técnico y
Superior Universitaria, para un mejor manejo estadístico las codificaremos: 1 Primaria, 2 Secundaria, 3
Superior Técnico y 4 Superior Universitaria.
Por lo cual en el lado izquierdo elegimos la alternativa “Numérico”

7
Profesor: Alejandro Berrocal
Escuela Nacional de Estadística e Informática - Arequipa

En la derecha indicamos Anchura 1 y Decimales 0, con un digito almacenamos hasta 10 respuestas, y no


necesitamos decimales.

Paso3: Pasamos a la columna “Etiqueta” y escribimos una breve descripción de la variable en este caso “Nivel
de Instrucción”

Paso4: Pasamos a la columna “Valores” y codificamos las respuestas:

OJO: En este caso el nivel de instrucción es una variable ordinal, a diferencia de las variables nominales
donde la codificación puede ser en cualquier orden, en el caso de las variables ordinales la codificación debe
reflejar el orden. Es decir necesariamente debemos asignar el número más bajo a la categoría más baja, el
segundo número más bajo a la segunda categoría más baja y así sucesivamente.

Paso5: Finalmente pasamos a la columna Medida e indicamos el tipo de variable en nuestro caso para la
variable Nivel de Instrucción es ordinal ya q si existe un sentido de orden o jerarquía entre las categorías.

8
Profesor: Alejandro Berrocal
Escuela Nacional de Estadística e Informática - Arequipa

Pasamos a la siguiente variable Edad:

Paso1: En la columna “Nombre” e indicamos el nombre para esta variable, en nuestro caso “Edad”.

Paso2: Nos ubicamos en la columna “Tipo” e indicamos el tipo de datos que almacenaremos, en nuestro caso
para la variable Edad es una variable Cuantitativa
Por lo cual en el lado izquierdo elegimos la alternativa “Numérico”
En la derecha indicamos Anchura 2 y Decimales 0, con dos dígitos almacenamos hasta 100 respuestas desde
cero hasta 99, consideraremos q las posibles respuestas de edad solo llegaran hasta 99 años y no necesitamos
decimales asumiremos que las respuestas serán números enteros.

Paso3: Pasamos a la columna “Etiqueta” y escribimos una breve descripción de la variable en este caso “Edad”

Paso4: Pasamos a la columna “Valores” y la dejamos vacía, las variables cuantitativas no necesitan ser
codificadas, el número que escriba el encuestado es la respuesta que debemos de almacenar:

Paso5: Finalmente vamos a la columna “Medida” e indicamos el tipo de variable en este caso la edad es una
variable cuantitativa, en SPSS elegimos Escala (para variables cuantitativas)

Pasamos a la siguiente variable Ingresos Mensuales:

Paso1: En la columna “Nombre” indicamos el nombre para esta variable “Ingresos Mensuales”.

Paso2: Nos ubicamos en la columna “Tipo” e indicamos el tipo de datos que almacenaremos, en nuestro caso
para la variable Ingresos Mensuales es una variable Cuantitativa.
Por lo cual en el lado izquierdo elegimos la alternativa “Numérico”
En la derecha indicamos Anchura 5 suponiendo que los ingresos lleguen hasta 99999 y Decimales 0, y no
necesitamos decimales asumiremos que las respuestas serán números enteros.

Paso3: Pasamos a la columna “Etiqueta” y para una breve descripción de la variable “Ingresos Mensuales”

Paso4: Pasamos a la columna “Valores” y la dejamos vacía, las variables cuantitativas no necesitan ser
codificadas, el número que escriba el encuestado es la respuesta que debemos de almacenar:

9
Profesor: Alejandro Berrocal
Escuela Nacional de Estadística e Informática - Arequipa

Paso5: Finalmente vamos a la columna “Medida” e indicamos el tipo de variable en este caso la edad es una
variable cuantitativa, en SPSS elegimos Escala (para variables cuantitativas)

Finalmente nuestra vista de variables debe verse de la siguiente forma:

Es altamente recomendable acompañar nuestra base de datos junto a un documento con el Diccionario de
Datos el cual básicamente es una tabla donde se muestran las principales características de cada una de las
variables. Incluso es preferible primero diseñar el Diccionario de Datos para luego recién elaborar la matriz de
datos en SPSS.

En nuestro caso el diccionario de datos seria el siguiente:

Nombre Tamaño Decimales Formato Etiqueta Tipo


Genero 1 0 N Genero Nominal
1 Masculino
2 Femenino
Estado.Civil 1 0 N Estado Civil Nominal
1 Soltero
2 Casado
3 Viudo
4 Divorciado
Nivel.Instruccion 1 0 N Nivel de Instrucción Ordinal
1 Primaria
2 Secundaria
3 Superior Técnica
4 Superior Universitaria
Edad 2 0 N Edad Cuantitativa
Ingresos.Mensuales 5 0 N Ingresos Mensuales Cuantitativa

Tamaño equivale a anchura.


Formato N para datos numéricos, C para datos cadena (texto)

10
Profesor: Alejandro Berrocal
Escuela Nacional de Estadística e Informática - Arequipa

INGRESANDO DATOS.

Habiendo culminado el diseño de nuestra matriz de datos ya podemos a comenzar a subir los datos de los
miembros del club.

Nos ubicamos en la vista de variables la cual ahora debe verse de la siguiente manera.

En la Vista de Datos cada fila representa un caso de estudio (unidad Estadística) y cada columna representa
una variable, si nos fijamos, ahora en la las cabeceras de columnas vemos los nombres de nuestras variables.

Es aquí en donde subiremos la información de los miembros del club; suponiendo que el primer miembro
sea Carlos y sus datos Género Masculino, Estado Civil Casado, Nivel de Instrucción Superior Técnico, 30 años
y con un sueldo mensual de 2000 soles.

Ingresamos los valores por los cuales hicimos la codificación directamente

Para ver los valores por los cuales hicimos las codificaciones hacemos click en el botón “Mostrar etiquetas”
de la barra de herramientas.

11
Profesor: Alejandro Berrocal
Escuela Nacional de Estadística e Informática - Arequipa

Luego nuestros datos se verán de la siguiente forma:

Podemos continuar añadiendo datos de manera indefinida.

Finalmente guardaremos nuestra Base de Datos de la misma forma que lo hacemos en cualquier otro
programa de Windows.

Menú Archivo -> Guardar….

12
Profesor: Alejandro Berrocal

S-ar putea să vă placă și