Sunteți pe pagina 1din 16

1

Prctica 1. Introduccin al SPSS

Prctica 1
INTRODUCCIN AL PROGRAMA SPSS
Y MANEJO DE DATOS

Objetivos:
En esta prctica, se pretende familiarizar a los estudiantes con la base de datos
incorporada en la aplicacin SPSS. A lo largo de la prctica los estudiantes aprendern
a introducir datos desde el teclado, manejar el editor de esta aplicacin, crear nuevas
variables como transformacin de las variables originales, filtrar datos y fundir e
importar archivos de datos.

ndice:
1.
2.
3.
4.
5.
6.
7.
8.

Aspectos tcnicos
Entrar al programa
Definicin de Datos
Introduccin y Edicin de datos
Transformacin de una Variable
Recodificacin de una Variable
Filtrado de datos
Ejercicios

1. Aspectos tcnicos

Prcticas de Mtodos Estadsticos en la ingeniera. Departamento de Informatica.

Prctica 1. Introduccin al SPSS

El programa SPSS para Windows es una versin para ordenadores personales del
paquete estadstico SPSS (Statistical Package for Social Sciences).
El programa trabaja con 3 tipos de archivos:
los archivos de datos propios de SPSS.
.sav
los archivos de grficos y resultados de SPSS.
.spo
los archivos de sintaxis de SPSS.
.sps
Adems, permite importar archivos creados con otras aplicaciones: Excel, Lotus, Dbase, ...
y exportar archivos de datos y grficos.

2. Entrar al programa
Seleccionamos SPSS y se abrir una ventana de opciones a realizar:

Seleccionaremos Introducir datos, pulsando con el botn izquierdo del ratn en el


crculo de Introducir datos y posteriormente en Aceptar y obtendremos la ventana de
edicin de datos:

Prcticas de Mtodos Estadsticos en la ingeniera. Departamento de Informatica.

Prctica 1. Introduccin al SPSS

En la parte inferior de la pantalla principal aparece la barra de estado en la que hay


informacin sobre el procesador de SPSS (SPSS El procesador est preparado),
adems de dos pestaas que permiten seleccionar "vista de datos" o "vista de
variables". En la parte superior aparece la barra de men. Al situar el puntero del ratn
sobre cualquiera de sus elementos, aparece informacin sobre las operaciones que
podemos realizar:
Archivo:

Crear, abrir o grabar los diferentes archivos de SPSS, mostrar informacin


de datos...., imprimir, acceso directo a los ltimos archivos abiertos, salir del
SPSS, ...
Edicin: Deshacer, borrar, copiar, cortar, pegar, buscar, opciones, ..
Ver:
Barra de estado, Barras de herramientas, Fuentes, Cuadrcula, Etiquetas
de valor.
Datos:
definir fechas y efectuar modificaciones en el archivo de datos: seleccionar,
aadir, ponderar, ordenar, ir al caso ...., etc.
Transformar: Modificacin y generacin de nuevas variables. Las funciones de este
men y del anterior son temporales y slo estn vigentes durante la sesin
sin que afecten al archivo original de datos. Si queremos que sean
permanentes debemos grabar los cambios.
Analizar: Anlisis estadsticos instalados.
Grficos: Edicin y creacin de diversos tipos de grficas de alta resolucin.
Utilidades: Cambiar fuentes, informacin sobre archivos.
Ventana: Funciones habituales para controlar las ventanas. Se pueden distinguir los
siguientes tipos de ventanas:
Edicin de datos de SPSS (Ventana principal con los mens)
Visor de SPSS
?:
Ayuda en el formato tpico de Windows.

Prcticas de Mtodos Estadsticos en la ingeniera. Departamento de Informatica.

Prctica 1. Introduccin al SPSS

3. Definicin de los Datos


Antes de empezar el anlisis de los datos conviene, siempre, prepararlos para su mejor
manejo e interpretacin.
Los archivos de datos habitualmente toman la forma de una matriz en la que cada fila
representa los valores que un individuo determinado tiene para unas variables. En
terminologa de SPSS cada fila es un caso. En las columnas de dicha matriz aparecen
los diferentes valores que una variable determinada toma para cada uno de los
individuos de ese grupo.

Veamos cmo abrir un archivo de datos:


selecciona Archivo/Abrir/Datos y busca el archivo AMBIENTE
aparecer la siguiente ventana:

Observa qu sucede al pinchar, con el ratn, el icono de etiquetas:

Prcticas de Mtodos Estadsticos en la ingeniera. Departamento de Informatica.

Prctica 1. Introduccin al SPSS

Archivo de datos AMBIENTE:


Este archivo de datos recoge la informacin obtenida en un proyecto de investigacin
medioambiental en el que se estudiaron los niveles de contaminacin atmosfrica en la
Comunidad Valenciana. Para ello se analizaron 100 observaciones aleatorias en cada
provincia, midiendo en el aire la concentracin de sulfato, el pH y la presencia de un
nivel elevado de ozono. Los datos obtenidos se encuentran en las variables:
sulfato: concentracin de sulfato en el aire
pH: pH observado en el aire
provin: provincia en la que se recogi la informacin (1=Alicante, 2=Castelln,
3=Valencia)
ozono: indica si hay un nivel elevado de ozono (1=nivel elevado, 0=nivel normal)

El primer paso a realizar para trabajar con un archivo de datos es definir las variables.
Para definir cada variable hay dos procedimientos:
hacer doble clic sobre el encabezamiento de la variable o
seleccionar, en la parte inferior, la pestaa Vista de variables.

Veamos cmo estn definidas las variables del archivo AMBIENTE.


Selecciona Vista de variables y aparece la ventana:

Observa que hay una fila para cada variable y que existen 10 columnas: Nombre, Tipo,
Anchura, Decimales, Etiqueta, Valores, Perdidos, Columnas, Alineacin y Medida. La
definicin de una variable se basa en las opciones que se ofrecen en esa ventana:
Asignar un Nombre a cada variable, cumpliendo las siguientes reglas:
Nombres con no ms de 8 caracteres (siendo siempre el primero una letra o @).
No utilizar smbolos como &, /, $, etc.
No utilizar nunca espacios en blanco.
No utilizar expresiones como ALL, AND, BY, EQ, GE, GT, LE, NE, NOT, OR, TO, o
WITH.

Asignar un Tipo a cada variable, indicando el mximo nmero de dgitos que


deseamos para anotar las observaciones de la variable y el tipo de la variable con la
que vamos a trabajar, alfanumrica, fecha, moneda o numrica, indicando en este
caso el nmero de cifras decimales con que queremos que aparezca en el editor.

Prcticas de Mtodos Estadsticos en la ingeniera. Departamento de Informatica.

Prctica 1. Introduccin al SPSS

SPSS permite trabajar con los siguientes tipos de variables:


Numricas: formato numrico estndar
Coma: comas de separacin cada tres posiciones. Un punto para la parte
decimal.
Punto: al contrario que el anterior.
Notacin Cientfica: uso de la E para exponente. Ejemplo 2,34E2
Cadena: variable alfanumrica (de ms de 8 caracteres se considera larga).
Adems estn los formatos de fecha, dlar y moneda personalizada.
Si no escogemos el tipo, el sistema lo asigna automticamente, siendo el formato por
defecto: Numrica 8.2 que significa: Anchura: 8 y Decimales: 2; es decir, una
amplitud de columna de 8 espacios, siendo los 2 ltimos para los decimales.

Haz un clic sobre el recuadro coloreado en la celda correspondiente al Tipo en la


variable sulfato y observa estas posibilidades.

Pulsa los tipos Fecha, Dlar, Moneda personalizada y Cadena y observa los formatos
permitidos.
Para salir, sin modificar el tipo original de la variable, pulsa Cancelar.
Observa el tipo del resto de variables.
Asignar una Etiqueta a cada variable de no ms de 120 caracteres (entre 30 y 40 es
el valor recomendado) que nos permita tener ms informacin sobre esa variable.

Asignar Valores: se trata de asignar etiquetas a los valores de cada variable. No es


obligatorio, pero s muy til en algunos casos.
Sitate en el campo correspondiente a Valores de la variable ozono y pincha
sobre el recuadro coloreado: Qu significa esta variable? Qu valores toma?
Qu significa cada valor?
Para salir, pulsa Cancelar.

Prcticas de Mtodos Estadsticos en la ingeniera. Departamento de Informatica.

Prctica 1. Introduccin al SPSS

Definir Perdidos: permite definir los valores de los datos especificados como
perdidos por el usuario. A menudo es til para saber por qu se pierde informacin.
Por ejemplo, se puede querer distinguir el dato perdido correspondiente a un
entrevistado que se niega a responder del dato perdido debido a que la pregunta no
afectaba a dicho entrevistado. Los valores de datos especificados como perdidos por
el usuario aparecen marcados para un tratamiento especial y se excluyen de la
mayora de los clculos.
Sitate en el campo correspondiente a Perdidos de cualquier variable y pincha sobre
el recuadro coloreado, aparece:

Los cdigos asignados a los valores ausentes deben de ser coherentes con el tipo de
variables declarado: numricos para las numricas y alfanumricos para las
alfanumricas (mximo 9 caracteres). Se pueden introducir hasta 3 valores perdidos
(individuales) de tipo discreto, un rango de valores perdidos o un rango ms un valor
de tipo discreto. Slo pueden especificarse rangos para las variables numricas.
Estos valores ausentes son denominados por SPSS "valores ausentes definidos por el
usuario" (user-defined missing values), a diferencia de los definidos por el sistema
(system-missing values o sysmis). Estos ltimos corresponden a los que establece el
sistema para los espacios en blanco y caracteres ilegales que puedan haber en el
archivo de datos. Aparecen en los listados representados por comas.

Prcticas de Mtodos Estadsticos en la ingeniera. Departamento de Informatica.

Prctica 1. Introduccin al SPSS

Definir Columnas: consiste en especificar la amplitud de la columna. Podemos


hacerlo tambin desde el propio archivo de datos.
Definir Alineacin: seleccionar la justificacin de las entradas de la columna:
Izquierda, Derecha y Centrado.
Especificar medida. Se puede seleccionar uno de los tres niveles de medida:
Escala: los valores de datos son numricos en una escala de intervalo. Las
variables de escala deben ser numricas.
Ordinal: los valores de datos representan categoras con un cierto orden
intrnseco (bajo, medio, alto; totalmente de acuerdo, de acuerdo, en
desacuerdo). Las variables ordinales pueden ser de cadena o valores
numricos. Notar que para variables de cadena ordinales, se asume que el
orden alfabtico de los valores de cadena indica el orden correcto de las
categoras; en el caso de bajo, medio y alto el orden sera alto, bajo y medio
(orden que no es correcto), por lo que es ms fiable utilizar cdigos numricos
para representar datos ordinales que usar etiquetas de estos cdigos.
Nominal: los valores de datos representan categoras sin un cierto orden
intrnseco. Las variables nominales pueden ser de cadena o valores numricos
que representan categoras diferentes, por ejemplo 1 = Hombre y 2 = Mujer.

Observa cmo han sido definidas todas las variables del archivo AMBIENTE.
Para salir de cada ventana, pulsa Cancelar. As evitars modificar el archivo.

Prcticas de Mtodos Estadsticos en la ingeniera. Departamento de Informatica.

Prctica 1. Introduccin al SPSS

4. Introduccin y Edicin de los datos


Para abrir un archivo nuevo de datos de SPSS debemos seleccionar el men de
Archivo/Nuevo/Datos:

Si ya estamos en el editor de datos vaco, no hace falta.

Si, previamente, tenamos abierto otro archivo de datos, por


ejemplo AMBIENTE.sav, y hemos realizado alguna modificacin de este
archivo, antes de cerrar ste y abrir uno nuevo, nos preguntar si queremos
guardar los cambios realizados. La respuesta es NO, de este modo, vuestros
compaeros podrn observar, tambin, el archivo original.

Una vez tengas la ventana del Editor de datos del SPSS abierta y vaca, lee atentamente
las siguientes instrucciones antes de introducir datos:

Debemos definir las variables adecuadamente (en Vista de variables) de forma que
despus podamos empezar a introducir los datos en cualquier orden (en Vista de
datos).

Para introducir los datos, nos situamos en una casilla, tecleamos su valor y pulsamos
Intro o el Tabulador o nos situamos con el ratn en otra casilla. Podemos introducir
los datos por filas o columnas indistintamente.

Conviene ir actualizando el archivo con la opcin Guardar Datos o con el botn de


grabar habitual en otras aplicaciones Windows. Para ello:
si ya lo habamos guardado con anterioridad, para guardar las ltimas
modificaciones, seleccionaremos la opcin de Guardar dentro de Archivo,
si es la primera vez que lo guardamos, como todava no le hemos asignado un
nombre al archivo, seleccionaremos la opcin Guardar como ... dentro de
Archivo. Nos pedir el nombre que queremos darle al archivo, su extensin (por
defecto utilizar .sav para datos del SPSS) y la carpeta en que queremos
guardarlo.

Ejercicio1: Introduce el archivo de datos que aparece a continuacin siguiendo las


instrucciones:
1.- Define las variables con el nombre indicado, el tipo y formato convenientes.
3.- Introduce los valores numricos del archivo de datos.
4.- Graba el archivo de datos con nombre ambiente1.sav en tu disquete.

Prcticas de Mtodos Estadsticos en la ingeniera. Departamento de Informatica.

Prctica 1. Introduccin al SPSS

10

Una vez introducidos los datos podemos considerar el modificarlos, ya sea para
introducir o ampliar con nuevos valores o para rectificar alguno ya introducido. La
edicin de datos en SPSS contiene comandos para: cortar, copiar, pegar, eliminar y
buscar (similar a otras aplicaciones Windows), insertar variables o casos, ir al caso,
ordenar casos, ... y se encuentran en el men Edicin y Datos.

Ejercicio 2.
1 - Insertar, entre los individuos 4 y 5, los datos correspondientes al siguiente
individuo: 2,9473
6,9708
Alto
Alicante
Para ello, nos situamos en el individuo n 5 y seleccionamos Insertar caso.
2 - Modificar el valor de la variable sulfato del individuo 11, por 2,2
3 - Modificar las especificaciones (nombre, tipo y formato columna ) de las variables
para que tengan la presentacin que t desees.
4.- Asignar las siguientes etiquetas de variable:
ozono
nivel de ozono registrado
provin
provincia del lugar de recogida de datos
5.- Sitate en Vista de datos y coloca la flecha del ratn encima del nombre de cualquier
variable, qu observas?
6.- Asignar etiquetas de valor a las variables ozono y provin:
ozono:
0 = normal, 1 = alto
provin:
1 = Alicante, 2 = Castelln, 3 = Valencia
7.- Pulsa el smbolo de etiqueta de la barra de herramientas, qu observas?
8.- Guardar las modificaciones en el archivo ambiente1.sav

Prcticas de Mtodos Estadsticos en la ingeniera. Departamento de Informatica.

Prctica 1. Introduccin al SPSS

11

5. Transformacin de una Variable


Una vez elaborado el archivo de datos, y previamente al anlisis estadstico de los
datos, es posible modificar los datos originales presentes en el archivo. Tales cambios
pueden referirse a las variables, a los casos, o al archivo en su conjunto. Puede
interesarnos tanto la recodificacin de los valores de una variable como la generacin
de nuevas variables mediante transformaciones de las ya existentes.
SPSS permite generar nuevas variables mediante transformaciones numricas
efectuadas sobre las antiguas.
Supongamos que, despus de tener el archivo de datos ya introducido, hemos detectado
un error en la medicin del pH debido a que el aparato utilizado incrementa en 0,3
unidades todas las mediciones que realiza. Convendra generar una nueva variable que
incorporara esta correccin.
Para ello elegimos Transformar/ Calcular, y realizamos los siguientes pasos:
1. asignar un nombre y un tipo (por defecto ser numrica) a la nueva variable en el
cuadro de texto de la Variable de destino, en nuestro caso new_pH
2. definir la Expresin numrica que va a permitir calcular los valores de la misma.
Para ello utilizaremos los nombres de las variables del archivo (podemos
escribirlos o seleccionarlos del listado que aparece), constantes, operadores y
funciones.

3. pulsa Aceptar.
Para construir estas expresiones pueden usarse operadores aritmticos como +, -, *, /,
** y funciones como SQRT, EXP, LG10, LN, ARTAN, COS, SIN, ABS, MOD10,
TRUNC, RND, entre otras muchas:

Prcticas de Mtodos Estadsticos en la ingeniera. Departamento de Informatica.

Prctica 1. Introduccin al SPSS

12

MOD10
Resto resultante de dividir entre 10.
TRUNC
Parte entera de un nmero.
RND
Redondeo al entero ms cercano.
Pulsando el botn derecho sobre le nombre de la funcin, aparece su descripcin.
El argumento de las funciones debe ir entre parntesis.
Existen funciones particulares como UNIFORM y NORMAL, que se utilizan para la
generacin de variables aleatorias. Son de bastante utilidad en estudios de simulacin.
Es importante tener cuidado con el orden de utilizacin de los operadores y no olvidar
que los valores antiguos pierden su vigencia al recodificar una variable sobre el mismo
nombre.
El botn SI... permite realizar modificaciones similares, pero sujetas a que se verifique
una condicin lgica. Se incluirn aquellos casos que verifiquen la condicin. Los que
no la cumplan pasarn a ser valores ausentes definidos por el sistema.
Por ejemplo, si queremos modificar slo las observaciones realizadas en Alicante, en
una nueva variable new2_pH, deberemos :
pulsar en el recuadro Si ...
seleccionar Incluir si el caso satisface la condicin
escribir la condicin: provin = 1

pulsar Continuar y en la siguiente pantalla pulsar Aceptar.

Una expresin lgica es una expresin que puede ser evaluada como verdadera o falsa
en funcin de los valores de las variables en ella relacionadas. El nexo de las variables
son los operadores de relacin: = , >= , <= , < , > , ~= . Es posible formar expresiones
complejas, utilizando los operadores lgicos: AND (&), OR ( | ), NOT (~).

Prcticas de Mtodos Estadsticos en la ingeniera. Departamento de Informatica.

Prctica 1. Introduccin al SPSS

13

6. Recodificacin de una Variable


A partir de una variable podemos crear otra cuyos valores sean una recodificacin de
los de la primera. Esta recodificacin podemos hacerla tanto en la misma variable como
en variables diferentes. Para ello, seleccionaremos Transformar/Recodificar/En
distintas variables... Se abre una ventana en la que deberemos asignar un nombre ( y
una etiqueta si queremos) a la nueva variable.

Cuidado!, si seleccionas En las mismas variables ... borrars la variable original.

Vamos a ver cmo recodificar la variable sulfato en una nueva variable llamada
niv_sulf, clasificndolo en: bajo [0,3), medio [3,6), alto [6,9) y muy alto [9,11].

1. Seleccionamos la variable sulfato, escribimos el nombre de la Variable de


resultado, y pulsamos Cambiar:

2. Pulsamos en Valores antiguos y nuevos ..... Aqu especificaremos los valores


antiguos y sus nuevos valores.
Es muy til cuando queremos recodificar variables cuantitativas mediante el
establecimiento de intervalos. Para ello utilizamos las posibilidades descritas en
Rango:
Para especificar 0 sulfato < 3 niv_sulf = 1, escribiremos en rango
(valores antiguos) 0 y 3, y en valor nuevo, 1, pulsaremos aadir y realizaremos los
mismos pasos con el resto de intervalos.
A continuacin, pulsar Continuar y en la siguiente pantalla Aceptar. Observa el
contenido de la nueva variable. Observas algo anmalo?

Prcticas de Mtodos Estadsticos en la ingeniera. Departamento de Informatica.

Prctica 1. Introduccin al SPSS

14

Ejercicio 4.
1. Aadir, a la variable niv_sulf las etiquetas de valores para leer baja, media, alta y
muy alta.
2. Recodificar la variable provin en una nueva variable cod_prov que contenga los
prefijos telefnicos de la provincia: Alicante 965, Castelln 964 y Valencia 963.

Prcticas de Mtodos Estadsticos en la ingeniera. Departamento de Informatica.

Prctica 1. Introduccin al SPSS

15

7. Filtrado de datos
El programa SPSS permite seleccionar determinados casos para un prximo proceso,
bien temporalmente o de forma permanente, sobre la base de un criterio lgico o de una
decisin aleatoria. Para ello seleccionaremos el men Datos/Seleccionar casos...

La seleccin de individuos puede ser temporal (filtrados) o permanente (eliminados):


En la seleccin permanente eliminamos del archivo activo los individuos deseados,
mientras que en la temporal, la seleccin es recuperable (los casos son filtrados). En
esta ltima situacin, los individuos (casos) del archivo que no satisfacen la condicin
aparecern marcados como excluidos mediante una lnea que cruza en diagonal su
nmero de fila. Aparece tambin una variable llamada FILTER_$ que el sistema crea
para controlar el filtrado de datos.

Veamos cmo seleccionar, sin eliminar, las filas correspondientes a las


mediciones con bajo nivel de sulfato:
seleccionamos Si se satisface la condicin
seleccionamos Filtrados
pinchamos en el cuadro Si. Especificamos la condicin niv_sulf = 1
pulsamos Continuar y, despus, Aceptar.
Observa el resultado y despus selecciona Todos los casos o Restablecer para
volver a considerar todos los individuos del archivo de datos.
Especificaciones:

Prcticas de Mtodos Estadsticos en la ingeniera. Departamento de Informatica.

Prctica 1. Introduccin al SPSS

16

Todos los casos: indica que quiere procesar todos los casos del archivo de datos de
trabajo.
Si se satisface la condicin: indica que quiere procesar slo los casos que satisfagan
una condicin lgica. Para especificar o cambiar la condicin, pulse en Si. Esta
alternativa crea la variable filter_$, que el sistema crea para controlar el filtrado de
datos.
Muestra aleatoria de casos: indica que queremos seleccionar los casos de forma
aleatoria para su procesamiento. Si ha tecleado las especificaciones de muestreo,
stas aparecern junto al botn de comando Muestra. Si no, o si quiere cambiarlas,
pulse en Muestra (vase ms adelante). Esta alternativa tambin crea la variable
filter_$.
Basndose en el rango del tiempo o de los casos: permite seleccionar los casos
deseados siempre que sean consecutivos, por ejemplo del 3 al 27.
Usar variable de filtro: indica que quiere utilizar los valores de una variable
numrica existente para controlar el filtrado de casos. Seleccione la variable de la
lista de la izquierda. Los casos cuyo valor sea 0, o ausentes, en la variable de filtro se
excluyen del anlisis.

Ejercicio 5
Seleccionar, para trabajar durante una sesin, los valores de pH por debajo de 6,0.
Desactivar el filtrado anterior
Seleccionar los 8 primeros datos de todas las variables ($casenum < 9).
Desactivar el filtrado anterior

8. Ejercicios
1.- Introduce ( y guarda en ficheros adecuados) los datos de los problemas 9, 11 y 16
del tema 1. En el ejercicio 11 crea una nueva variable en la que estn los datos en
grados centgrados :C=(F-32)/1.8.
2. Archivo de datos CEREBROS:
a.
b.
c.

Qu variables contiene?, de qu tipo son?, en qu unidades est codificada cada


variable?.
Recodifica la variable cuerpo en 3 categoras: menos de 30 Kg., entre 30 y 60 Kg.
y ms de 60 Kg. .Guarda esta variable como codcuer.
Transforma las dos variables numricas calculando sus logaritmos.

Prcticas de Mtodos Estadsticos en la ingeniera. Departamento de Informatica.

S-ar putea să vă placă și