Sunteți pe pagina 1din 44

SPSS

Apuntes para el curso

Sánchez Jáuregui Claudio PhD

Cuenca, abril de 2020


INDICE

Capítulo Página
Capítulo 1 La naturaleza del análisis estadístico 3

Capítulo 2 El paquete estadístico para las Ciencias Sociales (SPSS) 7


Herramienta para el Psicólogo

Capítulo 3 Las ventanas de trabajo: El editor de datos 12

Capítulo 4 Las ventanas de trabajo: El Visor de Resultados 20

Capítulo 5 Como crear una base de datos

1. Trabajo de mesa: Diseño de la estructura de la 24


base de datos

2. Creación de la base de datos 29

Capítulo 6 Otras opciones útiles 38

Capítulo 7 Las cajas de dialogo del Análisis estadístico 47

2
CAPÍTULO 1

LA NATURALEZA DEL ANALISIS ESTADISTICO

INTRODUCCION

La estadística es la ciencia de los datos y como tal es una herramienta


imprescindible en manos del estudiante y profesional que se dedica a la
investigación y/o al trabajo aplicado, pero que desea conocer lo más posible
acerca de la información que maneja para mejorar su trabajo.

John Sall en el manual JMP Start Stats dice:

“La estadística es la ciencia de la incertidumbre, de la credibilidad, de


la estimación. El oficio de la medición veraz. El tinte que el
investigador científico, devenido detective, aplica a sus datos para
revelar la estructura oculta. Es la herramienta investigativa.”

Decimos que es la ciencia de los datos, pero ¿Qué son datos?

Los datos no son mas que las observaciones realizadas al medir alguna
característica o propiedad de algún fenómeno, de algún objeto (entendiéndose
por objeto una persona o cosa). Estas observaciones responden a alguna
pregunta como: ¿cuántos?, ¿cuánto tiempo?, ¿cuán frecuente?, ¿cuán rápido?,
¿dónde?, ¿de qué tipo?

Entonces ¿Cómo podemos definir el ANALISIS ESTADISTICO?

Podemos decir que el análisis estadístico es aquel que se ocupa de la:

• Recolección
• Clasificación
• Organización
• Resumen
• Análisis e
• Interpretación de los datos

3
Y ¿Cuáles son sus objetivos?

Su objetivo fundamental o general es que intenta facilitarnos una comprensión


más ordenada y racional del fenómeno bajo estudio una vez que se haya hecho
observaciones, organizado y procesado éstas, y analizado e interpretado los
resultados de los datos. (ver fig. 1)

Figura.1

Realidad  Recolecto  Proceso  Interpreto  Realidad


antes datos datos datos después

Tiene además tres objetivos específicos que se refieren concretamente a la


organización y procesamiento de los datos:

1. Reducir o resumir los datos


2. Servir como herramienta para la medición inferencial
3. Identificar asociaciones o relaciones entre conjuntos de datos
(variables)

Estos objetivos, bien engorrosos de cumplir cuando el cálculo se debe realizar


manualmente, en la actualidad se facilitan enormemente con el uso de las
computadoras personales (ordenadores personales, PC). En todo caso el
engorro se ha desplazado hacia la creación de las bases de datos, o sea, la
introducción de la base de datos brutos en la computadora, actividad que es
monótona, pero imprescindible ya que de la calidad con que se haga depende la
confiabilidad de nuestros resultados, de nuestras interpretaciones y la calidad de
la toma de decisiones.

La computadora personal nos ha abierto múltiples posibilidades para el análisis


estadístico. Se han creado diversos programas que tienen ya varias versiones y
nos permiten el procesamiento de los datos. Todos tienen bondades y
deficiencias que dificultan la elección. Nosotros les proponemos en este texto
trabajar con el Statistical Package for Social Sciences conocido como SPSS
para Windows. Este es un paquete interactivo creado específicamente para las
ciencias sociales en sus orígenes, pero que en la actualidad se ha diversificado
hacia otras ramas con módulos para los negocios, las finanzas, etc. por lo
poderoso que es en cuanto a posibilidades de análisis y su facilidad de
interacción.

Al igual que cualquier otro procesador ya sea estadístico, de textos, hoja de


cálculo, generador de gráficos, el SPSS será capaz de hacer y brindarnos
resultados en la medida de nuestra capacidad para utilizarlo y esto lo digo en
dos sentidos:

4
1. Conocer la operación del sistema, sus opciones y comandos para hacer un
uso más eficiente del mismo

2. Conocer, en el caso que nos ocupa, de estadística para obtener aquellos


resultados que nos permitan la mejor descripción de nuestras muestras y
para poder hacer la mejor elección dentro de las alternativas de análisis que
ofrece, ajustando estas al nivel de medición de nuestras observaciones de
manera que los resultados obtenidos y la mejor interpretación al verificar
nuestras hipótesis, dando una solución más científica a nuestros problemas.

Ningún procesador será capaz de hacer más allá de lo que nosotros seamos
capaces de pedirle que haga.

Así mismo, pensamos ir entrelazando el manejo del paquete con los


conocimientos de estadística elemental, no explicados quizás a partir de lo que
para algunos sería el punto de vista más “científico”, o sea el de un estadístico
matemático, sino desde la visión más operativa de un especialista en Ciencias
de la Vida (UNESCO). El enfoque será pues el de dar los elementos necesarios
para decidir, de todas las opciones posibles, cual escoger por ser la más
adecuada a las observaciones recogidas; porque es aquella que permite
demostrar las hipótesis y estará siempre en función de lo que ofrece el paquete.

El objetivo del texto tampoco es el de ser el gran libro, sino el apoyo bibliográfico
para un curso de superación profesional sobre Estadística basado en el paquete
SPSS y para la asignatura, además puede servir material de consulta para
aquellos que deseen incursionar por su cuenta en el uso del paquete y abrirles
algunas de las posibilidades que les facilite el trabajo con el mismo.

Como no todos tenemos el acceso a las mismas versiones y existen algunas


versiones en español, muchas otras están en inglés por lo que hemos tratado de
dar también la terminología en este idioma.

5
Capítulo 2

EL PAQUETE ESTADÍSTICO PARA LAS CIENCIAS SOCIALES (SPSS)


HERRAMIENTA PARA EL ESTUDIANTE

1. DESCRIPCIÓN DEL SISTEMA

El SPSS, Statistical Package for Social Sciences, es un paquete estadístico,


IBM compatible, que como su nombre nos indica fue creado, específicamente,
para las Ciencias Sociales. Es un sistema comprensivo y flexible para llevar a
cabo la administración de datos y el análisis estadístico de los mismos. Esta
integrado por programas relacionados, lo que permite gran flexibilidad en la
manipulación, edición y análisis de los resultados.

Este es un programa interactivo con el que nos comunicamos a través de un


lenguaje de comandos propios. Existen versiones tanto para el sistema operativo
MS-DOS como para ambiente Windows. De éste último hay versiones tanto en
idioma inglés como en español.

El SPSS para Windows se presenta en un ambiente gráfico, utiliza menús


descriptivos simples y ventanas o cuadros de diálogo para la comunicación. La
mayoría de las tareas se logran escogiendo con el cursor y cliqueando
(pinchando) el botón izquierdo del ratón.

El núcleo del sistema es un módulo básico que incluye:


Comandos para el manejo de datos y ficheros y
Procedimientos estadísticos básicos

Tiene además otros módulos opcionales como por ejemplo:


Avanzado para análisis estadísticos multivariados
Data entry - hoja electrónica que permite hacer la entrada de datos y crear y
procesar encuestas.
Trends para el análisis de series temporales, etc.

Además de la interfase para el análisis estadístico, el SPSS para Windows


también trae:

Un Editor de Datos, similar en su formato a una hoja de cálculo. Este nos


permite construir la base de datos o cargar una base de datos creada
anteriormente ya sea en el sistema o en otros sistemas, como por ejemplo,
Excell o dBASE. Se presenta como una tabla de doble entrada conformada
por filas y columnas, por las filas se presentan los sujetos, por las columnas
se presentan las variables.

6
Un Editor de Tablas y Gráficos que nos permite, modificar y presentar a
nuestro gusto múltiples tipos de tablas y gráficas, con las que se presentan y
hacen más comprensible los resultados.

Graficador de alta resolución que nos permite generar, a partir de la base


ya referida gráficas y diagramas que resumen y facilitan la descripción y la
interpretación de los resultados.

2. COMO INICIAR UNA SESIÓN DE TRABAJO

Para iniciar una sesión de trabajo se abre el programa, con un click doble del
botón izquierdo del ratón sobre su icono o se selecciona del listado de
programas y se le da entrada cliqueando sobre su nombre.

Cuando se abre el sistema se presenta automáticamente en pantalla la ventana


del editor de datos y podemos dar inicio a la sesión creando o cargando una
base de datos.

3. VENTANAS DE TRABAJO

Esta aplicación tiene diferentes ventanas de trabajo. Al abrir el programa


aparece en primer plano la ventana denominada Editor de Datos, pero esta no
es la única. Veamos las mas importantes.

Editor de datos (SPSS data editor window, Newdata): esta aparece en


primer plano, en blanco, con el nombre de Untitled SPSS data Editor y es
aquella donde se crea la base de datos brutos o primarios, en caso de un
nuevo archivo o fichero; o se carga un archivo de datos ya existente para la
sesión de trabajo. Se puede tener abierta sólo una ventana de este tipo de
cada vez.

El Visor (viewer) o ventana de resultados, output o salida es aquella


donde se visualizan los textos y las gráficas resultantes de las operaciones
que ordenamos ejecutar. Es una ventana en la que se puede editar o no
según nuestros deseos y también se puede guardar para trabajos
posteriores. Esta ventana sólo se hace visible y aparece en primer plano
cuando se corre un comando que genera una salida. Se pueden tener
abiertas, simultáneamente, varias ventanas de este tipo en la misma sesión
de trabajo.

Ventana de sintaxis (syntax window): es aquella en la que podemos


construir pequeños programas de uso frecuentes pegando las opciones

7
elegidas en las ventanas o cuadros de diálogo. Estas elecciones aparecen
en forma de sintaxis de comandos. Se puede editar el comando para utilizar
características o partes del SPSS que no son accesibles a través de los
cuadros de diálogo. Los programas creados y pegados en estas ventanas se
pueden guardar y cargarse en sesiones de trabajos posteriores. Se pueden
tener abiertas, simultáneamente, varias ventanas de este tipo en una misma
sesión de trabajo. Estas no serán objetivos de nuestro curso.

4. Ventana designada vs. Ventana activa

Las ventanas puede ser ventanas activas o designadas, o ambas activa y


designada a la vez.

Cuando hay varias ventanas abiertas simultáneamente la ventana activa es


aquella que en ese momento esta seleccionada y aparece en el primer plano en
pantalla.

Cuando se ejecutan procedimientos y se obtienen resultados por primera vez, el


sistema los envía y pega en el Visor de resultados, que pasa a ocupar el primer
plano por lo que se convierte a la vez en activa y designada, activa por estar en
primer plano y designada por ser aquella en que se van a pegar los resultados .
La ventana designada queda identificada por un signo de admiración rojo hacia
el centro de la barra de estado.

La importancia de aclarar cual es designada ocurre cuando tenemos abiertas,


simultáneamente, mas de una ventana de salida o de sintaxis. Si tenemos varios
visores de resultados abiertos y estoy procesando información, el sistema
identifica en cual de las ventanas debe pegar la información, porque una de ellas
es la designada. Esta ventana puede cambiarse y convertir en designada
cualquiera de las otras de su tipo que se encuentren abiertas. El comando para
designar ventanas se encuentra en el sub-menú Utilidades (Utilities) del menú
principal.

Cuando se abre una nueva ventana la misma deviene activa.

Por ejemplo, cuando abrimos el sistema, la ventana de edición, que es la que


aparece en primer plano en ese momento es la ventana activa. Cuando
comenzamos el procesamiento de los datos y ordenamos un determinado
cálculo estadístico, el procesador trabaja y tan pronto están los resultados la
ventana de salida o Visor pasa a un primer plano con la presentación de los
textos. En ese momento se convierte en ventana activa y la de edición de datos
pasa a un segundo plano.

8
Para activar una ventana tenemos distintas opciones: se pincha sobre su barra
de nombre o sobre el botón con su nombre en la parte inferior de la pantalla o
también podemos pinchar sobre el icono que la representa en la barra de
herramientas o desplegar el menú Ventana (Window) del menú principal y hacer
la elección.

5. ALGUNOS TIPOS DE ARCHIVOS O FICHEROS

En una sesión de trabajo se generan diferentes tipos de ficheros que podemos o


no guardar según nuestro interés. En el administrador de archivos se almacenan
los distintos tipos de ficheros posibles. El tipo de archivo o fichero se identifica
por su extensión. Los archivos de trabajo mas importantes son:

Archivos de datos: Contienen los datos que se entran por la ventana de


edición. Llevan la extensión .sav (en versiones anteriores para el sistema
operativo MSDos estos ficheros, creados con el Data Entry, llevaban la
extensión .sys). Estos ficheros se cargan en la ventana de edición de datos.

Archivos gráficos (chart): Llevan la extensión .cht y contiene los gráficos de


diverso tipo que se pueden crear en el SPSS.

Archivos textos: El SPSS crea dos tipos de ficheros texto que se diferencian
por su extensión. Todos los que lleven extensión .spo son ficheros de
resultados (salida o output) y se cargan en esa ventana cuando los abrimos
o se crean durante una sesión de trabajo. Los que llevan extensión .sps son
ficheros de sintaxis y cuando se crean o se cargan van a una ventana de
ese tipo.

6. COMO GUARDAR Y SALIR DE SPSS

Cuando terminamos una sesión de trabajo, antes de salir, debemos primero, si


es de nuestro interés, guardar el contenido de cada ventana, y luego ir cerrando
las mismas. Si pedimos cerrar, sin previamente haber salvado, al solicitar esta
operación, inmediatamente sale una ventanita que nos interroga si deseamos
guardar el contenido de dicha ventana. Esto lo va haciendo una a una, nunca se
cierran todas las ventanas simultáneamente.

Para guardar podemos utilizar diversas vías: Podemos ir al menú principal y


pinchar “guardar” o podemos usar el icono de la barra de herramientas. Para
guardar una ventana determinada esta debe ser la ventana activa en ese
momento, o sea que siempre se salva la ventana que se encuentra en primer
plano primero y luego las que vayan ocupando ese lugar. Si cerramos desde la
ventana del Editor de datos, sin haber cerrado la de Resultados, se activa esta

9
última y se interroga si se desea salvar la misma. Respondida la pregunta
entonces se cierran ambas.

La primera vez que se guarda aparece la ventana de “guardar como”, ahí se


debe dar nombre al fichero y declarar el tipo de fichero en que deseamos se
guarde la información. Siempre tenemos las opciones de salvar en otros tipos de
procesadores.

Cuando guardamos una base de datos debemos reflexionar, recordando si


hemos seleccionado casos para procesar sólo algunos de ellos o ejecutado
alguna transformación que al salvar nos haga perder la información original.

Para cerrar la sesión de trabajo podemos hacerlo entrando al menú archivo y


seleccionando la opción salir o pinchando sobre la cruz que aparece en el
extremo superior derecho de la pantalla. Siempre aparecen dos cruces, la
inferior es la de la ventana activa la superior es la del procesador.

10
Capítulo 3

Las ventanas de trabajo

El EDITOR DE DATOS

1. CARACTERÍSTICAS GENERALES (DESCRIPCIÓN DE LA PANTALLA)

El editor de datos del SPSS es la ventana que aparece en primer plano cuando
abrimos el programa y es similar a la que se ilustra mas abajo con la diferencia
de que en ese momento está vacía.

En ella se puede crear una base de datos o cargar una ya creada (.sav). Si
es una ya creada podemos editar, cambiando valores, agregando o
eliminando casos y/o variables.

Fig. 1 Editor de datos (ventana vista de datos)

11
El editor en si consta de dos ventanas, la del visor de datos (Data View) y la
del visor de variables (Variable View).

Descripción de la ventana Data View o Visor de Datos

Las distintas partes de esta ventana son:

La barra superior (azul en pantalla) es la barra de nombre o título. Se inicia


con el icono que identifica esa hoja, a continuación, va el nombre del
archivo seguido del nombre de esa ventana de aplicación: SPSS Data
Editor. En el extremo derecho se encuentran los tres botones de minimizar,
maximizar y cerrar la pantalla.

Debajo de esta aparece la barra del menú principal. En esta barra


encontramos todos los submenús que me permiten administrar el sistema
y realizar el análisis estadístico. Al pinchar sobre cada nombre se
despliegan las opciones posibles lo que nos permite el acceso a las
facilidades de operación. Los submenú componentes son:

• Archivo (File): nos permite crear, activar o cargar ficheros, operar con
los mismos, guardarlos e imprimir y salir, etc..

• Edición (Edit): nos permite seleccionar, cortar, copiar, pegar, buscar,


remplazar, modificar textos tanto en ventanas de Visor como de Sintaxis.

• Ver (View): nos permite activar o desactivar las barras de estado y


herramientas, la cuadrícula de la base de datos, las etiquetas de los
valores de las variables en lugar de los números.

• Datos (Data): nos permite hacer cambios globales en los ficheros de


datos, definir variables y datos, insertar, unir o dividir ficheros, transponer
variables y casos, seleccionar subconjuntos de casos para el análisis,
ponderarlos, etc. Son cambios temporales que no afectan el fichero
permanentemente a no ser que así se explicite y salven los cambios. Solo
se puede acceder desde el editor de datos.

12
• Transformar (Transform): nos permite hacer cambios en las variables
elegidas, como por ejemplo recodificar o ranguear, crear nuevas variables
a partir de las ya existentes, generar números aleatorios. Estos cambios
no afectan permanentemente el fichero a no ser que explícitamente se
salve. Al mismo tiempo solo se puede acceder a ella desde la ventana de
edición de datos.

• Analizar (Analyze): nos permite seleccionar los diversos procedimientos


estadísticos que desee utilizar ya sea para describir o para inferir. Pueden
ser uni, bi o multivariados.

• Gráficos (Graphs): nos permite crear gráficos de todo tipo aunque no es


la única posibilidad. Algunos procedimientos estadísticos también
generan gráficos. El procesamiento es a partir del editor de gráficos.

• Utilidades (Utilities): nos da acceso al intercambio dinámico de los


datos, nos da la información contenida en los diccionarios de los ficheros
de datos y de variables, nos permite definir conjuntos, etc.

• Ventanas (Window): nos permite arreglar, seleccionar, y controlar


diferentes atributos de las diferentes ventanas de trabajo.

• ? Ayuda (Help): abre la ventana estándar de ayuda que contiene


información de cómo usar las diferentes posibilidades del SPSS y el
glosario de comandos.

La tercera fila es la barra de herramientas. Esta contiene todos los iconos


que agilizan el trabajo al contener funciones que se activan sin necesidad
de entrar al menú. Cuando colocamos el cursor sobre cualquiera de ellos
salta una pequeña ventana de ayuda que nos indica la función que cumple
ese botón

ICONOS DEL EDITOR (según orden de aparición)

Abrir archivo (Open file)

Guardar archivo (Save file)

Imprimir (Print)

Recuperar cuadros de diálogos (Dialog recall)

Deshacer/rehacer (Undo/redo)

13
Ir a gráfico (Goto chart)

Ir a caso (Goto case)

Variables (Variables)

Buscar (Find)

Insertar caso (Insert case)

Insertar variables (Insert variable)

Segmentar archivo (Split file)

Ponderar casos (Weight cases)

Seleccionar casos (Select cases)

Etiquetas de valores (value labels)

Usar conjuntos (Use sets)

Al igual que en otros procesadores cuando detenemos el cursor sobre uno de


los iconos inmediatamente salta a la vista una breve descripción o su función.

Las barras de herramientas pueden cambiarse de lugar y colocarlas donde sea


de nuestro agrado. Para ello sólo hay que pinchar el cursor sobre cualquier
espacio de la barra, entre los botones, y arrastrarla hacia el lugar escogido o
deseado.

La barra de texto o edición se ubica bajo la barra de herramientas y está


dividida en dos partes.

Area de referencia Celda de edición

En la partición de la izquierda (en gris) aparecen el número del caso (fila) y


el nombre de la variable (columna) que identifican la celda activa, o sea
aquella en la que se encuentra el cursor, este espacio recibe el nombre de
área de referencia. En la partición de la derecha (en blanco) aparece la celda
de edición, donde se muestra el valor que tecleamos (dato) y al que le

14
vamos a dar entrada, el texto o el valor actual de la celda que se encuentra
activa y que podemos editar.

A continuación, tenemos el identificador de columnas. Esta es una fila en


gris, subdividida en particiones sobre cada columna, en las cuales
aparecerá el nombre de la variable.

var var var var var var var

La columna en gris de la extrema izquierda, enumerada en consecutivo,


recibe el nombre de identificador de filas. Cada fila es un sujeto, pero el
número identifica sólo filas no a sujetos.

1
2
3
.
.
.
n

El área de trabajo esta conformada por celdas resultantes del


entrecruzamiento de filas y columnas (en fondo blanco). Los casos,
sujetos u observaciones coinciden con las filas. Las variables se presentan
por las columnas encabezadas por una celda gris identificada por la
abreviatura var, que luego se remplaza por el nombre de la variable cuando
se define la misma. A diferencia de las hojas de calculo, como EXCEL,
donde esto es indistinto, aquí las filas siempre serán los casos o sujetos y
las columnas siempre las variables. En las celdas se entra, edita o muestra
el contenido de la base de datos, o sea, el valor obtenido por el sujeto “X”
en esa variable. Otra diferencia con las hojas de cálculo es que las celdas
sólo contienen datos, no pueden contener fórmulas.

La base de datos es una matriz rectangular. Sus dimensiones dependen


del número de filas y columnas, o sea, del número de sujetos en la muestra
estudiada y del número de variables declaradas. Se pueden entrar datos en
cualquier celda. Si se entran datos en celdas fuera de los límites definidos,
el SPSS amplía o extiende sus límites para abarcar las nuevas filas o
columnas, o sea, abre nuevos sujetos o nuevas variables.

Es además importante saber que no quedan celdas vacías; si la variable


está definida como numérica, toda celda en blanco toma automáticamente
la categoría de valor perdido (missing value) y aparece con el símbolo

15
preestablecido por el sistema, que es un punto (.), a no ser que hayamos
definido un valor para ello, como, por ejemplo -1. ¡Ojo! El cero no es valor
perdido, tiene pleno significado numérico. En las variables tipo cadenas
(string o alfanuméricas) una celda en blanco o vacía es un valor válido, no
se considera perdido (missing).

Bajo el área de trabajo se encuentra la barra de desplazamiento. Esta tiene


primero los botones de desplazamiento, luego están dos orejas, la primera
se corresponde con la ventana de vista de datos y la segunda con la
ventana de la vista de variables. Pinchando sobre ellas pasamos de una
ventana a la otra. Hacia la derecha esta la barra de desplazamiento
horizontal.

En la parte inferior de la ventana aparece la barra de estado. Esta barra recibe


ese nombre porque precisamente en ella aparece el estado actual del
procesador.

Cuando se inicia la sesión de trabajo nos indica que el procesador se está


iniciando (Starting SPSS processor). Una vez que esta listo aparece la frase
SPSS El Procesador está preparado (SPSS Processor is ready).

Además de esta información, en la barra de estado podemos obtener


información adicional acerca de:

El estado de los comandos (command status): indicándonos para cada


comando que se corre el número de casos que va procesándose y en los
procedimientos estadísticos que requieren de iteración se muestra el número
de iteraciones.

El estado de los filtros (filter status): Nos indica, en caso haber seleccionado
un subconjunto de casos para el análisis, que sólo un subconjunto de casos
esta siendo procesado. Idem de haber elegido una muestra aleatoria.

El estado de ponderación (weight status): El mensaje “weight on” nos indica


que se esta usando una variable de ponderación para dar peso a los casos.

16
El estado de fichero dividido (Split file status): Este mensaje nos indica que el
fichero ha sido subdividido en grupos para realizar el análisis sobre la base
de los valores en una o varias variables de agrupación.

Descripción de la ventana Visor de Variables o Variable View

La vista de variables es la segunda pantalla del Editor de Datos. Es aquella


donde se van a definir las variables. Semejante en la mayoría de sus parte a la
visor de datos se diferencia de ella básicamente en el contenido de sus
indicadores de columnas y filas.

En este caso cada fila es una variable y cada columna una característica de esa
variable.

En el indicador de columnas aparecen los nombres de las características para


definir cada variable y de hecho la estructura de la base de datos. Estos
nombres son:

17
• Nombre (name) • Valores (value)
• Tipo (type) • Periods (missing)
• Anchura (width) • Columnas(column)
• Decimales ( decimal) • Alineación (align)
• Etiquetas (label) • Medida (measure)
En el indicador de filas aparece el consecutivo de números, activándose tantas
filas como variables se definan.

El resto de la ventana es semejante al visor de datos.

18
Capítulo 4

Las ventanas de trabajo

El Visor de Resultados

Características Generales

Esta ventana como su nombre lo indica es aquella donde aparecen los


resultados del procesamiento solicitado ya sea estadístico o gráfico. Es la
retroalimentación o salida de lo que hemos pedido.

Algunas de las partes de esta ventana coinciden con las del editor de datos otras
son propias. Ese es el caso de la barra de nombre o título. Se inicia con el
icono que identifica esa hoja, a continuación va el nombre del archivo de salida,
Resultados1 o Output1, hasta tanto se guarde por primera vez; seguido del

19
nombre de esa ventana de aplicación: Visor SPSS. En el extremo derecho se
encuentran los tres botones de minimizar, maximizar y cerrar la pantalla.

La barra del menú principal difiere ligeramente con respecto a la del editor por
lo que algunos de sus elementos coinciden y otros no e incluso los sub-menús
pueden contener operaciones semejantes a las que aparecen en el editor y
además otras propias. Al pinchar sobre cada nombre se despliegan las
opciones posibles lo que nos permite el acceso a las facilidades de operación.
Los submenú componentes son:

• Archivo (File): nos permite abrir, guardar, exportar ficheros, preparar su


presentación, imprimir, salir.

• Edición (Edit): nos permite seleccionar, cortar, copiar, pegar, buscar,


remplazar, modificar textos.

• Ver (View): nos permite activar o desactivar las barras de estado y


herramientas, expandir, contraer, mostrar u ocultar, ver tamaño de
titulares, etc.

• Insertar (Insert): nos permite insertar o eliminar saltos de pagina,


agregar textos, gráficos, etc.

• Formato (Format): nos permite dar formato a la ventana alineando a la


izquierda, al centro o a la derecha.

• Analizar (Analyze): idéntico al editor de datos, nos permite desde la


ventana del visor, o sea sin regresar a la ventana de datos, seleccionar
diversos procedimientos estadísticos que se deseen utilizar ya sea para
describir o para inferir. Pueden ser uni, bi o multivariados.

• Gráficos (Graphs): idéntico al editor de datos, nos permite desde la


ventana del visor, crear gráficos de todo tipo aunque no es la única
posibilidad. Algunos procedimientos estadísticos también generan
gráficos. El procesamiento es a partir del editor de gráficos.

• Utilidades (Utilities): nos da acceso al intercambio dinámico de los


datos, nos da la información contenida en los diccionarios de los ficheros
de datos, información sobre las variables, nos permite designar ventanas,
etc.

• Ventana (Window): idéntico al editor de datos, nos permite arreglar,


seleccionar, y controlar diferentes atributos de las diferentes ventanas de
trabajo.

20
• ? Ayuda (Help): idéntico al editor de datos, abre la ventana estándar de
ayuda que contiene información de cómo usar las diferentes posibilidades
del SPSS y el glosario de comandos.

Como podemos ver desde este menú podemos procesar estadísticamente o


hacer gráficas, sin necesidad de regresar al Editor.

En el visor de resultados podemos ver 2 barras de herramientas, una sobre otra,


que contienen todos los iconos que agilizan el trabajo en esta ventana. Algunos
son comunes con el editor y otros son propios. La primera barra es la de
Estándares del visor y la segunda la de Titulares del visor. La primera nos
permite controlar el acceso rápido a diferentes comandos de procesamiento , la
segunda nos permite controlar la presentación o formato en la pantalla. Las
funciones de los iconos son:

Barra de Estándares del Visor:

• Abrir archivo (Open file)


• Guardar archivo (Save file)
• Imprimir (Print)
• Presentación preliminar (Print preview)
• Exportar (Export)
• Recuperar cuadros de diálogos (Dialog recall)
• Deshacer/rehacer (Undo/redo)
• Ir a datos (Goto data)
• Ir a caso (Goto case)
• Variables (Variables)
• Usar conjuntos (Use sets)
• Seleccionar últimos resultados (Select last output)
• Designar ventanas (Designate Window)

Barra de Titulares del Visor

• Ascender
• Degradar
• Expandir
• Contraer
• Mostrar
• Ocultar
• Insertar encabezado
• Insertar título
• Insertar texto

21
A continuación de las barras de herramientas aparece el área donde se
visualizan los resultados propiamente dichos. Esta parte está dividida
verticalmente en dos secciones. En la sección de la izquierda va apareciendo un
esquema en forma de árbol subdividido en ramas, con las operaciones, en el
orden en que fueron ejecutadas durante la sesión de trabajo. Cada operación
aparece representada por su icono y su nombre. Esto facilita el movimiento al
necesitar retroceder, para visualizar un resultado anterior o para borrar una parte
de la salida que ya no nos interese conservar. En la parte de la derecha
aparecen los textos identificando los procedimientos, los resultados del
procesamiento, o sea, las tablas estadísticas y los gráficos.

En esta ventana nos podemos mover por las barras de desplazamiento vertical y
horizontal o pinchando en el esquema sobre el icono correspondiente según
nuestro interés, siendo esta última la forma más rápida de hacerlo.

El ancho del panel derecho puede variarse, ampliándolo o reduciéndolo a


nuestro gusto, colocando el cursor sobre la división y con el botón izquierdo del
ratón oprimido, arrastramos ésta hasta donde lo deseemos.

Bajo el área de trabajo se encuentra la barra de desplazamiento con funciones


similares a la de la ventana del editor.

En la parte inferior de la ventana aparece la barra de estado con las funciones


ya detalladas en el capítulo anterior.

22
CAPITULO 5

Como crear una base de datos

Estamos en la ventana del editor de datos y deseamos crear una base de datos.
La creación de esta base puede hacerse directamente en el editor, pero
nosotros preferimos y recomendamos para los no muy experimentados en este
tipo de tarea, dividirla en dos momentos, uno inicial, que denominaremos trabajo
de mesa y uno posterior que es la creación de la base de datos como tal.

1. Trabajo de mesa: Diseño de la estructura de la base de datos

El trabajo de mesa inicial que proponemos tiene como objetivos: primero, tener
un momento de reflexión y segundo, uno de definición de las variables o diseño
de la estructura de la base de datos en papel. Esto significa que debemos
revisar cuidadosamente nuestros objetivos, nuestras hipótesis, determinar,
dentro de toda la información recogida: las variables que son necesarias y su
nivel de medición (las definiciones operacionales), el número de caracteres que
tienen, si tienen o no decimales y en caso positivo cuantos lugares, las etiquetas
de variables y las de valores para las variables cualitativas, o sea, aquellas que
se miden en escala nominal u ordinal.

Otra sugerencia que consideramos importante es la de definir desde un inicio


todas las variables posibles a utilizar. Es preferible que sobren a no que falten en
el momento del procesamiento. Siempre es posible definir e incorporar una
nueva variable, pero esto nos retrasa enormemente el trabajo, ya que siempre
nos va a llevar más tiempo la creación de la base de datos, que el
procesamiento estadístico propiamente dicho. Por ejemplo, nuestra muestra es
de estudiantes de tercer grado de dos escuelas y nuestra hipótesis no exige la
distinción de escuelas, sin embargo, es posible que posteriormente, al procesar,
se nos ocurra que sería interesante saber si en una determinada variable hay
diferencias entre una escuela y la otra. En el trabajo de mesa no nos cuesta
ningún trabajo prever esta situación y poner una variable nombrada escuela y
definir la escuela “X” como 1 y la escuela “Y” como 2, nada perdemos si no
hacemos uso de ella.

Para facilitar la definición de variables o diseño de la estructura de la base de


datos, o sea la definición de lo que será el diccionario, sugerimos que todo el

23
trabajo de esta etapa se resuma en una tabla similar a la que sigue, en la que se
reproduce el visor de variables, donde las columnas aparecen identificadas
según lo que exige el sistema para definir una variable.

ALINEACIÓN
DECIMALES
ETIQUETAS

COLUMNAS
PERDIDOS
VALORES
NOMBRE

MEDIDA
ANCHO
TIPO
A B C D E F G H I J
nombre cadena 30 0 PD 30 Izquierda nominal
sexo numérica 2 0 1=masc. PD 3 derecha nominal
2=fem.
ed numérica 3 0 edad PD 4 Derecha escala

PD= valor predeterminado

Veamos como definir cada una de las características de la estructura anterior.

A. Nombre de la variable (Name).

Para dar nombre a una variable, hay que tener en cuenta los siguientes
aspectos:

• Este no debe exceder los 8 caracteres,


• Debe de empezar por una letra, los caracteres restantes pueden ser
cualesquiera excepto !, ?, ‘,*
• No puede terminar con un punto
• No puede tener espacios en blanco o caracteres especiales (!, ?, ‘,*)
• Debe ser único, no puede duplicarse (SPSS considera iguales los
nombres en mayúsculas, minúsculas o mixtas: SX= sx= Sx= sX)
• No se puede usar las palabras claves:
ALL NE EQ TO LE LT BY
OR GT AND NOT GE WITH

B. Tipo de variable (Type)

Lo que aparece prefijado es variable de tipo numérica. Otros tipos de variables


son: Coma (comma), Punto (dot), Notación Científica (scientific notation), Fecha
(date), Dólar (dólar), Moneda personalizada (custom currency), Cadena
(alfanumérica) (string). Coma y Punto son variables numéricas donde, en el
primer paso las cifras se separan de tres en tres por comas y el punto es el

24
separador decimal; el en segundo caso se separan las cifras de tres en tres por
puntos y la coma es el separador decimal.

Sugerimos que en lo posible se definan todas las variables como numéricas y


las que son en cadenas o alfanuméricas (caracteres) se codifiquen y se
presenten como numéricas, dando etiquetas a los valores, ya que el sistema se
creó para trabajar con números y no con letras. Por ejemplo, la variable sexo es
nominal dicotómica, se divide en dos categorías clasificatorias, masculino y
femenino; podemos definir que masculino es igual a 1 ó si lo deseamos, igual a
0 ó cualquier otro número y que femenino es igual a 2 ó si lo deseamos igual a 1
ó cualquier otro número.

C. Anchura ancho (width)

Lo que está prefijado son 8 caracteres que incluyen el separador decimal y dos
lugares decimales. Para los datos numéricos puedo definir un ancho de hasta 40
caracteres y 16 lugares decimales (Decimal places). Siempre, cuando declaro el
ancho debo contemplar un lugar, en caso de necesitarlo, para el indicador
decimal. Igualmente, si los números van acompañados de signos negativos (-) o
positivos (+), los espacios de estos deben contemplarse al definir el ancho. Por
ejemplo, el número –354,444.32 tiene un ancho = 11 caracteres. En los tipos
coma y punto hay que tener en cuenta los espacios para todas las comas y
puntos respectivos.

D. Decimales (decimals)
Lo prefijado son dos lugares, pero en caso necesario podemos declarar mas,
como máximo hasta 16.

E. Etiquetas (labels)

El término etiquetas se refiere exclusivamente a las etiquetas de los nombres de


las variables. Estas pueden tener hasta 120 caracteres. Por ejemplo, si le dimos
nombre a la variable edad como ed entonces puedo definir una etiqueta como
Edad, o si nombro una variable que se refiere al nivel escolar alcanzado como
esc puedo dar como etiqueta escolaridad, nivel escolar o último grado cursado.

F. Valores (labels)

Los valores tienen que ver con variables cualitativas, o sea aquellas definidas
como nominales u ordinales que fueron declaradas como numéricas. Aquí lo que
hacemos es declarar la codificación que deseamos usar. Esta definición de la
codificación no es necesaria, pero si recomendable porque, aunque nos lleve un
poco mas de tiempo al entrar los datos, facilita la selección de las variables y la
interpretación de las salidas, ya que las etiquetas aparecen en lugar de los

25
nombres y los valores. Además, las etiquetas quedan guardadas en el
diccionario al guardar la base de datos y si al cabo del tiempo nuevamente
abrimos la base de datos, rápidamente podemos identificar los valores.

Lo anterior también tiene otra justificación y es que, dependiendo de la versión a


nuestro alcance, el sistema trabaja con una facilidad relativa los valores
alfanuméricos de 8 caracteres o menos, pero procesa con menos facilidad los de
más de 8 caracteres (inferiores a V.9). Sugerimos dejar estos últimos para
variables identificadoras, como es, por ejemplo, el caso del nombre de los
sujetos, variable que se define, pero que no se utiliza para el procesamiento
estadístico.

Otra situación muy diferente es la de una variable denominada, por ejemplo,


procedencia geográfica, cuyo ancho es de más de 8 caracteres. Esta variable se
clasifica por provincias en categorías como Pinar del Río, Ciudad de La Habana,
Matanzas, Cienfuegos, etc. y sí nos puede interesar a la hora de procesar
estadísticamente la información. En este caso la variable presentada en
caracteres, que a partir de la versión 19 es procesable, pero en versiones
anteriores no, podemos codificarla numéricamente y definirle etiquetas a los
valores numéricos dados como códigos a cada provincia. Esto podría ser como
sigue:

1 = Pinar del Río, 2 = Ciudad de la Habana, 3 = Matanzas, 4=…, etc.

entonces no tendremos dificultades al trabajar.

El definirlas como numéricas y darles etiquetas a sus valores nos facilita además
aplicar ese diccionario a nuevas variables en otras bases de datos y de memoria
al retomar la base de datos nuevamente después de transcurrido varios meses,
cuando ya no nos acordamos de lo que cada número significa. El estatus de la
variable queda además aclarado al definir su nivel de medida como nominal.

G. Valores perdidos e indicadores decimales

Otro aspecto que se debe precisar es la codificación y tratamiento que le vamos


a dar a los valores perdidos (missing values).

Los valores perdidos son aquellos datos que nos faltan porque el sujeto no dio
respuesta y la información está incompleta. Para estos casos el tratamiento tiene
dos alternativas:

1- asumir el preestablecido por el sistema o


2- personalizarlo.

26
El sistema predefine un símbolo para identificar los valores perdidos. Este
símbolo se corresponde con el que está definido como separador o indicador
decimal en Windows. Si en Windows el indicador decimal se determina como el
punto (.), el SPSS utiliza el punto como indicador decimal y como código
identificador de un valor perdido. Si en Windows el indicador decimal se
predetermina como la coma (,) u otro símbolo, el SPSS usará, tanto para el
indicador decimal como para los valores perdidos, la coma. El sistema también
nos da la opción de definir el valor perdido como deseemos, por ejemplo –1, 9,
99, 999. Este código personalizado siempre debemos cuidar que no coincida
con uno de los valores posibles a tomar por nuestras variables. Para evitar
errores de este tipo sugerimos se trabaje con lo prefijado por el sistema en lugar
de personalizar.

H. Formato de columna (column format)


Lo preestablecido es 8, al igual que el ancho. Esta característica solo modifica el
ancho de la columna en pantalla. Si deseamos que luego, al entrar la
información, ésta sea totalmente visible debemos declarar al menos el mismo
número de caracteres que declaramos en ancho.

I. Alineación (align)
Como lo prefijado en tipo es numérica, en alineación lo prefijado es derecha
(right), para que los decimales todos caigan punto sobre punto. Si es nuestro
deseo los textos podemos alinearlos a la izquierda (left). La tercera opción es
centrado (center).

J: Medida (measure)

Lo otro que debemos especificar es el nivel de medida de la variable. Aparecen


tres opciones: Escala, Ordinal y Nominal. Escala (scale) es el nivel a declarar
para las variables numéricas o cuantitativas que están, según la clasificación
de Stevens, en niveles de intervalo o de razón, por ejemplo: la calificación de
una prueba, la edad, el número de hijos; Ordinal (ordinal) son las variables
cualitativas que guardan, al clasificar, un orden intrínseco y pueden codificarse
como numéricas o alfanuméricas, por ejemplo Muy mal, Mal, Regular, Bien y
Muy bien; Nominales son las variables cualitativas que únicamente clasifican y
pueden codificarse como numéricas o alfanuméricas, por ejemplo el sexo, el
departamento. Estas tres categorías le permiten al sistema orientarnos, en
algunas ocasiones, cuando no seleccionamos un procedimiento acorde con las
características de los datos, y a la hora de graficar. (Ver Parte II, Estadística,
Niveles de medición.)

Otra sugerencia que consideramos importante es la de definir desde un inicio


todas las variables posibles a utilizar. Es preferible que sobren a no que falten en
el momento del procesamiento. Siempre es posible definir e incorporar una
nueva variable, pero esto nos retrasa enormemente el trabajo, ya que siempre
nos va a llevar más tiempo la creación de la base de datos, que el

27
procesamiento estadístico propiamente dicho. Por ejemplo, nuestra muestra es
de estudiantes de tercer grado de dos escuelas y nuestra hipótesis no exige la
distinción de escuelas, sin embargo, es posible que posteriormente, al procesar,
se nos ocurra que sería interesante saber si en una determinada variable hay
diferencias entre una escuela y la otra. En el trabajo de mesa no nos cuesta
ningún trabajo prever esta situación y poner una variable nombrada escuela y
definir la escuela “X” como 1 y la escuela “Y” como 2, nada perdemos si no
hacemos uso de ella.

Terminada la definición de todas las variables ya estamos en condiciones de


sentarnos ante la computadora, abrir el SPSS y comenzar a entrar las
informaciones.

2. Creación de la base de datos

La creación de la base de datos propiamente dicha, también podemos dividirla


en dos momentos o etapas, si deseamos hacer un trabajo de calidad y
económico. El primero es la creación del diccionario, cuando damos entrada en
el visor de variables a la estructura previamente diseñada y el segundo la
entrada de los datos propiamente dichos en el visor de datos.

• La creación del diccionario

En el VISOR DE VARIABLES del Editor de Datos iremos entrando en cada fila y


por columnas los datos de la estructura de la base de datos previamente
definida. Para movernos de una celda a otra de la fila o variable, o sea en
sentido horizontal, además del ratón tenemos tres alternativas: el tabulador ( ),
entrada ( ) o la flecha direccional derecha ( ). Para retroceder podemos hacer
uso de la flecha direccional izquierda ( ) o con la tecla de mayúscula
presionada pulsamos tabulador ( ). Siempre podemos pasar de una celda a
otra en la variable utilizando cualquiera de las posibilidades anteriores.

A. Nombre de la variable En la primera celda entramos el nombre de la primera


variable teniendo en cuenta las especificaciones ya aclaradas y pasamos a la
segunda celda de la primera variable utilizando cualquiera de las alternativas de

28
movimientos ya explicadas. Inmediatamente se activan las restantes celdas de
esa variable con los valores prefijados por el sistema.

B. Tipo La celda aparece como numérico, que es lo preestablecido. Si el tipo no


es numérico pinchamos en el botón gris y se abre la ventana en donde podemos
definir otro tipo de variable y además el ancho y los lugares decimales según
corresponda.

C. Ancho Entrar cifra si es diferente de 8. Si al definir tipo dio también nuevo


ancho pasar al siguiente parámetro.

D. Decimales Si son 2 lugares o ya definió en tipo pasar a próximo parámetro, si


no dar número de lugares deseados.

E. Etiqueta Escribir directamente en celda de acuerdo a requisitos ya definidos


o saltar a próximo parámetro si no se requiere.

G. Valores Abrir ventana y definir según el trabajo de mesa previo, si no se


requiere (variables escala) pasar al próximo parámetro.

La entrada de la codificación se hace valor a valor y se van adicionando hasta


tenerlas todas definidas. Para ello se procede de la siguiente manera:

29
Escribe el valor
Escribe la etiqueta que desea dar a ese valor
La adiciono a la lista con Añadir

Estas etiquetas pueden: añadirse (add), cambiarse (change) o eliminarse


(remove). Adicionar se activa tan pronto escribo un valor y cambiarse o
eliminarse cuando marco la etiqueta en la ventanilla de etiquetas definidas.

G. Perdidos Si acepta el predefinido por el sistema pasar a próximo parámetro,


si desea personalizar abra ventana y defina.

H. Columnas escribir el ancho deseado para visualizar en pantalla, lo prefijado


es 8

I. Alineación escoger la deseada si difiere de lo prefijado por el sistema que es


Derecha

J. Medida abrir y elegir nivel de medida según variable

30
• La entrada de datos

Definida la estructura de la base de datos cambiamos la ventana y pasamos al


VISOR DE DATOS del Editor. En el visor de datos comenzamos la entrada de la
información correspondiente a cada sujeto y variable. Los datos pueden
introducirse en cualquier orden; la alternativa preferida es hacerlo por casos o
sujetos, en sentido horizontal, aunque podemos entrar la información por
variables, columnas o en sentido vertical.

Para entrar los datos:

a) Se pincha sobre la celda que deseamos activar o nos movemos con las
flechas direccionales hasta llevar el cursor hasta ella (, , →, ). La celda
activa aparece resaltada por un marco negro.

b) En la parte izquierda de la celda de edición aparecen el número del caso y el


nombre de la variable que identifican a la celda activada y en la parte
derecha se muestra el valor al que deseamos dar entrada, teniendo
oportunidad de editarlo en caso de error.

c) Se da entrada al dato. Hay 2 opciones. Si queremos entrar los datos por


variable (por columna) la entrada se da oprimiendo entrada (enter, ), si
queremos entrarlos por caso (por filas) se presiona el tabulador Tab ,
ubicada a la izquierda del teclado, sobre el cierre de mayúsculas.

Si deseamos retroceder podemos oprimir sucesivamente el juego de teclas


mayúsculas (shift, ) y Tab , manteniendo la primera oprimida al presionar
la segunda.

31
Resumiendo:

• Entrada [Enter () o carretón] mueve el cursor una celda hacia


abajo
• Tab mueve el cursor una celda hacia la derecha
• Tab [shift Tab o mayúscula Tab ] mueve el cursor una
celda a la izquierda.

La ventaja de entrar la información por sujetos haciendo uso del tabulador es


que al entrar el dato correspondiente a la última variable de un sujeto, el sistema
hace un retorno automático y el cursor pasa a la celda correspondiente a la
primera variable del siguiente sujeto.

LA EDICIÓN DE DATOS

En ocasiones una vez entrado los datos necesitamos hacer modificaciones,


intercalas sujetos o variables. La edición puede hacerse en el menú de Edición o
en el de Datos.

Cuando editamos podemos:

• Cambiar valores
• Cortar, copiar, y pegar valores
• Agregar, insertar o borrar casos
• Agregar, insertar o borrar variables
• Cambiar el orden de las variables
• Cambiar la definición de variables

Para Cambiar valores sencillamente se pincha sobre la celda cuyo valor se


quiera modificar, se teclea el nuevo valor que aparecerá en la celda de edición
derecha y se le da entrada.

Para Cortar y Copiar se marca la celda que se desea, se selecciona el icono


correspondiente de la barra de herramientas, o se oprime el botón derecho del
ratón y se selecciona la función Copiar. Luego se lleva el cursor al lugar donde
se desea poner el valor elegido y se Pega, nuevamente haciendo uso del icono
de la barra de herramientas o desde esa función por el botón derecho del ratón.
Si lo que se desea es copiar una columna, parados en la celda del nombre, se
marca esta y se copia por los mismos procedimientos que utilizamos para copiar
una celda. Para copiar una fila nos paramos sobre la celda gris con el número de
fila, se marca esta y se copia por las vías ya descritas. Para pegar se procede
de forma similar.

32
Copiar y pegar son una comodidad porque nos ahorra tiempo, por ejemplo,
cuando varias variables cualitativas tienen una misma codificación de valores,
defino la primera y luego copio esa definición y la pego en las restantes. Lo
mismo hago con un valor, copio este, marco el área donde deseo pegarlo y pego
por el menú o el botón derecho del ratón el valor en varias celdas
simultáneamente.

Para Agregar nuevos casos al final de los ya existentes podemos hacerlo


pinchando el número de caso (celda gris que inicia cada fila) a continuación del
último sujeto activo o con sencillamente poner un dato en una celda de una fila
en blanco. Esto activa automáticamente a dicha fila como caso. Si hay filas
intermedias entre la activada y la última con datos, automáticamente, a partir de
ese momento, las filas intermedias se activan como nuevos casos y aparecen
llenas con el símbolo de valores perdidos prefijado por el sistema.

Para Agregar nuevas variables al final de las ya definidas podemos seguir los
mismos pasos que en la situación anterior, pero en este caso pinchando la celda
var que encabeza la columna (celda gris que inicia cada columna), a
continuación de la última variable activa o con sencillamente poner un dato en
una celda de una columna en blanco. Esto activa automáticamente a dicha
columna como variable. Si hay columnas intermedias entre la activada y la
última con datos, a partir de ese momento, automáticamente, las columnas
intermedias se activan como nuevas variables y aparecen sus celdas como si
sus valores fuesen valores perdidos

Para Insertar nuevos casos o variables podemos hacerlo desde la ventana del
editor en el menú principal seleccionando datos y luego insertar variable o
insertar caso y también desde la barra de herramientas seleccionando el icono
o desde el botón derecho del ratón. ¿Cómo se procede?

Para insertar un caso entre otros ya existentes puedo hacerlo de varias


maneras:

Usando el menú:
a) Selecciono cualquier celda del caso que se encuentra por debajo de la
posición donde quiero hacer la inserción del nuevo caso y
b) Del menú selecciono datos y luego insertar caso

Usando la barra de herramientas o el botón derecho del ratón:


a) Pincho la celda gris correspondiente al caso que se encuentra por debajo de
la posición donde quiero hacer la inserción del nuevo caso y
b) Selecciono de la barra de herramientas el icono correspondiente u oprimo el
botón derecho del ratón y elijo insertar caso

33
Para insertar una nueva variable entre otras ya existentes puedo hacerlo de
varias maneras:

Usando el menú:

a) Selecciono cualquier celda de la variable que se encuentra a la derecha de la


posición donde quiero hacer la inserción de la nueva variable y
b) Del menú selecciono datos y luego insertar variable

Usando la barra de herramientas o el botón derecho del ratón:

a) Pincho la celda gris con el nombre de la variable que se encuentra a la


derecha de la posición donde quiero hacer la inserción de la nueva variable y
b) Selecciono de la barra de herramientas el icono correspondiente u oprimo el
botón derecho del ratón y elijo insertar variable

Para Borrar casos y variables desde la ventana del visor de datos tengo varias
opciones igualmente. Puedo hacer uso del menú, del teclado o del botón
derecho del ratón. ¿Cómo procedo?

Para borrar un caso haciendo uso del menú:

a) Pincho el número del caso que deseo borrar o pincho sobre cualquier celda
del caso y presiono Mayúscula (Shift) y manteniéndola oprimida, pulso el
espaciador, marcando de esta manera el caso. Si deseo borrar varios casos
que se encuentran en sucesión, una vez marcado el primer sujeto puedo,
manteniendo la tecla de mayúsculas oprimida ir marcando los sujetos con la
tecla de la flecha direccional hacia abajo ( ) o hacia arriba ( ) o con la
técnica de arrastre del ratón.

b) Elijo editar y dentro de él eliminar (clear). Esto borra el caso y corren hacia
arriba los de abajo ajustando el orden de continuidad.

Para borrar un caso haciendo uso del teclado o del botón derecho del ratón:

a) Pincho el número del caso que deseo borrar o pincho sobre cualquier celda
del caso y presiono Mayúscula (Shift) y manteniéndola oprimida el
espaciador marcando de esta manera el caso. Si deseo borrar varios casos
que se encuentran en sucesión, una vez marcado el primero puedo,
manteniendo la tecla de mayúsculas oprimida ir marcando los sujetos con la
tecla de la flecha direcccional hacia abajo ( ) o hacia arriba ( ) o con la
técnica de arrastre del ratón.

b) Oprimo la tecla suprimir del teclado o el botón derecho de ratón y elijo borrar

34
Para borrar una variable haciendo uso del menú:

a) Pincho el nombre de la variable que deseo borrar o pincho sobre cualquier


celda de la variable y presiono Control y manteniéndola oprimida el
espaciador marcando de esta manera la variable. Si deseo borrar varias
variables que se encuentran en sucesión, una vez marcada la primera puedo,
manteniendo la tecla de Mayúscula (Shift) oprimida ir marcando las variables
con la tecla de la flecha direccional hacia la derecha ( ) o hacia la izquierda
( ) o con la técnica de arrastre del ratón.

b) Elijo editar y dentro de él borrar (clear). Esto borra la variable y corren hacia
la izquierda las de la derecha, ajustando el orden de continuidad.

Para borrar una variable haciendo uso del teclado o del botón derecho del ratón:

a) Pincho el nombre de la variable que deseo borrar o pincho sobre cualquier


celda de la variable y presiono Control y manteniéndola oprimida el
espaciador marcando de estas maneras la variable. Si deseo borrar varias
variables que se encuentran en sucesión, una vez marcada la primera puedo,
manteniendo la tecla de Mayúsculas (Shift) oprimida ir marcando las
variables con la tecla de la flecha direccional hacia la derecha ( ) o hacia la
izquierda ( )o con la técnica de arrastre del ratón.

b) Oprimo la tecla suprimir del teclado o el botón derecho de ratón y elijo borrar.
Esto borra la variable y corren hacia la izquierda las de la derecha ajustando
el orden de continuidad.

Para Cambiar el orden de casos y variables o sea, moverlas de un lugar hacia


otro, usamos las opciones de cortar y pegar. Los pasos a seguir son varios:

a) Se inserta una nueva fila (caso) o una nueva columna (variable) en el lugar
hacia donde se desea hacer el movimiento.
b) Se marca el caso o la variable que se desea mover pinchando sobre el
número (caso) o el nombre (variable) que le identifica o utilizando la otra
técnica ya vista en insertar para marcar casos y variables.
c) Del menú escojo editar y dentro del mismo cortar u oprimo el botón derecho
del ratón y elijo cortar.
d) Pincho sobre el número de la nueva fila o el nombre de la nueva columna
insertada en el paso a o la marco por el mecanismo anteriormente descrito.
e) De editar selecciono pegar o del botón derecho del ratón selecciono pegar.

35
Para Cambiar la definición de las variables debo entrar nuevamente en el visor
de variables. Una vez dentro modifico aquello que me interese seleccionando las
nuevas opciones.

La inserción y eliminación de variables también lo puedo hacer desde el visor de


variables.

Para eliminar una variable sencillamente la marco pinchando la celda gris que la
identifica y pulso suprimir, o con el botón derecho del ratón escojo borrar o voy al
menú Edición y elijo eliminar.

Para insertar coloco el cursor en la celda identificador de variable o sobre


cualquier celda de la variable que queda por debajo de donde quiero hacer la
inserción y pulso el icono de insertar variable o en el menú datos escojo insertar
variable.

36
CAPÍTULO 6

OTRAS OPCIONES ÚTILES

Nuestra intención no es agotar cada una de las opciones del menú de SPSS,
pero si hay algunas otras que debemos conocer ya que nos facilitan el trabajo o
en un momento determinado nos pueden ser necesarias para el análisis de los
datos.

1. En la opción Archivo del menú:

A. TRABAJAR CON BASE DE DATOS CREADA EN OTRO SISTEMA

El SPSS nos da la posibilidad de trabajar con bases de datos creadas en otros


procesadores. En ocasiones tenemos, por ejemplo, una base de datos en
dBASE o en Excel ¿cómo hacer para cargar las mismas y posteriormente
trabajar con ellas utilizando el SPSS?

Cuando abrimos una base de datos por el menú o haciendo uso de icono de la
barra de herramientas, en la ventana que se abre lo primero que debemos
declarar en “Buscar en”, es la localización de la base de nuestro interés (torre,
carpeta, archivo) y aparecen las bases creada en el sistema con la extensión
.sav. En esa misma ventana en Tipo de archivos desplegamos los tipos de
archivo y aparecen todas las opciones posibles de la cual se elige la que
corresponda, supongamos que es dBASE (*.dbf). Inmediatamente aparecen en
pantalla aquellas bases de datos que tienen dicha extensión. De las mismas
escogemos la de nuestro interés y SPSS la carga declarando las modificaciones
que realiza al hacerlo, por ejemplo al nombre de las variables, de manera que se
ajusten al formato del sistema en 8 caracteres.

Las bases de datos creadas en dBASE son muy semejantes a las creadas en
SPSS y el sistema las carga sin grandes dificultades, los nombres de las
variables se traducen inmediatamente al formato de SPSS, aquellos que tienen
mas de 8 caracteres quedan truncados y si el nombre de los primeros 8
caracteres no es único la variable se desprecia.

37
En las hojas de cálculo, por ejemplo en Excel (*.xls), el formato es totalmente
diferente al del SPSS ya que por ejemplo, las celdas de la primera fila muchas
veces no contienen datos sino los nombres de las variables y así lo asume
SPSS. Si los nombres exceden los 8 caracteres SPSS los trunca y si no son
únicos los modifica. Las filas de la hoja de cálculo las considera casos o sujetos
y las columnas variables.

El número de variables esta determinada por la última columna con datos (o sea,
que no está en blanco) en la fila que contiene los nombres de las variables. Esto
quiere decir que si una celda de la primera fila no tiene un nombre de variable, o
sea, esta en blanco, el SPSS la ignora aunque tenga datos en el resto de la
columna.

El número de casos está determinado por la última fila con datos dentro del
límite definido por el número de variables.

El tipo de datos y el ancho para cada variable queda definido por el ancho de la
columna y el tipo de dato definido en la primera celda de datos de la columna.

Otros valores se convierten al símbolo de valor perdido del sistema. Si la primera


celda de datos de la columna está en blanco, se define con el tipo de dato
prefijado (numérico generalmente).

En las variables numéricas las celdas en blanco se sustituyen por el símbolo de


datos perdidos del sistema. En las variables tipo cadenas las celdas en blanco
se tratan como valores válidos por el sistema.

Si en la primera fila hay datos en lugar del nombre de las variables, el SPSS
utiliza letras como los nombres.

Para ficheros en Excel también se debe especificar el rango de las celdas a leer
comenzando por la letra de la primera columna y el número de la primera fila,
dos puntos, y la letra de la última columna y el número de la última fila (A1: D22).

Por ejemplo, hoja de cálculo con nombre de variables

Hoja de cálculo Editor de Datos del SPSS

NOMBRE SEXO EDAD NOMBRE SEXO EDAD

Juan 1 81 21 Juan 1 21
Pedro 1 77 No conoce Pedro 1 .
Fina 2 89 22 Fina 2 22

38
Por ejemplo, hoja de cálculo sin nombre de variables

Hoja de cálculo Editor de Datos del SPSS

A B C

Juan 1 21 Juan 1 . 21
Pedro 1 No conoce Pedro 1 . .
Fina 2 22 Fina 2 . 22

Si tenemos las variables por las filas y los sujetos por las columnas, después de
cargar la base de datos en SPSS podemos invertir filas y columnas utilizando el
comando Transponer (Transpose) del menú Datos (Data).

B. Mostrar información de datos (Display data information)

Nos muestra un cuadro que nos da los detalles de los datos de nuestro interés.
Se puede especificar localización, en torre, directorio, nombre del fichero o el
tipo de fichero del que nos interesa la información.

C. Aplicar diccionario de datos (Apply data Dictionary)

Es una opción que nos permite aplicar el diccionario de una base de datos
anterior (tipo de variable y ancho, formato de presentación, descripción de la
variable y los valores de las etiquetas y las especifificaciones en cuanto a los
valores perdidos) a la base que estamos trabajando actualmente. Para hacer
uso de este comando tenemos que tener una base abierta.

Para ello seleccionamos esa opción dentro de Archivo lo que hace que se abra
la caja de diálogo correspondiente, especificamos donde buscar el archivo, el
tipo de archivo y su nombre.

Para poder aplicar el diccionario es necesario que los nombres de las variables
en ambos ficheros coincidan. Las variables no tienen porque estar en el mismo
orden y aquellas que no están presentes en ambos ficheros no se ven
afectadas. Las reglas que se aplican son las siguientes:

• Si el tipo de variable es el mismo se aplica toda la información del


diccionario y si no es el mismo para ambos o hay una variable tipo
cadena de más de 8 caracteres solo se aplica la etiqueta de la variable.

• Las variables numéricas, dólar, punto, coma, fecha y tiempo son todas
consideradas numéricas y se aplica todo el diccionario.

39
• El ancho de las variables cadenas no se afecta al aplicar el cuestionario y
si son de 8 caracteres o menos se truncan los valores ausentes o los
valores especificados en las etiquetas si exceden el ancho definido en la
variable del fichero de trabajo.

Cualquier información del diccionario aplicado sobreescribe la información


del diccionario existente, de hecho se pierde entonces la información original.

2. EN LA OPCION VER DEL MENÚ:

A. Fuentes (Fonts) me permite cambiar el tipo de letra, el estilo, su tamaño y el


tipo de alfabeto, pinchando la opción deseada.

B. Cuadrícula (Gridlines) me permite eliminar las cuadrículas que conforman


las celdas del editor de datos o volverlas a colocar en dicha ventana.

C. Etiqueta de valores (Value labels) me permite, en las variables discretas


definidas como numéricas y con etiquetas de valores declaradas, visualizar
en pantalla en lugar de los números, las etiquetas correspondientes. Esto
mismo lo logro pinchando sobre el icono de etiquetas en la barra de
herramientas.

3. EN LA OPCIÓN DATOS DEL MENÚ

A. Ordenar casos (Sort) me permite ordenar los casos ascendente o


descendentemente a partir de una variable concreta que se declara.

B. Transponer (Transpose) me permite convertir las filas en columnas y las


columnas en filas. Esto es de utilidad cuando por ejemplo cargamos una
base de datos que originalmente era una hoja de cálculo que tiene los
sujetos por las columnas y las variables por las filas. Así las variables se
convierten en casos y los casos en variables. Esta prefijado que SPSS de
nombres a las nuevas variables creadas al transponer.

C. Fundir archivos (Merge files) me da la posibilidad de fundir 2 o más archivos


creados en el procesador del SPSS [extensión (*.sav) o (*.sys)] ya sea
adicionando casos o variables al que aparece en la ventana de edición
activa.

• Cuando adicionamos casos ambos archivos deben tener definidas las


mismas variables, éstas se emparejan por nombre. Siempre la fusión se
hace uniendo un fichero externo al que se encuentra activo en el
procesador, o sea al que ya está abierto. Una vez seleccionada esta
opción en la caja de diálogo que aparece en pantalla doy la localización
del fichero que deseo agregar, el tipo y el nombre.

40
Al pinchar aceptar aparece una nueva caja en la que me informan acerca
de las variables que no emparejan, identificando las del fichero activo con
un asterisco (*) y las del fichero externo con un signo mas (+). La
discrepancia puede ser en nombre y esto se puede subsanar
seleccionando y renombrando una de las variables para que coincidan en
nombre. La discrepancia también puede ser en el tipo de variable, las
numérica y en cadena son incompatibles, como también lo son dos
variables alfanuméricas (en cadena) cuyo ancho definido no coincida.

Aquí también tenemos la opción de mantener la identidad de la fuente


seleccionando esta alternativa que me crea una nueva variable indicadora
cuyo nombre prefijado, aunque si lo deseamos se puede dar nombre a
esa nueva variable. Este nombre no puede coincidir con los nombres ya
declarados. Esta variable es dicotómica y aparecen con valor 0 los casos
del fichero de trabajo y con 1 los del fichero externo.

Si la misma información está registrada con nombres de variables


diferentes en los dos fichero, se pueden parear marcando ambos
nombres y pinchando sobre el botón Par. En la lista de variables que
formaran el nuevo fichero de trabajo (el fundido) aparecen ambos
nombres juntos y la nueva variable por defecto lleva el nombre que tenia
en el fichero original de trabajo.
Si deseamos podemos incluir una variable dispareja en el nuevo fichero
sencillamente marcándola y pasándola al listado al pinchar sobre la
flecha ( ). Esto hace que los casos del fichero donde originalmente no
existía la variable aparezcan como valores perdidos.

• Cuando adicionamos variables se funden dos ficheros SPSS que tienen


los mismos casos pero variables distintas. Los ficheros tienen que ser del
sistema (*.sav) o (*.sys), los casos deben de encontrarse en el mismo
orden en ambos ficheros o se puede usar una variable de ordenamiento
ascendente que debe ser la misma en ambos ficheros. Nuevamente se
funde un fichero externo al fichero de trabajo que se encuentra activo
(abierto). Estos se hace igual que en el caso anterior en dos pasos,
primero selecciono el fichero externo que voy a fundir con el activo y al
abrirse la segunda ventana voy seleccionando las opciones.

Se pueden excluir variables, de hecho por defecto quedan excluidas


cualesquiera de las variables del segundo fichero cuyo nombre sea una
replica de una del primero. Si se empeña en agregarla debe renombrarla
primero. Aquí también tenemos la posibilidad de crear una variable de
origen, los casos del fichero de trabajo que no aparecen en el fichero
externo toman el valor de 0 en esta variable y los del fichero externo que
no aparecen en el de trabajo y los casos presentes en ambos el de 1.
Esta variable la puedo nombrar como desee si es de interés.

41
Los nuevos ficheros resultados de la fusión, se deben guardar dándoles un
nuevo nombre.

D. Segmentar archivos ( Split file) es una opción que me permite subdividir mi


base de datos en grupos para el análisis a partir de una o varias variables
de agrupación. Tengo tres alternativas la de analizar todos los casos es la
prefijada, la de comparar los grupos y la de organizar la salida por grupo.
Tengo que declarar además la o las variables que me van a subdividir en
grupos, estas pueden ser hasta 8 en número y también debo declarar si el
fichero debe ordenarse por variables de agrupación o si ya esta ordenado.
El comando se mantendrá activo hasta tanto no se desactive y afectará
todo el análisis estadístico posterior a su activación. Este comando es
quizás muy productivo cuando estamos trabajando, dentro del análisis
estadístico, la estadística descriptiva, pero nos puede complicar el análisis
inferencial por lo que se sugiere desactivarlo una vez terminada la
descripción. Se desactiva volviendo a la ventana y pinchando en la opción
“analizar todos los casos”, o el botón restablecer (reset).

E. Seleccionar casos (Select cases) es otra opción para elegir casos para
llevar a cabo el análisis por grupos, sobre todo cuando nuestro interés es el
estudio de un subgrupo determinado. Esta opción también nos permite
seleccionar una muestra aleatoria de casos. Hay cinco alternativas
excluyentes posibles para seleccionar, la primera es la prefijada por el
sistema y es todos los casos, la segunda es Si se satisface la condición y
requiere que se defina cual es esta condición, la tercera es la Muestra
aleatoria de casos declarando el % de casos que debe comprender, la cuarta
es la Amplitud basada en tiempo o caso propia para el análisis de series de
tiempo y por último tenemos el Uso de una variable filtro cuyo nombre debe
declararse. Esta debe ser una variable numérica.

Otro aspecto importante a considerar es el tratamiento que se hace de los


casos no seleccionados. Aquí hay dos alternativas: se filtran (la mas sana de
las dos) o se suprimen (borrar). Con la primera alternativa no perdemos los
casos originales, pero el procesamiento es algo mas lento. Con la segunda
se aligera el procesamiento, pero corremos el riesgo de perder los casos no
seleccionados si no desactivamos el criterio de selección antes de terminar
la sesión de trabajo. En caso de que esto ocurra es irrecuperable la
información original.

Esto nos lleva a sugerir que una vez terminada de crear la base de datos
debemos hacer una copia de seguridad de la misma que nos garantice, en
caso de equivocarnos, la posibilidad de tener los datos originales intactos en
otro lugar. Cuando se usa un filtro aparece la advertencia, filtro activado, en la
línea de estado del procesador. El activar una selección desactiva la posibilidad
de deshacer ya sea por el menú o por la barra de herramientas, y la pérdida, si
ocurre, es irreversible. En el Editor de Datos los casos excluidos aparecen

42
marcados por una diagonal en la columna de identificador de filas (celda gris).
Para desactivar esta opción entramos nuevamente a la caja de diálogo y
pinchamos la alternativa “todos los casos” o el botón restablecer (reset).

4. EN LA OPCIÓN TRANSFORMAR DEL MENÚ

A. Calcular (Compute) es el comando que nos permite crear nuevas variables a


partir del cálculo con otras que existen en la base de datos. Para calcular hay
que declarar:

a. La nueva variable. A ésta se le da un nombre, también se le puede dar


etiqueta y es la receptora de los resultados del cálculo y

b. La expresión numérica para el cálculo de la nueva variables. En ella se


utilizan los nombres de las variables, los operadores aritméticos y
funciones. La expresión se puede escribir directamente o se pueden ir
seleccionando y pegando sus elementos.

Esto es de mucha utilidad si por ejemplo usamos una prueba tipo batería
compuesta por varios subtest donde además se requiere de una calificación
general que es la suma de éstos. Esa suma se puede hacer a través de este
comando.

Por ejemplo, me puede interesar una nueva variable a la que puedo dar por
nombre din y por etiqueta dinamismo que sea el resultado de la expresión Suma
de las variables nombradas A, D y F varA+varD+varF o que sea el resultado de
la expresión promedio de ellas [(varA+varD+varF) / 3].

La caja de diálogo trae una calculadora donde aparecen todos los operadores
aritméticos, lógicos y relacionales (ver Tabla 2).

Tabla 2. Operadores

OPERADORES

Aritméticos Relacionales Lógicos


+ Adición < Menor que & Ambas relaciones
- Substracción > Mayor que And deben ser ciertas
* Multiplicación <= Menor que o igual a Una de las dos
I
/ División >= Mayor que o igual a relaciones debe ser
Or
cierta
** Potenciación = Igual a ~ Invierte el resultado

43
() Orden de las ~= No igual a No verdadera/falso de la
operaciones expresión

Es importante recordar el uso de los paréntesis para aclarar el orden de las


operaciones y como realizarlas. El orden de operaciones es: primero funciones,
a continuación potenciación, luego multiplicación y división y por último suma y
resta.

Los operadores relacionales se utilizan en expresiones condicionales y los


lógicos para unir dos expresiones condicionales. El sistema trae un listado de
funciones.

B. Recodificar (Recode) es el comando que me permite crear nuevas variables


a partir de la recodificación de las ya existentes. Cuando recodifico tengo dos
alternativas: hacerlo sobre la misma variable o hacerlo creando una nueva
variable. Sugerimos la segunda posibilidad para de esta manera no perder la
variable original ya que en la primera alternativa se sobreescriben los nuevos
valores sobre los anteriores y se pierden los originales.

La recodificación requiere de la declaración de los antiguos valores, ya sea


únicos, o rango de ellos y los nuevos valores que toman. Con la condición
“Si” puedo recodificar solo a un subconjunto de casos que cumplan la
condición declarada.

C. Asignar rangos a casos (Rank cases) me permite crear una nueva variable,
cuyo nombre es el de la variable rangueada con una r delante, por ejemplo si
pedimos rangos para la variable edad, la nueva variable lleva el nombre
redad. En esa variable aparecen los rangos de la variable original en el orden
que se haya solicitado. En la caja de diálogo, escogemos la variable, se
especifica si el rango 1 se da al valor menor (orden ascendente) o al mayor
(orden descendente). Se puede escoger también el tipo de rango y el
tratamiento a dar a las observaciones empatadas (con valores iguales) así
como si deseamos los rangos por subgrupos declarando una variables de
agrupación.

Dentro del tipo de rangos puede resultar interesante el Ntiles, o sea rangos
basados en los grupos de percentil donde cada grupo contiene
aproximadamente el mismo número de casos. Por ejemplo si pedimos Ntiles 10
se le asigna rango 1 a los casos por debajo y hasta el percentil 10, 2 a los que
están entre el 10 y hasta el 20, 3 a los que están entre el 20 y el 30 y así
sucesivamente. Solo es necesario declarar el número de subdivisiones que
deseamos.

44

S-ar putea să vă placă și