Sunteți pe pagina 1din 60

Anlisis Estadstico

de Datos con SPSS

15/01/2012
Anlisis Estadstico de Datos con SPSS.

INDICE

CAPTULO 1. Generalidades del SPSS. 4


Introduccin 4
1.1 Tipos de Ventanas IBM SPSS Statistics 20. 4
1.1.1 Ventana del editor de datos. 4
1.1.2 Visor 6
1.1.3 Editor de tablas pivote 6
1.1.4 Editor de grficos 7
1.1.5 Editor de resultados de texto 7
1.1.6 Editor de sintaxis 7
1.2 Barra de men 7
1.3 Barras de herramientas 7
1.4 Personalizar la barra de herramienta 8
1.4.1 Mostrar barra de herramientas 8
1.4.2 Para personalizar la barra de herramientas 9
1.4.3 Barra de herramientas de edicin 10
1.4.4 Para cambiar las imgenes de la barra de herramientas 11
1.5 Definir Variable 11
1.6 Formato de columna 15
1.7 Edicin de datos 15
1.7.1 Mover y copiar datos 15
1.7.2 Eliminar casos 16
1.7.3 Insertar variable 16
1.7.4 Buscar datos 16
CAPTULO 2. Tratamiento y Anlisis 17
2.1 Construccin de la matriz de datos 17
2.1.1 Matriz de datos 17
2.1.2 Entrada de datos 17

2
Anlisis Estadstico de Datos con SPSS.

2.2 Importacin y exportacin de archivos 18


2.3.1 Importacin de archivos 18
2.3.2 Exportacin de archivos 20
2.3 Transformacin de datos con IBM SPSS Statistics 20. 22
2.3.1 Ordenar casos 22
2.3.2 Fundir archivos 23
2.3.3 Agregar datos (casos) 26
2.3.4 Dividir archivos(Segmentar archivos ) 30
2.3.5 Seleccin de caso 31
2.3.6 Creacin de nuevas variables 35
2.3.7 Conteo de casos 37
2.3.8 Recodificacin de variables 39
CAPTULO 3. Anlisis Exploratorio de Datos 43
3.1 Anlisis exploratorio de datos. Procedimiento Explorar 43
3.2 Diagramas de Cajas 44
CAPTULO 4. Descripcin Estadstica de una variable 46
4.1 Datos y distribucin de frecuencias 46
4.2 Diagrama tallo y hojas 48
4.3 Representaciones grficas 48
4.4 Caractersticas de una distribucin 52
4.5 Medidas de Tendencia Central 53
4.6 Medidas de dispersin y su uso 53
CAPTULO 5. Descripcin conjunta de dos variables categricas 55
5.1 Tablas de contingencia 55
5.2 Test Chi - Cuadrado 57
5.3 Comparacin de Medias 57

3
Anlisis Estadstico de Datos con SPSS.

CAPTULO 1. Generalidades del SPSS.

Introduccin

El programa IBM SPSS Statistics 20, es un sistema global para el anlisis estadstico.
Adems, puede adquirir datos de casi cualquier tipo de archivo y utilizarlos para generar
informes tabulares, grficos y diagramas de distribuciones y tendencias, estadsticos
descriptivos y anlisis estadsticos complejos. Para empezar a trabajar en este programa, basta
elegir la opcin Todos los Programas del men IBM SPSS Statistics de Windows y
selecciona la sub opcin IBM SPSS Statistics 20 para Windows. Se obtiene una
pantalla (figura 1.1) que nos permite comenzar a trabajar con las distintas opciones. Una vez
seleccionada la opcin se presiona la tecla OK.

Figura 1.1 Opciones del IBM SPSS Statistics 20

1.1 Tipos de Ventanas IBM SPSS Statistics 20.

Existen diversos tipos de ventanas en IBM SPSS Statistics:

1.1.1 Ventana del editor de datos.

El Editor de datos proporciona un mtodo prctico (al estilo de las hojas de clculo) para
la creacin y edicin de archivos de datos. La ventana Editor de datos se abre
automticamente cuando se inicia una sesin.

El Editor de datos proporciona dos vistas de los datos.

4
Anlisis Estadstico de Datos con SPSS.

Vista de datos. Esta vista muestra los valores de datos reales o las etiquetas de
valor definidas (Figura 1.2, 1.3).

Vista de variables. Esta vista muestra la informacin de definicin de las


variables, que incluye las etiquetas de la variable definida y de valor, tipo de
dato (por ejemplo, cadena, fecha o numrico), nivel de medida (nominal, ordinal
o de escala) y los valores perdidos definidos por el usuario.

En ambas vistas, se puede aadir, modificar y eliminar la informacin contenida en el


archivo de datos.

Figura 1.2 Ventana del editor de datos IBM SPSS Statistics.

Figura 1.3 Ventana del editor de datos con observaciones en IBM SPSS Statistics 20

5
Anlisis Estadstico de Datos con SPSS.

1.1.2 Visor. Todas las tablas, los grficos y los resultados estadsticos se muestran en el
Visor. Puede editar los resultados y guardarlos para utilizarlos posteriormente. La
ventana del Visor se abre automticamente la primera vez que se ejecuta un
procedimiento que genera resultados.

Figura 1.4 Ventana visor IBM SPSS Statistics 20.

1.1.3 Editor de tablas pivote. Con el Editor de tablas pivote es posible modificar los
resultados mostrados en este tipo de tablas de diversas maneras. Puede editar el texto,
intercambiar los datos de las filas y las columnas, aadir colores, crear tablas
multidimensionales y ocultar y mostrar los resultados de manera selectiva.

Figura 1.5 Editor de tablas pivote IBM SPSS Statistics 20.

6
Anlisis Estadstico de Datos con SPSS.

1.1.4 Editor de grficos. Puede modificar los grficos y diagramas de alta resolucin en
las ventanas del los grficos. Es posible cambiar los colores, seleccionar diferentes tipos de
fuentes y tamaos, intercambiar los ejes horizontal y vertical, rotar diagramas de dispersin
3-D e incluso cambiar el tipo de grfico.

1.1.5 Editor de resultados de texto. Los resultados de texto que no aparecen en las
tablas pivote pueden modificarse con el Editor de resultados de texto. Puede editar los
resultados y cambiar las caractersticas de las fuentes (tipo, estilo, color y tamao).

1.1.6 Editor de sintaxis. Puede pegar las selecciones del cuadro de dilogo en una
ventana de sintaxis, donde aparecern en forma de sintaxis de comandos. A
continuacin puede editar esta sintaxis de comandos para utilizar las funciones
especiales que no se encuentran disponibles en los cuadros de dilogo. Tambin puede
guardar los comandos en un archivo para utilizarlos en sesiones posteriores.

Figura 1.6 Editor de sintaxis IBM SPSS Statistics 20.

1.2 Barra de men

En el editor de datos en la lnea superior vemos el cono de IBM SPSS Statistics 20. En la
lnea siguiente se presenta la barra de men general con todas sus opciones: Archivo,
Edicin, Ver, Datos, Transformar, Analizar, Marketing directo, Grficos, Utilidades,
Ventana, Ayuda. Cada una de estas opciones contiene distintos procedimientos para el
trabajo estadstico.

1.3 Barras de herramientas

Una barra de herramientas es un conjunto de botones-iconos que permiten ejecutar


muchas de las funciones del IBM SPSS Statistics 20, de forma rpida y sencilla. Cada
ventana tiene su propia barra de herramientas, con botones especficos adaptados a las
funciones bsicas de esa ventana. AI pasar con el puntero del ratn (sin pulsar el botn)

7
Anlisis Estadstico de Datos con SPSS.

por encima de una herramienta, se abre un pequeo recuadro de ayuda pista ofreciendo
una breve descripcin de la funcin asociada a esa herramienta.

Figura 1.7 Barra de herramienta IBM SPSS Statistics 20.

De izquierda a derecha, los conos de la barra de herramienta son los siguientes:

- Abrir documento de datos


- Guardar este documento
- Imprimir
- Recuperar los cuadros de dilogo reciente
- Deshacer una accin del usuario
- Volver a hacer una accin del usuario
- Ir a caso.
- Ir a la variable.
- Variables.
- Buscar.
- Insertar casos.
- Insertar variables.
- Dividir archivos.
- Ponderar casos.
- Seleccionar casos.
- Etiqueta de valor.
- Utilizar conjuntos de variables.
- Mostrar todas las variables.
- Corregir ortografa.

1.4 Personalizar la barra de herramienta

Puede personalizar las barras de herramientas y crear nuevas barras de herramientas. En


las barras de herramientas puede incluirse cualquier herramienta disponible, incluso la
de cualquier accin de men. Adems pueden contener herramientas personalizadas que
ejecutan otras aplicaciones, que ejecutan archivos de sintaxis de comandos o archivos
de procesos.

1.4.1 Mostrar barra de herramientas


Utilice Mostrar barras de herramientas para mostrar u ocultar, personalizar y crear
nuevas barras de herramientas. En las barras de herramientas puede incluirse cualquier
herramienta disponible, incluso la de cualquier accin de men. Adems pueden
contener herramientas personalizadas que ejecutan otras aplicaciones, que ejecutan
archivos de sintaxis de comandos o archivos de procesos.

8
Anlisis Estadstico de Datos con SPSS.

Figura 1.8 Ubicacin de la barra de herramienta.

Figura 1.9 Mostrar barra de herramientas.

1.4.2 Para personalizar la barra de herramientas

En los mens, seleccione:

Ver

Barras de herramientas

Personalizar
9
Anlisis Estadstico de Datos con SPSS.

Seleccione la barra de herramientas que desea personalizar y pulse en Edicin o


pulse en Nueva para crear una nueva barra de herramientas.

Para las barras de herramientas nuevas, introduzca un nombre para la barra de


herramientas, seleccione las ventanas en las que desea que aparezca y pulse en
Edicin.

Seleccione un elemento en la lista Categoras para que se visualicen las


herramientas disponibles en esa categora.

Arrastre y suelte las herramientas que desee en la barra de herramientas que


aparece en el cuadro de dilogo.

Para eliminar una herramienta de la barra de herramientas, arrstrela a cualquier


punto fuera de la barra de herramientas que aparece en el cuadro de dilogo.

Pulse en Nueva herramienta en el cuadro de dilogo Barra de herramientas de


edicin.

Introduzca una etiqueta descriptiva para la herramienta.

Seleccione la accin que desee realizar con la herramienta (abrir un archivo,


ejecutar un archivo.

Pulse en Examinar para seleccionar un archivo o una aplicacin para asociarlos a


la herramienta.

Las nuevas herramientas se muestran en la categora Personales, que adems


contiene los elementos de men definidos por el usuario.

1.4.3 Barra de herramientas de edicin

Utilice el cuadro de dilogo Barra de herramientas de edicin para personalizar las


barras de herramientas existentes y para crear nuevas barras. En las barras de
herramientas puede incluirse cualquier herramienta disponible, incluso la de cualquier
accin de men. Adems pueden contener herramientas personalizadas que ejecutan
otras aplicaciones, que ejecutan archivos de sintaxis de comandos o archivos de
procesos.

10
Anlisis Estadstico de Datos con SPSS.

Figura 1.10 Cuadro de dilogo Personalizar barra de herramientas

1.4.4 Para cambiar las imgenes de la barra de herramientas

Seleccione la herramienta cuya imagen desea cambiar en la barra de


herramientas.

Pulse en Cambiar imagen.

Seleccione el archivo de imagen que desea utilizar para la herramienta. Se


admiten los siguientes formatos de imagen: BMP, PNG, GIF, JPG.

- Las imgenes deben ser cuadradas. Las imgenes no cuadradas se recortan hasta
formar un cuadrado.

- El tamao de las imgenes se ajusta automticamente. Para una visualizacin


ptima, utilice imgenes de 16x16 pxeles para imgenes pequeas de la barra
de herramientas, o de 32x32 pxeles para imgenes grandes.

1.5 Definir Variable

Una vez activada la ventana Datos nuevos en IBM SPSS Statistics 20, pasamos a definir
la variable correspondiente a la columna o celda seleccionada. Para ello pinchar en el
men Datos y dentro del men que se desplegar, elegir la opcin Definir variable, es
decir:

11
Anlisis Estadstico de Datos con SPSS.

Figura 1.11 Definir la variable de un conjunto de datos en IBM SPSS Statistics 20

La ventana Vista de variables permite llevar a cabo todas las tareas relacionadas con la
definicin de una variable:

1. Nombre de variable: Debe tener caracteres, que pueden ser alfabticos o


numricos. o el smbolo de subrayado (_); la nica restriccin es que el primer
carcter debe ser alfabtico, $ o #.
2. Tipo de datos: Los distintos tipos de datos son los siguientes;

- Numrico. Una variable cuyos valores son nmeros. Los valores se muestran en
formato numrico estndar. El Editor de datos acepta valores numricos en
formato estndar o en notacin cientfica.

- Coma. Una variable numrica cuyos valores se muestran con comas que
delimitan cada tres posiciones y con el punto como delimitador decimal. El
Editor de datos acepta valores numricos para este tipo de variables con o sin
comas, o bien en notacin cientfica. Los valores no pueden contener comas a la
derecha del indicador decimal.

- Punto. Una variable numrica cuyos valores se muestran con puntos que
delimitan cada tres posiciones y con la coma como delimitador decimal. El
Editor de datos acepta valores numricos para este tipo de variables con o sin
puntos, o bien en notacin cientfica. Los valores no pueden contener puntos a la
derecha del indicador decimal.

- Notacin cientfica. Una variable numrica cuyos valores se muestran con una
E intercalada y un exponente con signo que representa una potencia de base 10.
El Editor de datos acepta para estas variables valores numricos con o sin el
exponente. El exponente puede aparecer precedido por una E o una D con un
signo opcional, o bien slo por el signo (por ejemplo, 123, 1,23E2, 1,23D2,
1,23E+2 y 1,23+2).
12
Anlisis Estadstico de Datos con SPSS.

- Fecha. Una variable numrica cuyos valores se muestran en uno de los


diferentes formatos de fecha-calendario u hora-reloj. Seleccione un formato de
la lista. Puede introducir las fechas utilizando como delimitadores: barras,
guiones, puntos, comas o espacios. El rango de siglo para los valores de ao de
dos dgitos est determinado por la configuracin de las opciones (en el men
Edicin, seleccione Opciones y, a continuacin, pulse en la pestaa Datos).

- Dlar. Una variable numrica que se muestra con un signo dlar inicial ($),
comas que delimitan cada tres posiciones y un punto como delimitador decimal.
Se pueden introducir valores de datos con o sin el signo dlar inicial.

- Moneda personalizada. Una variable numrica cuyos valores se muestran en


uno de los formatos de moneda personalizados que se hayan definido
previamente en la pestaa Moneda del cuadro de dilogo Opciones. Los
caracteres definidos en la moneda personalizada no se pueden emplear en la
introduccin de datos pero s se mostrarn en el Editor de datos.

- Cadena. Una variable cuyos valores no son numricos y, por lo tanto, no se


utilizan en los clculos. Los valores pueden contener cualquier carcter siempre
que no se exceda la longitud definida. Las maysculas y las minsculas se
consideran diferentes. Este tipo tambin se conoce como variable
alfanumrica.

3. Ancho de columna: Se especifica el numero de caracteres para el ancho de


columna este valor debe de estar entre un rango de 1 a 40.

4. Decimales: Cantidad de decimales con las que se va a trabajar las variables de


tipo cuantitativa.

5. Etiquetas de variable: Puede asignar etiquetas de variable descriptivas de hasta


256 caracteres de longitud. Las etiquetas de variable pueden contener espacios y
caracteres reservados que no se admiten en los nombres de variable.

6. Etiqueta de valor: Puede asignar etiquetas de valor descriptivas a cada valor de


una variable. Este proceso es especialmente til si el archivo de datos utiliza
cdigos numricos para representar categoras que no son numricas (por
ejemplo, cdigos 1 y 2 para hombre y mujer).

13
Anlisis Estadstico de Datos con SPSS.

Figura 1.12 Etiqueta de valor en IBM SPSS Statistics 20

7. Valores perdidos: Valores perdidos define los valores de los datos definidos como
perdidos por el usuario. Por ejemplo, es posible que quiera distinguir los datos
perdidos porque un encuestado se niegue a responder de los datos perdidos porque la
pregunta no afecta a dicho encuestado. Los valores de datos que se especifican como
perdidos por el usuario aparecen marcados para un tratamiento especial y se excluyen de
la mayora de los clculos.
Figura 1.13 Valores perdidos en IBM SPSS Statistics 20

8. Nivel de medicin: Puede especificar el nivel de medida como Escala (datos


numricos de una escala de intervalo o de razn), Ordinal o Nominal. Los datos
nominales y ordinales pueden ser de cadena (alfanumricos) o numricos.

- Nominal. Una variable se puede tratar como nominal si sus valores representan
categoras que no obedecen a una ordenacin intrnseca (por ejemplo, el
departamento de la empresa en el que trabaja un empleado). Algunos ejemplos de
variables nominales son: regin, cdigo postal o confesin religiosa.

- Ordinal. Una variable puede tratarse como ordinal cuando sus valores
representan categoras con alguna ordenacin intrnseca (por ejemplo, los
14
Anlisis Estadstico de Datos con SPSS.

niveles de satisfaccin con un servicio, que vayan desde muy insatisfecho hasta
muy satisfecho). Entre los ejemplos de variables ordinales se incluyen escalas de
actitud que representan el grado de satisfaccin o confianza y las puntuaciones de
evaluacin de las preferencias.

- Escala. Una variable puede tratarse como escala (continua) cuando sus valores
representan categoras ordenadas con una mtrica con significado, por lo que son
adecuadas las comparaciones de distancia entre valores. Son ejemplos de
variables de escala: la edad en aos y los ingresos en dlares.

Nota: Para variables de cadena ordinales, se asume que el orden alfabtico de los
valores de cadena indica el orden correcto de las categoras. Por ejemplo, en una
variable de cadena cuyos valores sean bajo, medio, alto, se interpreta el orden de
las categoras como alto, bajo, medio (orden que no es el correcto). Por norma
general, se puede indicar que es ms fiable utilizar Cdigos numricos para
representar datos ordinales.

1.6 Formato de columna: Se refiere a la anchura de columna y alineacin del texto este
estn incorporados en la ventana de vista de variables.

1.7 Edicin de datos:

El Editor de datos puede modificar el archivo de datos de diversas maneras:

Cambiar los valores de datos


Cortar, copiar y pegar valores de datos
Aadir y eliminar casos
Aadir y eliminar variables
Cambiar el orden de las variables

1.7.1 Mover y copiar datos

Puede cortar, copiar y pegar valores de casillas individuales o grupos de valores en el


Editor de datos. Tiene la posibilidad de:

Mover o copiar un nico valor de casilla a otra casilla


Mover o copiar un nico valor de casilla a un grupo de casillas
Mover o copiar los valores de un nico caso (fila) a varios casos
Mover o copiar los valores de una nica variable (columna) a varias variables
Mover o copiar un grupo de valores de casillas a otro grupo de casillas
Al mover o copiar datos, el formato original es sustituido por el formato de las nuevas
columnas que pasan a ocupar. Si la conversin de formato de un dato no es posible, el
dato se convierte en un valor perdido definido por el sistema.

15
Anlisis Estadstico de Datos con SPSS.

1.7.2 Eliminar casos

Para eliminar el texto seleccionado (ya sea una casilla, un caso, una variable o un
conjunto de casillas):

Seleccionar la opcin Borrar del men Edici6n. La tecla suprimir produce el


mismo efecto.

1.7.3 Insertar variable

Para insertar una variable nueva (una columna nueva entre dos variables existentes:

Situar el cursor en la columna donde se desea insertar la nueva variable


Seleccionar la opcin Insertar variable del men Datos, o
pulsar el botn Insertar variable de la barra de
herramienta.

1.7.4 Buscar datos

Esta opcin permite buscar un valor concreto en los casos de la variable seleccionada
(es decir, en los casos de la columna en la que se encuentra el cursor). Para buscar un
dato:

Seleccionar la opcin Buscar datos del men Edicin ( o pulsar el botn Buscar
de la barra de herramientas) para acceder al cuadro de dialogo Buscar datos
(figura 1.14).

Figura 1.14. Cuadro de dilogo Buscar datos.

16
Anlisis Estadstico de Datos con SPSS.

CAPTULO 2. Tratamiento y Anlisis.


2.1 Construccin de la matriz de datos

Antes de comenzar a construir una matriz de datos es necesario referirnos al concepto de


este.

2.1.1 Matriz de datos: Es aquella que est conformada por todas las variables de
importancia en un estudio y todas las unidades elementales de anlisis en una
investigacin estos pueden ser: Personas, Empresas, Animales, Producto etc., su
estructura est dada por la figura 2.1:

Figura 2.1. Matriz de datos.


Variable 1 Variable 2 . Variable m
Caso 1
Caso 2
..
Caso n

2.1.2 Entrada de datos: Se selecciona el programa IBM SPSS Statistics 20 y se


selecciona la opcin introducir los datos y seleccione ok, automticamente se
visualiza la vista de variables donde se efecta la definicin para cada variable, tipo,
etiqueta, etc. Esto se debe realizarse antes de introducir los datos de cada caso en Vista de
datos.

La Vista de datos, permite introducir datos en cualquier orden. Asimismo, se pueden


introducir datos por:

1) caso: En este caso, se activar la fila correspondiente al caso y despus se pasa a


introducir los datos. Es decir, una vez activada una determinada fila, el valor tecleado
se almacena en la primera columna de la fila activada, el segundo valor se almacena en
la segunda columna, y as sucesivamente hasta completar todos los datos del primer
caso.
2) variable: cuando se teclea el primer valor y se pulsa la tecla de Intro ste se
almacena en la celda correspondiente al primer caso de la primera variable, el segundo valor
se almacena en la celda correspondiente al segundo caso de la primera variable, y as
sucesivamente hasta completar todos los datos de la primera variable. Despus se activa la
segunda variable, y se procede de la misma forma. Y as sucesivamente, hasta completar
todos los datos de todas las variables.

3) Casillas individuales: Se selecciona una casilla y se introduce un valor de dato, este se


muestra en le editor de la casilla. Los valores no se registran hasta que se pulsa intro o
se selecciona otra casilla.

17
Anlisis Estadstico de Datos con SPSS.

2.2 Importacin y exportacin de archivos.


Los archivos guardados en formato IBM SPSS Statistics 20, puede abrir archivos de
Excel, SAS, Stata, archivos delimitados por tabuladores y otros archivos sin necesidad de
convertirlos a un formato intermedio ni de introducir informacin sobre la definicin de los
datos.

2.2.1 Importacin de archivos: Elija en los mens:

Archivo
Abrir base de datos
Nueva consulta.

Se selecciona el origen de datos que sea compatible con IBM SPSS Statistics 20:

dBase Files:
dBASE IV (*.dbf). Formato dBASE IV.
dBASE III (*.dbf). Formato dBASE III.
dBASE II (*.dbf). Formato dBASE II.

Excel files:
Excel 97, Formato XLS.
Excel 2007, Formato XLSX

Ms Access Database:
Ms Access Database, Formato DB (2000-2003)
Ms Access Database, Formato DBX (2007)

Luego, seleccione Siguiente y le aparecer una pantalla de la forma siguiente:

Figura 2.4. Seleccin del origen de datos que se desea importar.

18
Anlisis Estadstico de Datos con SPSS.

Selecciona Examinar y busca la base de datos que desea importar al programa IBM
SPSS Statistics 20 y selecciona abrir, automticamente le aparecer la venta Acesso al
controlador ODBC con la ubicacin de la base de dato que desea importar. Luego
seleccione Aceptar y le aparecer una ventana (Figura 2.5).

Figura 2.5 Ventana seleccin de datos.

19
Anlisis Estadstico de Datos con SPSS.

Seleccione Finalizar, automticamente le aparecer la base importada.

2.2.2 Exportacin de archivos: El Asistente para la exportacin a base de datos


permite:

- Reemplazar los valores de los campos (columnas) de la tabla de la base de datos


existente o aadir nuevos campos a una tabla.
- Aadir nuevos registros (filas) a una tabla de base de datos.
- Reemplazar completamente una tabla de base de datos o crear una tabla nueva.

Para exportar datos a una base de datos:

En los mens de la ventana del Editor de datos correspondientes al conjunto de


datos que contiene los datos que se desean exportar, seleccione:

Archivo
Exportar a base de datos...

Seleccione el origen de base de datos.

En el primer panel del Asistente para la exportacin a base de datos, seleccione el


origen de datos al que desea exportar los datos.

Figura 2.6Asistente para la exportacin a base de datos.

20
Anlisis Estadstico de Datos con SPSS.

Puede exportar datos a cualquier origen de base de datos para el que tenga el
controlador ODBC adecuado.

Una vez seleccionado el origen de datos, se indica la forma en la que se desean exportar
los datos.

Figura 2.7 Cuadro de dilogo para la exportacin de base de datos.

Las siguientes opciones estn disponibles para exportar datos a una base de datos:
21
Anlisis Estadstico de Datos con SPSS.

- Reemplazar los valores de los campos existentes. Reemplaza los valores de los
campos seleccionados en una tabla existente con valores de las variables seleccionadas
en el conjunto de datos activo.

- Aadir nuevos campos a una tabla existente. Crea nuevos campos en una tabla
existente que contiene los valores de las variables seleccionadas en el conjunto de
datos activo. Si desea obtener ms informacin. Esta opcin no est disponible para
los archivos de Excel.

- Aadir nuevos registros a una tabla existente. Aade nuevos registros (filas) a una
tabla existente que contiene los valores de los casos del conjunto de datos activo. Si
desea obtener ms informacin.

- Eliminar una tabla existente y crear una tabla nueva con el mismo nombre.
Elimina la tabla especificada y crea una nueva tabla con el mismo nombre que
contiene variables seleccionadas del conjunto de datos activo. Toda la informacin de
la tabla original, incluidas las definiciones de las propiedades del campo (como las
claves primarias o los tipos de datos) se pierde.

- Crear una tabla nueva. Crea una tabla nueva en la base de datos que contiene datos
de las variables seleccionadas en el conjunto de datos activo. El nombre puede ser
cualquier valor que est permitido como nombre de tabla por el origen de datos. El
nombre no puede coincidir con el nombre de una tabla o vista existentes en la base de
datos.

Siga las instrucciones del asistente para exportacin para exportar los datos.

2.3 Transformacin de datos con IBM SPSS Statistics 20.


En ocasiones, los datos tienen algunos tratamientos para su posterior anlisis las cuales se
detallan a continuacin:

2.3.1 Ordenar casos: Esta opcin ayuda a ordenar los casos (filas) de una o varias
variables de ordenacin en forma ascendente o descendente.

Para ordenar casos se debe de considerar lo siguiente:

Si se seleccionas ms de una variable de ordenacin, los casos se ordenaran por


variables dentro de las categoras de la variable anterior de la lista Ordenar por.
Por ejemplo, si selecciona Sexo como la primera variable de ordenacin y gastos
como la segunda, los casos se ordenarn por gastos dentro de cada categora de
sexo.

Para ordenar casos elija en los mens

Datos
Ordenar casos, aparecer una ventana (Figura 2.8)

22
Anlisis Estadstico de Datos con SPSS.

Figura2.8. Cuadro de dilogo Ordenar casos.

Especifique con respecto a que variable desea ordenar los casos y seleccione una de las
opciones de ordenacin y seleccione Aceptar. Al editar la vista de datos, los casos
estarn ordenados.

2.3.2 Fundir archivos: Es posible fundir los archivos de dos maneras diferentes:

1. Para fundir archivos con las mismas variables casos diferentes abra uno de los
archivos de datos. Los casos de este archivo aparecern primero en el nuevo
archivo de datos fusionado. Elija en los mens:

Datos

Fundir archivos

Aadir casos.

Aparecer automticamente una ventana (Figura2.9)

Figura 2.9. Aadir casos en uno de los archivo de datos.

23
Anlisis Estadstico de Datos con SPSS.

Seleccione Examinar y busque el archivo de dato que desea fundir u selecciona


Examinar, Continuar, le aparecer una ventana Aadir casos (Figura 2.10).

Figura 2.10. Cuadro de dilogo Aadir casos.

Al aparecer esta ventana podr eliminar las variables que no desea incluir de la lista
variables en el nuevo archivo de datos. Aada parejas de variables de la lista de
variables desemparejadas que representa la misma informacin registrada con nombres
diferentes en los dos archivos. Por ejemplo: el salario de un obrero podra tener el
nombre de la variable Salobrer en un archivo y salario en el otro.
Para seleccionar una pareja de variables desemparejadas puede enviarlas a variables del
nuevo conjunto de datos activos y selecciona Aceptar. En resumen, aadir caso fusiona
el archivo de datos de trabajo con otro archivo de datos que contiene las mismas variables
pero diferentes casos.
Las variables desemparejadas se deben a lo siguiente: Las variables definidas como
datos numricos en un archivo y como datos de cadena en el otro (las variables
numricas no pueden fusionarse con variables de cadena), Variables de cadenas de
longitud diferentes (la longitud definida de una variable de cadena debe ser la misma en
ambos archivos de datos).

2. Fundir archivos con los mismos casos pero variables diferentes (columnas). Se debe
considerar lo siguiente:
Los casos deben estar ordenados de la misma manera en ambos conjuntos de
datos.

24
Anlisis Estadstico de Datos con SPSS.

Si se utilizan una o ms variables clave para emparejar los casos, los dos
conjuntos de datos deben estar ordenados por orden ascendente de la variable o
variables clave.
Los nombres de las variables del segundo archivo de datos que son duplicados
de los del conjunto de datos activo se excluyen por defecto, abra uno de los
archivos de datos activo se excluyen por defecto, ya que aadir variables supone
que estas variables contienen informacin duplicada.
Elija en los mens:
Datos

Fundir archivos

Aadir variables.

Aparecer automticamente una ventana (Figura2.11)

Figura 2.11. Aadir variables en uno de los archivo de datos.

Seleccione el conjunto de datos o el archivo de datos IBM SPSS Statistics que va a


fusionar con el conjunto de datos activo. Para seleccionar variables claves, elija las
variables entre las variables del archivo externo (marcados por el signo +) en la lista de
variables excluidas (Figura 2.10)

Figura 2.12. Cuadro de dilogo Aadir variables.

25
Anlisis Estadstico de Datos con SPSS.

Seleccione Emparejar los casos en las variables clave para los archivos ordenados.
Aada las variables a la lista Variables clave.
Las variables clave deben existir en el conjunto de datos activo y en el otro
conjunto de datos. Ambos conjuntos de datos deben estar ordenados segn el
orden ascendente de las variables clave y el orden de las variables de la lista
Variables clave debe ser igual a su secuencia de ordenacin.

2.3.3 Agregar datos (casos):


Agregar datos consiste en agrupar varios casos en uno solo. La opcin Agregar crea un
nuevo archivo de datos en el que cada nuevo caso representa a un conjunto de casos del
archivo de datos original. Un archivo agregado tiene, por tanto, menos casos que el
archivo original.

Para comprender en qu consiste agregar datos es necesario que definamos:

Variables de segmentacin: Los casos del archivo original son agrupados a partir de los
niveles de una o ms variables de segmentacin. Cada combinacin nica de valores de
variables de segmentacin define un grupo.

La variable de segmentacin, puede ser tanto numrica como de cadena.

26
Anlisis Estadstico de Datos con SPSS.

Agregar variables. Las variables del nuevo archivo se obtienen a partir de variables del
archivo original. El nombre de la variable agregada viene seguido de una etiqueta de
variable opcional.

Para agregar casos:

Seleccione Datos

Agregar

Automticamente le aparecer una ventana (Figura 2.13)

Figura 2.13. Cuadro de dilogo agregar datos.

Puede seleccionar una o ms variables de segmentacin que definan cmo deben


agruparse los casos para crear datos agregados. En la figura 2.13, se ubico una
variable de segmentacin de tipo numrico Sexo, lo que significa que todos

27
Anlisis Estadstico de Datos con SPSS.

los entrevistados que tengan el mismo Sexo pasaran a formar un nico caso en el
nuevo archivo de datos agregados.

En la figura hemos decidido que el nuevo archivo contenga una variable:


Salario (el nombre es automticamente asignado por el IBM SPSS Statistics
20.).

Seleccione una funcin de agregacin para cada variable agregada.

Figura 2.14. Funciones de agregacin.

La variable Salario (figura 2.13), ser el resultado de obtener, para cada nuevo caso
agregado, el promedio de los salarios en todos los casos de cada segmento definido por el
Sexo.

Nombre y etiquetas (opcional). Las nuevas variables son nombradas, por


defecto, P10_n ,si se desea cambiar el nombre asignado por defecto:

Pulsar el botn Nombre y etiquetas... para acceder al cuadro de dialogo


Agregar datos: Nombre y etiqueta de variable que muestra la figura 2.15.

28
Anlisis Estadstico de Datos con SPSS.

Figura 2.15. Nombre y etiqueta de la variable agregada.

Guardar el resultado agregado:

1. Aadir las variables agregadas al conjunto de datos activo. Las nuevas


variables basadas en las funciones de agregacin se aaden al conjunto de datos
activo. El propio archivo de datos no se agrega. Cada caso con los mismos
valores de variables de segmentacin recibe los mismos valores para las nuevas
variables agregadas.

2. Crear un nuevo conjunto de datos que contenga nicamente las variables


agregadas. Guarda los datos agregados en un nuevo conjunto de datos durante la
sesin actual. El conjunto de datos incluye las variables de segmentacin que
definen los casos agregados y todas las variables de agregacin definidas por las
funciones de agregacin. No afecta al conjunto de datos activo.

3. Escribir un nuevo archivo de datos que contenga slo las variables


agregadas. Guarda los datos agregados en un archivo de datos externo. El
archivo incluye las variables de segmentacin que definen los casos agregados y
todas las variables agregadas definidas por las funciones de agregacin. No
afecta al conjunto de datos activo.

Opciones de ordenacin para archivos de datos grandes

En el caso de los archivos de datos muy grandes, puede resultar ms eficiente agregar
datos ordenados previamente.

El archivo ya est ordenado por las variables de segmentacin. Si los datos ya se


han ordenados por los valores de las variables de segmentacin, e procedimiento se
ejecuta ejecucin ms rpidamente y utiliza menos memoria. Utilice esta opcin con
precaucin.

Los datos se deben ordenar por valores de variables de segmentacin en el


mismo orden que las variables de segmentacin especificadas para el
procedimiento Agregar datos.

Si va a aadir variables al conjunto de datos activo, seleccione slo esta opcin


si los datos se han ordenado mediante valores ascendentes de las variables de
segmentacin.
29
Anlisis Estadstico de Datos con SPSS.

Ordenar el archivo antes de la agregacin. En situaciones muy extraas y con


archivos de datos voluminosos, puede ser necesario ordenar el archivo de datos por los
valores de las variables de segmentacin antes de realizar la agregacin. No se
recomienda esta opcin a menos que se presenten problemas de memoria y/o
rendimiento.

2.3.4 Segmentar archivos:

Segmentar archivo divide el archivo de datos en distintos grupos para el anlisis


basndose en los valores de una o ms variables de agrupacin. Si selecciona varias
variables de agrupacin, los casos se agruparn por variable dentro de las categoras de la
variable anterior de la lista Grupos basados en. Por ejemplo, si selecciona sexo como la
primera variable de agrupacin y Edad como la segunda, los casos se agruparn por la
Edad dentro de cada categora de sexo. Es posible especificar hasta ocho variables de
agrupacin (Figura 2.16).

Figura 2.16. Cuadro de dilogo para segmentar archivo.

Los casos deben ordenarse segn los valores de las variables de agrupacin, en el
mismo orden en que aparecen las variables en la lista Grupos basados en. Si el archivo de
datos todava no est ordenado, seleccione Ordenar archivo segn variable de
agrupacin.

Los grupos de segmentacin del archivo se presentan juntos para poder compararlos a
travs del botn Comparar los grupos (Figura 2.16). Los grupos de segmentacin del
archivo se presentan juntos para poder compararlos. Para las tablas pivote se crea una
sola tabla y cada variable de segmentacin del archivo puede desplazarse entre las
dimensiones de la tabla. En el caso de los grficos se crea un grfico diferente para
cada grupo y se muestran juntos en el Visor. El resultado de cada procedimiento se

30
Anlisis Estadstico de Datos con SPSS.

muestra por separado para cada grupo de segmentacin del archivo si se selecciona el
botn Organizar los resultados por grupos.

Para segmentar un archivo de datos para el anlisis

Elija en los mens:

Datos
Segmentar archivo...
Seleccione Comparar los grupos u Organizar los resultados por grupos.
Seleccione una o ms variables de agrupacin.

2.3.5 Seleccin de casos.

En ocasiones puede interesar centrar el Anlisis en solo un grupo de casos que cumplan
determinada condicin. En otras ocasiones puede que solo interese analizar una muestra
aleatoria del total de casos del archivo de datos.
IBM SPSS Statistics, permite seleccionar un conjunto de casos utilizando diferentes
criterios: Seleccin de una muestra aleatoria de casos, seleccin de los casos que
cumplen con una determinada condicin, seleccin de un nmero determinado de casos. La
seleccin de casos es una opcin a la que todo usuario termina encontrando gran
utilidad. Para seleccionar casos:

Seleccione en los mens:


Datos
Seleccionar casos. (Figura 2.17)

31
Anlisis Estadstico de Datos con SPSS.

Figura 2.17 Seleccionar casos.

Se observa que por defecto estn seleccionados todos los casos, es decir los anlisis
se realizarn utilizando todos los casos.

1. Si se satisface la condicin. Cuando se desee seleccionar aquellos casos que


satisfagan una determinada condicin lgica se activar esta opcin seleccionando el
botn Si... para especificar la condicin. Si el resultado de la expresin condicional es
verdadero, se selecciona el caso. Si el resultado es falso o perdido, no se selecciona el
caso (Figura 2.18)
Figura 2.18. Ventana de seleccin de casos si se satisface la condicin.

32
Anlisis Estadstico de Datos con SPSS.

2. Muestra aleatoria de casos. Selecciona una muestra aleatoria basndose en un


porcentaje aproximado o en un nmero exacto de casos (Figura 2.19).

Figura 2.19. Seleccin de casos con la opcin muestra aleatoria de casos.

Con la opcin Aproximadamente se especifica el porcentaje de casos que se quieren


seleccionar.
Con la opcin Exactamente se especifica el nmero de casos que se quieren
seleccionar.
3. Basndose en el rango del tiempo o de los casos. Selecciona los casos basndose en
un rango de los nmeros de caso o en un rango de las fechas/horas (Figura 2.20).

Los rangos de casos se basan en el nmero de filas que se muestra en la vista de datos.

Figura 2.20 Seleccin de casos basados en rango.

4. Usar variable de filtro. Utiliza como variable para el filtrado la variable numrica
seleccionada del archivo de datos. Se seleccionan los casos con cualquier valor distinto
del 0 o del valor perdido para la variable seleccionada.

Por ejemplo; Si la variable Sexo es una variable que en la vista de variable tiene
valores : 1 = Femenino , 2 = Masculino y se desea seleccionar nicamente Femenino que
toma el valor de 1 en la variable utilizada como filtro y no entraran en el anlisis los casos
que tomen valor de 2 en dicha variable ( Figura 2.21)

33
Anlisis Estadstico de Datos con SPSS.

Figura 2.21. Conjunto de datos filtrados por la variable sexo Femenino.

Observe que los casos no seleccionados se marcan con una lnea diagonal en la vista de
datos.

Especifique los criterios de seleccin de casos (Resultado)

Esta seccin controla el tratamiento de casos no seleccionados. Puede elegir una de las
siguientes alternativas para tratar los casos no seleccionados:

1. Descartar casos no seleccionados. Los casos no seleccionados no se incluyen en


el anlisis, pero se conservan en el conjunto de datos. Podr utilizar los casos no
seleccionados ms adelante en la sesin, si desactiva el filtrado. Si selecciona una
muestra aleatoria o si selecciona los casos mediante una expresin condicional, se
generar una variable con el nombre filter_$ que tendr el valor 1 para los casos
seleccionados y el valor 2 para los casos no seleccionados.

2. Copiar casos seleccionados a un nuevo conjunto de datos. Los casos


seleccionados se copiarn a un nuevo conjunto de datos, lo que mantendr
inalterado el conjunto de datos original. Los casos no seleccionados no se
incluirn en el nuevo conjunto de datos y se mantendrn en su estado original en
el conjunto de datos original.

3. Eliminar casos no seleccionados. Los casos no seleccionados se eliminarn del


conjunto de datos. Slo se pueden recuperar los casos eliminados saliendo del
archivo sin guardar ningn cambio y abrindolo de nuevo. La eliminacin de los
casos ser permanente si se guardan los cambios en el archivo de datos.

Si elimina los casos no seleccionados y guarda el archivo, no ser posible recuperar


estos casos.

34
Anlisis Estadstico de Datos con SPSS.

2.3.6 Creacin de nuevas variables.

La creacin de nuevas variables se origina a partir de funciones aritmticas, funciones


estadsticas, funciones de distribucin. Para crear una variable seleccione en el men
Transformar, y dentro de este se selecciona la opcin Calcular, aparecer una venta
(figura 2.22).
Figura 2.22. Cuadro de dilogo para Calcular variable.

Variable de destino: se especifica el nombre que se va a dar a la nueva variable.

Expresin numrica: se especifica la expresin aritmtica o lgica que se va a


evaluar. Esta expresin puede contener operadores aritmticos, operadores
lgicos o una de las funciones que aparecen en la lista que figura debajo de este
campo. Esta lista contiene funciones aritmticas, funciones estadsticas,
funciones referentes a valores missing, funciones de distribucin y funciones
temporales. Las constantes de cadenas deben ir entre comillas o apstrofes.

Si no se selecciona casos opcionales, la nueva variable se calculara para todos los casos y
se aadir al final de la vista datos. (Figura 2.23).

35
Anlisis Estadstico de Datos con SPSS.

Figura 2.23 Ventana de datos con la nueva variable Costo1.

A veces es necesario calcular la nueva variable en un subconjunto de casos


seleccionados utilizando expresiones condicionales (Figura 2.24).

Figura 2.24. Calcular variable de un subconjunto de casos.

36
Anlisis Estadstico de Datos con SPSS.

Al plantear esta condicin, la nueva variable ser creada nicamente para los casos que
satisfacen dicha condicin (Figura 2.25).

Figura 2.25 Ventana de datos con la nueva variable Costo1, para una determinada sub
muestra que verifica una condicin.

2.3.7 Conteo de casos.

Para realizar el conteo de valores dentro de los casos deber seleccionar en el men
Transformar, y dentro de este se selecciona la opcin Contar valores dentro de los
casos, aparecer una venta (figura 2.26).

Figura 2.26 Ventana de conteo de valores dentro de los casos.

37
Anlisis Estadstico de Datos con SPSS.

Se debe introducir la variable destino. Luego, seleccione definir valores y especifique los
valores que se deben contar (Figura 2.27).

Figura 2.27 Definir valores para el conteo de los casos.

Si no se selecciona casos opcionales, el conteo de valores entre los casos se aadir al


final de la vista datos. (Figura 2.28).

Figura 2.28 Conteo de valores en la vista de datos

38
Anlisis Estadstico de Datos con SPSS.

Si desea, puede definir un subconjunto de casos en los que contar las apariciones de
valores bajo ciertas condiciones.

2.3.8 Recodificacin de variables.

Los valores de datos se pueden modificar mediante la recodificacin. Esto es


particularmente til para agrupar o combinar categoras. Puede recodificar los valores
dentro de las variables existentes o crear variables nuevas que se basen en los valores
recodificados de las variables existentes.

Recodificacin en la misma variable: El cuadro de dilogo Recodificar en las


mismas variables le permite reasignar los valores de las variables existentes o agrupar
rangos de valores existentes en nuevos valores. Por ejemplo, podra agrupar los Costos
en categoras que sean rangos de Costos.

Seleccione el men Transformar, y dentro de este se selecciona la opcin Recodificar en


las mismas variables, aparecer una venta (figura 2.29)

Figura 2.29. Ventana de dilogo Recodificar en la misma variable.

Seleccione las variables que desee recodificar. Por ejemplo: Costo.

Si selecciona mltiples variables, todas debern ser del mismo tipo (numricas o de
cadena).Luego, deber seleccionar en Valores antiguos y nuevos y especifique cmo
deben recodificarse los valores. (Figura 2.30).

39
Anlisis Estadstico de Datos con SPSS.

Figura 2.30. Cuadro de dialogo de valores antiguos y nuevos.

Si lo desea, puede definir un subconjunto de los casos para su recodificacin como


sigue:

Valor antiguo. Determina el valor o los valores que se van a recodificar. Puede
recodificar valores individuales, rangos de valores y valores perdidos. Los rangos y los
valores perdidos del sistema no se pueden seleccionar para las variables de cadena, ya
que ninguno de los conceptos es aplicable a estas variables. Los rangos incluyen sus
puntos finales y los valores definidos como perdidos por el usuario que estn dentro del
rango.

Valor. Valor antiguo individual que se va recodificar en un valor nuevo. El valor debe ser
el mismo tipo de datos (numrico o de cadena) que el de las variables que se van
recodificar.

Perdido por el sistema. Valores asignados por el programa cuando los valores de sus
datos no estn definidos de acuerdo al tipo de formato que haya especificado, cuando un
campo numrico est vaco, o cuando no est definido un valor como resultado de un
comando de transformacin. Los valores numricos perdidos del sistema se muestran
como puntos. Las variables de cadena no pueden tener valores perdidos del sistema, ya
que es lcito cualquier carcter en las variables de cadena.

Perdido por el sistema o usuario. Observaciones que tienen valores que el usuario ha
declarado perdidos o que son desconocidos y se les ha asignado el valor perdido del
sistema, lo que se indica mediante un punto (.).

40
Anlisis Estadstico de Datos con SPSS.

Rango. Rango inclusivo de valores. No disponible para variables de cadena. Se incluir


cualquier valor perdido por el usuario dentro del rango.

Todos los dems valores. Cualquier valor no incluido en una de las especificaciones de la
lista Antiguo->Nuevo. Aparece en la lista Antiguo->Nuevo como ELSE.

Una vez que seleccione la manera de cmo va a recodificar a la variable selecciona


Continuar y Aceptar. Automticamente en la vista de datos aparece la nueva
recodificacin de la variable con etiqueta de valor lo cual esta se deber de definir en la vista
de variables (Figura 2.31).

Figura 2.31. Etiqueta de valor de la nueva variable recodificada.

Selecciona aceptar y en la vista de datos aparecern los nuevos valores para la variable
Costo, definida en rangos.

La recodificacin en una misma variable es un poco inusual ya que una vez creada la
nueva variable no se podr recuperar la base de datos original.

Recodificacin en distinta variable.

El cuadro de dilogo Recodificar en distintas variables le permite reasignar los valores de


las variables existentes o agrupar rangos de valores existentes en nuevos valores para una
variable nueva. Por ejemplo, podra agrupar los Costos en una nueva variable que
contenga categoras de rangos de Costos.

Seleccione el men Transformar, y dentro de este se selecciona la opcin Recodificar en


distintas variables, aparecer una venta (figura 2.32)

41
Anlisis Estadstico de Datos con SPSS.

Figura 2.32. Ventana de dilogo Recodificar en distinta variable.

Seleccione las variables que desee recodificar. Por ejemplo: Costo.

Introduzca el nombre y etiqueta de la nueva variable, seleccione cambiar. Luego,


deber seleccionar en Valores antiguos y nuevos y especifique cmo deben
recodificarse los valores. (Figura 2.30).

Una vez que seleccione la manera de cmo va a recodificar a la variable selecciona


Continuar y Aceptar. Automticamente en la vista de datos aparece la nueva
recodificacin de la variable con etiqueta de valor lo cual esta se deber de definir en la vista
de variables (Figura 2.31).

Selecciona aceptar y en la vista de datos aparecern los nuevos valores para la variable
Costo1, definida en rangos (Figura 2.32).

Figura 2.32. Vista de variable con la variable Costo1.

42
Anlisis Estadstico de Datos con SPSS.

CAPTULO 3. Anlisis Exploratorio de Datos.

3.1 Anlisis exploratorio de datos. Procedimiento Explorar.

El software IBM SPSS Statistics permite realizar anlisis exploratorio completo de


datos (Visual y formal) a travs del procedimiento Explorar, que genera estadsticos de
resumen y representaciones grficas, bien para todos los casos o de forma separada para
grupos de casos. Existen numerosas razones para utilizar este procedimiento: para
inspeccionar los datos, obtener descripciones, comprobar supuestos y caracterizar
diferencias entre sub poblaciones (grupos de casos). La inspeccin de los datos puede
mostrar que existen valores inusuales, valores extremos, discontinuidades en los datos u
otras peculiaridades. La exploracin de los datos puede ayudar a determinar si son
adecuadas las tcnicas estadsticas que est teniendo en consideracin para el anlisis de
los datos. La exploracin puede indicar que necesita transformar los datos si la tcnica
necesita una distribucin normal. O bien, el usuario puede decidir que necesita utilizar
pruebas no paramtricas.

Para explorar los datos en los mens, seleccione:

Analizar

Estadsticos descriptivos
Explorar... (Figura 3.1)

Figura 3.1 Cuadro de dilogo explorar.

Seleccione una o ms variables dependientes. Si lo desea, puede:

- Seleccionar una o ms variables de factor, cuyos valores definirn grupos de casos. -

Seleccionar una variable de identificacin para etiquetar los casos.

43
Anlisis Estadstico de Datos con SPSS.

- Pulse en Estadsticos para obtener estimadores robusto, percentiles y tablas de


frecuencias.

- Pulse en Grficos para obtener histogramas, pruebas y grficos de probabilidad normal y


diagramas de dispersin por nivel con estadsticos de Levene.

- Pulse en Opciones para manipular los valores ausentes.

Aceptar.

3.2 Diagramas de Cajas.

El diagrama de caja y bigotes permite analizar y resumir a un conjunto de datos


univariante dado. Esta herramienta de anlisis exploratorio de datos va a permitir
estudiar la simetra de los datos, detectar valores atpicos (Observaciones aisladas
cuando el comportamiento se diferencia claramente del comportamiento medio del resto de
las observaciones).

El grfico de caja y bigotes divide los datos en cuatro reas de igual frecuencia, una caja
central divide en dos reas por una lnea horizontal y otras dos reas representadas por
dos segmentos verticales (Bigotes) que parten de cada lado horizontal de la caja. La
mediana es la lnea horizontal en el interior de la caja, si esta lnea esta en el centro no
hay asimetra. El sistema considera valores atpicos los que se encuentran a la
izquierda del bigote izquierdo a la derecha del bigote derecho, mediante puntos
alineados con la lnea vertical central para que sean fciles de detectar.

Para obtener un diagrama de caja seleccione en el men: Grficos Cuadro de


dilogo antiguo Diagramas de caja y elija simple y resmenes para distintas
variables (Figura3.2).

Figura 3.2 Cuadro de dilogo Diagrama


de caja para distintas variables.

44
Anlisis Estadstico de Datos con SPSS.

Al seleccionar Definir se obtiene la figura 3.3, en la que elije la variable motor para
representar en cajas. Luego, pulse Aceptar.

Figura 3.3 Cuadro de dilogo Definir diagrama de caja


Simple, para distintas variables.

Para obtener diagramas de caja cuando existe una variable dependiente y un nivel de
categora. Seleccione en el men: Grficos Cuadro de dilogo antiguo
Diagramas de caja y elija simple y resmenes para grupos de datos (Figura 3.4).

Al seleccionar Definir se obtiene la figura 3.5, en la que elije la variable motor para
representar en cajas y como eje de categora origen. Luego, pulse Aceptar

Figura 3.4 Cuadro de dilogo Figura 3.5. Cuadro de dilogo Definir


Diagrama caja para grupos de casos. Diagrama de caja con eje de categoras.

45
Anlisis Estadstico de Datos con SPSS.

CAPTULO 4. Descripcin Estadstica de una variable.


4.1 Datos y distribucin de frecuencias

Datos: Es aquel que se obtiene mediante un proceso que comprende la observacin o


medicin. Un conjunto de datos debe cumplir las normas de denominacin de variables.

Distribucin de frecuencia: Es un agrupamiento de datos en categoras que muestra el


numero de observaciones en un estudio.

En IMB SPSS Statistics, en el men Analizar Estadsticos descriptivos


Frecuencia, permite obtener distribuciones de frecuencias, representaciones grficas de
dichas distribuciones, y los estadsticos descriptivos ms utilizados.

Figura 4.1 Cuadro de dilogo de frecuencia

Con las opciones de Estadsticos se solicitan los estadsticos descriptivos para las
variables numricas seleccionadas, entonces se obtiene la siguiente ventana :

Figura 4.2 Cuadro de dilogo opciones de Estadsticos.

46
Anlisis Estadstico de Datos con SPSS.

Los estadsticos que se desean obtener; observemos que por defecto no est
seleccionado ningn estadstico.
Si se seleccionan los Cuartiles, muestra los valores correspondientes a los percentiles 25,
50 y 75. Los Puntos de corte son los valores que dividen los casos en un nmero de grupos
del mismo tamao. Despus de seleccionar esta opcin, introduzca un entero positivo,
entre 2 y 100, para especificar el n de grupos de igual tamao que desea obtener. Por
ltimo, si se selecciona la opcin Percentil(es), hay que introducir un valor de percentil entre
0 y 100 y pulsar en el botn de Aadir
La opcin Grficos son opcional estos los analizaremos ms adelante. Si desea cambiar el
formato de la tabla selecciona Formato y aparecer una ventana (Figura 4.3)

Figura 4.3Cuadro de dilogo de frecuencia Formato.

Observemos que por defecto, el programa ordena de forma ascendente los resultados
segn los valores que toma la variable a analizar. Si se quiere ordenar de forma
descendente, se selecciona la opcin Valores descendentes. Si se desea ordenar la tabla
de frecuencias resultante segn los valores de las frecuencias, en vez de por los valores
de las variables, se seleccionan la opcin Frecuencias ascendentes o Frecuencias
descendentes.
Interpretacin de resultados a partir de la tabla de distribucin de frecuencia.
1. Supngase que se desea analizar la distribucin de frecuencia de la variable Sexo,
entonces se obtiene al seleccionar la barra de men (Figura 4.1), donde obtendremos
la tabla de frecuencias en la ventana de resultados.

En la tabla de frecuencia se tiene como resultado:

47
Anlisis Estadstico de Datos con SPSS.

Frecuencia absoluta
Frecuencia relativa porcentual.
Porcentaje de valores vlidos, coincide con el porcentaje anterior porque esta
variable no tiene valores missing.
Porcentaje acumulado.

4.2 Diagrama tallo y hojas


El diagrama de tallo y hoja es un procedimiento semigrfico para presentar la
informacin para variables cuantitativas, que es especialmente til cuando el nmero total
de datos es pequeo (menor que 50).
El diagrama de tallo y hojas, tambin llamado histograma digital, es una combinacin
entre un histograma de barra y una tabla de frecuencias. Al mantener los valores de la
variable, el diagrama tallo y hoja resulta ms informativo que el clsico histograma de
barras, ya que conserva los datos originales y al mismo tiempo, compone un perfil que
ayuda a estudiar la forma y simetra de la distribucin. Adems, muestra el rango de los
datos.
Para obtener el diagrama tallo y hojas seleccione el men: Analizar Estadsticos
descriptivos Explorar Grfico y seleccione en Descriptivos en tallos y
hojas Continuar visualizacin seleccione Aceptar (grfica 4.4).

Grfico 4.4 Diagrama tallo y hojas de la


Variable Costo en Base ejemplo 1 .

Costo Stem-and-Leaf Plot

Frequency Stem & Leaf

6.00 0. 000234
10.00 0 . 5555567777
4.00 1 . 1223
3.00 1 . 579
1.00 2. 2
1.00 Extremes (>=550)

Stem width: 100.0


Each leaf: 1 case(s)

4.3 Representaciones grficas

Para realizar algn tipo de grfica, seleccione el men Grficos Generador de


Grficos, se abre automticamente una ventana (Figura 4.5)

48
Anlisis Estadstico de Datos con SPSS.

Figura 4.5 Cuadro de dilogo Generador de grficos.

En la lista Elija entre, seleccione una categora de grficos. Cada categora ofrece
varios tipos. Luego, Arrastre la imagen del grfico deseado al lienzo. Tambin puede
pulsar dos veces en la imagen. Si en el lienzo ya aparece un grfico, el grfico de la
galera sustituir al conjunto de ejes y a los elementos grficos del grfico.

Arrastre variables desde la lista Variables y colquelas en las zonas de colocacin del
eje Y, si est disponible, en la zona de colocacin de agrupamiento. Si una zona de
colocacin del eje ya muestra un estadstico que desea utilizar, no tendr que
arrastrar ninguna variable a la zona de colocacin. Slo deber aadir una variable a
la zona cuando el texto de la zona sea azul. Si el texto es negro, la zona ya contiene
una variable o un estadstico.

49
Anlisis Estadstico de Datos con SPSS.

Figura 4.6 Cuadro de dilogo Generador de grfico.

Si necesita cambiar los estadsticos o modificar los atributos de los ejes o las leyendas
(como la amplitud de la escala), pulse en Propiedades del elemento.

Figura 4.7 Cuadro de dilogo Propiedades del elemento.

50
Anlisis Estadstico de Datos con SPSS.

En la lista Editar propiedades de, seleccione el elemento que desea cambiar. (Si
desea obtener informacin acerca de propiedades especficas, pulse en Ayuda.)

Una vez realizados los cambios, pulse en Aplicar.

Si necesita agregar ms variables al grfico (por ejemplo, para la agrupacin o la


adicin de paneles), pulse en la pestaa Grupos/ID de puntos del cuadro de dilogo
Generador de grficos y seleccione una o ms opciones. A continuacin, arrastre las
variables categricas a las nuevas zonas de colocacin que aparecen en el lienzo.

Si desea transponer el grfico (por ejemplo, para que las barras sean horizontales),
pulse en la pestaa Elementos bsicos y, a continuacin, pulse en Transponer.

Pulse en Aceptar para crear el grfico. Aparecer el grfico en el Visor ( Figura 4.8)

Figura 4.8 Grfico sectorial (Pastel) en la ventana visor.

Pude Editar el grficos para que pueda personalizar sus grficos y explorar los datos
de la siguiente manera:

- Puede crear un grfico en IBM SPSS Statistics o abrir un archivo con grficos
del Visor.

- Pulse dos veces en un grfico del Visor.


- Pulse dos veces en elemento grfico o Seleccionar un elemento grfico y elija a
continuacin en los mens: Edicin Propiedades. Adems, el cuadro de
dilogo Propiedades aparece automticamente al aadir un elemento al grfico.

El cuadro de dilogo Propiedades incluye una serie de pestaas que le permiten definir
las opciones y realizar otros cambios en el grfico. Las pestaas que puede ver en el
cuadro de dilogo Propiedades se basan en la seleccin actual. Dilogo de Propiedad
para la grfica. Para cualquier cambio que realice en la grafica seleccione Aplicar.
51
Anlisis Estadstico de Datos con SPSS.

4.4 Caractersticas de una distribucin

La curtosis y la asimetra son los estadsticos que caracterizan la forma y simetra de la


distribucin. Estos estadsticos se muestran con sus errores tpicos.

- Curtosis. Medida del grado en que las observaciones estn agrupadas en torno al punto
central. Para una distribucin normal, el valor del estadstico de curtosis es 0. Una
curtosis positiva indica que las observaciones se concentran ms y presentan colas ms
largas que las de una distribucin normal. Una curtosis negativa indica que las
observaciones se agrupan menos y presentan colas ms cortas.

- Asimetra. Medida de la asimetra de una distribucin La distribucin normal es


simtrica y tiene un valor de asimetra igual a 0. Una distribucin que tenga una
asimetra positiva significativa tiene una cola derecha larga. Una distribucin que
tenga
una asimetra negativa significativa tiene una cola izquierda larga. Como regla
aproximada, un valor de la asimetra mayor que el doble de su error tpico se asume que
indica una desviacin de la simetra.

- Orden de presentacin. Por defecto, las variables se muestran en el orden en que se


hayan seleccionado. Si lo desea, se pueden mostrar las variables alfabticamente, por
medias ascendentes o por medias descendentes.

Para encontrar las caractersticas de la distribucin, seleccione:

Analizar
Estadsticos descriptivos
Frecuencia
Estadsticos (Seleccionar Distribucin)
Continuar
Aceptar (Figura 4.9)

Tabla 2. Caractersticas de la distribucin de la variable Costo Base


de datos Ejemplo1.

En la tabla de estadsticos caractersticas de la distribucin de la variable Costo, se


tienen los siguientes resultados:

N, valores validos, se refiere al total de casos en la ventana de datos.


No hay valores Missing.

52
Anlisis Estadstico de Datos con SPSS.

Asimetra
Error estndar de asimetra.
Curtosis
Error estndar de curtosis.

4.5 Medidas de Tendencia Central.

En el estudio de estadsticos univariados se disponen de las medidas de tendencia


central tales como;

Media aritmtica.
Mediana.
Moda.

Nota: Estas medidas se pueden calcular nicamente para variables cuantitativas y


cuando los casos (datos) no se encuentran agrupados por intervalos.

- Supongamos que deseamos calcular y analizar las medidas de tendencia central de la


variable Costo, se selecciona el men Analizar Estadsticos descriptivos
Frecuencia, se ubica la variable Costo y se selecciona Estadsticos y con el
mouse seleccione las medidas de tendencia central. Luego, seleccione Continuar y
Aceptar. En la ventana de resultado aparecer una tabla con los estadsticos solicitada
(Tabla 2. Estadsticos de tendencia central)

Tabla2. Estadsticos de tendencia central de la variable Costo.

En la tabla de estadsticos de tendencia central se tienen los siguientes resultados:

N, valores validos, se refiere al total de casos en la ventana de datos.


No hay valores Missing.
Media
Mediana
Moda

4.6 Medidas de dispersin y su uso.

En el estudio de estadsticos univariados se disponen de las medidas de variabilidad o


dispersin tales como;

Valor mximo.
Valor mnimo.
53
Anlisis Estadstico de Datos con SPSS.

Rango.
Varianza.
Desviacin Estndar.
Error estndar de la media.

Nota: Estas medidas se pueden calcular nicamente para variables cuantitativas y


cuando los casos (datos) no se encuentran agrupados por intervalos.

- Supongamos que deseamos calcular y analizar las medidas de dispersin de la variable


Costo, se selecciona el men Analizar Estadsticos descriptivos
Frecuencia, se ubica la variable Costo y se selecciona Estadsticos y con el
mouse seleccione las medidas de dispersin. Luego, seleccione Continuar y
Aceptar. En la ventana de resultado aparecer una tabla con los estadsticos solicitada
(Tabla 3. Estadsticos de dispersin)

Tabla 3. Estadsticos de dispersin para la variable Costo.

En la tabla de estadsticos de dispersin se tienen los siguientes resultados:

N, valores validos, se refiere al total de casos en la ventana de datos.


No hay valores Missing.
Error estndar de la media.
Desviacin estndar.
Varianza.
Rango.
Valor mnimo.
Valor mximo.

54
Anlisis Estadstico de Datos con SPSS.

CAPTULO 5. Descripcin conjunta de dos variables categricas.

5.1 Tablas de contingencia

El procedimiento Tablas de contingencia crea tablas de clasificacin doble y mltiple y,


adems, proporciona una serie de pruebas y medidas de asociacin para las tablas de
doble clasificacin. La estructura de la tabla y el hecho de que las categoras estn
ordenadas o no determinan las pruebas o medidas que se utilizaban. Los estadsticos de
tablas de contingencia y las medidas de asociacin slo se calculan para las tablas de
doble clasificacin. Si especifica una fila, una columna, el procedimiento tablas de
contingencia crea un panel de medidas y estadsticos asociados para cada valor del
factor o una combinacin de valores para dos o ms variables de control.

Para la creacin de la tabla de contingencia seleccione el men:

Analizar
Estadsticos descriptivos
Tablas de contingencia... (Grfico 5.1)

Grfico 5.1 Cuadro de dilogo de Tablas de contingencia

- Seleccione una o ms variables de fila y una o ms variables de columna.


- Seleccionar una o ms variables de control.

55
Anlisis Estadstico de Datos con SPSS.

- Pulsar en Casillas para obtener porcentajes, residuos y valores esperados y


observados ( Figura 5.2)
-
Figura 5.2 Cuadro de dilogo Mostrar en las casillas

Recuentos. El nmero de casos realmente observados y el nmero de casos esperados si las


variables de fila y columna son independientes entre s.

Porcentajes. Los porcentajes se pueden sumar a travs de las filas o a lo largo de las
columnas. Tambin se encuentran disponibles los porcentajes del nmero total de casos
representados en la tabla (una capa).

Residuos. Los residuos brutos no tipificados presentan la diferencia entre los valores
observados y los esperados. Tambin se encuentran disponibles los residuos tipificados y
tipificados corregidos.

No tipificados. Diferencia entre el valor observado y el valor esperado. El valor


pronosticado es el nmero de casos que se esperara encontrar en la casilla si no hubiera
relacin entre las dos variables. Un residuo positivo indica que hay ms casos en la
casilla de los que habra en ella si las variables de fila y columna fueran independientes.

Tipificados. El residuo dividido por una estimacin de su error tpico. Los residuos
tipificados, que son conocidos tambin como los residuos de Pearson o residuos
estandarizados, tienen una media de 0 y una desviacin tpica de 1.

Tipificados corregidos. El residuo de una casilla (el valor observado menos el valor

56
Anlisis Estadstico de Datos con SPSS.

Pronosticado) dividido por una estimacin de su error tpico. El residuo tipificado


resultante viene expresado en unidades de desviacin tpica, por encima o por debajo de la
media.

- Pulsar en Formato para controlar el orden de las categoras.

5.2 Test Chi - Cuadrado.


2
El Test Chi_ Cuadrado ( ) es una prueba estadstica no paramtrica para diferencias
entre dos o ms muestras donde frecuencias esperadas son comparadas en relacin con
frecuencias obtenidas.

Prueba No Paramtrica: procedimiento estadstico que no adopta ningn supuesto


acerca de cmo se distribuye la caracterstica bajo estudio en la poblacin, y que slo
requiere datos nominales u ordinales.

Estas medidas son importantes porque la mayora de la informacin en la investigacin


social y administrativa es de carcter nominal u ordinal, y porque no siempre estamos
seguros que la caracterstica que deseamos estudiar se distribuye normalmente en la
poblacin.

2
Se utiliza para hacer comparaciones entre frecuencias y no entre valores medios.
2
La de Pearson se emplea para comprobar la independencia de variables aleatorias.

Para hacer uso del Test Chi_ Cuadrado, seleccione el men:

Analizar

Estadsticos descriptivos

Tablas de contingencia... (Grfico 5.3)

Grfico 5.3. Cuadro de dilogo Tabla de contingencia para el anlisis de la


chi- cuadrada.

57
Anlisis Estadstico de Datos con SPSS.

- Seleccione una o ms variables de fila y una o ms variables de columna.


- Seleccionar una o ms variables de control.
- Pulsar en Estadsticos y seleccione Chi _cuadrado ( Figura 5.4)

Figura 5.4 Cuadro de dilogo de Estadstico.

- Continuar.
- Aceptar.

58
Anlisis Estadstico de Datos con SPSS.

Por ejemplo; Se desea saber si El salario y Nivel acadmico son independiente, se


efecta el anlisis de la chi_ cuadrado se obtiene la siguiente tabla 4.

Tabla 4. Estadstico Chi_ Cuadrado.

En la tabla de estadsticos Chi _Cuadrado se tienen los siguientes resultados:

Chi_ Cuadrado de Pearson.


Razn de verosimilitud.
Asociacin lineal por lineal.
N de casos vlidos.
2
El valor (muestral) del estadstico es 2651.149a; los grados de libertad (gl)
son 1980, que es el resultado de la siguiente multiplicacin: (nmero de filas-
1)(nmero de columnas-1); y el p-valor o nivel crtico (Sig. asint. bilateral) es
0.000 (menor que el habitual nivel de significacin, = 0.05), por lo que
deberamos rechazar la hiptesis nula de independencia de las variables El
salario y Nivel acadmico.

5.3 Comparacin de Medias.

El procedimiento Medias, calcula medias de subgrupo y estadsticos univariados


relacionados para variables dependientes dentro de las categoras de una o ms variables
independientes.

Para obtener medias de subgrupo

En los mens, seleccione:

- Analizar

Comparar medias

Medias... (Figura 5.5)

59
Anlisis Estadstico de Datos con SPSS.

Figura 5.5 Cuadro de dilogo Medias.

- Seleccione una o ms variables dependientes.


- Utilice uno de los siguientes mtodos para seleccionar variables independientes
categricas:

Seleccione una o ms variables independientes. Se mostrarn resultados


individuales para cada variable independiente.

Seleccione una o ms capas de variables independientes. Cada capa subdivide


consecutivamente la muestra. Si tiene una variable independiente en Capa 1 y
otra variable independiente en Capa 2, los resultados se mostrarn en una tabla
cruzada en contraposicin atablas individuales para cada variable independiente.

Si lo desea, pulse en Opciones si desea obtener estadsticos opcionales, una tabla


de anlisis de varianza, eta, eta cuadrado, R, y R2.

Tabla de Anova y eta. Muestra una tabla de anlisis de varianza de un factor y calcula la
eta y la eta cuadrado (medidas de asociacin) para cada variable independiente de la primera
capa.

Contrastes de linealidad. Calcula la suma de cuadrados, los grados de libertad y la


media cuadrtica asociados a los componentes lineal y no lineal, as como la razn F, la R y
la R cuadrado. Si la variable independiente es una cadena corta entonces la
linealidad no se calcula.

60

S-ar putea să vă placă și