Sunteți pe pagina 1din 15

INTRODUCCION

SPSS (Statistical Package for Social Sciences) es uno de los paquetes


estadsticos ms comnmente empleado. Permite realizar informes y grficos
estadsticos sin tener que conocer la mecnica del clculo. Gracias a la
avanzada interface grfica de usuario podemos indicar mediante un sistema
de ventanas los anlisis, grficos y transformaciones de variables que
deseamos realizar.
Existen dos formas de trabajar con el SPSS: seleccionando las tareas a realizar
mediante el sistema de ventanas, o indicando las operaciones a efectuar
mediante la sintaxis del programa (lenguaje de comandos).
En ocasiones algunas de las posibilidades del SPSS solo estn accesibles a
travs de la sintaxis. La ventaja que presenta trabajar con este lenguaje de
comandos es que los archivos de sintaxis pueden guardarse y volver a ser
ejecutados en sesiones diferentes.
Para iniciar el sistema seleccionamos:
Inicio / Todos los programas / SPSS para Windows / SPSS (VERSION) para
Windows

2.1 Historia de SPSS


Fue creado en 1968 por N orman H. Nie, C. Hadlai (Tex) Hull y Dale H. Bent.
Entre 1969 y 1975 la Universidad de Chicago por medio de su National Opinion
Research Center estuvo a cargo del desarrollo, distribucin y venta del
programa. A partir de 1975 corresponde a SPSS Inc.
Originalmente el programa fue creado para grandes computadores. En 1970 se
publica el primer manual de usuario del SPSS por Nie y Hall. Este manual
populariza el programa entre las instituciones de educacin superior en EE.
UU. En 1984 sale la primera versin para computadores personales.
Desde la versin 14, pero ms especficamente desde la versin 15 se ha
implantado la posibilidad de hacer uso de las libreras de objetos del SPSS
desde diversos lenguajes de programacin. Aunque principalmente se ha
implementado para Python, tambin existe la posibilidad de trabajar desde
Visual Basic, C++ y otros lenguajes.
Con la era del PC y Windows evolucion muy rpidamente y hoy, en su
versin, constituye un programa que ofrece un conjunto de herramientas de
anlisis grfico y cuantitativo, estructurado en partes independientes e
integrables que reciben el nombre de mdulos. As, partiendo desde un mdulo
base que contiene, como su propio nombre indica, el conjunto bsico de
utilidades, es posible aadir diferentes partes para realizar una amplia gama de
anlisis.
Su xito en el mercado espaol como herramienta de anlisis fue rpido debido
a su versatilidad, facilidad de uso, buen precio, y los algoritmos robustos y
continuamente mejorados que lo integran. Como muestra de ello la prctica
totalidad de las Universidades espaolas son usuarios de este producto.
Pero SPSS Inc, la compaa, no es slo el SPSS y sus mdulos
dependientes.
En efecto, SPSS Inc , que toma su nombre del anagrama del producto que la
origin, comercializa una amplia gama de programas y aplicaciones, que dan
cobertura a las distintas etapas del anlisis de datos en funcin de la
perspectiva del usuario: tanto para analistas expertos que realizan sus

investigaciones en continua interaccin y supervisin de la metodologa


empleada, como para usuarios de negocio, quienes suelen primar la estructura
de caja negra: problema-aplicacin-solucin, sin necesidad de interactuar con
el mtodo de resolucin.
2.2 Definicin de SPSS
Statistical

Package

for

the

Social

Sciences

(SPSS) es

un programa

estadstico informtico muy usado en las ciencias sociales y las empresas de


investigacin de mercado. En la actualidad, la sigla se usa tanto para designar
el programa estadstico como la empresa que lo produce. Originalmente SPSS
fue creado como el acrnimo de Statistical Package for the Social
Sciences aunque tambin se ha referido como "Statistical Product and Service
Solutions" (Pardo, A., & Ruiz, M.A., 2002, p. 3).
Como programa estadstico es muy popular su uso debido a la capacidad de
trabajar con bases de datos de gran tamao. En la versin 12 es de 2 millones
de registros y 250.000 variables. Adems, de permitir la recodificacin de las
variables y registros segn las necesidades del usuario. El programa consiste
en un mdulo base y mdulos anexos que se han ido actualizando
constantemente con nuevos procedimientos estadsticos. Cada uno de estos
mdulos se compra por separado.
Actualmente, compite no slo con softwares licenciados como lo son
SAS, MATLAB, Statistica, Stata, sino tambin con software de cdigo abierto y
libre, de los cuales el ms destacado es el Lenguaje R. Recientemente ha sido
desarrollado

un

paquete

libre

llamado PSPP,

con

una

interfaz

llamada PSPPire que ha sido compilada para diversos sistemas operativos


como Linux, adems de versiones para Windows y OS X. Este ltimo paquete
pretende ser un clon de cdigo abierto que emule todas las posibilidades del
SPSS.
Actualmente, compite no slo con softwares licenciados como lo son
SAS, MATLAB, Statistica, Stata, sino tambin con software de cdigo abierto y
libre, de los cuales el ms destacado es el Lenguaje R. Recientemente ha sido
desarrollado

un

paquete

libre

llamado PSPP,

con

una

interfaz

llamada PSPPire que ha sido compilada para diversos sistemas operativos

como Linux, adems de versiones para Windows y OS X. Este ltimo paquete


pretende ser un clon de cdigo abierto que emule todas las posibilidades del
SPSS.
2.3 Versiones de SPSS
SPSS Inc. desarrolla un mdulo bsico del paquete estadstico SPSS, del que
han aparecido las siguientes versiones:
SPSS-X (para grandes servidores tipo UNIX)
SPSS/PC (1984, en DOS. Primera versin para computador porttil)
SPSS/PC+ (1986 (en DOS)
SPSS for Windows 6 (1992) / 6.1 para Macintosh
SPSS for Windows 7
SPSS for Windows 8
SPSS for Windows 9
SPSS for Windows 10 / for Macintosh 10 (2000)
SPSS for Windows 11 (2001) / for Mac OS X 11(2002)
SPSS for Windows 11.5 (2002)
SPSS for Windows 12 (2003)
SPSS for Windows 13 (2004): Permite por primera vez trabajar con mltiples
bases de datos al mismo tiempo.
SPSS for Windows 14 (2005)
SPSS for Macintosh 13 (2006)
SPSS for Windows 15 (2006)
SPSS for Windows 16 (Octubre de 2007): En la lista de usuarios de SPSS
"SPSSX (r) Discussion [SPSSX-L@LISTSERV. UGA. EDU]" varios funcionarios
de la empresa anunciaron previamente la salida de la versin 16 de este
software. En ella se incorpor una interfaz basada en Java que permite realizar
algunas mejoras en las facilidades de uso del sistema.

SPSS for Macintosh 16


SPSS for Linux 16
SPSS for Windows 17 (2008): Incorpora aportes importantes como el ser
multilenguaje, pudiendo cambiar de idioma en las opciones siempre que
queramos. Tambin incluye modificaciones en el editor de sintaxis de forma tal
que resalta las palabras claves y comandos, haciendo sugerencias mientras se
escribe. En este sentido se aproxima a los sistemas IDE que se utilizan en
programacin.
SPSS for Windows 18 (2009): Cambia su denominacin de SPSS por PASW
18.
IBM SPSS Statistics 19.0 (2010)
IBM SPSS Statistics 20.0 (2011)

2.4 SPSS orientado a los anlisistas


-SPSS Base y los mdulos dependientes. (El producto original)
-SPSS AnswerTree
-SPSS Sample Power
-SPSS Clementine
-Amos
-SPSS Decision Time
-SPSS What If?
-SPSS Data Entry (Familia de Productos)
-SPSS SmartViewer Web Server
-SPSS Dimensions
2.5 SPSS orientado a los usuarios de los negocios
- SPSS PredictiveMarketing

- SPSS Reporting Solutions


- SPSS Predictive Text Analytics
- SPSS Predictive Web Analytics
2.6 Modulos de SPSS
El sistema de mdulos de SPSS, como los de otros programas (similar al de
algunos lenguajes de programacin) provee toda una serie de capacidades
adicionales a las existentes en el sistema base. Algunos de los mdulos
disponibles son:
Modelos de Regresin: proporciona tcnicas para analizar los datos que no se
ajusten a los tradicionales modelos estadsticos. Incluye procedimientos para el
anlisis probit, la regresin logstica, la estimacin ponderada, la regresin de
mnimos cuadrados en dos fases y la regresin no lineal general.

Modelos Avanzados: se centra en las tcnicas utilizadas con ms frecuencia en


la investigacin experimental y biomdica sofisticada. Incluye procedimientos
para los modelos
lineales generales (MLG), los modelos lineales mixtos, el anlisis de
componentes de la varianza,
el anlisis loglineal, la regresin ordinal, las tablas de mortalidad actuariales, el
anlisis de supervivencia de Kaplan-Meier y las regresiones de Cox bsica y
extendida.
SPSS Tablas crea una amplia variedad de informes tabulares de gran
calidad, como por ejemplo tablas sofisticadas y presenta datos de respuestas
mltiples.
SPSS Tendencias realiza anlisis de prediccin y de series temporales muy
completos, con diversos modelos de ajuste de curvas, modelos de suavizado y
mtodos para la estimacin de funciones autorregresivas.
SPSS Categoras ejecuta procedimientos de escalamiento ptimo, incluidos
los anlisis de correspondencias.

SPSS Anlisis conjunto ofrece una manera realista de medir el modo en que
los diferentes atributos del producto afectan a las preferencias de los
consumidores y los ciudadanos. Con SPSS
Anlisis conjunto se puede medir con facilidad el efecto sobre el equilibrio de
cada uno de los
atributos de un producto dentro del contexto del conjunto de atributos del
producto, tal como hacen los consumidores cuando deciden lo que van a
comprar.
SPSS Pruebas exactas calcula los valores p exactos (valores de
significacin) para las pruebas estadsticas en aquellos casos en los que las
muestras son pequeas o se distribuyen de forma
poco uniforme y puedan hacer que las pruebas habituales resulten poco
precisas.
SPSS Anlisis de valores perdidos describe los patrones de los datos
perdidos, realiza una estimacin de las medias y otros estadsticos y permite
imputar los valores a las observaciones
perdidas.
SPSS Mapas transforma los datos distribuidos geogrficamente en mapas de
alta calidad, con smbolos, colores, grficos de barras, grficos de sectores y
combinaciones de temas, para
representar no slo lo que est ocurriendo sino tambin dnde tiene lugar.
SPSS Muestras complejas permite a los analistas de encuestas, mercado,
salud y opinin pblica, as como a los socilogos que utilizan una metodologa
de encuesta de ejemplo, incorporar los diseos de muestras complejas al
anlisis de datos.
SPSS Classification Tree crea un modelo de clasificacin basado en rboles,
y clasifica casos en grupos o pronostica valores de una variable (criterio)
dependiente basada en valores de variables independientes (predictores). El
procedimiento proporciona herramientas de validacin para anlisis de
clasificacin exploratorios y confirmatorios.

SPSS Data Preparation ofrece una rpida instantnea visual de los datos.
Ofrece la posibilidad
de aplicar reglas de validacin que identifiquen valores de los datos no vlidos.
Puede crear reglas que marquen los valores fuera de rango, valores perdidos o
valores en blanco. Tambin puede guardar variables que registren cada una de
las violaciones de las reglas y el nmero total de violaciones de reglas por cada
caso. Tambin se incluye un conjunto limitado de reglas predefinidas que
puede copiar o modificar.
Amos (del ingls analysis of moment structures, anlisis de estructuras de
momento) utiliza el modelado de ecuaciones estructurales para confirmar y
explicar los modelos conceptuales que tratan las actitudes, percepciones y
otros factores que determinan el comportamiento.
La familia de productos de SPSS tambin incluye aplicaciones para la
introduccin de datos, anlisis de textos, clasificacin, redes neuronales y
servicios predictivos para empresas.
Reduccin de datos: Permite crear variables sintticas a partir de variables
colineales por medio del Anlisis Factorial.
Clasificacin: Permite realizar agrupaciones de observaciones o de variables
(cluster analysis) mediante tres algoritmos distintos.
Pruebas no paramtricas: Permite realizar distintas pruebas estadsticas
especializadas en distribuciones no normales.
Tablas: Permite al usuario dar un formato especial a las salidas de los datos
para su uso posterior. Existe una cierta tendencia dentro de los usuarios y de
los desarrolladores del software por dejar de lado el sistema original de
TABLES para hacer uso ms extensivo de las llamadas CUSTOM TABLES.
Tendencias
Categoras: Permite realizar anlisis multivariados de variables normalmente
categoras. Tambin se pueden usar variables mtricas siempre que se realice
el proceso de recodificacin adecuado de las mismas.

Anlisis Conjunto: Permite realizar el anlisis de datos recogidos para este tipo
especfico de pruebas estadsticas.
Mapas: Permite la representacin geogrfica de la informacin contenida en un
fichero (descontinuado para SPSS 16).
Pruebas Exactas: permite realizar pruebas estadsticas en muestras pequeas.
Anlisis de Valores Perdidos: Regresin simple basada en imputaciones sobre
los valores ausentes.
Muestras Complejas: permite trabajar para la creacin de muestras
estratificadas, por conglomerados u otros tipos de muestras.
SamplePower (clculo de tamaos muestrales)
rboles de Clasificacin: Permite formular rboles de clasificacin y/o decisin
con lo cual se puede identificar la conformacin de grupos y predecir la
conducta de sus miembros.
Validacin de Datos: Permite al usuario realizar revisiones lgicas de la
informacin contenida en un fichero ".sav" y obtener reportes de los valores
considerados atpicos. Es similar al uso de sintaxis o scripts para realizar
revisiones de los ficheros. De la misma forma que estos mecanismos es
posterior a la digitalizacin de los datos.
SPSS Programmability Extension (SPSS 14 en adelante). Permite utilizar el
lenguaje de programacin Python para un mejor control de diversos procesos
dentro del programa que hasta ahora eran realizados principalmente mediante
scripts (con el lenguaje SAX Basic). Existe tambin la posibilidad de usar las
tecnologas .NET de Microsoft para hacer uso de las libreras del SPSS.
Aunque algunos usuarios han cuestionado sobre la necesidad de incluir otros
lenguajes, la empresa no tiene esto entre sus objetivos inmediatos.
Desde el SPSS/PC hay una versin adjunta denomina SPSS Student que es
un programa completo de la versin correspondiente pero limitada en su
capacidad en cuanto al nmero de registros y variables que puede procesar.
Esta versin es para fines de enseanza del manejo del programa

2.7 Ficheros de datos de SPSS


Los ficheros de datos en formato SPSS tienen en Windows la extensin. SAV.
Al abrir un fichero de datos con el SPSS, vemos la vista de datos, una tabla en
la que las filas indican los casos y las columnas las variables. Cada celda
corresponde al valor que una determinada variable adopta en un cierto caso.
Adems de esta vista de datos, en las ltimas versiones del programa existe
una vista de variables en la que se describen las caractersticas de cada una.
En esta vista las filas corresponden a cada variable y las columnas nos
permiten acceder a sus caractersticas:

Nombre, limitado a 8 caracteres.

Tipo de variable (comprese este listado de opciones con los tipos


de variables estadsticas existentes)

Numrico, nmero en formato estndar)

Coma decimal, nmero con comas cada tres posiciones y con un


punto como delimitador de los decimales

Punto decimal, nmero con puntos cada tres posiciones y con


una coma como lmite delimitador de los decimales.

Notacin cientfica, nmero que se expresa con un formato tal


que se sigue de una E y un nmero que expresa la potencia de
10 a la que se multiplica la parte numrica previa

Fecha

Moneda dlar, formato numrico con el que se expresan


cantidades en dlares

Moneda del usuario, formato numrico con el que se expresan


cantidades en la moneda definida en la pestaa de monedas del
cuadro de dilogo "Opciones"

Cadena de caracteres o variable alfanumrica

Tamao total

Tamao de la parte decimal

Etiqueta de la variable

Etiquetas para los valores

Valores perdidos

Espacio que ocupa en la vista de datos

Alineacin de la variable en la vista de datos

Escala de medicin.

Algunos usuarios pasan por alto las caractersticas de las variables cuando se
trabaja en la base de datos. Sin embargo, cuando se utilizan scripts o Python
las caractersticas de las variables pueden tomar gran relevancia en la
construccin de procedimientos ad-hoc.

2.8 Fichero de sintaxis de SPSS


Se pueden generar estos archivos de sintaxis con la ayuda del programa
mismo, pues en casi todas las ventanas donde se realizan tareas en el SPSS
existe un botn "Pegar". Este botn cierra la ventana en cuestin y guarda la
sintaxis de las acciones seleccionadas en dicha ventana. Una vez salvado este
archivo es susceptible de modificacin.
La sintaxis tal cual se presenta a continuacin fue producida directamente con
el SPSS. Este programa le da un formato legible a la sintaxis, formato que el
software en algunos casos no requiere para su correcto uso.
Otra peculiaridad de las sintaxis del SPSS es que no son "case sensitive". Ante
lo cual es comn ver sintaxis escritas solo en maysculas, solo en minsculas
o bien una combinacin propia de cada usuario. Esta situacin se modifica para
aquellas personas que hacen uso de Python dentro de sus sintaxis, pues ste
es un lenguaje sensitivo a las variaciones entre maysculas y minsculas. Esto
obliga a estos usuarios a escribir sintaxis con mayor cuidado.

El siguiente ejemplo ilustra como abrir un fichero de datos mediante sintaxis y


como llevar a cabo una frecuencia y una tabla de contingencia con datos de
uno de los archivos de ejemplo que instala el programa.
*Este es un comentario, debe ir precedido por un asterisco y finalizado por un
punto.
*Abre el archivo Tomato.sav.
GET
FILE='C:\Program Files\SPSS\Tomato.sav'.
*Genera una tabla con las frecuencias de la variable fertilizante.
FREQUENCIES
VARIABLES=fert
/ORDER= ANALYSIS.
*Genera una tabla de contingencia con las variables altura inicial y fertilizante.
CROSSTABS
/TABLES=initial BY fert
/FORMAT= AVALUE TABLES
/CELLS= COUNT
/COUNT ROUND CELL.

2.9 Manejo de SPSS


SPSS tiene un sistema de ficheros en el cual el principal son los archivos de
datos (extensin. SAV). Aparte de este tipo existen otros dos tipos de uso
frecuente:

Archivos de salida (output, extensin. SPO): en estos se despliega toda


la informacin de manipulacin de los datos que realizan los usuarios

mediante las ventanas de comandos. Son susceptibles de ser


exportados con varios formatos (originalmente HTML, RTF o TXT,
actualmente la versin 15 incorpora la exportacin a PDF junto a los
formatos XLS y DOC que ya se encontraban en la versin 12)

Archivos de sintaxis (extensin. SPS): Casi todas las ventanas de SPSS


cuentan con un botn que permite hacer el pegado del proceso que el
usuario desea realizar. Lo anterior genera un archivo de sintaxis donde
se van guardando todas las instrucciones que llevan a cabo los
comandos del SPSS. Este archivo es susceptible de ser modificado por
el usuario. Muchos de los primeros usuarios del SPSS suelen escribir
estos archivos en vez de utilizar el sistema de pegado del programa.

Existe un tercer tipo de fichero: el fichero de scripts (extensin. SBS). Este


fichero es utilizado por los usuarios ms avanzados del software para generar
rutinas que permiten automatizar procesos muy largos y/o complejos. Muchos
de estos procesos suelen no ser parte de las salidas estndar de los comandos
del SPSS, aunque parten de estas salidas. Buena parte de la funcionalidad de
los archivos de scripts ha sido ahora asumida por la insercin del lenguaje de
programacin Python en las rutinas de sintax del SPSS. Procedimientos que
antes solo se podan realizar mediante scripts ahora se pueden hacer desde el
sintax mismo.
El programa cuando se instala trae un determinado nmero de ejemplos o
utilidades de casi todos los ficheros en cuestin. Estos son usados para ilustrar
algunos de los ejemplos de uso del programa.
Aqu est una pequea lista de cosas que se pueden hacer mediante este
programa:
1.Introduccion de datos:
Vamos a vista de datos y se introducen en DISTINTAS columnas (porque son
distintas variables) de arriba abajo
2.Cculos bsicos:
-para hacer operaciones: ANALIZAR>>estadsticos descriptivos>>frecuencias
(para tablas de frecuencias) ah llevas la variable que te interese al otro lado y

le das a estadsticos donde marcaremos todo lo que queramos saber (media,


moda, mediana, cuartiles). Nos parecer una pantalla nueva con los
resultados. Si necesitamos saber P2,5 o P97,5 habra que hacerlo aqu.
-ANALIZAR>>estadsticos descriptivos>>explorar: ah introducimos la variable
en el primer campo (lista de dependientes) y le damos a aceptar. Aqu nos da
toda la informacin de antes pero ADEMS nos da el intervalo de confianza y
estimacin muestral as como el error tpico de la media ENCIMA nos da las
grficas del diagrama tronco hojas y el de cajas.
-Para la ASIMETRIA y la KURTOSIS: En simetra: si es negativo est sesgada
a la IZQUIERDA si es 0 es simtrica y si es positivo est sesgada a la
DERECHA.En curtosis: si est rondando el 0 es mesocurtica, si es negativo
platicrtica y si es positiva leptocrtica
-ANALIZAR>>estadsticos descriptivos>>frecuencias>>grficos esto es til
para ver la FORMA DE LA DISTRIBUCIN ya que podemos superponer la
curva de la normal. Si la curva se parece al histograma podemos decir que es
simtrica.
-Si por ejemplo queremos hacer una nube de puntos o un diagrama de
disperisn para ver dos variables cuantitativas,vamos a Grficos>>cuadro de
dilogos antiguos>>dispersin puntos>>dispersin simple>>definir>> OJO hay
que saber cual es la dependiente y cual la independiente. En funcin de ser la
X (dependiente

(Y)

y independiente

(X)[la

edad

por

ejemplo

sera

independiente en la mayora de los casos])


-Otra cosa que podemos sacar es el coeficiente de correlacin lineal de
Pearson ANALIZAR>>correlaciones>>bivariadas. Ah nos aparecer una tabla.
En una diagonal siempre nos saldr 1 (no hacer caso) en el otro te aparecer
otro valor, que ser el importante.
-El

coeficiente

de

regresin

el

coeficiente

de

determinacin:

ANALIZAR>>regresin>>lineal. De todas las tablas que hay, hay que fijarse en


la que pone RESUMEN DEL MODELO y fijarse en la R2 (coef. De
determinacin). Para sacar el coeficiente de regresin (b) hay que mirar en una
tabla llama COEFICIENTES. Ah vemos dos numero debajo de la B. la primera

se llama constante (tambin denominada a) y el segundo es el coeficiente B de


regresin. En resumen hay que coger el SEGUNDO.
-Si queremos contrastar dos medias: ANALIZAR>> comparar medias>>prueba
t para muestras independientes>>definir grupos.
-Para hacer una seleccin de datos de una variable: DATOS>>Seleccionar
casos>>Si satisface la condicin>>Pones la variable a la derecha=(lo que
quieras comparar) Ahora ya vamos a ANALIZAR>>explorar.
-ANALIZAR>>Estadstico descriptivo>>tablas de contingencia>>casillas>>% en
filas>> aceptar
-ANALIZAR>>Estadsticos descriptivos>>Tablas de contingencia>>Mostras
grafico de barras agrupados Y estadsticos>>(el estadstico que se quiera)
-ANALIZAR>>Comparar medias>>Prueba T para 1 muestra>>(ponemos el
valor en valor de prueba)>>Aceptar `[Miramos en Sig]
-Si queremos cambiar el nombre a las variables para que sea ms cmodo, se
puede en VISTA DE VARIABLES (pestaa derecha) y clickas en el nombre.

2.10

Beneficios de SPSS

a) Recoger

datos

procedentes

de

encuestas

(papel/telfono/web),

almacenados en bases de datos, o almacenados en formato texto sin la


estructura tradicional.
b) Definir y realizar los anlisis adecuados al problema objeto de estudio,
bien mediante herramientas interactivas con pleno control del usuario,
bien mediante su personalizacin de modo que, desvaneciendo los
aspectos tcnicos y metodolgicos, permitan su manejo e interpretacin
por usuarios de negocio.
c) Publicar los resultados de los anlisis para su difusin, y/o reintroducirlos
en los sistemas de informacin del negocio para su empleo como inputs
de funciones de decisin, o anlisis posteriores.

S-ar putea să vă placă și