Sunteți pe pagina 1din 55

Captulo VI

Pautas bsicas del SPSS y AMATLAB

Introduccin
SPSS-12.0 ofrece una gama de posibilidades para llevar a cabo
todo el proceso de anlisis de informacin. Genera la informacin que necesita el investigador para tomar decisiones acertadas, utilizando procedimientos estadsticos y presentando los
resultados en tablas y grficos.
Existen publicaciones ampliamente conocidas como Anlisis estadstico con SPSS para WINDOWS de Visauta, Estadstica
con SPSS en su versin 12 de Nel Quezada, que abordan con detalle y amplitud diversos procedimientos del SPSS y al que deber remitirse el lector interesado en temas especializados del software estadstico SPSS.
No se pretende hacer un libro del SPSS, sino un manual o
gua sencilla que el lector puede usar, con comandos claros y especficos para obtener los resultados presentados en los captulos anteriores del presente libro o cuando desea realizar el anlisis estadstico de la base de datos de su inters, con el auxilio del
software estadstico SPSS_12.
En el presente captulo se usan algunas bases de datos que se
han preparado especialmente para esta publicacin como tambin
para el libro Estadstica descriptiva con soporte del SPSS y MATLAB. Cabe indicar que en cada uno de los captulos precedentes
del presente libro se han presentado los comandos del SPSS que
permitieron ejecutar los procedimientos correspondientes aqu:

[11]

295

se presentan los procedimientos de estadstica descriptiva,


que si bien escapan a nuestros objetivos, seguramente para
muchos usuarios sern de utilidad.
Se usan otras bases de datos que corresponden con la primera publicacin para ilustrar los tpicos de pruebas de hiptesis, asociaciones, correlacin y regresin.

Ventanas del SPSS


Para entrar en el SPSS hacer doble clic en el cono SPSS. Aparecer la figura 6.1 con las siguientes ventanas:
Figura 6.1
Ventanas de aplicacin, de edicin de datos y de salida
Ventana de aplicacin

Ventana de datos

Ventana de variables

Ventana de salida

296

Ventana de Aplicaciones: Contiene la barra de mens con


las distintas opciones del programa.
Ventana de edicin (data editor): Contienen el archivo
de datos con el que se est trabajando. Esta ventana se abre automticamente al iniciar una sesin de SPSS.
Ventana de salida (output): Es una pantalla donde aparecen los resultados de los anlisis estadsticos realizados con el
programa. Estos resultados se pueden archivar para su utilizacin posterior.
Ventana de carrusel de grficos: Se abre con el primer
grfico generado en una sesin de SPSS y los sucesivos se van
incorporando a la misma.
Ventana de grficos: Permite modificar y archivar grficos en archivos extensin.cht.
Ventana de sintaxis: Se puede pegar en esta ventana la
sintaxis de los comandos seleccionados desde la ventana de dilogo de cualquier opcin. Permite editar la sintaxis de estos comandos y ampliarla con aquellas opciones que tienen el lenguaje
SPSS, pero que no estn disponibles a travs de mens.
Siempre que hagamos un anlisis con SPSS, los resultados
irn a la ventana de salida (output).

Men principal
Desde el men se accede a la mayora de las funciones del SPSS.
El men principal tienen las siguientes opciones:
File: Permite crear un nuevo archivo SPSS, abrir un archivo
ya existente, grabar, leer datos creados con otras aplicaciones, etc.
Edit: Contiene las opciones de Windows para copiar datos,
buscar, etc.

297

Data: Contiene opciones para hacer cambios que afectan a todo el archivo de datos (unir archivos, transponer variables y casos, crear subconjuntos de casos, etc.). Estos cambios son temporales mientras no se guarde explcitamente el
archivo.
Transform: Permite cambios sobre variables seleccionadas, permite la creacin de nuevas variables. Estos cambios son temporales mientras no se guarde explcitamente el
archivo.
Analyze: Desde esta opcin se ejecutan todos los procedimientos estadsticos.
Graphs: Desde esta opcin se realizan todos los grficos estadsticos.
Utilities: Permite cambiar fuentes, obtener informacin
completa del archivo de datos, acceder a un ndice de comandos
SPSS, etc.
Windows: Ordena, selecciona, controla atributos de las ventanas abiertas.
Help: Abre un archivo estndar de ayuda Windows.

Procedimientos bsicos para un anlisis estadstico


Para realizar cualquier anlisis estadstico con el SPSS tenemos
que realizar estas tres operaciones bsicas:
a)
b)
c)

298

Seleccionar cualquier base de datos.


Seleccionar del men principal el procedimiento estadstico
deseado.
Seleccionar las variables a incluir en el anlisis y otros parmetros adicionales.

Crear la base
de datos

Seeccionar el
procedimiento
estadstico

Seleccionar a
variable

Resultados

CREAR UN ARCHIVO NUEVO


file/
new/
data/
Aparece la hoja de datos en blanco, donde cada fila es para un
caso o individuo y cada columna es para una variable.
Variable view: permite definir las variables.
SELECCIONAR UN ARCHIVO DE DATOS
File/
Open/
Data/
Nombre del archivo/ Podemos seleccionar un archivo de la lista
o especificar una ruta y extensin de inters.
Abrir.

Vamos a ilustrar con la base de DATOS1-maestra, usando


las variables sexo y coeficiente de inteligencia.

NO NUMRICAS
VARIABLE VIEW:
NAME:
TYPE:
WIDTH:
LABEL:
VALUE:
VALUE LABEL:
ALUE:
VALUE LABEL:
DATA VIEW:

permite definir las variables


SEXO (nombre de la variable)
STRING
8
SEXO DE LOS ESTUDIANTES
1
FEMENINO V
2
MASCULINO
se procede a declarar los datos

299

NUMERICAS
VARIABLE VIEW:
NAME:
TYPE:
WIDTH:
DECIMALS:
LABEL:
DATA VIEW:

permite definir las variables


INTELIGENCIA
NUMERICA
8
0
COEFICIENTE DE INTELIGENCIA
se procede a declarar los datos

El ancho mximo es de 40 caracteres y el nmero de decimales 16.


As, en la base de DATOS10-maestra ya se crearon las variables sexo, coeficiente de inteligencia, situacin laboral y nota
de ingreso a la maestra.

GUARDAR UN ARCHIVO
FILE/
SAVE AS/
NOMBRE DEL ARCHIVO: DATOS1-maestra
GUARDAR

Figura 6.2
Relacin de archivos creados, entre ellos DATOS10-maestra

Se quiere abrir el archivo DATOS10-maestra

300

variable
unidad

Figura 6.3
Variables creadas en el archivo DATOS10-maestra

Vista de datos

Vista de variables

Este libro solamente trata de inferencia estadstica, pero


no hemos querido soslayar los temas de estadstica descriptiva y que ilustramos con bases de datos que corresponden al
libro: Estadstica descriptiva con soporte del SPSS(Gmez,
et.al. 2005).
A continuacin podemos seleccionar cualquiera de los procedimientos estadstico, correspondiente a los temas tratados en
el presente libro. A travs de todo el libro se ilustra con las diversas bases de datos.

Procedimientos estadsticos
Luego de ingresar los datos al EDITOR, debe elegirse un procedimiento en el men ANALIZE para poder obtener los resultados
deseados. El software nos permite realizar informes estadsticos
descriptivos que incluyen tablas de frecuencias, grficos, correlaciones, rectas de regresin entre otros.

301

Figura 6.4
Relacin de procedimientos estadsticos
Elegir el
procedimiento

Despus de abrir el archivo, se selecciona el procedimiento estadstico. En la ilustracin se ha seleccionado el procedimiento de estadsticas descriptivas y se quiere hacer la tabla
de frecuencias.
Figura 6.5
Seleccionar el procedimiento estadstico

Luego, se selecciona(n) la(s ) variable(s) que se quiere usar


en el procedimiento de anlisis o en el grfico seleccionado.

302

Figura 6.6
Relacin de variables variable
variable

El paso final es el examen de resultados en la ventana OUTPUT.


Esta ventana muestra dos paneles, el de izquierda con el conjunto
de titulares de los elementos situados en el panel de la derecha.
Figura 6.7
Resultados(output) del procedimiento tabla de frecuencias
Conjunto de titulares

elementos grficos: tablas o grficos

Si se desea un grfico descriptivo, se elige en el men GRFICOS, puede ser normal o interactivo, en cuyo caso se podr
modificar posteriormente las variables usadas.
Los resultados y grficos que se genera se van acumulando
para su posterior impresin o almacenamiento en disco. En el

303

caso de grficos interactivos podemos modificar directamente,


sin necesidad de volver a generar otra vez el grfico.
Frecuencias para variables cualitativas
El procedimiento permite obtener una descripcin de la distribucin de la variable a partir de la tabla de frecuencias, medidas
de tendencia central, percentiles, medidas de dispersin, etc.
Cabe reiterar que para realizar cualquier procedimiento debe
crearse o abrirse la base de datos. Se ilustra con la base DATOS2matemtica.
Para construir una tabla de frecuencias seleccionar los siguientes opciones:
ANALYZE/ DESCRIPTIVE STATISTICS/FREQUENCIES/ en el cuadro de dilogo que aparece se elige la variable
MEDIO TRANSPORTE/ se pulsa OK para ejecutar el procedimiento con las opciones por defecto. A continuacin se presenta
la salida del SPSS.
Tabla 6.1
Medio de transporte para ir a la universidad

Valid

vehculo propio
vehculo de familiares
transporte pblico
transporte universidad
Total

Frequency

Percent

Valid
Percent

Cumulative
Percent

5
13
110
72
200

2.5
6.5
55.0
36.0
100.0

2.5
6.5
55.0
36.0
100.0

2.5
9.0
64.0
100.0

Se nos muestra:
value:
frequency:
percent:

304

los distintos valores o categoras de la variable.


las frecuencias absolutas para cada valor o categora de la variable.
las frecuencias relativas multiplicadas por el 100%,
incluyendo los valores perdidos.

valid percent:

las frecuencias relativas multiplicadas por el


100%, eliminando de la muestra los valores
perdidos.
cumulate percent: las frecuencias relativas acumuladas multiplicadas por el 100%.
Al final de la tabla se tiene el nmero total de casos vlidos y
el nmero total de casos perdidos.
Nota: En la opcin FREQUENCIES/FORMAT/ se tienen diversas opciones para ordenar la tabla de frecuencias segn los
valores de la variable o las frecuencias, y en orden ascendente o
descendente. Para poder utilizar esta opcin no podemos solicitar ni valores de percentiles ni histogramas.
Frecuencias para variables cuantitativas
Variables discretas
Para ilustrar consideremos la variable X5 de base de DATOS4ciudadana. Abrir la base de datos y ejecutar los siguientes comandos:
ANALYZE/ DESCRIPTIVE STATISTICS/FREQUENCIES/
en el cuadro de dilogo que aparece elegir la variable NMERO
DE ORGANIZACIONES SOCIALES CERCANAS A SU DOMICILIO/ pulsar OK para ejecutar el procedimiento con las opciones por defecto.
Nmero organizaciones sociales cercanas domicilio

Valid

1
2
3
4
5
Total

Frequency

Percent

Valid
percent

Cumulative
percent

10
27
37
21
5
100

10.0
27.0
37.0
21.0
5.0
100.0

10.0
27.0
37.0
21.0
5.0
100.0

10.0
37.0
74.0
95.0
100.0

305

Variables continuas
Para construir la tabla considerar la variable coeficiente de inteligencia de la base de DATOS1- maestra y ejecutar los siguientes
comandos:
ANALYZE/ DESCRIPTIVE STATISTICS/FREQUENCIES/
en el cuadro de dilogo que aparece elegir la variable INTELIGENCIA/ pulsar OK para ejecutar el procedimiento con las opciones por defecto.
El output del SPSS muestra la siguiente tabla.

Tabla 6.2
Tabla de frecuencias para la variable coeficiente de inteligencia
Inteligencia

Valid

93
93
94
94
95
114
116
117
118
120
Total

Frequency

Percent

Valid
percent

Cumulative
percent

1
2
1
1
1
1
1
1
1
2
70

1.4
2.9
1.4
1.4
1.4
1.4
1.4
1.4
1.4
2.9
100.0

1.4
2.9
1.4
1.4
1.4
1.4
1.4
1.4
1.4
2.9
100.0

1.4
4.3
5.7
7.1
8.6
92.9
94.3
95.7
97.1
100.0

La tabla 6.2 muestra una parte de la tabla de frecuencias


bsica para una variable cuantitativa como si se tratara de una
variable cualitativa, pero por la teora estadstica sabemos que
dicha presentacin debe hacerse en intervalos de clase. A continuacin se describen los pasos a seguir para la presentacin en
intervalos de clase, suponiendo que se desea presentar en 7 intervalos de clase.

306

a)

Se establece previamente los limites de los intervalos, para


lo cual se obtiene el valor mximo: 120, el valor mnimo: 93,
el rango: 27 y la amplitud de cada intervalo: 4. As, si seleccionamos los intervalos semiabiertos como ya fue sealado
en el captulo 2, los lmites de los intervalos son:
[92 - 96]
[96 - 100]
[100 - 104]
[104 - 108]
[108 - 112]
[112 - 116]
[116 - 120]

b)

Se crea una variable ficticia con cdigos: 1, 2, 3, 4, 5, 6 y 7, a


la que se denomina INTELI1, donde se guardan los valores
contenidos en cada uno de los intervalos propuestos, para
los que se usan los siguientes comandos:
TRANSFORM/ RECODE/ INTO DIFFERENT VARIABLES/
En el cuadro de dilogo que se presenta elegir como variable
INPUT la variable INTELIGENCIA/ a la variable output
darle el nombre INTELI1/ presionar CHANGE/ OLD &
NEW VALUES/ en el nuevo cuadro de dilogo que se presenta colocar como antiguos valores los intervalos de clase y
como nuevos valores los cdigos de 1 a 5, siguiendo la siguiente secuencia:
pulsar RANGE/colocar el primer intervalo
92 y 95.99
96 y 99.99:
100 y 103.99:
104 y 107.99:
..:
116 y 120:

y pulsar: 1 en new
2 en new
3 en new
4 en new
..
7 en new

pulsar CONTINUE / y OK para ejecutar.


En la base de datos se ha creado una nueva variable denominada: INTELI1.

307

Figura 6.7
Comando Recode para recodificar inteligencia en INTELI1

Se termina de declarar la equivalencia entre la variable original coeficiente de inteligencia y se ha creado la variable ficticia
INTELI1.
c)

308

Se pide la tabla de frecuencias para la variable ficticia COEFI1, ejecutando los siguientes comandos:
ANALYZE/ DESCRIPTIVE STATISTICS/FREQUENCIES/
elegir la variable INTELI/ DISPLAY FREQUENCY TABLES/
OK. En el OUTPUT se lee la siguiente tabla.

Tabla 6.3
Distribucin de frecuencias de la variable ficticia
INTELI

Valid 1
2
3
4
5
6
7
Total

d)

Frequency

Percent

Valid
Percent

Cumulative
Percent

9
28
13
12
2
2
4
70

12,9
40,0
18,6
17,1
2,9
2,9
5,7
100,0

12,9
40,0
18,6
17,1
2,9
2,9
5,7
100,0

12,9
52,9
71,4
88,6
91,4
94,3
100,0

Hacer la equivalencia entre los cdigos de la variable INTELI1 y los intervalos de la variable coeficiente de inteligencia,
usando los comandos:
VARIABLE VIEW/ NAME(INTELI1)/ VALUES /
VALUE 1 /VALUE LABEL
VALUE 2/VALUE LABEL
VALUE 3/VALUE LABEL
VALUE 4/VALUE LABEL

VALUE 7/VALUE LABEL

e)

[92 96[
[96 100[

[100 104[
[108 112[

...........

[116 120]

Reconstruir la tabla de frecuencias para la variable coeficiente de inteligencia, con tan solo hacer el cambio de variable de INTELI1 por coeficiente de inteligencia. En el output
se lee lo siguiente.

A partir de la salida del SPSS se hace la Distribucin de frecuencias absolutas, relativas y acumuladas para la variable coeficiente de inteligencia.

309

Tabla 6.4
Distribucin de frecuencias de la variable coeficiente de inteligencia
Coeficiente Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
de
absoluta
relativa
absoluta
relativa
relativaen
relativa
inteligencia
acumulada acumulada porcentaje acumulada
fi
hi
Intervalos
porcentaje
Hi
Fi
hi %
de clase
Hi %

[ 92- 96 )
[ 96-100 )
[100-104)
[104-108)
[108-112)
[112-116)
[116-120]

9
28
13
12
2
2
4

0.129
0.400
0.186
0.171
0.029
0.029
0.057

Total

70

100.0

9
37
50
62
64
66
70

0.129
0.529
0.714
0.886
0.914
0.943
1.000

12,9
40,0
18,6
17,1
2,9
2,9
5,7

12,9
52,9
71,4
88,6
91,4
94,3
100,0

100.0

Grficos para variables cualitativas


a)

Para construir un grfico de barras para la variable sexo,


seleccionar los siguientes comandos:
GRAPHS/ BAR/SIMPLE/ DEFINE/ en category axis declarar SEXO/ marcar N CASOS/ y presionar OK para ejecutar
el grfico.
Figura 6.8
Grfico de barras para la variable sexo de los estudiantes
50

Count

40
30
20
10
0

310

femenino
masculino
sexo de los estudiantes

b)

Para construir una grfico de SECTORES seleccionar los


siguientes comandos:
GRAPHS/ INTERACTIVE/ PIE/ SIMPLE / en el cuadro de
dilogo colocar en DEFINE SLICES BY la variable SEXO/ activar PIES/ seleccionar PERCENT/ ACEPTAR.
Figura 6. 9
Grfico de sectores de la variable sexo de los estudiantes

Grficos para variables cuantitativas


Para construir el histograma de frecuencias presentado en la Figura 7.12 se usan los siguientes comandos:
GRAPHS/HISTOGRAM/ SELECCIONAR la variable INTELIGENCIA / DISPLAY NORMAL CURVE/ OK.
Figura 6.10
Histograma de la variable coeficiente de inteligencia
20

Frequency

15
10
Mean = 101.77
Std. Dev. = 6.294
N = 70

5
0
95

100

105
110
inteligencia

115

120

311

Otra alternativa es usando los siguientes comandos:


GRAPHS/INTERACTIVE/HISTOGRAM/presionar ASIGN
VARIABLES y colocar COUNT e INTELI1/ en HISTOGRAM elegir 7 intervalos/ si desea coloca el ttulo/ para ejecutar elegir
ACEPTAR.
Figura 2.5
Histograma de frecuencias absoutas para los coeficientes de inteligencia

20

Count

15
10
5
0

2.00 3.00 4.00 5.00

6.00

Inteli 1

Para hacer el grfico de frecuencias relativas cambiar


COUNT por PERCENTS.
Figura

Percent

30

20

10

2.00 3.00 4.00 5.00


Inteli 1

312

6.00

Para frecuencias acumuladas:


GRAPHS/INTERACTIVE/HISTOGRAM/CUMULATIVE
HISTOGRAM/ presionar ASIGN VARIABLES y colocar COUNT
e INTELI1/ en HISTOGRAM elegir 7 intervalos/ si desea coloca
el ttulo/ para ejecutar elegir ACEPTAR. Para hacer el grfico de
frecuencias relativas cambiar COUNT por PERCENTS.
Figura

Court

60
40
20
0

2.00

3.00

4.00

5.00

6.00

Inteli 1

Figura

Court

60
40
20
0
2.00

3.00

4.00

5.00

6.00

Inteli 1

313

Medidas de tendencia central y de dispersin


a)

La opcin FREQUENCIES, adems de tablas y grficos, nos


permite calcular algunas estadsticas bsicas de posicin y
de dispersin para una variable numrica. Para hacer la ilustracin, continuamos con la variable coeficiente de inteligencia de la base DATOS1-maestra y ejecutar los siguientes
comandos.
ANALYZE/ DESCRIPTIVE STATISTICS/FREQUENCIES/
elegir la variable INTELIGENCIA/ presionar STATISTICS/
seleccionar
MEAN MEDIAN MODE SUM
STD DEVIATION VARIANCE MINIMUN MAXIMUN,
PERCENTILES 10 ADD 20 ADD /CONTINUE/ y OK para
la ejecucin.
Los resultados estn en el siguiente cuadro.
Tabla 6.5
Medidas de tendencia central, dispersin y forma de la
variable coeficiente de inteligencia
Statistics

inteligencia
N
Mean
Median
Mode
Std. Deviation
Variance
Skewness
Std. Error of Skewness
Kurtosis
Std. Error of Kurtosis
Range
Minimum
Maximum
Sum
Sum
Percentiles

314

Valid
Missing

6.282
39.464
1.301
.287
1.558
.566
27
93
95.37
10
20

70
0
101.79
100.00
100

120
7125
95.37
96.97

donde para cualquier variable cuantitativa:


mean:
media aritmtica,
median:
mediana,
mode:
moda,
sum:
suma de todos los valores,
std deviation:
desviacin estndar,
variante:
varianza,
minimum:
valor ms pequeo,
mximun:
valor ms grande,
range:
rango,
std. Error of mean: error estndar de la media aritmtica,
kurtosis:
curtosis,
skewness:
sesgo.
b)

La opcin DESCRIPTIVES al igual que la opcin anterior,


tambin permite calcular algunas medidas de tendencia central, de dispersin y de distribucin. La secuencia de los comandos es la siguiente:
ANALYZE/ DESCRIPTIVE STATISTICS/DESCRIPTIVES/
elegir la variable INTELIGENCIA/OPTION/ MEAN,
SUM, KURTOSIS, SKEWNESS,
CONTINUE /OK.
Como opciones adicionales, este procedimiento nos permite:

guardar en nuevas variables los valores estandarizados


de las variables originales,
visualizar o no las etiquetas de cada variable,
decidir el orden en que se visualizarn los resultados.

Coeficientes de correlacin y regresin lineal


a ) Coeficiente PHI
Abrir o crear la base de datos.
En el presente caso abrir la base DATOS8-phi y seleccionar
del men las siguientes opciones:

315

ANALYZE/ DESCRIPTIVE STATISTICS/CROSSTABS. Aparecer el cuadro de dilogo en el que deber colocar en ROWS la
variable ESTADO CIVIL, y en COLUMNS colocar la variable
DESERCION. Continuar con los comandos FORMAT/DESCENDING/ STATISTICS/PHI/ CONTINUE y se ejecuta el procedimiento con OK.
En el OUTPUT aparece:
DESERCION * ESTADO CIVIL Crosstabulation
ESTADO CIVIL

DESERCION
Total

1
0

2
8
10

4
1
5

Total

6
9
15

Symmetric Measures
Value
Nominal by
Nominal

Phi

.577

b) Coeficiente BISERAL-PUNTUAL
Abrir o crear la base de datos.
En el presente caso, abrir la base DATOS9-biseral y seleccionar las variables sexo y estatura de los estudiantes.
El SPSS no proporciona directamente el valor del coeficiente de correlacin biseral, pero proporciona las medias muestrales y la desviacin estndar necesarios que se reemplazan en la
frmula correspondiente.
Se crea una variable ficticia donde se guardan las estaturas
de los estudiantes del sexo femenino. Esa variable se denomina
X0, de la que necesitamos su media aritmtica.

316

Se crea otra variable ficticia donde se guardan las estaturas


de los estudiantes del sexo masculino. Esa variable se denomina
X1, de la que necesitamos tambin su media aritmtica.
De la variable estatura, sin diferenciar el sexo, necesitamos
la desviacin estndar.
Abrir la base DATOS9-biseral y ejecutar los siguientes comandos:
a) TRANSFORM/COMPUTE en target colocar XO/ en expresin numrica colocar ESTATURA/ IF/ activar INCLUDE
IF CASE SATISFIES CONDITION SEXO=0/ CONTINUE /
OK. Se ha creado la variable X0.
b) TRANSFORM/COMPUTE en target colocar X1/ en expresin
numrica colocar ESTATURA/ IF/ activar INCLUDE IF
CASE SATISFIES CONDITION SEXO=1/ CONTINUE /OK.
c) ANALYZE/ DESCRIPTIVE STATISTICS/ DESCRIPTIVES/
seleccionar las variables ESTATURA XO X1/ OK.
Descriptive Statistics
n

estatura de los
estudiantes
Xo
x1
Valid N (listwise)

15
7
8
0

= 66.75

r
c)

Minimum Maximum

bp

55
55.00
62.00

= 61.14

73
67.00
73.00

=8

66.75 61.14 8 x7
4.749
15 x14

Mean

Std. Deviation

64.13
61.1429
66.7500

4.749
3.62531
4.13176

=7

= 4.749

0.61

Coeficiente TETRACRICO

El SPSS nos proporciona la tabla de contingencia de la que tomamos los valores de las celdas para reemplazarlos en la frmula
de la pgina 95. Se ilustra con la base DATOS10-tetracrico con

317

las variables notas en el curso de estadstica (dicotomizada: aprob o desaprob) y las notas en el curso de metodologa de la investigacin tambin dicotomizada. Las dos variables son de naturaleza cuantitativa. Para obtener la tabla de doble entrada se
procede de la siguiente manera:
ANALYZE/ DESCRIPTIVE STATISTICS/CROSSTABS. Aparecer el cuadro de dilogo en el que deber colocar en ROWS la
variable NOTAS EN ESTADSTICA, y en COLUMNS colocar la
variable NOTAS EN METODOLOGA. Continuar con los comandos FORMAT/DESCENDING/ CONTINUE y se ejecuta el procedimiento con OK.
En el output aparecen las frecuencias conjuntas
notas de estadstica * notas de metodologa de la investigacin Crosstabulation
Count
notas de metodologa
de la investigacin

notas de
estadstica
Total

desaprob

aprob

a=11
c=34
45

b=36
d=18
54

aprob
desaprob

Total

47
52
99

b c 36(34)
= 6.18 . En la
=
11(18)
ad
tabla H d el valor de dicho cociente se encuentra en el intervalo
6.044 y 6.288 por lo que el valor del coeficiente de correlacin
tetracrico es 0.62.
con las que se calcula el cociente

d ) Coeficiente BISERAL
Este tipo de coeficiente se calcula cuando se tienen dos variables
cuantitativas una de las cuales ha sido dicotomizada. Tampoco el
SPSS calcula este coeficiente pero nos proporciona las cuentas auxiliares para la obtencin del coeficiente. Se usa la base DATOS11-

318

biseral donde la variable nota del estudiante se ha dicotomizado la


habilidad del estudiante y asignado 1 si aprob y 0 si desaprob.
Se crea una variable ficticia donde se guardan los tiempos
que demoran en resolver el problema los estudiantes que desaprueban o no tienen habilidad. Dicha variable se denomina X0,
de la que necesitamos su media aritmtica.
Se crea otra variable ficticia donde se guardan los tiempos
que demoran en resolver los estudiantes que aprueban o que tienen habilidad para resolver el problema. Dicha variable se denomina X1, de la que necesitamos tambin su media aritmtica.
De la variable tiempo, sin diferenciar si el estudiante fue hbil
o no, se necesita la desviacin estndar.
Abrir la base DATOS11-biseral y ejecutar los siguientes comandos:
a)

b)

c)

TRANSFORM/COMPUTE en target colocar XO/ en expresin numrica colocar TIEMPO/ IF/ activar INCLUDE IF
CASE SATISFIES CONDITION HABILIDAD=0/ CONTINUE /OK. Se ha creado la variable X0.
TRANSFORM/COMPUTE en target colocar X1/ en expresin
numrica colocar TIEMPO/ IF/ activar INCLUDE IF CASE
SATISFIES CONDITION HABILIDAD=1/ CONTINUE /OK.
ANALYZE/ DESCRIPTIVE STATISTICS/ DESCRIPTIVES/
seleccionar las variables TIEMPO XO X1/ OK.
En el output se dispone del siguiente cuadro
Descriptive Statistics

tiempo para
resolver
x0
x1

Mean

Std.
Deviation

99
52
47

63.54
63.0113
64.1310

10.168
10.58776
9.76176

que luego permiten calcular el coeficiente de correlacin biseral usando la frmula de la pgina 98.

319

e)

Coeficiente de SPEARMAN

Se crea o abre el archivo de datos, que en el presente caso es la base


de DATOS6-jurado y se seleccionan los siguientes comandos:
ANALYZE/CORRELATE/BIVARIATE/elegir las variables
X e Y/ SPEARMAN/ OK y el SPSS nos proporciona el coeficiente
de correlacin de Sperman.
Correlations
RANGO A
RANGO A
LAS NOTAS
LAS NOTAS
DEL JURADO DEL JURADO
1
2
Spearman's rho RANGO A LAS
NOTAS DEL
JURADO 1
RANGO A LAS
NOTAS DEL
JURADO 2

f)

Correlation
Coefficient

1.000

.332

Correlation
Coefficient

.332

1.000

Coeficiente de CONTINGENCIA

Es til cuando las dos variables son cualitativas como en los ejemplos 4.2 y 4.3.
Para el ejemplo 4.2 se us la base DATOS2-matemticas y se
construy la tabla de doble entrada para el sexo y la escuela profesional a la que pertenece el estudiante. Esta vez, adems del
cuadro se obtiene el coeficiente de contingencia. Los comandos
son los siguientes:
ANALYZE/ DESCRIPTIVE STATISTICS/CROSSTABS/ colocar en ROWS la variable SEXO y en COLUMNS colocar ESCUELA PROFESIONAL/ pulsar STATISTICS/ activar CONTINGENCY COEFFICIENT/ CONTINUE/ ejecutar con OK.
El output del SPSS adems de la tabla bidimensional incluye
el siguiente cuadro:

320

Symmetric Measures
Value
Nominal by Nominal

Contingency
Coefficient

.217

Anlisis de REGRESIN LINEAL SIMPLE


Para ver las opciones de este procedimiento vamos a trabajar con
variables cuantitativas del archivo DATOS3-educacin: edad de
los participantes, nota promedio, nota en lgebra, nota en aritmtica, nota en trigonometra.
a ) Diagrama de dispersin
Entrar en
GRAPH/SCATTER / del cuadro de dilogo que aparece se
selecciona las opciones SIMPLE DEFINE/ colocar la variable PROMEDIO como variable dependiente en el eje de las Y/ colocar la
variable LGEBRA como variable independiente en el eje de las
X/ dejar el resto de opciones por defecto y ejecutar el procedimiento con OK.

16

Notas prmedio

14

12

10

8
8

10
12
Notas de lgebra

14

321

Se observa en el grfico una relacin lineal razonablemente


alta entre la nota promedio de los estudiantes y la nota de lgebra. Para cuantificar dicha relacin debe calcularse el coeficiente de correlacin de Pearson.
b) Coeficiente de correlacin de PEARSON
ANALYZE/ CORRELATE/ BIVARIATE/ pasar a la lista de variables destino las variables PROMEDIO y ALGEBRA/ dejamos
todas las opciones por defecto y se ejecuta el procedimiento con
OK. Obtenemos la matriz de correlaciones que aparece en la siguiente figura.
Correlations
NOTAS
PROMEDIO
NOTAS

Pearson

PROMEDIO

Correlation

NOTAS DE

Pearson

LGEBRA

Correlation

c)

NOTAS DE
ALGEBRA

.925

.925

.000

Coeficientes de correlacin para


varias variables

ANALYZE/ CORRELATE/ BIVARIATE/ pasar a la lista de


variables destino todas las variables cuantitativas para las
que se desea encontrar las correlaciones bivariantes/ dejamos
todas las opciones por defecto y se ejecuta el procedimiento con
OK. Obtenemos la matriz de correlaciones que aparece en la siguiente figura.

322

Correlations
Edad de los Tiempo de Notas de Notas
estudiantes servicio lgebra promedio

Edad de los
estudiantes

Pearson Correlation
Sig. (2-tailed)
N

Tiempo de servicio Pearson Correlation


Sig (2-tailed)
N

1
.
47

.734**
.000
47

-.107
.473
47

-.077
.608
47

.734**
.000
47

1
.
47

-.173
.244
47

-.124
.407
47

Notas de lgebra

pearson correlation
Sig. (2-tailed)
N

-.107
.473
47

-.173
.244
47

1
.
47

.925**
.000
47

Notas promedio

Pearson Correlation
Sig. (2-tailed)
N

-.077
.608
47

-.124
.407
47

.925**
.000
47

1
.
47

** Correlation is significant at the 0.01 level (2-tailed).

Se observa que la matriz es simtrica y los valores de la diagonal igual a 1, pues corresponde a la correlacin de cada variable consigo misma.
d ) Coeficiente de correlacin parcial
Se trata de un coeficiente de correlacin que nos da la idea de la
relacin lineal existente entre dos variables, ajustada a los efectos lineales que sobre ella puedan tener una o ms variables intervinientes.
Si deseamos encontrar el coeficiente de correlacin parcial entre la nota promedio y lgebra, ajustado por la influencia que podra tener la nota de aritmtica, los comandos son los
siguientes:
ANALYZE/ CORRELATE/ PARTIAL/elegir como variables
destino PROMEDIO y LGEBRA/ en controllin for colocar la variable control ARITMTICA/ dejar todas las opciones por defecto y se ejecuta el procedimiento con OK.

323

Correlations
Control
Variables

NOTAS DE
ARITMTICA

NOTAS
PROMEDIO
NOTAS DE
LGEBRA

NOTAS
PROMEDIO

NOTAS DE
LGEBRA

Correlation

1.000

.611

Correlation

.611

1.000

Pasamos de un coeficiente de correlacin de Person 0.925 a


un coeficiente de correlacin parcial de 0.611.
e)

Scatterplot

Entrar en GRAPHS/SCATTER/ aparece el cuadro de dilogo con


las siguientes opciones:
Simple: cada punto representa un sujeto de la base de datos.
Matriz: una matriz cuadrada de SCATTERPLOTS simples para
cada combinacin de pares de variables.
Overlay: representa varios SCATTERPLOTS en el mismo eje.
Three-D: cada punto representa un sujeto con valores en tres
variables. Se puede rotar el grfico.
e1) Simple
En este cuadro de dilogo tenemos:

324

En el eje de las Y la variable que, en el caso de existir


dependencia, acta como variable dependiente.
En el eje de las X, la variable independiente.
En SET MARKET BY una variable que clasifique los individuos por grupos.
En LABEL CASES BY una variable que con sus valores o
categoras identifique a cada sujeto en el grfico.

GRAPHS/ SCATTER/ SIMPLE/ DEFINE. En Y entramos la


variable PROMEDIO y en X la variable ALGEBRA. En SET MARKERS BY la variable SEXO. Dejar el resto de opciones por defecto. Pulsar OK y se obtiene la siguiente figura.
El grfico nos muestra los puntos, separados para los distintos subgrupos de la variable en SET MARKERS BY, en nuestro
caso la variable SEXO.

Sexo de los
participantes

16,0000

Femenino
Masculino

Notas promedio

14,0000

12,0000

10,000

8,0000
8,0000 10,0000 12,0000 14,0000

f)

Regresin lineal simple

Entramos en ANALYZE/ REGRESSION/ LINEAR y obtenemos el cuadro de dilogo, donde se elige la variable PROMEDIO como variable dependiente y LGEBRA como variable
independiente. Dejamos el resto de opciones por defecto y ejecutamos el procedimiento. Los resultados son los que aparecen a
continuacin.

325

Model Summmary
Model
1

R Square

Adjusted
R. Square

.925

.855

.852

Std. error of
the estimate
.518

a. Predictors: (Constant), Notas de lgebra

ANOVAb
Model
1

Regression
Residual
Total

Sum of
Squares

df

Mean
Square

Sig.

71.298
12.077
83.375

1
45
46

71.298
.268

265.659

.000

a. Predictors: (Constant), NOTAS DE LGEBRA


b. Dependent Variable: NOTAS PROMEDIO

Coefficientsa
Unstandardized
Coefficients
Model

1 (Constant)
NOTAS DE LGEBRA

Standardized
Coefficients

Std. Error

Beta

Sig.

3.853
.708

.477
.043

.925

8.071
16.299

.000
.000

a. Dependent variable: NOTAS PROMEDIO

La recta de regresin ajustada por el mtodo de mnimos cuadrados es:


Y = 3.853 + 0.708 X y el coeficiente de correlacin vale 0.925.

g ) Grfico de la recta de regresin lineal


Entrar en GRAPH/ INTERACTIVE/ SCATTERPLOT / en el cuadro de dilogo que aparece se eligen las variables independiente
(en el eje X) y dependiente(en el eje Y)/ presionar FIT/ elegir como
mtodo REGRESIN / en fit lines for elegir TOTAL/ presionar
ACEPTAR para ejecutar.

326

14

Notas promedio

13

Linear
Regression

Notas promedio = 3.85 + 0.71 * lgebra


R-Square = 0.86

12
11
10
9
8

10

12

14

Notas de lgebra

h ) Anlisis de regresin lineal mltiple


ANALYZE/ REGRESSION/ LINEAR y dejamos la variable PROMEDIO como variable dependiente, LGEBRA y ARITMTICA
como variables independientes respectivamente. Dejar el resto
de opciones por defecto y se ejecuta el procedimiento. Se obtiene
los siguientes resultados.
Model Summmaryb
Model
1

R Square

Adjusted
R. Square

.940

.884

.879

Std. error of
the estimate
.468

a. Predictors: (Constant), NOTAS DE ARITMTICA, NOTAS DE LGEBRA


b. Dependent Variable: NOTAS PROMEDIO

ANOVAb
Model
1

Regression
Residual
Total

Sum of
Squares

df

Mean
Square

Sig.

73.734
9.641
83.375

2
44
46

36.867
.219

168.257

.000

a. Predictors: (Constant), NOTAS DE ARITMTICA, NOTAS DE LGEBRA


b. Dependent Variable: NOTAS PROMEDIO

327

Coefficientsa
Unstandardized
Coefficients
Model

1 (Constant)

NOTAS DE LGEBRA
NOTAS DE ARITMTICA

Standardized
Coefficients

Std. Error

Beta

Sig.

2.759
.448
.280

.542
.087
.084

.585
.381

5.091
5.122
3.334

.000
.000
.002

a. Dependent variable: NOTAS PROMEDIO

En el output se tiene la siguiente informacin:


La variable dependiente del modelo.
La relacin de las variables independientes.
El coeficiente de correlacin mltiple.
El coeficiente de determinacin.
El coeficiente de determinacin ajustado.
El anlisis de varianza.
Los coeficientes de la ecuacin de regresin mltiple.

Pautas bsicas del MATLAB


MATLAB significa MATrix LABoratory. Originalmente fue desarrollado como un software para operar matrices. Una manera
fcil de visualizar MATLAB es pensar en l, como una calculadora cientfica que maneja nmeros reales y complejos y como
una calculadora programable que puede almacenar y recuperar
datos, que puede crear, ejecutar y guardar secuencias de rdenes
para automatizar el clculo de ecuaciones importantes; y tambin puede hacer comparaciones lgicas y controlar el orden en
el que se ejecutan los comandos. Adems permite presentar datos en gran variedad de formas.
Ejecuta lgebra matricial, manipula polinomios, integra funciones, manipula simblicamente ecuaciones, etc.
Realiza tambin procedimientos estadsticos como tabla de
frecuencias, grficos, estadsticas de posicin etc.

328

MATLAB tiene las operaciones aritmticas conocidas: suma


(+), resta (-), multiplicacin (*), divisin (/) y potencia (^) y se
operan de la manera que usted acostumbra.
Cuando se activa, en el pront aparece el smbolo >>.
Ejemplo
>> 2+pi
>> 1/9
>> 2^3

ans =5.1416
ans = 0.1111
ans = 8

Si lo usamos como una calculadora cientfica, ella posee un


nmero grande de funciones, entre stas se incluyen: abs, sqrt,
exp, sin etc.
Ejemplo
" abs(1+i)
" exp(0)
" exp(1)

ans = 1.4142
ans = 1
ans = 2.7183

MATLAB permite asociar un nombre a una cantidad numrica dada (al que llamamos variable) Se declara las variables
usando el signo "=":
Ejemplo
" a=13
" b=a+a/pi

a = 13
b = 17.1380

MATLAB nos muestra las respuestas en ans (answers) cuando no asignamos nombre de ninguna variable.
Ejemplo
" pi
" ans/2

ans = 3.1416
ans = 1.5708

Los nombres de las variables deben comenzar con una letra,


despus es vlido cualquier ordenacin de letras, nmeros o su-

329

brayado. Puede contener hasta 19 caracteres. MATLAB es sensible a las maysculas: a y A son variables diferentes.
Declaracin de vectores y matrices
Los escalares, los vectores y las matrices, se ejecuta en MATLAB sin ninguna declaracin especial. Los vectores pueden ser
considerados como matrices de una sola columna o de una sola
fila, as tambin los escalares pueden ser considerados como
matrices de orden uno. Existen varias formas de escribir matrices en MATLAB, consideremos algunas de las ms sencillas:
Para escribir la matriz fila b de componentes: 1, 2, 3 y 4
digito:
>>b=[1 2 3 4], a lo que matlab responde:
b=
1 2 3 4
Cada nueva columna est separada por un espacio, tambin
puede usarse tambin una coma
" b=[1,2,3,4]
b=
1 2 3
4
Escribimos un vector columna c, separando cada nueva fila
con un punto y coma.
" c = [1; 2;3, -9]
c=
1
2
3
-9
Una matriz A se escribe:
" A = [1 2 3;4 5 6;7 8 9].
A=
1 2 3
4 5 6
7 8 9
Recuerde que cada nueva columna se separa con ";".

330

Para escribir vectores podemos usar dos puntos, (:) de la siguiente manera:
vector = primer elemento: incremento: ltimo elemento.
Ejemplo
>> v1=1:5:39
v1 = 16 11 16 21 26 31 36
Al ser el incremento igual a 5, el siguiente de 36 sera 41 que
rebasa la cota superior de 39.
Puede considerarse fracciones como incremento:
" v2 = 2 : 0.4: 4

v2 = 2.0000 2.4000 2.8000


3.6000 4.0000.

3.2000

Los incrementos pueden ser negativos


" v3 = 10: -0.5: 8.0 v3 = 10.0000 9.5000 9.0000 8.5000
8.0000.
Por omisin MATLAB entiende que el incremento es uno.
" v4=13:19
v4 = 13 14 15 16 17 18 19
Mediante el comando linspace decidimos el nmero de puntos en que dividimos un intervalo por ejemplo dividir el intervalo [0,pi ], en 6 sub-intervalos
" v5 = linspace(0,pi,7)
v5 = 0 0.5236 1.0472 1.5708
2.0944 2.6180 3.1416
Para saber el tamao (dimensin) del vector v1 o su orden
cuando lo pensamos como una matriz, escribimos los comandos:
>>length(v1)
ans = 8
>> [ fila, colum ] = size(v1)fila = 1 colum = 8
Nos dice que v1 tiene 8 componentes o que es una matriz de
una fila y ocho columnas.
MATLAB conoce muchas matrices tales como la identidad,
la matriz constante 0, etc, basta escribir los comandos:

331

" iden = eye(4), cero = zeros(3,5), uno = ones(2,4).


iden
=
cero =
uno =
1 0 0 0
0 0 0 0 0
1 1 1 1 1
0 1 0 0
0 0 0 0 0
1 1 1 1 1
0 0 1 0
0 0 0 0 0
0 0 0 1
Escriba las ordenes: eye(3,5), zeros(5), ones(5,3) y mire que
obtiene. Una matriz que servir para algunos ejemplos rutinarios es la matriz mgica, escriba magic(5), intente ver que propiedades tiene.
Dado un vector podemos obtener una matriz diagonal donde su diagonal principal esta dada por las componentes de ste
vector:
" v=1:5
v=1
2 3
4
5
" dia=diag(v)
dia =
1 0 0
0
0
0 2 0
0
0
0 0 3
0
0
0 0 0
4
0
0 0 0
0
5
Ensaye ahora el comando diag(dia). En A tiene guardado una
matriz, muestre en pantalla, escriba diag(diag(A)), qu obtiene?
Una matriz R cuyas entradas son nmeros aleatorios
R=rand(4)
R=
0.9501 0.8913
0.8214
0.9218
0.2311 0.7621
0.4447
0.7382
0.6068 0.4565
0.6154
0.1763
0.4860 0.0185
0.7919
0.4057
Podemos ensamblar una matriz a partir de matrices de menor orden, por bloques, como sigue:

332

" B=[A,
B=
1 2
4 5
7 8
0 0
0 0
0 0

zeros(3);
3
6
9
0
0
0

0
0
0
1
1
1

zeros(3), ones(3)]
0
0
0
1
1
1

Ejemplo
" a = 4: 9
" b = 9: -1: 4 b =
" c = ones(2) c = 1
1 1
" d1=[a b]
" d2=[a; b]
" d3=[d2,

" d4=[c; d2]

0
0
0
1
1
1

a=4 5
9
8
1

6
7

7
6

8
5

9
4

d1 = 45
9
8
d2 = 45
9
8
c]
d3 =
8
9
9
8
1
1
d4 = 1
7
8
1
1
5
4

6
7
6
7
4
1
7

7
6
7
6
5
1
6

8
5
8
5
6

9
4
9
4
7

1
9
9

Filas, columnas y elementos de una matriz. Submatrices


El elemento de una matriz A que se encuentra en la fila i columna j se denota como en lgebra lineal A(i, j). En las matrices dadas en los ejemplos anteriores:
" B(4,5)
ans = 1
" A(3,2)
ans = 8
" d1(10)
ans = 6

333

En el caso de vectores basta con dar la componente del vector, la primera componente es d1(1), y as para todos los vectores, no existe para matlab una componente de ndice cero, igual
con las matrices, el elemento de la primera fila y primera columna es A(1, 1), no existe A(0, 0).
Podemos redefinir una matriz modificando algn elemento,
por ejemplo:
" A(3,2)=17
Observe el elemento (3, 2), en la matriz A que se tenia y como
se reemplaz en la nueva A:
A=
1 2
4 5
7 8

A=
1
4
7

3
6
9

Ejemplo
" d1
d1 = 45
" d1(10)

6
7
ans = 6

2
5
17

3
6
9

7
6

8
5

9
4

Modificamos la componente 10 del vector d1: sta es reemplazada por la suma de la primera y la dcima componente.
" d1(10)=d1(1)+d1(10)
8 9 9
8
7

d1 = 4
10
5

5
4

Para obtener la primera columna de la matriz A escriba:


" A (:, 1)
ans =
1
4
7

334

para la tercera fila:


" A(3,:)
ans = 7

17

La fila i la columna j se obtienen escribiendo A(i,:) A(:, j)


respectivamente.
Si quisiramos borrar la tercera fila, hacemos:
" A(3,: )=[ ]
A=
1 2 3
4 5 6
Usando dos puntos podemos construir otras submatrices, recordamos que tenemos en la matriz B y escribimos la submatriz
B1 formado por la segunda, tercera y cuarta fila
"B
B=
1
4
7
0

2
5
8
0
0
0

3
6
9
0
0
0

0
0
0
1
0
0

0
0
0
1
1
1

0
0
0
1
1
1

1
1

" B1=B(2:4,:)
Escribimos el dos para la fila inicial, el cuatro para la final, si
no se escribe el incremento, MATLAB asume que es uno.
B1 =
4 5
7 8
0 0

6
9
0

0
0
1

0
0
1

0
0
1

335

" B2=B(:,1:2:6)
Para la submatriz B2, escribimos uno para que comience en
la primera columna, incrementndose de dos en dos, a lo ms
hasta la sexta columna:
B2 =
1 3
4 6
7 9
0 0
0 0
0 0

0
0
0
1
1
1

Esto es, la submatriz B2 est formada por la primera, tercera


y quinta columna.
" B3=B(:, [2
B3 =
2 0
5 0
8 0
0 1
0 1
0 1

5])

B3 est formada por la segunda y la cuarta columna.


B4 = B([1
B4 =
2 3 0
0 0 1

5], [2 3

4])

B4 est formada por la primera y quinta filas, adems por la


segunda, tercera y cuarta columnas.

336

Operaciones con matrices y vectores


Para tomar la transpuesta de la matriz A: se coloca un apstrofe
" B=A'
B=
1 4 7
2 5 8
3 6 9
La suma de matrices y de vectores es igual a la suma de escalares.
Ejemplo
A=[1 2 3;4 5 6;7 8 9], B=A'.
A=
B=
1 2 3
1
4
4 5 6
2
5
7 8 9
3
6

7
8
9

" C = A+B
C=
2 6 10
6 10 14
10 14 18
" a =4: 9
" b =9: -1: 4
"c=a+b
" d1= 3*a-2*b
" [1 1 1]/3

6
7
7
6
13
13
4
9
0,3333

a=
b=
c=
d1 =
ans =

4
5
9
8
13
13
-6
-1
0,3333

8
9
5
4
13
13
14
19
0,3333

El producto de matrices es el usual del lgebra, el nmero de


columnas de la primera matriz factor debe coincidir con el nmero de filas del segundo factor.

337

" D=A*B
D=
14 32 50
32 77 122
50 122194
El producto interior de dos vectores puede obtenerse de la
siguiente manera:
" d2=a*b'

d2 = 236

Existe otro producto, se le llama producto exterior:


" d3=[1; 2; 3]*[1 2 3]
d3 =
1 2 3
2 4 6
3 6 9
Usamos el "punto operacin" para efectuarlo componente a
componente como sigue:
" d4=[1 2

" d5=[2
d5 =1
" A.*B
ans =
1 8
8 25
21 48

2
4

2
2

4].*[1 1/2
1
1
2].^[0 1
8

1/3
1
2

1/4] d4 = 1
3]

21
48
81

Anlisis de datos
Las matrices son usadas de manera natural por MATLAB para
analizar datos. Por convencin el conjunto de datos se almacenan

338

en matrices orientada por columnas, cada columna representa una


variable diferente y cada fila representa a un individuo.
Al digitar help datafun, matlab le muestra una lista de las
funcionres estadsticas que podra Ud. necesitar, algunas de estas es mostrada en la siguiente tabla:
Funcin estadstica

Descripcin

bar(x)
corrcoef(x)
cov(x)
cumprod(x)
cumsum(x)
diff(x)
hist()
mean(x)
median(x)
prod(x)
rand(x)
randn(x)
sort(x)
std(x)
sum(x)

Diagrama de barras
Coeficientes de correlacin
Matriz de covarianza
Producto acumulado de columnas
Suma acumulado de columnas
Calcula las diferencias entre elementos
Histograma
Valor medio de columnas
Valor de la mediana de las columnas
Producto de elemtos en columnas
Nmeros aleatorios distribuidos uniformemente
Nmeros aleatorios distribuidos normalmente
Ordena columnas en orden ascendente
Desviacin estandar de columnas
Suma de elementos de cada columna

Ejemplo
Supongamos que la siguiente matriz represente a cuatro
variables (columnas) y 3 individuos (filas).
A=[
2 7 4 7
6 4 6 1
4 0 7 4]
>>mean(A) nos da la media aritmtica de cada una de las
variables
ans = 4.0000 3.6667
5.6667
4.0000
>> sum(A) nos da la suma de los valores de cada variable
ans = 12
11
17
12

339

sort(A)
ans =
2 0 4 1
4 4 6 4
6 7 7 7
>> cov(A) proporciona la matriz de covarianzas de las tres
variables
ans =
4.0000
-3.0000
2.0000
- 6.0000
-3.0000
12.3333
-5.1667
4.5000
2.0000
-5.1667
2.3333
-3.0000
-6.0000
4.5000
-3.0000
9.0000
Nmeros aleatorios
Nos sirven para simular un problema complejo.
Los nmeros aleatorios que tienen la misma probabilidad
de ser elegidos entre un lmite superior y uno inferior se denominan nmeros aleatorios uniformes.
MATLAB mediante la funcin rand genera nmeros aleatorios distribuidos uniformemente en el intervalo [0,1], la sintaxis es:
rand (n) %matriz de orden n de entradas entre 0 y 1.
rand(m,n) %matiz de orden m por n
Para obtener una sucesin de nmeros aleatorios se utiliza
el valor de una semilla el valor de este semilla inicialmente es
cero, pero se puede cambiar con la funcin seed
rand('seed', n) %asigna n como valor de la semilla
rand('seed'),%devuelve el valor actual de la semilla del generador de nmeros aleatorios.
Las sucesiones aleatorias que tienen algunos valores con
mayor probabilidad de ocurrir que otros pueden modelarse con
nmeros aleatorios normales.
MATLAB genera valores gaussianos con una media de cero
y una varianza de 1.0 en [0,1], mediante:
randn(m)
randn(m,n)

340

%genera una matriz de orden m


%genera una matriz de orden m por n

Ejemplo
y=randn(1500,1); % genera 1500 nmeros aleatorios con distribucin normal de media
cero y varianza 1.
hist(y) % dibuja un histograma de 10 barras para los datos
del vector y.
Ejemplo
x=-2.9:0.1:2.9
y=randn(1000,1),
hist(y, x);

50
45
40
35
30
25
20
15
10
5
0

-3

-2

-1

Recordar que todos los comandos MATLAB SE DIGITAN EN


LETRAS MINSCULAS.
Los comandos de ayuda
Si conocemos el nombre del comando del que necesitamos ayuda, escribimos help nombre del comando, por ejemplo escriba help
diag, y lea lo que matlab muestra en pantalla acerca de diag. Si

341

escribimos help +, matlab nos muestra todo acerca de las operaciones aritmticas y otras relaciones ms; en cambio help help
nos explica que es lo que hace help.
Vea que es lo que hace un solo help.
Si no conocemos exactamente el nombre del comando pero sabemos por ejemplo que esta relacionado con los nmeros complejos escribimos lookfor complex, matlab nos muestra una lista de
comandos que est relacionado con los complejos. Escriba lookfor
fourier y lea lo matlab muestra en pantalla.
Los comandos who y whos
Nos muestra en pantalla las variables que estamos utilizando en
sta sesin de Matlab.
Los comandos save y load
Si queremos conservar la matriz A para usarla en la siguiente sesin escribir save A y A es guardada en un archivo de extensin
mat, para recuperarla en la siguiente sesin escribir load A.mat
El comando intro
Hace un paseo de demostracin, muestra lo que matlab puede
ofrecer. Digite intro y disfrute de este paseo. Puede recorrer tambin por demo, para ello digite demo.
Para averiguar que es lo que hacen algunos de los comandos
que nos muestra intro, por ejemplo plot, grid, etc digite:help plot,
help grid.
El comando %
Sirve para escribir comentarios, lo que sigue despues del % en
toda esa lnea, matlab no lo ejecuta.

342

Archivos M
Cuando un programa tiene comandos que ocupan varias lneas
es conveniente usar los archivos.m, funcionan como macrocomandos matlab, lo pensamos como programas escritos en lenguaje matlab, pueden guardarse en disco y corregirse tantas veces como sea necesario. Incluye cualquier cosa que el usuario
pueda escribir directamente en la ventana de comandos.
Estos archivos.m son de dos clases: los archivos.m de guin
y los archivos.m de funcin.
Los archivos.m de guin es una lista de comandos matlab,
que pueden operar con datos que existen en el espacio de trabajo
y pueden crear nuevos datos para seguir operando, pueden llamar a otros archivos.m, Cualquier variable que ellos han creado
permanecen en el espacio de trabajo y pueden ser usadas en los
clculos que siguen.
Los archivos.m de funcin aceptan argumentos en la entrada y retornan argumentos en la salida. El nombre del archivo y el
nombre de la funcin deben coincidir.
Para empezar de un clic con el ratn en file, se despliega un
men, elija new y haga un clic y por ltimo clic en M-file, matlab
nos mostrar una ventana como la siguiente:

343

Al que llamar ventana del archivo.m, en sta ventana podemos empezar digitando, en la primera linea:
function y = nombre_archivo( x)
donde y es el argumento de salida y x el argumento de entrada,
tanto x como y pueden ser una matriz, un vector o un nmero
indistintamente.
En la segunda linea puede digitarse un comentario acerca
de lo que hace ste archivo.
Ambos procedimientos tanto para crear un archivo.m de
funcin como el de un archivo.m de guin, es el mismo, as tambin para guardar el archivo.

Ejemplo 7. 16 Suponga que quiere realizar la siguiente tabla de


frecuencias.

fi

Fi

0
1
2
4
5

2
11
11
3
3

2
13
24
27
30

Definir una funcin de distribucin de frecuencias acumuladas de una variable discreta al que llamaremos funcin esklra
Comenzando el procedimiento, con el ratn:
file clic
new clic
M-file clic

344

En la ventana que se muestra digitar:


function f=esklra(x);
% funcin escalera en un intervalo desde 0 hasta M dimensin del vector de frecuencias a,
%donde para cada subintervalo de longitud uno, se asocia
una componente del vector a, por
%decir para x entre 0 y 1 se asocia 2, entre 1 y 2 el 13, etc.
a= [2 13
24
24
27
30];%a es un vector de frecuencias
M=length(a);
for k=1:M-1,
aa=k-1;bb=k;
set=find( aa <= x )&find( x < bb);
f(set)=a(k);
if isempty(f) == 0;
break,
end,
end,
if isempty(f) == 1;
f(1)=a(6);
end
Para guardarlas hacemos lo siguiente con el raton:
file clic
save as clic.
En el espacio nombre del archivo escribir esklra.m (no olvidar la extencin.m) y en el espacio 'guardado en' buscar work,
por ltimo dar un clic con el ratn en guardar.
Para ejecutar estos archivos escribir en la ventana de comandos el nombre del archivo sin la extensin, en este caso
por ser un archivo.m de funcin, es como si se evaluara una
funcin en matlab escribimos en la ventana de comandos esklra(4.5) y dando un enter obtenemos por ejemplo esklra(4.5)=27,
esklra(0.8)=2, etc.

345

Cada vez que modificamos (corregimos) un archivo.m tenemos que avisar a matlab, guardando este archivo del modo
siguiente, con el ratn:
file clic
save clic
Nuevamente ya est listo para su ejecucin
El procedimiento para construir un archivo.m de guin es el
mismo que el de archivo.m de funcin solo se diferencian en la
primera lnea, digite % y luego un comentario acerca de lo que
hace este archivo.m, de modo tal que si se digita en la ventana de
comandos:
help nombre_archivo,nos mostrar este comentario.
Luego de digitado el programa en la ventana del archivo.m,
tiene que guardarlo con un nombre adecuado de modo que nos
sugiera lo que ese archivo resuelve. Para ello en la ventana del
archivo.m de un clic en file, en el men desplegado de un clic en
save as nos mostrar una tercera ventana: guardar como; escribir el nombre del archivo con la extencin.m y buscar matlab
para guardarlo. Ya est listo para ser usado.
Ejemplo Hacer la grfica de la funcin eskalra del ejemplo
anterior.
Comenzamos el proceso abriendo la ventana de archivos.m
para ello con el ratn clic en files, clic en new y por ltimo clic en
M-files, aparecer una ventana en el que digitamos
% para graficar la funcin escalera, necesitamos el archivo
esklra
clear, clf,
for jj=0:1:5;
j=1;
for xx=jj:.01:jj+.99;
ww=esklra(xx);
xxx(j)=xx;
www(j)=ww;

346

j=j+1;
end
hold on
plot(xxx,www)
clear xxx www;
end
hold on;
x=[1 2 4 5];
a= [2 13
24
plot(x,a,'o');
x=[0 1 2 4 5];
a=[2 13 24 27 30];
plot(x,a,'.')
axis([0 6 0 35])
hold off;

27];

Escrito todos los comandos lo guardamos con algn nombre, recuerde: clic en files, clic en save as y reemplazar en Untitle
(por ejemplo) por gr_esc.m, en este caso est listo para ser ejecutado, digitando en la ventana de comandos gr_esc (sin la extensin), nos mostrar el grfico de la escalera.

35
30
25
20
15
10
5
0

347

Ejemplo. Hacer el grfico de una distribucin de frecuencias acumuladas de una variable continua, como la siguiente:
Intervalos
174 -196
196 - 218
218 - 240
240 - 262
262 - 284
284 - 306
306 -328
328 -350

fi

Fi

2
7
10
23
38
11
5
4

2
9
19
42
80
91
96
100

Crear los datos de vectores X e Y. En la ventana de archivos.m


escribimos:
X=[196 218 240 262 284 306 328 350];
Y=[2 9 19 42 80 91 96 100];
plot(X,Y);
hold on
plot(X,Y,'.');
hold off
set(gca,'xtick',X)
set(gca,'ytick',Y)
Lo salvamos con el nombre gr_fre.m, lo llamamos por gr_fre
y nos muestra:
100
96
91
80

42

19
9
2
196

348

219

240

262

284

306

328

360

Ejemplo. Para la misma tabla de frecuencias, hacer el grfico del un polgono de frecuencias absolutas.
clear,clf,
X1=[174 196 196 218 218 240 240 262 262 284 284 306 306
328 328 350];
for k=1:2:15
pt_me((k+1)/2)=(X1(k)+X1(k+1))/2;
end
Y3=[0 2 7 10 23 38 11 5 4 0];
pt_me=[163,pt_me,361];
plot(pt_me,Y3)
hold on
plot(pt_me,Y3,'.')
hold off
X=[163 174 196 218 240 262 284 306 328 350 361];
set(gca,'xtick',X)

40
35
30
25
20
15
10
5
0

163 174 196

218

240

262

284

306

328 350 361

349

S-ar putea să vă placă și