Documente Academic
Documente Profesional
Documente Cultură
LIMA PER
2011
INTRODUCCION
Actualmente las distintas Tcnicas para el anlisis de Datos aplicando modelos Estadsticos son
instrumentos
empleados por
los investigadores en las diferentes
reas cientficas.
Especialmente en las Ciencias de la Conducta que en los ltimos aos han ido aumentando y, ms
concretamente, en la Carrera de Psicologa y Trabajo Social.
Las reas de la Psicologa y Trabajo Social ms utilizadas son: Psicologa experimental, Psicologa
del aprendizaje, Psicologa educacional, Psicologa social, Psicologa Organizacional etc. Hasta en
la Psicologa clnica que exige un dominio profundo de las tcnicas estadsticas.
Al terminar el curso, el alumno aprender el manejo y la aplicacin de las diversas tcnicas de
anlisis mas utilizadas que puede aplicar al realizar estudios de casos, as como tambin
desarrollara un espritu critico ya que el mismo deducir y decidir cual es la tcnica de anlisis
ideal en una determinada situacin.
Cabe sealar, para llevar a cabo el Curso de Tcnicas Multivariadas de Anlisis, es necesario
contar con una calculadora cientfica y mas que todo con los programas de Microsoft Excel y el
SPSS, para trabajar con las tcnicas y realizar el anlisis de resultados.
Los Autores
UNIDAD I
ANLISIS E INTERPRETACIN DE
DATOS
1.
2.
3.
4.
5.
6.
5. Asimetra y Curtosis.
6. Correlacin (relaciones lineales entre variables, diagrama de dispersin,
correlacin entre dos conjuntos de datos agrupados en clases).
7. Regresin lineal simple (correlacin por rangos, coeficiente de correlacin por
rangos, caso de rangos empatados o repetidos).
1. Frecuencia
Ejemplo 1:
Resiliencia:
10
2
87
11
2
84
10
0
90
9
7
8
5
9
8
8
8
9
6
10
4
90
93
10
4
98
90
10
1
97
10
6
95
10
8
80
93
87
88
98
82
98
94
10
5
84
98
93
82
10
5
82
92
11
4
95
10
3
75
10
1
93
10
0
8
2
8
4
8
4
8
5
8
7
8
7
8
8
8
8
9
0
9
0
9
0
91
9
2
9
3
9
3
9
3
9
3
9
4
9
5
9
5
9
6
9
6
9
7
9
7
9
8
98
98
10
0
10
0
101
98
101
10
0
10
2
98
10
3
10
4
10
4
10
4
10
5
10
5
10
6
10
8
112
114
Al ordenar los datos podemos distinguir que hay un valor menor o valor mnimo Vmin, que
en nuestro caso es 73, y un valor mayor o valor mximo Vmax, que en nuestro caso es
114, adems vemos que hay datos que se repiten.
Solucin:
1 paso: Cuntas clases o intervalos necesitamos?
k = 1 + 3.3 log n
k = 1 + 3.3 log 50
k = 1 + 3.3 (1.69)
k = 6.58
C = I/k
C=6
Vmin + C
73 + 6 = 79
Intervalos
73 79
79 85
85 91
91 97
97 103
103 109
109 115
Conteo
Frecuencia (fi)
73 79
76
II
79 85
82
IIIII I
85 91
88
IIIII III
91 97
94
IIIII IIIII I
11
97 103
100
13
103 109
106
IIIII III
109 115
112
II
2
n = 50
NOTA: la parte del conteo es referencial, a esta tabla se le conoce como tabla de
distribucin de frecuencias absolutas.
Ejemplo 2:
Inteligencias Mltiples
Luego de una investigacin cognitiva, da fe de la
medida en que los estudiantes poseen diferentes
mentalidades y por ello aprenden, memorizan,
realizan y comprenden de modos diferentes.
Existen suficientes pruebas positivas de que
algunas personas adoptan una aproximacin
lingstica al aprendizaje, mientras que otras
prefieren un rumbo espacial o cuantitativo.
Igualmente algunos estudiantes obtienen mejores
resultados cuando se les pide que manejen smbolos
de clases diversas, mientras que otros estn mejor
capacitados para desplegar su comprensin mediante demostraciones prcticas o a
travs de interacciones con otros individuos.
Todos los seres humanos son capaces de conocer el mundo de siete modos diferentes
.Segn el anlisis de las siete inteligencias todos somos capaces de conocer el mundo de
a travs del lenguaje, del anlisis lgico-matemtico, de la representacin espacial, del
pensamiento musical, del uso del cuerpo para resolver problemas o hacer cosas, de una
comprensin de los dems individuos y de una comprensin de nosotros mismos. Donde
los individuos se diferencian es en la intensidad de estas inteligencias y en las formas en
que recurre a esas mismas inteligencias y se las combina para llevar a cabo diferentes
labores, para solucionar problemas diversos y progresar en distintos mbitos.
La facultad de Psicologa de la universidad Inca Garcilaso de la Vega ha evaluado
mediante un test de inteligencias mltiples a 40 alumnos del tercer ciclo del turno noche
para medir el nivel de desarrollo de la inteligencia intrapersonal, en la tabla se muestran
los puntajes obtenidos:
13
14
16
14
16
16
15
12
17
14
22
14
13
14
13
13
14
17
14
14
14
13
16
13
15
12
14
11
15
15
14
15
15
14
14
15
14
16
13
12
13
13
13
13
13
13
14
14
14
14
14
14
14
14
14
14
14
14
14
14
15
15
15
15
15
15
15
16
16
16
16
16
17
17
22
Al ordenar los datos podemos distinguir que hay un valor menor o valor mnimo Vmin, que
en nuestro caso es 11, y un valor mayor o valor mximo Vmax, que en nuestro caso es 22,
adems vemos que hay datos que se repiten.
Existen tambin relaciones que no se aprecian y para poderlas percibir se clasifican
todos los datos, que en nuestro caso son 40, en grupos o conjuntos llamados intervalos o
clases, para ello realizamos lo siguiente:
1 paso: Cuntas clases o intervalos necesitamos?
Usamos la frmula de sturges
k = 1 + 3.3 log n
Donde: k = nmero de intervalos o clases.
n = nmero de datos (tamao de la muestra)
Reemplazando:
k = 1 + 3.3 log
k = 1 + 3.3 ( )
k =_______
Luego redondeamos el resultado siempre al entero inmediato superior.
k = _______
Con lo que, para este caso entonces, obtenemos 7 intervalos.
2 paso: Verificar si existe algn exceso en la distribucin de datos a realizar y
10
Para este caso distribuiremos el exceso con + 1 para el Vmax y -1 para el Vmin, y
luego comenzamos a elaborar la matriz de la distribucin de frecuencias.
NOTA: de haber un exceso, la mitad entera mayor del exceso, se le suma al valor
mximo de los datos (Vmax), obteniendo as un nuevo Vmax, el cual se usara en la
construccin del intervalo y la mitad entera menor del exceso, se le resta al valor mnimo
de los datos (Vmin), obteniendo un nuevo Vmin, el cual se usara en la construccin de los
intervalos.
3 paso: Construir los intervalos.
Tomamos el valor mnimo de los datos (Vmin) que para nuestro caso es ___ y le sumamos
la amplitud del intervalo que hallamos anteriormente (C), es decir:
Vmin + C __ + ___ = ___
De este modo obtenemos el primer intervalo: ___ ___
Y as sucesivamente complete la siguiente tabla:
Intervalos
__ __
__ __
__ __
__ __
__ __
__ __
__ __
4 paso: Marca de clase.
Consiste en hacer que cada uno de los datos que se hallan dentro de un mismo intervalo,
estn representados por un mismo valor, esto se denomina marca de clase, las cuales se
obtienen promediando los extremos de cada intervalo.
11
Marca de clase
Conteo
Frecuencia
(xi)
(fi)
n = 40
NOTA: la parte del conteo es referencial, a esta tabla se le conoce como tabla de
distribucin de frecuencias absolutas.
f/n
f = frecuencia absoluta.
n = nmero total de elementos (tamao de la muestra).
f% = (f / n) * 100
12
Expuesto en el ejemplo anterior, sobre el test tomado a 40 alumnos del tercer ciclo,
se obtuvo la siguiente tabla de distribucin de frecuencias:
Intervalos
10
12
14
16
18
20
22
Frecuencia (fi)
1
10
21
7
0
0
1
12
14
16
18
20
22
24
n = 40
Se pide hallar:
a. Frecuencia relativa.
b. Frecuencia porcentual.
c. Frecuencia acumulada.
d. Frecuencia porcentual acumulada.
Intervalos
10 12
12 14
14 16
16 18
18 20
20 22
22 24
f(i)
1
10
21
7
0
0
1
n = 40
f/n
0,025
0,250
0,525
0,175
0
0
0,025
f/n = 1
f%
2,5
25,0
52,5
17,5
0
0
2,5
f% = 100
F
1
11
32
39
39
39
40
F%
2,5
27,5
80
97,5
97,5
97,5
100
Interpretacin:
13
Ejercicio 1:
Estrs laboral
El estrs laboral se conceptualiza como el conjunto de
fenmenos que se suceden en el organismo del
trabajador con la participacin de los agentes
estresantes lesivos derivados directamente del trabajo
o que con motivo de este, pueden afectar la salud del
trabajador.
La empresa INKA TEXT dedicada al rubro textil ha
evaluado a su personal de la planta ubicada en la ciudad
de Arequipa, donde se midi el nivel de stress a 50
obreros del rea de produccin que est expresado en
porcentajes:
Se necesita construir una tabla de distribucin de
frecuencias
51
61
50
60
45
69
62
54
61
51
54
79
63
43
80
97
64
62
59
54
60
73
70
77
72
54
49
81
52
60
59
65
61
80
64
58
52
43
67
59
60
50
64
90
40
60
65
57
60
60
14
INGRESO DE DATOS
El ingreso de datos por medio del teclado es muy similar al uso de una mquina de
escribir, pero se deben tener en cuenta:
Los datos slo se ingresan en la celda activa.
Excel guardar en la celda el ltimo dato digitado.
FORMULAS
Es la secuencia de valores, referencias de celdas, nombres, funciones u operaciones que
producen un nuevo valor a partir de valores existentes.
Toda formula debe empezar con el signo igual (=), no se digitan espacios en blancos en
las operaciones.
15
A
Suma
Resta
Multiplicacin
Divisin
= B1
= B1
= B1
= B1
B
+ C1
- C1
* C1
/ C1
= (B1 + C1) / 2
= (3 * (B1 + C1) / 2) - 10
= (B1 + C1) / 2
Fija la celda
Ejm: $E$7
FUNCIONES BSICAS
FUNCION
FORMATO
SUMA
=SUMA(rango de celdas)
MAXIMO
=MAX(rango de celdas)
MINIMO
=MIN(rango de celdas)
DEFINICION
Suma el contenido de las celdas
comprendidas dentro del rango.
Halla el nmero mximo entre el
contenido de las celdas comprendidas
dentro del rango.
Halla el nmero mnimo entre el
contenido de las celdas comprendidas
dentro del rango.
16
PRODUCTO
=PRODUCTO(rango de celdas)
LOG
=LOG (celda)
POTENCIA
=POTENCIA(celda, potencia)
CONTAR
=CONTAR(rango de celdas)
SI
2. Representaciones Grficas
Las representaciones grficas cumplen un rol muy importante, puesto que basta mirar
una grfica para entender con facilidad los cambios en las variables involucradas.
HISTOGRAMAS DE FRECUENCIAS.Para realizar este grfico utilizamos un sistema de coordenadas bidimensionales; se
acostumbra colocar los valores de los intervalos en el eje horizontal y en el eje vertical
se colocan las frecuencias absolutas.
El histograma de frecuencias se representa mediante rectngulos cuyas bases son cada
uno de los intervalos de una distribucin de frecuencias que se encuentran localizadas en
el eje horizontal y cuyas alturas son las respectivas frecuencias absolutas de la tabla de
distribucin.
Ejemplo: con la siguiente tabla de frecuencias:
Intervalos
73 79
79 85
85 91
91 97
97 103
103 109
109 115
Frecuencia (fi)
2
6
8
11
13
8
2
17
Histograma de frecuencias
14
12
10
(fi)
8
6
4
2
0
73-79
79-85
85-91
91-97
97-103
103-109
109-115
Intervalos
POLIGONO DE FRECUENCIAS.Procedemos de manera semejante a la realizada por el histograma de frecuencias en lo
que se refiere a la determinacin de la escala vertical y horizontal.
Para este grfico las bases son cada uno de las marcas de clase de la distribucin de
frecuencias, es decir las localizadas en el eje horizontal y las alturas son las respectivas
frecuencias absolutas de la tabla de distribucin.
EJEMPLO: con los datos que realizamos el grafico del histograma, realizamos ahora el
polgono de frecuencias, este grfico suavizado, lo llamamos curva normal.
Polgono de frecuencias
14
12
10
(fi)
8
6
4
2
0
76
82
88
94
Marca de clase
18
100
106
112
Curva normal
14
12
10
8
6
4
2
0
76
82
88
94
100
106
112
GRAFICOS CIRCULARES.Por medio de sectores circulares, tambin se representan las categoras de las variables
cualitativas, que nos muestran el rea, cantidad y/o porcentaje que este representa.
EJEMPLO: con los siguientes resultados:
coeficiente
alto
medio
bajo
personas
10
32
8
Realizamos un grfico circular para apreciar el porcentaje que representa cada uno.
Personas
16%
alto
20%
m edio
64%
19
bajo
A)
1.-
Crear
la
tabla,
la
distribucin
de
Intervalos
20
30
30
40
40
50
50
60
60
70
70
80
Frecuencia
(f)
2
4
7
5
3
1
columnas.
4.- En seguida se mostrar el siguiente grfico, el cual debe ser modificado para dar la
forma de un histograma de frecuencias.
90
80
70
60
Intervalos
50
40
30
20
10
0
1
20
a) En el primer paso se debe dar un clic derecho sobre el grfico y elegir la opcin:
Seleccionar datos
b) En la ventana emergente se debe quitar todos los elementos del lado izquierdo
excepto la frecuencia que es fi.
d)
Visualizar
el
grfico.
e)
Finalmente
si
desea puede mover el grfico a una hoja independiente, dando clic derecho sobre
el grfico seleccionar la opcin Mover grfico.
B)
21
Xi
25
35
45
55
65
75
f
2
4
7
5
3
1
80
70
60
50
Xi
40
30
20
10
0
1
4.-
En
seguida
se
mostrar el siguiente grfico, el cual debe ser modificado para dar la forma de un
polgono de frecuencias.
a) En el primer paso se debe dar un clic derecho sobre el grfico y elegir la opcin:
Seleccionar datos
22
b) En la ventana emergente se debe quitar todos los elementos del lado izquierdo
excepto la frecuencia que es fi.
23
Polgono de Frecuencias
8
7
6
5
4
3
2
1
0
d)
25
35
45
55
65
75
Visualizar
el
grfico.
e) Finalmente si desea puede mover el grfico a una hoja independiente, dando clic
derecho sobre el grfico seleccionar la opcin Mover grfico.
UNIDAD II
MEDIDAS DE INVESTIGACIN
1. Clculos de las medidas de tendencia central media aritmtica,
mediana y moda con Excel como herramienta.
2. Medidas de posicin: cuartiles, deciles y percentiles.
24
25
FUNCION
PROMEDIO
FORMATO
DEFINICION
=PROMEDIO(rango de celdas)
FUNCION
MEDIANA
FORMATO
DEFINICION
=MEDIANA(rango de celdas)
Halla la mediana
dentro del rango.
comprendidas
Usos de la Mediana:
1.- Se prefiere a la mediana como medida de concentracin, cuando en los datos existen
valores extremos muy grandes o muy pequeos, es decir valores muy altos o muy bajos
que obligan a la media aritmtica a desplazarse a la derecha o a la izquierda del punto
medio de la distribucin.
En cambio la mediana seala siempre el punto que divide los datos en dos partes
iguales: 50% a un lado y 50% al otro lado, sin importar donde se halla ese punto.
2.- Cuando simplemente necesitamos conocer si los datos que nos interesan estn dentro
de la mitad superior o inferior de la distribucin de los datos y no tiene importancia
saber particularmente su alejamiento al centro de la distribucin.
26
FUNCION
MODA
FORMATO
DEFINICION
Halla la moda comprendida dentro
del rango.
=MODA(rango de celdas)
Usos de la Moda:
1.- Cuando se necesita una estimacin rpida de la tendencia central.
2.- Cuando se desea conocer el punto de mxima frecuencia en una distribucin
asimtrica de datos, esto es el valor ms repetido de un conjunto de datos.
Q1
25%
Q2
25%
Q3
25%
50%
75%
Q1: es el valor que representa de las observaciones.
Q3: es el valor que representa de as observaciones.
FUNCION
CUARTIL
FORMATO
DEFINICION
=CUARTIL(rango de celdas;
n de cuartil)
4. Medidas de Dispersin
27
FUNCION
FORMATO
DESVICIN
ESTANDAR
DEFINICION
=DESVEST(rango de celdas)
FUNCION
FORMATO
VARIANZA
DEFINICION
=VAR(rango de celdas)
EJERCICIOS DE APLICACIN
Ejercicio N 2: La Hiperactividad infantil es un trastorno de
conducta de origen neurolgico. Su incidencia es de un 3% a un
5% de la poblacin infantil. Sucede ms en nios que en nias.
Un 25% de los nios hiperactivos incurren en actos delictivos,
abusan del alcohol, drogas. El principal trastorno de los nios
hiperactivos es el "Dficit de atencin" y no el "Exceso de
actividad motora". El "Dficit de atencin" habitualmente persiste y el "Exceso de
actividad motora" desaparece. No todos los nios hiperactivos mantienen las mismas
caractersticas pero las dificultades de atencin, impulsividad e hiperactividad son
rasgos comunes que presentan todos los nios. En el colegio Reyes Rojos se aplic una
prueba para medir el nivel de hiperactividad de los nios del 4to grado de primaria y los
resultados de las evaluaciones aplicadas, se muestran a continuacin:
64
52
63
63
1.
59
43
87
48
75
67
39
47
36
61
65
53
74
77
72
55
63
68
52
75
81
38
72
59
62
75
50
70
95
69
38
84
82
79
53
95
73
75
82
87
44
66
58
63
69
76
89
43
30
84
73
59
a)
28
1.
25
46
44
24
26
35
22
27
31
34
26
23
31
38
28
24
30
43
47
25
34
19
30
28
37
25
34
29
42
28
36
29
41
30
36
30
19
46
40
30
26
33
45
29
26
37
20
28
30
35
17
46
3.
Elaborar un grfico circular (en otra hoja) que muestre el nivel de estrs, sabiendo
el bajo nivel se encuentra de 0 a 25, el nivel moderado de 26 a 40 y el alto nivel de
41 a 60. Responder: Qu porcentaje del personal de seguridad se aprecia en cada
nivel?
29
..............................................................................................................................................................
..............................................................................................................................................................
..............................................................................................................................................................
4.
Hallar:
a. la media (promedio (X)
b. la mediana (Me)
c. la moda (Mo).
d. la desviacin estndar (S)
e. la varianza (var)
..
....
Grupo A:
CV = (10/48) * 100
Grupo B:
CV = (10/36.5) * 100
Grupo C:
CV = (10/29.8) * 100
= 20.83%
= 27.40%
= 33.56%
30
Media Aritmtica
39.6
42.8
36.5
Desviacin estndar
9.23
8.99
9.21
= 23.08 %
Grupo Comas
= 21.36 %
: CV= (9.14/42.8)*100
EJERCICIOS DE APLICACIN
Ejercicio N 4: Formar con los alumnos de clase 2 muestras llamadas Grupo 1 y Grupo
2 del mismo tamao y aplicar el Test de inteligencia emocional que el profesor
proporcione. Construir la tabla de frecuencias para cada grupo. Responder a las
siguientes preguntas:
a. En qu intervalo se encuentra el mayor nmero de estudiantes en ambos grupos?
____________________________________________________________
___________________________________________________________
b. Qu porcentaje representa cada uno de ellos?
____________________________________________________________
___________________________________________________________
31
32
UNIDAD III
GENERACIN DE CLCULOS Y
ANLISIS DE RESULTADOS
1. Inferencia estadstica para la investigacin
2. SPSS como herramienta de anlisis e interpretacin y entorno de trabajo de
SPSS.
3. Tratamiento de los datos o valores perdidos.
4. Generacin de clculos con la calculadora de SPSS.
5. Transformacin de datos.
6. Recodificacin de variables o segmentacin de rangos.
7. Ordenar y agrupar casos.
8. Desarrollo de casos y ejercicios aplicativos prcticos.
33
Muestra (n)
s2
p
Parmetros
X1
X2
X3
.
.
.
Xn
Valores Estadsticos
Xi: es una variable subindicada, se utiliza para representar a la variable y sus diferentes
valores observados.
Valores Estadsticos: son medidas estadsticas que se calculan para una variable en
base de los datos provenientes de la muestra. Por ejemplo:
Promedio = 44.5
Mediana me = 60.5 Kg
Desviacin estndar S = 4.5
: La edad promedio
: La mediana del peso de los alumnos
: La variabilidad promedio del rendimiento
Parmetro: son medidas estadsticas que se calculan para una variable en base de los
datos provenientes de una poblacin. Por ejemplo:
Promedio o media
Varianza
Proporcin
: El promedio de la edad
: La varianza de una poblacin
Observaciones:
o Las medidas estadsticas asumen las mismas unidades de medida de la variable en
estudio.
o Slo pueden ser calculadas para variables cuantitativas a excepcin de la moda que
tambin se calcula para una variable cualitativa.
34
o Cuando los datos se muestran en una tabla de frecuencias de una variable continua
(intervalo de clases), entonces las medidas estadsticas calculadas son aproximadas.
Poblacin: es un conjunto de unidades elementales, que poseen caractersticas similares.
Generalmente se describen en trminos de espacio y tiempo. Ejemplo: Los alumnos
egresados de la universidad Inca Garcilaso de la Vega.
Muestra: es un subconjunto de la poblacin, se especfica como un tamao de la muestra.
Ejemplo: 50 alumnos egresados tomados aleatoriamente.
Unidad elemental: es un elemento de la poblacin a la cual se le va a registrar un
conjunto de variables. Ejemplo: Un alumno egresado.
Variables: son caractersticas que se registran de las unidades elementales de una
muestra o una poblacin. Las variables pueden ser definidas como:
Variables Cuantitativas que indican cantidad o nmero, por ejemplo:
o Rendimiento
: 15
o Edad
: 40 aos
o Peso
: 72 Kg.
Variables Cualitativas que indican un atributo o categora, por ejemplo:
o Sexo
: Femenino
o Estado civil
: Soltero
o Ocupacin
: Psiclogo
Poblacin
Muestra
35
36
300
100
Hig 500
Discreto
52
6. Columnas: (columna)
Indica el ancho de la columna en la Vista de datos.
7. Alineacin: (alineacin)
Es la alineacin del dato dentro de la celda (Izquierda, Centro y Derecha).
8. Medida: (medida)
Indica el tipo de medida estadstica que emplear ese dato:
a). Nominal: para variables que tendrn valores cualitativos, estos para poder ser
medidos (measure) deben ser de tipo nominal. Por ejemplo: el estado civil (soltero,
casado, viudo), el sexo (masculino, femenino).
b). Ordinal: para variables cuyo valor representa algn orden o posicin en
particular. Por ejemplo: el grado de instruccin (primaria, secundaria,
superior, post grado), etapas (nio, joven, adulto).
c). Escala: para variables cuyo valor es netamente cuantitativas, representan
valores del tipo, netamente numricos. Por ejemplo: la edad (15, 28, 37),
los sueldos (1500, 2100, 845, etc).
INGRESO DE DATOS
Una vez que se definieron las variables en el visor Variable, pasamos al visor Data, en
este lugar, notamos que aparece en las columnas, las variables registradas o
declaradas
anteriormente,
comenzamos
entonces
digitar
los
valores
Men Analizar.
2.
Estadsticos descriptivos.
3.
Frecuencias
4.
37
6.
7.
8.
GENERACIN DE GRAFICOS
1.
Men Analizar.
2.
Estadsticos descriptivos.
3.
Frecuencias.
4.
5.
6.
7.
EJERCICIO A:
Se realizo una encuesta tomando una muestra aleatoria de las familias
del nivel socioeconmico B. La variable de medicin es el nmero de
personas fumadoras por familia. Los resultados fueron los siguientes:
2
2
2
3
1
1
3
2
2
3
2
2
1
3
4
2
1
2
1
3
1
1
1
2
2
2
1
1
4
2
4
3
1
2
2
2
4
3
1
1
1
2
2
4
3
38
1
2
2
1
3
Grfico sectores.
Variable:
Nombre: num_fumadores.
Tipo: numrico.
Etiqueta: numero de fumadores.
Valores: ninguno.
Perdidos: ninguno.
Columnas: 12.
Alineacin: centrado.
Medida: escala.
EJERCICIO B:
En un estudio de investigacin sobre como el estado civil
influye en el rendimiento acadmico de los alumnos
universitarios, debido a que sus responsabilidades en el
hogar o problemas familiares no permiten un optimo
desempeo acadmico. Para el estudio se describe que la
muestra est compuesta por alumnos de universidades
privadas y nacionales. Se debe cuantificar para el estudio
estadstico el estado civil y el nivel educativo. Se
obtuvieron los siguientes resultados:
Cod_encuesta
A1
A2
A3
A4
A5
A6
A7
A8
A9
Estado_civil
Soltero
Casado
Soltero
Soltero
Divorciado
Casado
Soltero
Viudo
Casado
Nivel_educativo
Superior
Secundaria
Postgrado
Superior
Secundaria
Postgrado
Superior
Postgrado
Superior
Declarando variables:
1) Nombre
:
Tipo
:
Etiqueta :
Valores
39
Edad
27
32
22
28
32
37
31
42
19
Pensin
3500
400
750
1500
300
500
2000
500
1000
Universidad
Privada
Nacional
Nacional
Privada
Nacional
Nacional
Privada
Nacional
Privada
Perdidos :
Columnas :
Alineacin :
Medida :
2) Nombre
:
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :
3) Nombre
:
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :
4) Nombre
:
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :
5) Nombre
:
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :
6) Nombre
Tipo
:
:
40
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :
Realizar las siguientes actividades:
Generar la tabla de frecuencias de las variables Estado civil, Nivel educativo, Edad y
Pensin.
Generar el histograma de las mismas variables.
Mostrar la media, mediana y moda de cada una de ellas.
Edad
25
20
40
250
51
39
35
23
24
18
Parte 1)
41
4 = no responde.
Y en su columna Perdidos registrar el 4 (ya que es el valor perdido).
En la variable Edad, declare todo normalmente, pero:
En su columna Perdidos registrar el 250 (ya que es el valor perdido).
Parte 2)
Rpta: ...................................................................................................................................................
..............................................................................................................................................................
.
OTROS ANLISIS:
a)
El promedio de las edades considerando como valor perdido el 250 es
= ....................
b)
Suponiendo que asumimos que hubo un error de digitacin y la edad 250 es
25 (es decir lo corregimos), calculamos nuevamente el promedio de las edades y
obtenemos como media = .....................
c)
Si no declaramos valores perdidos, nuestra media ser = ..................
Observacin: ...........................................................................................................................................
APLICANDO SPSS
TRANSFORMANDO DATOS (Men Transformar)
Transformar, contiene funciones y procedimientos modulares que permiten la
manipulacin y modificacin de los datos.
La opcin Calcular variable, permite realizar clculos y operaciones en las variables,
obteniendo nuevas variables.
Ejemplo: Si tenemos los siguientes datos
Peso
Talla
58,5
1,45
63,2
1,67
70,8
1,55
Y necesitamos hallar el ndice de masa corporal (Imc) de cada uno, para lo cual sabemos
que:
Podemos con la opcin Calcular variable, realizar dicho calculo (colocando la formula
correspondiente) y automticamente nos generara una nueva variable Imc, con los
resultados respectivos.
Peso
58,5
63,2
Talla
1,45
1,67
42
Imc
40,34
37,84
70,8
1,55
45,67
Variable destino:
Aqu, se coloca el nombre que llevara la nueva columna, es decir la nueva variable que se
generara con la formula, funcin u otros que aplique.
Tipo y etiqueta:
Aqu, se coloca el tipo de dato que tendr la nueva variable y en Etiqueta o etiqueta, se
coloca la referencia o nombre completo de la variable.
Expresiones numricas:
Aqu, se digitan las formulas, u operaciones a realizar; el resultado se mostrar en la
variable que declaro en el sector correspondiente.
Calculadora del SPSS:
A)
Operadores aritmticos (+, -, *, /, ** (potencia)).
B)
Operadores de comparacin (<, >, <=, >=, =, ~= (diferente)).
C)
Operadores lgicos (& (y), | (o), ~(negacin)).
D)
Operador de asociacin ( ).
E)
Teclado numrico.
Lista de funciones del SPSS:
SPSS tiene ms de 70 funciones, por ejemplo Mean (media), pero esta funcin calcula el
promedio de una fila, mas no el promedio de la muestra.
Si lo que desea es el promedio muestral, debe realizar los clculos como se indica en los
Clculos de medidas de tendencia central.
43
El botn Si la opcin:
Permite ingresar al mdulo donde se define las condiciones.
EJERCICIO D:
Registrar los siguientes datos:
Nombre
Practica_1
Practica_2
Practica_3
Ex_final
Jose
18
12
17
16
Carla
14
9
16
10
Beto
7
14
12
12
Pedro
11
8
10
12
Obtener las columnas, o nuevas variables:
a) Promedio de prcticas (pp).
b) Nota final (nf)
Donde: pp = (practica_1 + practica_2 + practica_3) / 3
nf = (pp + 2 * ex_final) / 3
Solucin a):
1. Men transformar.
2. Calcular variable.
3. En Variable destino (Target Variable), colocar pp.
4. En Tipo etiqueta, colocar en Tipo: numrico, y en Etiqueta: promedio de practicas.
5. En expresiones numricas, digitar: (practica_1 + practica_2 + practica_3) / 3
6. Presionar Aceptar.
Solucin b):
1.
Men transformar.
2.
Calcular variable.
3.
Presionar el botn Restablecer, para que se borren todos los
datos y poder registrar los nuevos valores.
4.
En Variable destino, colocar nf.
5.
En Tipo etiqueta, colocar en Tipo: numrico, y en Etiqueta: nota
final.
6.
En expresiones numricas, digitar: (pp + (2 * ex_final)) / 3
7.
Presionar Aceptar.
EJERCICIO E:
Usando la tabla del ejercicio anterior, se desea obtener la variable X cuyo valor ser la
desviacin de la variable ex_final respecto a su media, y la variable Y, cuyo valor ser el
cuadrado de dichas desviaciones obtenidas.
Solucin para hallar la variable X:
1.
Calcular la media de la variable ex_final.
Men Anlisis.
Estadsticos descriptivos.
44
2.
3.
4.
5.
6.
7.
8.
Frecuencias.
Seleccionamos y pasamos la variable ex_final.
Presionamos el botn estadsticos.
En la ventana que aparece, marcamos Media.
Presionamos Aceptar.
Volvemos a presionar Aceptar.
En los resultamos que se muestran, apuntar, el valor que se obtuvo como
media.
Men transformar.
Calcular variable.
Presionar el botn Restablecer, para que se borren todos los
datos y poder registrar los nuevos valores.
En Variable destino colocar X.
En Tipo etiqueta colocar en Tipo: numrico, y en Etiqueta:
desviacin.
En expresiones numricas, calculamos la diferencia (resta) del
ex_final menos su media (que acabamos de hallar), esto nos indicar cuanto se
aleja la nota del ex_final de su respectiva media, es decir digitamos: ex_final
media.
Presionar Aceptar.
45
7.
Presionar Aceptar.
NOTA: como ya se menciono anteriormente, Mean como funcin, calcula el promedio de
las filas de datos, mas no de las columnas. En cambio el Media que se obtiene de las
frecuencias, si es el promedio de columnas.
RECODIFICACION DE VARIABLES (Segmentacin en rangos)
Permite establecer cdigos a criterios en particular del analista, con propsitos
especficos.
Por ejemplo: Se tiene la variable edad; esta variable se puede segmentar en estratos,
tomando un criterio en particular, es decir puede ser:
Edades: 8, 9, 9, 10, 12, 14, 16, 21, 21, 22, 23, 25, 27, 28, 30, 30, 32, 34
Cdigo
1
2
3
Una vez definida la variable cdigo, esta pude asumir valores, si el analista lo desea, por
ejemplo, en vez que figure 1,2,3 puede colocar niveles o etapas, donde 1=nio, 2=joven,
3=adulto:
Edades
Nivel
Desde la edad mas baja hasta 14
Nio
15 25
Joven
26 mas
Adulto
EJERCICIO G:
Registrar los siguientes datos:
Nombre
Turno
Sueldo
Fernando
Maana
500
Carlos
Noche
1500
Pedro
Noche
780
Vanessa
Maana
850
Alicia
Maana
980
Dora
Noche
955
Augusto
Maana
1200
Recodificar la variable sueldo en una nueva variable llamada Rango_sueldo, del siguiente
modo:
Sueldo
Rango
Desde el sueldo mas bajo hasta 800
1
801 1000
2
46
1001 mas
Solucin:
1. Menu transformar.
2. Seleccione Recodificar en distintas variables.
3. En la ventana que se muestra, seleccionar la variable a segmentar, en este caso es
la variable Sueldo y agregarla al siguiente cuadro.
4. En Variable de resultado
Se coloca el nombre a la nueva variable, la cual tendr los rangos del sueldo.
Nombre
Rango_sueldo
5. Presionar el botn Cambiar.
6. Presionar el botn Valores antiguos y nuevos.
7. Marcar:
Rango, INFERIOR hasta valor:
800
801
hasta
1000
2
1001
47
Si ahora desea que los rangos obtenidos con cdigos (1,2 y 3) cambien a Valores por
ejemplo: 1=bajo, 2=medio, 3=alto, debe modificar en la ficha Vista de Variables, los
Valores correspondientes a la nueva variable obtenida, rango_sueldo.
EJERCICIO H:
Registrar los siguientes datos:
Cdigo
Nive_Social
Nro_Hijos
A01
A02
A03
A04
A05
A06
2
4
3
1
1
5
A
C
B
A
B
C
Ingreso_familia
r
2500
800
1200
3500
1500
600
EJERCICIO I:
Registrar los siguientes datos:
Cdigo
Sexo
Talla
Peso
1
Femenino
1.59
50
2
Masculino
1.60
65
3
Masculino
1.43
45
4
Femenino
1.33
37
5
Femenino
1.70
65
6
Masculino
1.65
70
7
Femenino
1.74
68
8
Femenino
1.62
55
9
Femenino
1.55
67
Considerar la variable Talla, para establecer 2 segmentos en una nueva variable llamada
Rango_Talla (considere usted cuales son los valores que tomara cada uno de los rangos).
48
Prom_eda
d
20
24
Num_afectad
os
2
3
Solucin:
1.
Menu Datos.
2.
Seleccionar Agregar.
3.
En la ventana, seleccionar la variable a agrupar, que en este caso es Ciclo y la
pasamos a la seccin: Variables de segmentacin.
4.
Seleccionamos ahora, el dato a calcular de la primera columna, y la agregamos a la
seccin: Variables agregadas, sobre este dato se realizarn los clculos. Para
nuestro ejercicio ser la variable Edad.
5.
Presionamos el botn Funcin para seleccionar la funcin a aplicar, mrquela y
presione el botn Continuar. Nosotros seleccionaremos de la lista de funciones
Media.
6.
Marque: Nmero de casos: (Guardar el nmero de casos de la variable agrupada
en la variable:)
49
Sueldo
2500
3500
1500
500
1200
800
600
en
el escritorio
como:
en
el
como:
escritorio
en el escritorio como:
en el escritorio como:
EJERCICIO K:
Considerando el archivo de datos del EJERCICIO I, calcule lo siguiente:
a) Talla mxima por sexo.
b) Peso mnimo por sexo.
c) Promedio de tallas por sexo.
EJERCICIO L:
En un estudio de investigacin sobre cmo el cargo influye en el elevado nivel de estrs
laboral de los trabajadores, debido a que la cantidad de tareas a realizar en las
diferentes reas no permiten un ptimo desempeo laboral. Para el estudio se describe
que la muestra est compuesta por trabajadores de diferentes sexos. Las notas
50
Cdigo
TA1
TA2
TA3
TA4
TA5
TA6
TA7
TA8
TA9
Cargo
Administrativo
Obrero
Administrativo
Administrativo
Obrero
Obrero
Administrativo
No responde
Obrero
Religin profesada
Edad
catlica
evanglica
catlica
evanglica
catlica
evanglica
catlica
evanglica
No responde
27
32
22
38
32
37
31
142
19
Declarando variables:
1) Nombre :
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :
2) Nombre :
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :
3) Nombre :
Tipo
:
Etiqueta :
Valores
51
Notas de
evaluacin
18
12
9
4
32
12
20
10
15
Sexo
Femenino
Masculino
Femenino
Masculino
Femenino
Masculino
Femenino
Femenino
Masculino
Perdidos :
Columnas :
Alineacin :
Medida :
4) Nombre :
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :
5) Nombre :
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :
6) Nombre :
Tipo
:
Etiqueta :
Valores :
Perdidos :
Columnas :
Alineacin :
Medida :
Realizar las siguientes actividades:
Se debe calcular la nueva nota del trabajador sabiendo que todos han recibido un
punto adicional sobre su evaluacin.
52
Cdigo
1
11 16
17 mas
Donde 1 es Desaprobado, 2 es Regular y 3 Sobresaliente
2
3
53
UNIDAD IV
TCNICAS DE ANLISIS
MULTIVARIADAS
1.
2.
3.
4.
5.
6.
54
55
2.2) Relacin entre individuos: Existe relacin entre individuos si alguno de ellos son
semejantes entre s.
Ejemplo: Suponga que se evalan diferentes tipos de cervezas respecto a su nivel de
aceptacin y se miden, por ejemplo, los consumos de las mismas para diferentes
grupos de edades, se podra esperar que las cervezas claras y oscuras tengan algn
tipo de relacin, o que los tipos de cervezas sean totalmente diferentes.
En los mtodos multivariados, se supone que las variables estn correlacionadas, pero
las observaciones sobre los individuos son independientes. Generalmente se supone
tambin que el conjunto de variables que intervienen en el anlisis poseen una
distribucin normal multivariada. Esta suposicin permite que el anlisis multivariado
se desarrolle paralelamente al correspondiente anlisis univariado basado en una
distribucin normal.
Clasificacin de los mtodos multivariados:
1) Dirigidas o motivadas por las variables: se enfocan en las relaciones entre
variables. Ejemplos: matrices de correlacin, anlisis de componentes principales,
anlisis de factores y anlisis de regresin.
2) Dirigidas o motivadas por los individuos: se enfocan en las relaciones entre
individuos. Ejemplos: anlisis discriminante, anlisis de conglomerados y anlisis
multivariado de varianza.
56
ANLISIS DE REGRESIN
Sean 2 variables, en las cuales una depende de la otra.
x variable independiente.
y variable dependiente.
y
y = A + Bx
x
Se trata de encontrar el comportamiento de estos puntos y acomodarlo a una forma
matemtica (ecuacin), lo que llamamos modelo. Esa forma puede ser una recta, una
curva, etc. (cada una de ellas tiene su propia ecuacin matemtica).
La distancia de cada punto a la recta es el error, los puntos que caen en la misma recta
no tienen error, la idea es minimizar esos errores.
El Principio del Anlisis de Regresin es:
y = A + Bx
y = A + Bx + E
= a + bx
Aplicacin:
Sean las variables:
Presin
30
31
32
33
34
35
36
Millas
29,5
32,1
36,3
38,2
37,7
33,6
26,8
Donde:
Presin: esta en lb/pulg2 (libras por pulgada al cuadrado), que es la presin aplicada a los
neumticos de un auto.
57
Men Grficos.
Seleccionar cuadro de dilogos antiguos
Seleccionar la opcin Lneas
Seleccionar Simple, marcar la opcin Resmenes para grupo de casos y presionar
el botn Definir.
5. Seleccionar la variable independiente y pasarla a Eje de categoras.
6. Seleccionar la variable dependiente, marcar la opcin: Otro estadstico y agregar
la variable.
7. Presionar Aceptar.
58
Men Grficos.
Seleccionar cuadro de dilogos antiguos
Seleccionar la opcin Lneas
Seleccionar Lneas verticales, marcar la opcin: Resmenes para distintas
variables y presionar el botn Definir.
5. Seleccionar la variable independiente y pasarla a Eje de categoras.
6. Seleccionar la variable dependiente y pasarla a Los puntos representan, luego
vuelva a aadirla, es decir debe aadir la variable dependiente 2 veces. (Tambin
puede probar otro grafico aadiendo en este punto, ambas variables tanto la
dependiente como la independiente).
7. Presionar Aceptar.
59
Anlisis inicial: Ante los resultados de ambos grficos se puede especular que el
modelo podra ser aplicado porque el modelo puede tender a formar una curva, aunque
lo ideal es que forme una recta lineal hacia arriba (+) o hacia abajo (-).
3) Ya teniendo una idea del comportamiento de las variables, podemos confirmar el
anlisis exploratorio, realizando lo siguiente:
1.
2.
3.
4.
Men Analizar.
Seleccione la opcin Regresin.
Presione la opcin Lineales
Pase la variable independiente y dependiente, cada una al lugar que le
corresponde.
5. Presione el botn Estadsticos y verifique que estn marcados: Estimaciones y
Ajuste del modelo, presione el botn Continuar.
6. Presione Aceptar.
4) De los resultados que se muestran:
1. Debemos verificar el valor de R cuadrado que se encuentra en la segunda tabla,
este valor es el coeficiente de determinacin de Pearson, que nos mide el grado
de, que tan perfecto puede ajustarse los valores de las variables a una recta. Si
este valor esta entre 0.9 y 1 (que significa 90% a 100%), podemos decir que si
cumple con el modelo, es decir que los datos si se ajustan a una recta, por lo que
usar la ecuacin ( = a + bx) para predecir, ser valido. Si el valor obtenido en el R
cuadrado es 1, se dice que el ajuste es perfecto. En nuestro caso el resultado del
anlisis se muestra en el siguiente cuadro.
Resumen del modelo
Modelo
1
R
,067a
R cuadrado
R cuadrado
Error tp. de la
corregida
estimacin
,004
-,195
4,6889
Cantidad de
Carbohidratos
100
120
140
150
180
200
220
Peso
59,5
62,1
65,3
67,9
69,7
70,9
72,8
60
Grfico 2 Dispersin
Anlisis inicial: Ante los resultados de ambos grficos se puede especular que el
modelo podra ser aplicado porque el modelo puede tender a formar una recta lineal
hacia arriba (+).
61
Modelo
R cuadrado
,977a
R cuadrado
Error tp. de la
corregida
estimacin
,954
,945
1,1332
Coeficientesa
Coeficientes
Coeficientes no estandarizados
Modelo
1
B
(Constante)
Cantidad de carbohidratos
tipificados
Error tp.
Beta
49,634
1,745
,109
,011
,977
Sig.
28,445
,000
10,199
,000
a
b
4) Siendo la ecuacin:
= a + bx
De la tabla de resultados, tomar el valor de a = 49.634 y el valor de b = 0.109.
Se pide predecir:
62
3. El peso que tendr el nio si consume 290 carbohidratos por lo que x = ___.
Reemplazando:
= a + bx
=
=
Rpta: el peso del nio que consuma __ carbohidratos ser de _____ kilogramos.
EJERCICIO N:
En una empresa de artesana desea saber si la cantidad de cermica producida por un
trabajador influye en elevar su nivel de experiencia,para poder hacer las
predicciones respectivas.
Trabajador
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
Nivel de
experiencia
213,9
212,6
215,3
215,3
215,4
228,2
245,6
259,9
250,9
234,5
205,9
202,7
198,5
195,6
200,4
200,1
201,5
63
Cantidad de cermica
producida
3147
3160
3197
3173
3292
3561
4013
4244
4159
3776
3232
3141
2928
3063
3096
3096
3158
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
213,2
219,5
243,7
262,3
252,3
224,4
215,3
202,5
200,7
201,8
202,1
200,4
209,3
213,9
227,0
246,4
3338
3492
4019
4394
4251
3844
3276
3184
3037
3142
3159
3139
3203
3307
3585
4073
Solucin:
1) Identificar la variable independiente y la dependiente.
Cantidad de cermica producida variable________________
Nivel de experiencia variable_________________________
2) Realice el anlisis exploratorio
R cuadrado = ______ aproximadamente ______%
Se puede aplicar la tcnica de anlisis de regresin. Por qu?
____________________________________________________________
____________________________________________________________
____________________________________________________________
___________________________________________________________
4) Siendo la ecuacin:
= a + bx.
De la tabla de resultados, tomar el valor de a = _______ y el valor de b = _____.
Se pide predecir:
1. El nivel de experiencia que tendr un trabajador si produce 800 cermicas.
Reemplazando:
= a + bx
=
=
Rpta: el nivel de experiencia del trabajador que produzca 800 unidades ser
de________.
64
variables independientes.
Y
variable dependiente.
Modelo de Regresin Mltiple Ajustado: = a0 + a1x1 + a2x2 + a3x3 + ....... + anxn
Al igual que el modelo de regresin lineal simple, el R cuadrado debe ser mayor al 90%,
para poder asumir que si se cumple con el modelo. Y hacer las predicciones del caso.
Aplicacin:
Tenemos un estudio estadstico del resultado del Test de inteligencia aplicado a un
grupo de alumnos. Se desea cuantificar cul es el grado de influencia de los niveles
de nutricin y el nivel de concentracin en los resultados del test de los alumnos.
Alumno
Jos
Matas
Ana
Jorge
Luis
Rafaela
Leonardo
Miriam
Puntajes del
Test de inteligencia
48,8
43,2
39,4
29,8
26,2
24,8
24,0
21,5
65
Niveles de
Nutricin
831,5
1204,0
1153,5
499,6
466,6
522,3
376,6
431,3
Nivel de
Concentracin
30
18
20
25
30
12
12
20
Lucas
Daniel
Marissa
Angel
Beatriz
Yuliana
Roberto
Fernando
Karina
Elia
Hugo
18,3
15,6
14,3
12,9
12,5
8,8
6,0
5,9
3,6
1,7
1,0
282,2
311,8
284,5
399,0
462,8
205,0
162,4
45,8
113,7
237,3
170,8
10
13
7
8
3
12
3
1
4
7
5
Solucin:
1) Determine las variables independientes y la variable dependiente.
Para este caso, analizamos de la siguiente manera:
Un colegio, puede decidir por mejorar el nivel de nutricin de sus alumnos, a travs de
comedores estudiantiles, adems de realizar talleres que estimulen la mejora de
concentracin en los alumnos con el objetivo de mejorar su rendimiento escolar
Con el anlisis realizado, podemos identificar:
Nutricin y Concentracin
variables independientes.
Test de inteligencia
variable dependiente.
2) Realizar un anlisis exploratorio:
Puede realizar grficos de distintos tipos, por ejemplo, los lineales simples, analizando
como se comporta la variable dependiente solo con una de las variables independientes,
del mismo modo, otro grafico lineal simple, con la misma variable dependiente, pero
analizando el comportamiento con otra de las variables independientes, y as
sucesivamente.
1. Tambin, puede realizar un grafico lineal mltiple
2. Seleccionar valores individuales de los casos
3. Luego Definir
4. Pasar la variable dependiente a la opcin variable y las independientes a Las lneas
representan.
5. Presiona Aceptar.
66
Men Analizar.
Seleccione la opcin Regresin.
Presione la opcin Lineales
Pase las variables independientes y la dependiente, cada una al lugar que le
corresponde.
5. Presione el botn Estadsticos y verifique que estn marcados: Estimaciones y
Ajuste del modelo, presione el botn Continuar.
6. Presione Aceptar.
4) De los resultados que se muestran:
1. Debemos verificar el valor de R cuadrado que se encuentra en la segunda tabla,
este valor es el coeficiente de determinacin de Pearson, que nos mide el grado
de, que tan perfecto puede ajustarse los valores de las variables a una recta. Si
este valor esta entre 0.9 y 1 (que significa 90% a 100%), podemos decir que si
cumple con el modelo. Si el valor obtenido en el R Square es 1, se dice que el
ajuste es perfecto.
Resumen del modelo
Modelo
1
R
,949a
R cuadrado
,901
R cuadrado
Error tp. de la
corregida
estimacin
,888
4,6902
67
a0
a1
a2
CONCENTRACIN
NUTRICIN
Test
NOTA: a0 , es una constante general, el cual si es negativo no es un valor muy lgico, por
lo que sera bueno realizar un anlisis sin considerar dicho valor.
Para suprimir dicha constante:
Al momento de hacer la Regresin, es decir:
1. Men Analizar.
2. Seleccione la opcin Regresin.
3. Presione la opcin Lineales
4. Pase las variables independientes y la dependiente, cada una al lugar que le
corresponde.
5. Presione el botn Estadsticos y verifique que estn marcados: Estimaciones y
Ajuste del modelo.
6. Presione el botn Opciones y quite el check en: Incluir la constante en la ecuacin
7. Presione el botn Continuar.
8. Presione Aceptar.
Con lo cual se obtiene un R2 mucho ms aceptable, siendo este de 0.965
aproximadamente de 96.5%, ya no habr un valor a 0, slo los de a1 y a2, los cuales sern:
a1 = 0.626 y a2 = 0.026
Se pide predecir:
1. Cul sera el puntaje del Test de inteligencia de un alumno que tenga un nivel de
concentracin de 15 y tenga un nivel de nutricin de 1000.
68
Tiempo_duracin_dias
19
25
24
24
31
30
Costo_desarr_estudio
350,00
300,00
280,00
300,00
250,00
260,00
69
Num_integr_grupo
6
4
5
3
4
6
G07
G08
G09
G10
G11
G12
G13
G14
22
24
28
32
32
35
19
25
354,00
350,00
275,00
262,00
240,00
230,00
389,00
267,00
6
4
3
5
2
3
5
2
Dficit de concentracin
25,2
23,8
45,2
12,6
48,6
10,3
34,6
21,3
8,2
34,2
11,5
Nivel de motivacin
78,5
81,3
36,7
98,7
32,2
99,6
63,2
86,2
99,9
64,3
97,6
70
Rendimiento escolar
14
15
8
17
6
18
12
16
19
11
17
Orosco
Brea
Vicente
50,6
18,7
38,7
29,8
88,6
70,2
4
16
13
5. Se pide predecir:
a. Cul sera el rendimiento escolar de un alumno que tenga un dficit de
concentracin de 60,8 y tenga un nivel de motivacin de 45,6.
Respuesta: El rendimiento escolar de un alumno con un dficit de concentracin
de ___, y un nivel de motivacin de ____, ser aproximadamente de _____.
b. Cul sera el rendimiento escolar de un alumno que tenga un dficit de
concentracin de 8,4 y tenga un nivel de motivacin de 67,8.
Respuesta: El rendimiento escolar de un alumno con un dficit de concentracin
de ___, y un nivel de motivacin de ____, ser aproximadamente de _____.
c. Cul sera el rendimiento escolar de un alumno que tenga un dficit de
concentracin de 43,6 y tenga un nivel de motivacin de 78,9.
71
72
ANOVA DE UN FACTOR
Estudia 2 variables:
1
2
2)
3)
Ir al Men Analizar.
4)
5)
6)
7)
Presionar Aceptar.
8)
73
3=Mantenimiento
Los datos figuran en la siguiente tabla:
Categora Laboral
1
1
1
1
1
1
1
1
1
1
2
2
2
2
3
1
1
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
1
2
2
Salario
550
540
850
420
726
1320
1560
938
658
1440
826
1600
1360
758
532
844
1360
934
1420
738
840
1420
934
748
946
1260
1280
1200
726
916
1420
544
1120
416
1200
822
936
765
1148
74
2
1) Categora laboral
Salario
1128
Media
gl
cuadrtica
Inter-grupos
259800,832
129900,416
Intra-grupos
3951114,943
37
106786,890
Total
4210915,775
39
F
1,216
Sig.
,308
Para este caso se obtuvo: Sig. = 0.308 como es mayor a 0.05, entonces aceptamos H 0.
Conclusin: H0 = La categora laboral de un empleado no influye en su salario.
EJERCICIO R:
Se tienen los siguientes datos experimentales, en el que se ha recogido informacin de 2
variables, se desea saber si el consumo telefnico depende del nivel socio econmico.
Tomando en cuenta que los niveles socioeconmicos son las siguientes:
1=Clase Alta
2=Clase Media
3=Clase Baja
75
Consumo telefnico
155
154
148
132
126
132
156
138
158
144
80
60
65
85
32
144
136
134
142
138
140
82
72
82
78
68
76
34
26
36
29
34
32
36
28
32
136
65
78
68
76
77
H0 : MA = MB
Ha : MA MB
H0:__________________________________________________________
Ha:__________________________________________________________
3. Realizar ANOVA de un factor.
4. Qu hiptesis acepta y cual rechaza? Por qu?
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
________________________________________________________________
EJERCICIO S:
Se convoc a todos los interesados, a realizar un estudio sobre inteligencias mltiples,
deban organizarse en grupos de personas que tengan el mismo grado acadmico, los
datos fueron:
Cod_grupo
A
B
C
D
E
F
G
H
I
J
K
L
M
N
Tpo_estudio_dias
19
25
24
24
31
30
22
24
28
32
32
35
19
25
Costo_desarr_estudio
350,00
300,00
280,00
300,00
250,00
260,00
354,00
350,00
275,00
262,00
240,00
230,00
389,00
267,00
78
Grado_academico_grupo
profesionales
profesionales
tcnicos
profesionales
tcnicos
tcnicos
profesionales
tcnicos
profesionales
profesionales
tcnicos
tcnicos
profesionales
tcnicos
I.
H0 : MA = MB
Ha : MA MB
H0:__________________________________________________________
Ha:__________________________________________________________
3. Realizar ANOVA de un factor.
4. Qu hiptesis acepta y cual rechaza? Por qu?
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
________________________________________________________________
II.
H0 : MA = MB
Ha : MA MB
H0:__________________________________________________________
Ha:__________________________________________________________
79
80
ANLISIS FACTORIAL
El anlisis factorial es una tcnica de reduccin de datos que sirve para encontrar
grupos homogneos de variables a partir de un conjunto numeroso de variables. Esos
grupos homogneos se forman con las variables que correlacionan mucho entre s y
procurando, inicialmente, que unos grupos sean independientes de otros.
Cuando recogemos un gran nmero de variables de forma simultnea, como por ejemplo
en un cuestionario de satisfaccin laboral, podemos estar interesados en averiguar si las
preguntas del cuestionario se agrupan de alguna forma caracterstica. Aplicando un
anlisis factorial a las respuestas de los sujetos podemos encontrar grupos de variables
con significado comn y conseguir de esta manera reducir el nmero de dimensiones
necesarias para explicar las respuestas de los sujetos.
El anlisis factorial es, por tanto, una tcnica de reduccin de la dimensionalidad de los
datos. Su propsito ltimo consiste en buscar el nmero mnimo de dimensiones capaces
de explicar el mximo de informacin contenida en los datos. A diferencia de lo que
ocurre en otras tcnicas como el anlisis de varianza o el de regresin, en el anlisis
factorial todas las variables del anlisis cumplen el mismo papel: todas ellas son
independientes en el sentido de que no existe a priori una dependencia conceptual de
unas variables sobre otras.
Modelo Matemtico del Anlisis Factorial
El modelo matemtico del AF supone que cada una de las p variables observadas es
funcin de un nmero m factores comunes (m<p) ms un factor especfico o nico. Tanto
los factores comunes como los especficos no son observables y su determinacin e
interpretacin es el resultado del AF. Analticamente, supondremos un total de p
variables observables tipificadas y la existencia de m factores comunes. El modelo se
define de la siguiente forma:
X1
=
l11
F1
+
X2
=
l21
F1
+
...
Xp = lp1 F1 + lp2 F2 + lpm Fm + ep
l12
l22
F2
F2
+
+
l1m
l2m
Fm
Fm
81
+
+
e1
e2
Como tanto los factores comunes como los especficos son variables hipotticas,
supondremos, para simplificar el problema, que:
1. Los factores comunes son variables con media cero y varianza 1. Adems se
suponen incorrelacionados entre s.
2. Los factores nicos son variables con media cero. Sus varianzas pueden ser
distintas. Se supone que estn incorrelacionados entre s. De lo contrario la
informacin contenida en ellos estara en los factores comunes.
3. Los factores comunes y los factores nicos estn incorrelacionados entre si Esta
hiptesis nos permite realizar inferencias que permitan distinguir entre los
factores comunes y los especficos.
Basndonos en el modelo y en las hiptesis formuladas, podemos demostrar que la
varianza (informacin contenida en una variable) de cada variable se puede descomponer
en:
aquella parte de la variabilidad que viene explicada por una serie de factores
comunes con el resto de variables que llamaremos comunalidad de la variable
Var(xj ) = 1 = l 2j1 Var(F1 ) + l 2j2 Var(F2 ) + ... + l 2jm Var(Fm ) + Var(ej ) = l 2j1 + l 2j2 +
l 2jm + Var(ej )
donde:
82
B = - ( n - 1 - (2p + 5)/6 ) ln | R* |
bajo la hiptesis nula resulta X 2(p2 - p)/2
donde:
p es el nmero de variables y
83
donde:
o
Si 0.5 < KMO < 0.6 grado de correlacin medio, y habra aceptacin media.
Si KMO > 0.7 indica alta correlacin y, por tanto, conveniencia de AF.
84
85
N of
Items
25
En esta etapa debemos analizar cada uno de los tems, para los cual
verificamos en la ventana de resultados, la tabla: Estadsticos total
elemento.
Luego ir a la columna Correlacin elemento-total corregida, slo se
aceptarn los tems cuyos valores de correlacin sean mayores a 0,2;
aquellos tems que no cumplan con esta condicin no se tomarn en cuenta
para la construccin de la matriz factorial. En nuestro ejemplo, basados en
la siguiente tabla 4 items deben ser descartados.
86
Estadsticos total-elemento
Scale Mean
Scale
if Item
Variance if
Deleted
Item Deleted
Correlacin
Cronbach's Alpha if
elemento-total
Item Deleted
corregida
Cuando planeo algo lo realizo
132,58
290,740
,534
,880
132,46
289,553
,597
,878
132,88
291,041
,460
,882
132,51
289,010
,582
,878
132,47
289,923
,516
,880
131,90
289,128
,652
,877
133,69
303,693
,199
,889
132,24
288,590
,596
,878
133,32
297,067
,369
,884
132,94
291,714
,529
,880
134,21
303,657
,169
,891
133,22
295,028
,387
,884
132,64
290,369
,517
,880
Tengo autodisciplina
132,87
293,821
,467
,881
132,49
292,135
,571
,879
132,22
294,087
,507
,880
132,25
288,867
,577
,879
131,98
292,596
,600
,879
132,25
297,449
,519
,881
134,08
309,052
,084
,894
131,76
291,779
,623
,878
87
2.
88
Luego
botn
seleccionar
cantidad sin
continuar.
presionar el
Rotacin
y
varimax que indica
decimales,
y
89
90
3. Anlisis de la matriz factorial: Para que la matriz tenga validez debe cumplir 3
criterios o condiciones bsicas:
El valor del determinante debe ser igual a 0,000 o lo ms cercano posible, y se
encuentra al pie de la tabla de la matriz, en nuestro ejemplo resulto: a
determinante=0,000.
El KMO debe ser mayor a 0,5.
Bartlett's Test of Sphericity su nivel de significacin debe ser igual a 0,00
Approx. Chi-Square
df
,933
2,935E3
210
Sig.
,000
En concusin nuestra matriz cumple con las 3 condiciones, por lo tanto se concluye
que es una matriz valida.
4. Creacin de componentes o factores: Una vez que la matriz fue validad se
crean los componentes o factores.
Tabla de comunalidades o factores: El valor total debe ser 1, que se
obtiene de la suma de la comunalidad o extraccin como es conocida en la
tabla y la cantidad de unicidad que corresponde al margen de error y
factores del medio ambiente que influyen en el resultado de la prueba o
test.
91
Var(xj ) = 1 = l 2j1 Var(F1 ) + l 2j2 Var(F2 ) + ... + l 2jm Var(Fm ) + Var(ej ) = l 2j1 + l 2j2 +
l 2jm + Var(ej )
1 = Extraccin + unicidad
Communalities
Initial
Extraction
1,000
,458
1,000
,606
1,000
,419
1,000
,600
1,000
,429
1,000
,619
1,000
,433
1,000
,630
Soy decidido(a)
1,000
,547
1,000
,245
1,000
,421
Tengo autodisciplina
1,000
,414
1,000
,469
1,000
,493
1,000
,472
1,000
,532
1,000
,382
1,000
,552
1,000
,493
1,000
,568
1,000
,489
Por ejemplo: En la tabla inferior se observa que el item 1 tiene un mayor margen de
error en la aplicacin que nos da un 0,542 versus su confiabilidad de 0,458, en cambio el
item 2 muestra una confiabilidad de 0,606 versus un margen de error de 0,394.
92
TOTAL
Unicidad o
margen de error
Extraccin
1,000
,542
,458
1,000
,394
,606
93
Componente
Total
% of Variance
Loadings
Cumulative %
Total
% of
Acumulado
Variance
Total
% of Variance
Acumulado %
7,813
37,206
37,206
7,813
37,206
37,206
4,583
21,824
21,824
1,320
6,286
43,491
1,320
6,286
43,491
3,959
18,852
40,677
1,137
5,415
48,906
1,137
5,415
48,906
1,728
8,230
48,906
,974
4,637
53,544
,919
4,378
57,922
,851
4,051
61,973
,780
3,714
65,687
,744
3,541
69,228
,695
3,308
72,536
10
,675
3,216
75,753
11
,655
3,118
78,871
12
,615
2,930
81,801
13
,564
2,685
84,486
14
,537
2,557
87,043
15
,465
2,215
89,258
16
,431
2,052
91,310
17
,422
2,011
93,321
18
,391
1,861
95,182
19
,372
1,769
96,951
20
,360
1,716
98,667
21
,280
1,333
100,000
En nuestro ejemplo resultan 3 componentes que cumplen con el requisito de Total debe
ser mayor a 1. En el acumulado antes de la rotacin de los tems result un 48,906% y
despus de la rotacin se obtuvo el mismo porcentaje, en ocasiones puede existir una
diferencia mayor o menor entre ambas.
Tabla Matriz de Componentes Rotados: Esta tabla nos permite
distribuir los item a cada uno de los factores que pertenece, observando
donde se produce una mayor saturacin del mismo, tomando en cuenta que
en nuestro ejemplo del test de resiliencia se formaron tres componentes.
94
,593
,743
,540
,737
,606
,705
,489
,772
Soy decidido(a)
,586
,485
,555
Tengo autodisciplina
,588
,611
,601
,597
,673
,532
,624
,559
,650
,418
,529
Esto nos ayuda a agrupar los item en cada uno de los factores o componentes, y en caso
que se muestre un resultado numrico en varios factores como por ejemplo el item:
Acepto que hay personas a las que yo no les agrado, donde se puede observar una
saturacin en el componente 1 y 2, se toma en cuenta el mayor valor, que en este caso es
0,529 que determina que el item est ms prximo al componente 2.
95
Y finalmente, al agrupar los item, puedo determinar que el componente o factor 1 est
formado por 11 items, el componente o factor 2 est formado por 8 items y el
componente o factor 3 est formado por 2 items.
Componente o Factor
1
2
3
Cantidad de tems agrupados
en el componente o factor
11
Y en base a la relacin de los tems puedo dar un nombre a cada componente, como por
ejemplo especificar el rea a la que pertenece afectiva, conductual, cognitiva, entre
otras.
Factor 1: Reacciones emocionales ante situaciones cotidianas.
Factor 2: ___________________________
Factor 3: ____________________________
EJERCICIO S: Utilizando la misma base de datos Tesis de resiliencia:
1. Realizar el ndice de discriminacin o anlisis de tems utilizando los tem F1 hasta el
tem F29.
2. Los tem analizados son fiables. Por qu?
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
96
5. La matriz factorial obtenida es vlida. Cules son sus criterios en los que se basa?
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
97