Documente Academic
Documente Profesional
Documente Cultură
Clase 2
EL MÉTODO CIENTIFICO
Y
EL ANÁLISIS ESTADÍSTICO MULTIVARIADO
MÉTODO
MÉTODOD CIENTÍFICO MULTIVARIADOS
ETAPAS:
ETAPAS: • PLANIFICACIÓN DEL DISEÑO
OBSERVACIÓN DEL FENÓMENO •DISEÑO DEL INSTRUMNETO
FORMULACIÓN DE HIPÓTESIS • RECOLECCIÓN DE DATOS
•PROCESAMIENTO DE DATOS
VERIFICACIÓN DE HIPÓTESIS •PRESENTACIÓN DE INFORMACIÓN
ACEPTACIÓN O RECHAZO DE HIPÓTESIS •ANÁLISIS DE INFORMACIÓN
ANALSIS MULTIVARIADO
Ciencia METODOS
MULTIVARIADOS
ESTADÍSTICOS PARÁMETROS
PRODUCTOS
Y
SERVICIOS
Las ciencias pura o básicas o formales estudian el mundo que nos rodea incluso a nosotros mismos sin ningún beneficio inmediato para el hombre. Se
investiga porque busca enriquecer el conocimiento. ciencia aplicada o fáctica trata de resolver problemas específicos o conjuntos de problemas,
o de crear productos
ANALSIS MULTIVARIADO
PLANIFICACIÓN DE LA INVESTIGACIÓN
Aspectos teóricos
Aspectos
PROBLEMA metodológicos
JUSTIFICACIÓN
OBJETIVOS
PROPÓSITOS Aspectos
MARCO Administrativos
TEÓRICO
TIPO DE ESTUDIO
RECURSOS:
POBLACIÓN Y MUESTRA
HUMANOS
PRESUPUESTO
CRONOGRAMA
HIPOTESIS
PLANES DE RECOLECCIÓN Y PLANES DE
TRAMIENTO PRESENTACIÓN Y
ANÁLISIS
ANALSIS MULTIVARIADO
RECOLECCIÓN
DE
DATOS
CONSIDERACIONES
ÉTICAS
MEDICIÓN PROCESO
VARIABLE SE DEFINE
REGISTRO DE
sexo PRIMARIA SECUNDARIA CUESTIONARIO OBSERVACIONES
Discretos y
continuos
NIVEL
NOMINAL
MIXTA OBSERVACIÓN
NIVEL
ORDINAL ENTREVISTA
´Producción
Grados de estudio
NIVEL
INTERVALO
NIVEL
RAZÓN
Datos Discretos
Todos valores posibles que puede tomar la
variable son números enteros
Ejemplo: Número de unidades no conformes,
Cuantitativos número de accidentes, etc
Datos
numéricos Continuos
La variable puede tomar cualquier valor
Ejemplo: Tiempo, peso, distancia
MEDICIÓN ANALSIS MULTIVARIADO
• Implica comparar con un patrón o serie de características de
cualidades que presentan las personas u objetos o diversas
magnitudes asociadas con una escala numérica.
• Estas propiedades que toman distintos valores se llaman variables
• Términos importantes de la medición: Exactitud y precisión
INEXACTITUD
EXACTITUD
ERROR SISTEMATICO: sesgo
Proximidad de una medida a su verdadero valor
ALTA DISPERSIÓN
ANALSIS MULTIVARIADO
ejemplos
Nivel nominal: la respuesta del pueblo fue: Nivel de intervalo:
Positiva________Negativa__________ Marque con una X la estatura de el individuo:
4
5
6
ANALSIS MULTIVARIADO
•Entrevista
•Observación
Cuantitativo Método
•Cuestionario
Método
•Grupos focales
•Técnica delphi
•Cualitativas •Método
•Historia de vida
• Estudio de casos
ANALSIS MULTIVARIADO
ETAPAS DEL DISEÑO DE UN FORMULARIO
TIPIO DE PREGUNTA:
DE REPUESTA LIBRE. DESCRIBE LA RESPUESTA
CERRADAS: DICOTÓMICA SI__NO__, ; 1____2___; V___F____
:
SOBRE ELECCIÓN DE PRODUCTOS:
a. PRODUCTO A
b. PRODUCTO B
c. PRODUCTO C
ESCALA DE LIKERT
SOBRE PROYECTOS
CARACTERÍSTICAS DEL DE PROYECTO A B C D E
EL PROYECTO CUMPLE CON LAS NORMAS
EL PROYECTO ESTA BIEN ELABORADO
EL PROYECTO ES MUY COSTOSOS
EL PROYECTO CUENTA CON EL PERSONAL ADECUADO
.
ANALSIS MULTIVARIADO
POBLACIÓN DE ESTUDIO
FINITO IINFINITO HIPOT’ETICO
Población
diana No probabilístico
probabilístico
Población
accesible Calculo
según
Población estudio
elegible
Universo
muestra MUESTRA
SPSS,
STACGRAPHIC
S y Mat Lab
ANALSIS MULTIVARIADO
PRESENTACIÓN DE LA INFORMACIÓN
ESTUDIOS MULTIVARIADOS
Tablas Gráficos
Agrupamiento o De correspondencia
clúster de atributos
ANALSIS MULTIVARIADO
BIBLIOGRAFÍA RECOMENDADA
Arbuckle, J. L. (2010). IBM SPSS AMOS 19 User´s Guide. Chicago: Amos Development Corporation.
Bollen, K. A. (1989). Structural Equations with Latent Variables. New York: John Wiley & sons.
Bollen, K. A. y Long, J. S. (Ed.). (1993). Testing structural eqution models. Newbury Park, CA: Sage.
Byrne, B. M. (2001). St ructural Equation Modeling with AMOS. Basic Concepts, Applications and
Programming. Mahwah, NJ: Lawrence Erlbaum Associates, Pbs.
Dillon, W. R. y Goldstein, M. (1984). Multivariate Analysi s: Methods and Applicat ions. New York: John
Wiley & Sons.
Hai r, J. F. , Bl ack, W. C. , Babi n , B. J. , Anderson, R. E. , Tatham, R. L. (2009) - 7ª Ed. Multiva r i ate Dat a
Analysis. Pearson Prentice-Hall.
Hooper, D . , Coughl an, J . y Mul l e n , M.R. (2008): Structural Equation Mode l l i ng: Guidelines of
determining Model Fit. The Electronic Journal of Business Research Methods, 6 (1), 53-60.
Hoyl e, R. H. (ed) (1995). St ructural Equation Modeling: Concept s, Issues and Applicat ions. Thousand
Oaks, CA: Sage.
Jöreskog, K.G., Sörbom, D., 1982. Recent developments in structural equation modeling. Journal of
Marketing Research 19, 404–416.
Lévy Mangin, J. P (2006) (Di r. ): Modelización con Estructuras de Covarianzas en Ciencias Sociales,
Ed. Netbiblo, La Coruña
Long, J. S. (1983). Conf irmatory Factor Analysis: A Preface to LISREL. Sage Universi ty Paper Series on
Quantitative Applications in the Social Sciences, 007-033. Newbury Park, CA: Sage.
Long, J . S. (1990 ) . Covariance St r u c t u re Models: An introduct ion to LISREL. Sage Unive r s i ty Paper
Series on Quantitative Applications in the Social Sciences, 007-034. Newbury Park, CA: Sage.
van Eye, A. y Clogg, C. C. (Ed.) (1994). Latent Variables Analysis: Applications for Developmental
ANALSIS MULTIVARIADO
Conceptos previos
Algebra vectorial y estadística multivariada
Función normal multivariada
Matriz de varianza- covarianza xyy Matriz de correlación xy
Estrategia de toma de muestras
Errores en la entrada de datos. Doble operador
Datos Outlier Multivariados y localización
Procedimientos gráficos ( Anfrews, caras de Chernoff
Pruebas de normalidad
Elaboración y validación de instrumento
Validez y confiabilidad
Correlación de muestras
ANALSIS MULTIVARIADO
X1 X2 Xp
x x12 x1 p : Valores de la r-ésima unidad
I 1 11
I 2 x 21 x 22 x 2 p experimental en la j-ésima
X I r x r1 x r 2 x rp variable respuesta
p: Cantidad de variables
I n x
x n 2 x np
n1 n p
n: Individuos o unidades
experimentales sobre la cual se
están midiendo las variables X
ANALSIS MULTIVARIADO
LENGUAJE SIMBÓLICO
MATRICES Y VECTORES DE DATOS
Los reglones de una matriz de datos se llaman
vectores de reglones, se simboliza por :
También se llama transpuesto del vector columna y
sus elementos son:
REGLÓN COLUMNA
x [ xr1, xr 2, ..., xrp ]
' x r1
r
x
r1
.
xr
.
.
xp
ANALSIS MULTIVARIADO
LENGUAJE SIMBÓLICO
SUBÍNDICE DE LOS DATOS:
1) I, j, k,… se usan como subíndices para las variables respuesta
2) S, t,… se usan como subíndices de las unidades experimentales
Alfabeto griego
Error estructural
variable latente endógena dependiente
Cargas factoriales
1
x ' 1 x
f x x; ,
1
e 2
para x E p
2
p 1
2
2
X p
X1
X p
aX a1 a2 a p ai X i
2
i 1
tiene una distribución normal univariada
X p
para todo vector a .
ANALSIS MULTIVARIADO
E ( X p ) p
11 12 1 p
21 22 2 p
Cov ( X ) E
X X
p1 p2 pp
Con
jj Var ( X j ) E[ X j j ] 2 , para j 1, 2,..., p, y
ij Cov( X i , X j ) E ( X i i )( X j j ) ' , para i j 1, 2,..., p,
N
1
ij Cov( X i , X j ) E ( X i i )( X j j )
'
[ ( x ri xi )( x rj x j )
N 1 r 1
ANALSIS MULTIVARIADO
GRAFICOS DE DATOS MULTIVARIADOS
2 4 3
2 3 4
X 3 3 4
1 5 6
2 8
2
a) ¿Cuales son los valores de p, N,
b) Determinar x j ,ij ij y
c) Determinar x3 , x' ii y
3
Correlación y matriz de correlación
ij
El coeficiente de correlación entre X i y X j se denota por ij : ij
ii jj
La matriz de correlación para un vector aleatorio X se denota por :
Utilice cualquier método para hallar la matriz de correlación con base a la matriz de varianza covarianza
ANALSIS MULTIVARIADO
Caras de Chernoff
Caras de Chernoff
COMPORTAMIENTOS OUTLIERS
ANALSIS MULTIVARIADO
Clase 3
ANLIS DE DATOS MEDIANTE SPSS
MANEJO BÁSICO MATLAB ANÁLISIS ESTADÍSTICO MULTIVARIADO
VALIDEZ Y FIABILIDAD DEL INSTRUMENTO
ANÁLISIS DESCRIPTIVO ( MEDIA DESVIACIÓN, ASIMETRÍA Y CURTOSIS
CORRELACIÓN DE MUESTRAS E INTERVALOS DE CONFIANZA PARA
CORRELACIÓN
METODO GRAFICO
INTERVALOS DE CONFIANZA DE FISHER
INTERVALOS DE CONFIANZA DE RUBEN
EIGEVALORES Y EIGENVECTORES
TALLER
1. Tomar la base de datos taller 1 y analice el comportamiento de los datos mediante caras de
chernoff . Utilice stacgraphics
2. Tomado como base la base 1 del taller 1 desarrolle los
siguiente puntos:
• Almacene X en Y, halle matrices de varianza covarianza (MC), inversa de la MC (MI)
• Almacene en DP elementos de la diagonal principal de MC
• Almacene en DS elementos de la diagonal secundaria de MC
• Otras actividades de aprendizaje del paquete PLOT,…
Elaboración y validación de instrumento
Validez y fiabilidad
Alfa de Cronbach
a) Mediante la varianza de los items b) Mediante la matriz de correlación
n Vi nr
1
n 1 Vt 1 r (n 1)
: Alfa de cronbach : Alfa de cronbach
n : Númer de items n : Númer de items
Vi : Varianza de cada var iable r : Pr omedio de la correlación lineal
Vi : Varianza del total de cada uno de los items
Este calculo lo puede hacer con SPSS. se espera que este índice >= 0,7
Se puede alminar variables con estimaciones bajas y calcular el índice a ver si mejora o empeora
TRANFORMACIÓN DE LA ESCALA CUANDO CRONBACH
DA NEGATIVO. con varoianza
En una escala Likert hay reactivos positivos y reactivos negativos:
Ejemplo reactivo Positivo: cuanta confianza te inspira la persona que te ha atendido
Ejemplo de reactivo Negativo: Cuanto te molesto tener que esperar o el tiempo invertido en la sala de espera de la EPS
Si el índice de cronbach es negativo se procede así: ( v2 y v3 son de reacción negativa)
transformación-calcular suma=v1+v2..+np-acepta y se saca la correlación incluyendo la suma y aparece correlación negativa, buscar la
variable que con suma da negativo y proceda:
Hallamos alfa de cronbach. Si da menos de 0,7 convertimos las preguntas de reacción negativa en positiva
1. Para invertirlo se copia en nueva columna v2i con los valores de v2 y lo ordenamos de mayor a menor
2. Invertimos los valores así: 1 es 5; 2 es 4 ;3 es 3; 4 es 2; 5 es 1
3. Hallamos nuevamente alfa de cronbach. Si da menos de 0,7 se repite con v3i copiando el contenido de v3
4. Hallamos el alpha de cronbach solo con las variables incluyendo las invertidas Desarrolle el siguiente ejemplo
ID V1 V2 V3 V4 V5
1 1 4 4 1 3
2 5 3 2 2 3
3 4 1 1 3 3
4 2 5 2 3 3
5 3 3 1 4 3
6 1 2 5 2 3
7 4 1 1 5 3
8 1 2 3 3 3
9 2 5 2 3 3
10 2 4 4 1 3
TRANFORMACIÓN DE LA ESCALA CUANDO CRONBACH
DA NEGATIVO
En una escala Likert hay reactivos positivos y reactivos negativos:
Ejemplo reactivo Positivo: cuanta confianza te inspira la persona que te ha atendido
Ejemplo de reactivo Negativo: Cuanto te molesto tener que esperar o el tiempo invertido en la sala de espera de la EPS
Si el índice de cronbach es negativo se procede así:
transformación-calcular suma=v1+v2..+np-acepta y se saca la correlación incluyendo la suma y aparece correlación negativa, buscar la
variable que con suma da negativo y proceda:
1. Para invertirlo se copia en nueva columna y nuevamente halla correlación y colocamos V3i y lo ordenamos: ordenamos la
columna suma
2. Invertimos los valores así: 1 es 5; 2 es 4 ;3 es 3; 4 es 2; 5 es 1
3. Hallamos nuevamente la suma cambiando la variable V3 por V3i y ordenamos la v3i
4. Hallamos correlación incluyendo la nueva suma
5. Repetimos el procesos hasta que todas las correlaciones sean positivas
6. Hallamos el alpha de cronbach solo con las variables incluyendo las invertidas Desarrolle el siguiente ejemplo
ID V1 V2 V3 V4 V5
1 1 4 4 1 3
2 5 3 2 2 3
3 4 1 1 3 3
4 2 5 2 3 3
5 3 3 1 4 3
6 1 2 5 2 3
7 4 1 1 5 3
8 1 2 3 3 3
9 2 5 2 3 3
10 2 4 4 1 3
ANALIS DESCRIPTIVO: MEDIAS, DESVIACIÓN Y
COEFICIENTES DE ASIMETRÍA
CURTOSIS
Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores,
( Xla media de la muestra y (ni) la frecuencia de cada valor.
Los resultados de esta fórmula
se interpretan:
(g2 = 0) la distribución es Mesocúrtica:
(g2 > 0) la distribución es Leptocúrtica
(g2 < 0) la distribución es Platicúrtica
30 120
25 100
20 80
X2
X2
15 60
10 40
5 20
0 0
-6 -4 -2 0 2 4 6 0 2 4 6 8 10
X1 X1
¿SON SUFICIENTEMENTE GRANDES LAS CORRELACIONES COMO PARA
SER UTILES?
tanh[0.8673-1.96/221/2]=tanh[0.8673-0.4179]=tanh[0.4494]=0.421
tanh[0.8673+1.96/221/2]=tanh[0.8673+0.4179]=tanh[1.2852]=0.858
Ayudan al investigador a:
Ejemplo
2, 210 2,255 2, 350 2, 380 2, 380 2, 390 2, 420 2, 440 2, 450 2, 550
2, 630 2, 825
Dato menor:2210; Q1 = (2, 350 + 2, 380)/2 = 2, 365 (12/4) ( Posición 3 y 4 por ser par)
Mediana: Q2=(2390+2420)/2=2405; Q3 = (2, 450 + 2, 550)/2 = 2, 500. Dato mayor:2825
ESTADÍSTICA APLICADA
Todo valor que está más alejado del 1,5RI, tanto del Q1 como del Q3, se dice que es atípico.
Un valor atípico es extremo si está a mas allá de 3RI Del cuartil Q1 o Q3·
¿SON SUFICIENTEMENTE GRANDES LAS CORRELACIONES COMO PARA
SER UTILES?
tanh[0.8673-1.96/221/2]=tanh[0.8673-0.4179]=tanh[0.4494]=0.421
tanh[0.8673+1.96/221/2]=tanh[0.8673+0.4179]=tanh[1.2852]=0.858
Ayudan al investigador a:
Ejemplo
2, 210 2,255 2, 350 2, 380 2, 380 2, 390 2, 420 2, 440 2, 450 2, 550
2, 630 2, 825
Dato menor:2210; Q1 = (2, 350 + 2, 380)/2 = 2, 365 (12/4) ( Posición 3 y 4 por ser par)
Mediana: Q2=(2390+2420)/2=2405; Q3 = (2, 450 + 2, 550)/2 = 2, 500. Dato mayor:2825
ESTADÍSTICA APLICADA
Todo valor que está más alejado del 1,5RI, tanto del Q1 como del Q3, se dice que es atípico.
Un valor atípico es extremo si está a mas allá de 3RI Del cuartil Q1 o Q3·