Sunteți pe pagina 1din 3

COMPONENTES PRINCIPALES

#Activar RComander
library(Rcmdr)

#Ver las variables


list(componentes_principales)

#que cada columna sea una variable


attach(componentes_principales)

#Estadísticos descriptivos
install.packages("pastecs")
library(pastecs)
stat.desc(CONSOLIDADO[10:15],basic = FALSE) Commented [RCA1]: Se especifica las columnas que
representan variables cuantitativas

#ver matriz de correlación simple


#Aqui se especifica las columas [2:10], osea a partir de la columna 2 hasta la 10,
#por que la 1 son las iniciales del país
#guardo la matriz de correlación como la variable 'Correlacion'
Correlación=cor(componentes_principales[2:10],method = "pearson")
View(Correlación)

#Reconocer como variabels las columnas


#Ver diagrama de dispersión
#linea de regresión
#Análisis de correlación gráfico
attach(componentes_principales)
install.packages("psych")
plot(Agricultura~Mineria,xlab="Mineria",ylab = "Agricultura")
abline(lm(Agricultura~Mineria))
pairs(~Agricultura + Mineria)
pairs.panels(componentes_principales[c(2:10)])

#Validar que la matriz de correlación no corresponde a la identidad


#Test de esfericidad de Bartlet
#Si el p-valor<5% se acepta la hipótesis nula de que la matriz de correlación
#no es la matriz de identidad
library(psych)
cortest.bartlett(Correlación,n=26)

#Identificar el numero de componentes principales a extraer por medio del


#criterio de autovalor, aquellos cuyos valores en ($eig) en la primera columna
#sean mayores a 1, seran las componentes a trabajar
install.packages("factoextra")
library(FactoMineR)
#guardo el grafico de componentes principales como una variable llamada
#'GCP
GCP=PCA(componentes_principales[2:10],scale.unit = TRUE,ncp = 9,graph = TRUE)
head(GCP)

#grafico de sedimentacion
library(factoextra)
fviz_eig(GCP,geom = "line")
theme_grey()

#analisis paralelo de Horn para buscar definitivamente cuantos componentes


#se debe retener, el criterio es que los valores deben ser mayores 1
install.packages("paran")
library(paran)
paran(componentes_principales[2:10],iterations=300,graph = TRUE,color = FALSE)

#despues de identificar el número de componentes, se analiza nuevamente


# head(GCP), para tomar la información de $var$coord y solo analizar las
#dimensiones especificadas
PCA(componentes_principales[2:10],scale.unit = TRUE,ncp = 9,graph = TRUE) - grafico
summary(GCP) – para ver el resumen rápido de lo que se debe analizar

CORRESPONDENCIAS MULTIPLES
#reconocer las variables
attach(Datos_5_2_Caso)

#Determinar el análisis de correspondencias


install.packages("FactoMineR")
library(FactoMineR)
library(factoextra)

correspondencias=MCA(Datos_5_2_Caso,ncp = 5,graph = TRUE)


summary(correspondencias) Commented [RCA2]: De los resultados solo t
omar
Eigenvalues – es lo primero
#grafico de sedimentacion
library(factoextra)
fviz_eig(correspondencias,geom = "line")
theme_grey()

#grafico o mapa perceptual


get_mca_var(correspondencias)
get_mca_ind(correspondencias)
fviz_mca_var(correspondencias,repel = TRUE)

#ver cada dimension como esta explicada por cada categoria


summary(correspondencias)

#grafico para explicar la contribucion


#solo se consideran las que sobrepasan la linea roja
fviz_contrib(correspondencias,choice = "var",axes = 1)
fviz_contrib(correspondencias,choice = "var",axes = 2)
fviz_contrib(correspondencias,choice = "var",axes = 1:2)

REGRESIÓN LOGÍSTICA

S-ar putea să vă placă și