Sunteți pe pagina 1din 2

Cargar

un archivo de datos

>problema<read.table("CASchools.csv",sep=",",header=T)
nombre

instruccin

archivo

con encabezamiento

(problema$students)
Seleccionar una variable
entera en el Archivo de datos selecciona la vble students en el conjunto problema
> nrow(problema)
Contar filas

> sum(problema$students)
Sumar trminos de una

variable
> mean(problema$read)
Media conjunto de datos

Cargar archivo de grficos
install.packages("ggplot2", dependencies=T)
library(ggplot2)
Grfico de dispersin de dos
variables

g1.1 <- ggplot(data=problema, aes(x=read,y=math)) + geom_point()


define datos selecciona ejes
+ labs(x="lectura",y="matematicas")
etiqueta los ejes

plot(g1.1)
dibuja

Convertir un dato cualitativo


en cuantitativo( para ver los
datos de nuevo como al
principio hay que cargar la
tabla otra vez)
Resumen de los datos de una
variable

problema$county <- factor(ifelse(problema$county=="Orange", 1,2))


variable convierte el condadp orange en 1 y todos los dems en 2

summary(problema[problema$county==1,])

resumen datos dentro de los datos solo de los condados que son 1, es decir Orange

summary(ceosal$roe)
resumen de una variable concreta, de todos sus valores

summary(reg)

resumen de una regresin


Regresin simple entre dos


variables de un conjunto de
datos

reg <- lm(salary~roe, data=ceosal)


vble y vble x datos

Representacin de los datos


de una regresin

g <- ggplot(data=ceosal, aes(x=roe,y=salary)) + geom_point() +


datos vblex vble y
geom_abline(slope=a, intercept=b, colour = "red")
dibujar la recta de regresin en color rojo

Suma de residus

Suma de residuos por vble x

Suma de residuos cuadrados

sum(regceo$residuals)

sum(regceo$residuals*ceosal$roe)

sum((regceo$residuals)^2)

SCR

SCT

SCE

sum((regceo$residuals)^2)

sum((ceosal$salary-mean(ceosal$salary))^2)

sum((regceo$fitted-mean(ceosal$salary))^2)

Aadir una variable que sea


modificacin de una ya
existente

hprice$sqmtr<- (hprice$sqrft)*0.0929030

Crear un nuevo dataframe


que contenga solo ciertos
datos del dataframe original

rent.1980 <- subset(rent, year==80)

Regresin lineal multiple



Regresin logaritmica

reg1 <- lm(price~sqmtr+bdrms, data=hprice)



reg1 <- lm(rent~log(pop)+log(avginc)+pctstu, data=rent.1980)

reg1 <- lm(log(rent)~log(pop)+log(avginc)+pctstu, data=rent.1980)

nueva variable en antigua vble conversin


mismo cjto de datos

Nuevo dataframe subcjto antiguo datos que quiero


Dataframe en el Nuevo dataframe

S-ar putea să vă placă și