Sunteți pe pagina 1din 8

#SESIN 1

#SINTAXIS DE UN VECTORES EN R^n


#1) UNA FORMA MUY SIMPLE DE ESCRIBIR UN VECTOR ES
x<-c(1,2,3,4,5,6,7,8,9,10)

#2) PARA GENERAR SUCESIONES NUMERICAS CRECIENTES SE UTILIZA


y<-1:10
y
#PARA GENERAR SUCESIONES NUMERICAS DECRECIENTES SE UTILIZA
y<-10:1
y

#3 PARA GENERAR SUCESIONES MAS COMPLEJAS SE UTILIZA LA FUNCION seq() o seq(from=


0, to=1)
z<-seq(0,1,by=0.2)
z

#4 lA funcion rep(), PERMITE DUPLICAR OBJETOS DE FORMA DIVERSAS, POR EJEMPLO, Q


UEREMOS REPLICAR EL VECTOR V TRES VECES
v<-c(1,2,4,5)
p= rep(v, times=3)
p
#rev() invierte las componente del vector
rev(x)
#R EN R HAY VECTORES LOGICOS QUE SOLO PUEDEN TOMAR LOS VALORES FALSE (falso) y T
RUE (verdadero)
#PUEDE ACTUAR SOBRE VECTORES NUMERICOS
x<-c(1,2,3,4,5,6,7,8,10)
tem<-x>5
tem

#LOS OPERADORES LOGICOS SON: < (menor), <= (menor o igual), > (mayor), >= (mayor
o igual),== (igual),
# y != (distinto). ADEMAS, si c1 y c2 son expresiones logicas, entonces c1&c2 es

su interseccion ( conjuncion ),
# c1|c2 es su union ( disyuncion ) y !c1 es la negacion de c1.

#PARA PEDIR LA COMPONENTE 4 DE UN VECTOR UTILIZAMOS


y=c(1,2,5,3,7,5,9,3,10,28)
y[4]

#PARA PEDIR LAS COMPONENTE MAYORES QUE 4 DE UN VECTOR UTILIZAMOS


x[X>4]
# realizar la suma de cada nmero en un vector con los numeros que le anteceden.
cumsum(x)

mean(y)
#desviacin tpica
sd(y)
#varianza
var(y)
#tabla de distribuciones de frecuencia
y=c(15,23.7,19.7,15.4,18.3,23,14.2,20.8,13.5,20.7,17.4,18.6,12.9,20.3,13.7)
range(y) # valor mnimo y valor mximo
rango=23.7- 12.9
rango
n=6 #numero de clases
amplitud=rango/n #amplitud de clase
amplitud

#Frecuencia absoluta
fabs=table(cut(y,breaks=seq(12,24,2),rigth=TRUE))
fabs

#Para calcular las frecuancias absoluta acumulada utilizamos.


fabsA=as.table(cumsum(fabs))
fabsA

#frecuencia relativa
Frel=(table(cut(y,breaks=seq(12,24,2),rigth=TRUE))/length(y))
Frel

#para redondear a dos cifras


Frel=round(Frel,2)
Frel

#frecuencia relativa acumulada


frelA=as.table(cumsum(Frel))
frelA

#Las tablas anteriores la podemos escribir como data.frame y cambiarle nombres


fabs=data.frame(fabs)
names(fabs)=c("intervalo","fabs") # cambia el nombre
fabs

fabsA=data.frame(fabsA)
names(fabsA)=c("intervalo","fabsA") # cambia el nombre
fabsA

Frel=data.frame(Frel)
names(Frel)=c("intervalo","Frel") # cambia el nombre
Frel

frelA=data.frame(frelA)
names(frelA)=c("intervalo","frelA") # cambia el nombre
frelA

#Para unir todas las tablas de frecuencia en una sola utilizamos


FrelAb=Frel[,-1]#elimina la columna uno
fabsAcu=fabsA[,-1]
frelAcu=frelA[,-1]
Tf=cbind(fabs,FrelAb,fabsAcu,frelAcu)
Tf
y=c(15,23.7,19.7,15.4,18.3,23,14.2,20.8,13.5,20.7,17.4,18.6,12.9,20.3,13.7)
dato=y
dato
min=12
max=24
Amplitud=2
Tabla.Frecuencia=function(dato){frecuencia=table(cut(dato,breaks=seq(min,max,Amp
litud),right=TRUE));
frelativa=round((frecuencia/length(dato))*100,2);
FAAcum=cumsum(frecuencia);
FAR=cumsum(frelativa);
tabla=cbind(frecuencia,frelativa,FAAcum,FAR);
print(tabla)}
Tabla.Frecuencia(dato)

#Ejemplo
m=c(100.78 ,88.06 ,92.18,79.30,101.85 ,74.91,106.33,114.29,109.09,107.87,
81.19,105.15,108.96,107.40 ,83.09 ,97.72 ,95.32,99.38,102.36,92.84,
112.43,122.04,117.93,94.21,104.24,120.36,78.84,81.85,100.12,106.41)
dato=m
min(dato)
max(dato)
rango=min(dato)-max(dato)
rango
1+3.3*log(30)
amplitud=rango/(1+3.3*log(30))
Amplitud
Amplitud =1.8
min=0.9
max=22.5

# Diagrama de sectores
x=c(0.4,0.3,0.3,0.1)

nombres=c("Futbol=40%","Basket=30%","Voleibol=30","tenis=10%")
pie(x,labels=nombres)

#Diagram de barras
barplot(x,names.arg=nombres)

#Diagrama de caja
v=c(1.94,1.33,1.33,3.22,1.37,3.33,3.00,1.92,3.45,3.92,3.65,3.66)
boxplot(v)

#Histograma
hist(v, col="red")

#Producto escalar y sus aplicaciones


#EJEMPLO 1
#Supongamos que se tienen tres muestras las cuales consideraremos como vectores:
X=c(1,1,13,13)
Y=c(1,5,8,14)
Z=c(6,6,8,8)
#VECTOR CONSTANTE
V=c(1,1,1,1)
#PROYECCIN DE X SOBRE V
Prx=(((sum(X*V))/sum(V*V)))*V
Prx
#MEDIA DE X
mean(X)
#PROYECCION DE Y SOBRE V
PrY=(((sum(Y*V))/sum(V*V)))*V
PrY
#MEDIA DE Y
mean(Y)

#PROYECCION DE Z SOBRE V
PrZ=(((sum(Z*V))/sum(V*V)))*V
PrZ
#MEDIA DE Z
mean(Z)

#EJEMPLO 2
#Considerando los vectores anteriores X=(1,1,13,13), Y=(1,5,8,14) y Z=(6,6,8,8)
como muestras, hallamos las desviaciones tpicas muestral
#al escrivir las frmulas tenemos:
dX=sqrt(sum((X-Prx)*(X-Prx))/3)
dX
dY=sqrt(sum((Y-PrY)*(Y-PrY))/3)
dY
dZ=sqrt(sum((Z-PrZ)*(Z-PrZ))/3)
dZ
# En R calcula la desviacin tipica muestral con la instruccin
sd(X)
sd(Y)
sd(Z)

#EJEMPLO 3
#Los vectores siguientes muestran las mediciones entre peso P en kilogramo y tal
la T en centimetro de 20 nios
T=c(9,10,6,8,10,5,8,7,4,11,7,7,6,8,5,11,5,9,6,10)
P=c(72,76,59,68,60,58,70,65,54,83,64,66,61,66,57,81,59,71,62,75)
#VECTOR CONSTANTE
V=c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1)
#Calcular la media de cada una de las variables calculando el vector proyeccin

#1 PROYECCION DEL VECTOR T SOBRE V


PrT=(((sum(T*V))/sum(V*V)))*V
PrT
#PROYECCION DEL VECTOR P SOBRE V
PrP=(((sum(P*V))/sum(V*V)))*V
PrP

#2 Calcular las desviaciones tpicas muestrales de las variables usando la expresin


# DESVIACION TIPICA DEL PESO
dP=sqrt(sum((P-PrP)*(P-PrP))/19)
# DESVIACION TIPICA DE LA TALLA
dT=sqrt(sum((T-PrT)*(T-PrT))/19)

#3 Cual de los dos conjuntos de datos es ms homogeneo?


#COEFICIENTE DE VARIACION DE LA TALLA
CVT=sd(T)/mean(T)
CVT
# COEFICIENTE DE VARIACION PARA EL PESO
CVP=sd(P)/mean(P)
CVP
#4existe correlacion lineal entre las variable peso y talla?
# se explorara la relacin entre la variable T y P graficamente utilizando la inst
ruccin
plot(T,P)
#El coeficiente de correlacion lo calculamos con
cor(T,P)

library(Rcmdr)
Commander()
library(datasets)
data()
data(iris)
iris

data(longley)
longley
help.search("longley")
dim(longley)
longley.x <- data.matrix(longley[, 1:6])
longley.y <- longley[, "Employed"]
pairs(longley, main = "longley data")
summary(fm1 <- lm(Employed ~ ., data = longley))

S-ar putea să vă placă și