Documente Academic
Documente Profesional
Documente Cultură
Datos de dispersin:
var(Monto) -> varianza
sd(Monto) -> desviacin estndar
Cear variable:
Deuda=NCM/NCP
Crear una nueva base de datos: ser la unin de la base de datos inicial +
Deuda
banca2=data.frame(banca, Deuda)
revisar si se cre:
head(banca2)
LABORATORIO 2
Graficos
Bloxplot(x,main=bloxplot de x)
Col=yellow
Xlab=hola
Ylab=chao
Xlim=c(0,100)
Ylim=c(100,100)
Distribuciones
X distribuye poisson (lambda 5)
P(x=2) -> dpois(2,5)
P(x=<2) -> ppois(2,5)
P(x=<k)=0,5 -> qpois(0,5,5)
CICLO
Es una sentencia que se realiza repetias veces
- IF (condicin)[sentencia]
- FOR (indicador IN desde:hasta)[sentencia depediente del indicador]
Metodo de los momentos
- E(Xr)=Xr barra
Mtodo de mxima verosimilitud
- f(x1,x1,,xn|tetha) = L(X|tetha) = pitatoria de a hasta n de fx(x|
tetha)
- fitdistr(X, FAMILIA)
Package: MASS
Para cargarlo: library (MASS)
Crear una variable
n=c(5,20,50,500,1000)
corchete [] busca posiciones -> n[3] posicin 3
crear una normal -> y=rnorm(n[1],100,5)
para mostrarla -> y
crear el mximo verosmil -> fitdistr(y,normal) y muestra media y
desviacin estndar aproximadas y abajo el error
antes de y=nrnorm poner for(j in 1:5)
queda as:
for(j in 1:5){
y=rnorm(n[j],100,5)
print(fitdistr(y,"normal"))
}
Es asintticamente insesgado, a medida que crece la muestra se acerca
mas a los valores reales
*SI SALEN PUROS + HAY QUE PONERLE STOP Y EJECUTAR*
Para probarlo:
Sigma gorro=2,9/raz de 5
5.067/sqrt(1000)
Actividad 2
T=read.table("clipboard", header=TRUE, dec=","
head(T)
attach(T)
hist(Tiempo)
fitdistr(Tiempo,"exponential")
para guarder: fitdistr(Tiempo,"exponential")$estimate
lambda=fitdistr(Tiempo,"exponential")$estimate
tetha=fitdistr(Tiempo,"normal")$estimate
para mostrarlos
lambda -> 1 solo valor
tetha -> media y desviacin estndar
crear vector auxiliar: aux=seq(0,20,0.02) de 0 a 20 con distancia
aux para mostrar
LABORATORIO 5
Para hacer una transformacin basta con aplicar la funcin al LI y LS, slo si
la funcin es montona.
Muestra pareada: hacer un examen a una muestra de enfermos y luego
hacrsela de nuevo despus de que tomaran un medicamento.
Para comparar 2 muestras primero comparo sus varianzas.
Para comparar sus varianzas se deben dividir ya que en ella tenemos
muestras conocidas, a diferencia de si comparramos con una resta.
Es estimador de mu distribuye normal, la resta de normales es normal, no
as la divisin de normales, por eso se ocupa la resta.
EJERCICIO
DJ=read.table("clipboard", h=T, dec=",")
head(DJ,1)
attach(DJ)
attach(DJ)
hist(RET.MO)
*IC para la media de RET.MO
t.test(RET.MO)$conf.int
*nombrar el IC
IC.retmo=t.test(RET.MO)$conf.int -> 95% confianza por defecto
*Aplicarle una funcin para transofrmarla
log(IC.retmo+1)
*IC para mu de RET.T
t.test(RET.T)$conf.int -> intervalo de confianza contiene al cero, eso es
bueno para los economistas.
*Comparemos las dos muestras
1 comparar varianzas
*IC para la razn de varianzas entre RET.MO y RET.T
var.test(RET.MO,RET.T)$conf.int
Las varianzas son distintas ya que el 1 no pertenece al intervalo. La
segunda es ms grande.
*IC para la diferencia de medias entre RET.MO y RET.T
t.test(RET.MO,RET.T,var.equal=FALSE,paired=FALSE)$conf.int
ya que el cero no pertenece al intervalo NO son iguales
Las muestras son diferentes
LABORATORIO 6
Grfico cuantil-cuantil
Emprica: 001112222233344 suponemos que distribuye poisson(2)
Teorica: 01112222333444 es una verdadera poisson
se ajustan segn el lugar?
function(p) fpois(p,2)
ACTIVIDAD
V1: nmero de meses en promocin durante el ao -> binomial o poisson
restringida
Entonces:
V1 distribuye binomial(n,p)
n=12
pgorro=Xbarra/n
veamos la base de datos:
datos=read.table("clipboard", h=T, dec=",")
attach(datos)
head(datos)
vamos a hacer un grfico pertinente para una variable discreta. En este
caso, lo mejor es usar un grfico de barras con eje:
plot(prop.table(table(V1)))
para poner puntos o lneas en el grafico hacer una variable auxiliar
aux=seq(0,9,1) 1 ya que es discreta
aux
crear p gorro
p.gorro=mean(V1)/12
p.gorro
points(aux,dbinom(aux,12,p.gorro),col="purple",lwd=5)
se ajusta correctamente? S, se acerca bastante
En el caso 2 la probabilidad binomial sobreestima a la emprica.
En 4 y 5 la terica subestima a la emprica.
Hacer cucuplot
qqplot(Datos,Simulacin)
qqplot(V1,rbinom(10000,12,p.gorro))
con el qqplot esperamos que se forme una recta. se form? S
Ahora vamos a hacer una lnea
qqline(V1, distribution = function(p) qbinom(p,12,p.gorro),col="red")
V4: tiempo en das entre que llegue un interesado
head(V4)
tenemos 3 opciones: poisson, exponencial o normal
veamos el histograma:
hist(V4,prob=TRUE)
library(MASS)
v4.normal=fitdistr(V4,"normal")$estimate
v4.gamma=fitdistr(V4,"gamma")$estimate
v4.exp=fitdistr(V4,"exponential")$estimate
aux2=seq(0,8,0.01)
lines(aux2,dnorm(aux2,v4.normal[1],v4.normal[2]),col="red")
lines(aux2,dgamma(aux2,v4.gamma[1],v4.gamma[2]),col="blue")
lines(aux2,dexp(aux2,v4.exp),col="green")
estos se ejecutan juntos
par(mfrow=c(1,3))
qqplot(V4,rnorm(10000,v4.normal[1],v4.normal[2]))
qqline(V4, distribution = function(p)
qnorm(p,v4.normal[1],v4.normal[2]),col="red")
qqplot(V4,rgamma(10000,v4.gamma[1],v4.gamma[2]))
qqline(V4, distribution = function(p)
qgamma(p,v4.gamma[1],v4.gamma[2]),col="red")
qqplot(V4,rexp(10000,v4.exp))
qqline(V4, distribution = function(p) qexp(p,v4.exp),col="red")
1- Ajuste a distribucion normal -> se desvirtan las colas, la tendencia
de la figura no es una recta, es una ola, no lo abarca correctamente
2- Ajuste a distribucion gamma -> se ajusta mejor
3- Ajuste a distribucion exponencial
LABORATORIO 7
H0: = 0
H1: distinto 0
Formas para rechazar o no la idea:
Ver que la media est en el intervalo
Ver si el estadstico observado est en una normal (0,1)
Rechazamos H0 cuando:
no pertenece a IC
Z0 pertenece a la RC
Valor p < alfa