Sunteți pe pagina 1din 4

#pas 1 : Generam ID pentru 500 firme

id<-1:500
#pas 2 : Consideram ca avem firme din 5 domenii de activitate astfel:30% sunt firme
din domeniul IT , 20% sunt firme din dom. consultanta , 25% din dom. constructii ,
12% automobile si 13% autospatiala
#Generati domeniul de activitate al firmelor

help("sample")
dom<-sample(1:5,size=500,replace=T,prob=c(0.3,0.2,0.25,0.12,0.13))
View(dom)
domeniu<-
factor(dom,labels=c("IT","Consultanta","Constructii","Automobile","Aerospatiala"))
#Generam domeniul firmelor
#Unim informatiile referitoare la id si la informatiile firmei
firme=data.frame(id,domeniu)
View(firme)

#Geenram venitul firmelor


#Stabilim ca firmele se impart in firme mici si firme mari si firme de dimensiuni
mediii cu proportia 40%firme mari,20%firme medii si restul firme de dimensiuni mici
#a)generam dimensiunea firmelor
dim<-sample(1:3,size=500,replace=T,prob=c(0.4,0.2,0.4))
dimensiune<-factor(dim,labels=c("mica","medie","mare"))
#Vreau sa vad tipul observatiilor pe cele trei categorii
View(dimensiune)
table(dimensiune)
#Adaugam coloana de dimensiune la tabelul initial
firme=data.frame(firme,dimensiune)
View(firme)

table(firme)
summary(firme)

#Determinati venitul total al firmelor stiind ca acesta urmeaza o repartitie


normala de medie 1000 pt firmele de dimensiuni mici si abatere de 100 respectiv o
normala de medie de 2000 si o abatere de 250 pt firmele medii si o normala de 5000
cu abatere de 200 pt firmele mari
#N(1000,100),N(2000,250)
#Extragem firmele de cele 3 dimensiuni din esantionul ...?

fmari<-subset(firme,dimensiune=="mare")
fmari
View(fmari)
summary(fmari[-1])

#Coloana de dimensiune ia cu == ceva identic


#subset=esantion,set=multime

fmici<-subset(firme,dimensiune=="mica")
fmici
summary(fmici)

fmedie<-subset(firme,dimensiune=="medie")
fmedie
summary(fmedie)
dim(fmedie)

#Generam variabila de venit pt fiecare tip de firma


#Generez firmele medii
venit01<-rnorm(108,mean=2000,sd=150)
View(venit01)

#Cand dau set seed nu se mai schimba valorile cand generez ceva
set.seed(43)
vt<-rnorm(dim(fmari)[1],mean=5000,sd=200)
vt
hist(vt)
summary(vt)

#Adaug acest venit pt firme mari la subsetul de firme mari...?


fmari<-cbind(fmari,vt)
fmari
View(fmari)
#cbind e pt unire de coloane

#generam venituri pt firmele medii


set.seed(40)
vt<-rnorm(dim(fmici)[1],mean=1000,sd=100)
vt
summary(vt)
fmici<-cbind(fmici,vt)
fmici
View(fmici)

set.seed(56)
vt<-rnorm(dim(fmedie)[1],mean=1500,sd=150)
vt
View(fmedie)

fmedie<-cbind(fmedie,vt)
View(fmedie)
summary(fmedie)

#unim liniile celor 3 obiecte,firme mici,medii,mari


#lbind pt a uni liniile
firme<-rbind(fmici,fmedie,fmari)
View(firme)
summary(firme)

#Reprezentati grafic venitul obtinut


plot(firme$vt,col="blue")
#din firme iau coloana de venit si dau si culoare
hist(firme$vt)

#Se stie ca firmele fac investitii folosind o ipoteza conform careia variabila de
investitii reprezinta 35% din venitul total pornind de la o expresie de forma
400+0.35*Venitul+e unde termenul de eroare e urmeaza o distributie de medie 0 si
abatere 1
#Generam distributia termenului eroare unde e urmeaza o distributie normala de
medie 0 si abatere standard 1
e<-rnorm(500,0,1)

inv<-400+0.35*firme$vt+e
summary(inv)

#adaugam investitiile,coloana de investitii adica la esantionul initial


firme<-cbind(firme,inv)
View(firme)
#reprezentati grafic si investitiile
plot(inv)
#cu set seed fac doar cand generez ceva,aici nu mai fac pt ca doar aplic o
formula,calculez,nu generez nimic

#Reprezentati grafic dependenta dintre venit si investitii si calculati


coeficientul de corelatie
#pe ox pun venitul si pe oy investitiile
#cu par si mfrow se rezolva
par(mfrow=c(2,1))
plot(firme$vt,col="green",main="venit total")
plot(firme$inv,col="green",main="investitii")

#dependenta dintre vt si investitii


plot(firme$inv,firme$vt,col="red",main="dependenta dintre venit si investitii")
cor<-cor(firme$inv,firme$vt) #coef de corelatie
cor

#Pas 4
#Adaugati o coloana in care calculati costul de productie pt fiecare firma in parte
stiind ca aceste costuri urmeaza distributii normale
#Pt firmele mari avem o distributie normala de N(3000,200),pt firmele medii
N(1000,50),pt firmele mic N(500,50)
ct<-rnorm(dim(fmari)[1],mean=3000,sd=200)
fmari<-cbind(fmari,ct)

ct<-rnorm(dim(fmedie)[1],mean=1000,sd=50)
fmedie<-cbind(fmedie,ct)
ct<-rnorm(dim(fmici)[1],mean=500,sd=50)
fmici<-cbind(fmici,ct)
firme<-rbind(fmari,fmedie,fmici)

#Calculati variabila d eprofit,utilizati histograma si faceti un grafic pt profitul


obtinut

firme$pf<-firme$vt-firme$ct #profit=venit-cost
pf<-firme$pf
View(firme)
hist(firme$pf)

firme$Rpf=firme$pf
Rpf<-firme$Rpf
View(firme)

#Extrageti un esantion care sa contina firmele din industria IT si calculati rata


rentabilitatii firmelor respective.Determinati care firme din acest sector are
profitul cel mai mare
firme$Rpf=firme$pf
Rpf<-firme$Rpf
View(firme)

#extragem un esantion cu firmele IT


IT<-subset(firme,domeniu=="IT")
IT
IT$Rpf<-IT$pf/IT$vt*100
Rpf<-IT$Rpf
View(Rpf)
summary(Rpf)

#care firma obtine cel mai mare profit


summary(IT[ ,7])
which.max(IT[ ,7])
IT[which.max(IT[ ,7]),]

which.min(IT$Rpf)

#Tema:
#Pentru fiecare firma din fiecare domeniu de activitate calculati rata de
rentabilitate si identificati care firma a obtinut rata rentabilitatii cea mai mare
si adaugati-le intr-un tabel,intr-o matrice.
#b)Reprezentati intr-un grafic unul sub altul profitul obtinut de firmele de
dimensiune medie din fiecare sector de activitate.Pt aceste firme furnizati
matricea de corelatie.

S-ar putea să vă placă și