Documente Academic
Documente Profesional
Documente Cultură
Cursul 2-modul 2
De ce utilizam R
Este gratuit (open-source)
Functioneaza pe o mare varietate de
platforme incluzand Windows (dar si Mac,
Linux, chiar Playstation 3)
Ofera o platforma pentru programarea
metodelor noi de statistica intr-o modalitate
facila
Contine rutine statistice avansate care nu
sunt disponibile in alte programe
Include cele mai moderne disponibilitati
grafice
Permite o trecere graduala de la utilizator la
programator.
Cum se descarca
Se cauta pe Google using R sau
CRAN (Comprehensive R Archive
Network) sau
Se utilizeaza direct link-ul
http://www.r-project.org
Tutoriale
P. Kuhnert & B. Venables, An Introduction to R:
Software for Statistical Modeling & Computing
J.H. Maindonald, Using R for Data Analysis and
Graphics
B. Muenchen, R for SAS and SPSS Users
W.J. Owen, The R Guide
D. Rossiter, Introduction to the R Project for
Statistical Computing for Use at the ITC
W.N. Venebles & D. M. Smith, An Introduction to R
Lista completa de documentatie la:
http://www.r-project.org/doc/bib/R-books.html
Istoric
Initial R a fost creat de Ross Ihaka si
Robert Gentleman de la
Departamentul de Statistica al
Universitatii din Auckland, Noua
Zeelanda in cursul anilor 90 ca dialect
al limbajului S (creat in 1976 de catre
John Chambers in laboratoarele Bell).
Este un limbaj pentru realizarea
calculelor si reprezentarilor grafice in
statistica.
Interfata R
Odata cu pornirea sistemului R va
apare fereastra principala (RguiGraphic User Interface) cu o subfereastra (R Console)
In fereastra Consola cursorul ramane
in asteptarea comenzilor (>)
permitand lucrul in mod interactiv.
Alta metoda este lucrul cu ajutorul
scripturilor (apelate prin Open script)
Fereastra de lucru in
Comenzi de baza in R
Comenzile se pot introduce cate una in
momentul aparitiei prompterului (>)
sau se poate introduce un set de
comenzi dintr-un fisier sursa.
Exista o mare varietate de date cum ar
fi: vectori (numerici, de caractere,
logici), matrici, tabele de date si liste
Pentru a iesi din programul R utilizati
quit
>q()
Help
Pentru a obine informaii despre
facilitile oferite de functia help(), din R
> help.start()
Pentru a obine informaii despre o
anumit funcie R, de exemplu plot
> help(plot)
sau comanda alternativ
> ?plot
Introducere in R
Atribuirea si rezultatele calculelor pot
fi scrise sub forma de obiecte utilizand
operatori ca:
O sageata formata din caracterul mai
mic si caracterul liniuta (<-) - atribuire
Caracterul egal (=)
Putem utiliza semnul # pentru comentarii,
programul va ignora tot ceea ce scriem la
dreapta acestui simbol.
Obiecte
In R exista cinci tipuri de clase de obiecte:
Caracter
Numeric (numere reale)
Intreg
Complex
Logic
Obiectul de baza este vectorul. Un vector trebuie
sa contina numai obiecte de aceeasi clasa.
Singura exceptie este lista, reprezentata ca un
vector dar poate contine obiecte de clase
diferite.
Introducere in R
Aceste obiecte pot fi utilizate in alte calcule
Pentru a printa un obiect este suficient sa
introducem numele obiectului respectiv
Exista unele restrictii atunci cand denumim
un obiect:
Numele obiectului nu poate contine urmatoarele
simboluri !, +, -, #
Sunt permise punctul si underscore (.), (_)
Numele poate contine un numar dar nu poate
incepe cu un numar
R este case sensitive deci conteaza daca
utilizam litere mari sau litere mici
Date tabelare
-sunt reprezentate ca tipuri speciale de
liste in care fiecare element trebuie sa
aiba aceeasi lungime
-fiecare element al listei poate fi
considerat o coloana in timp ce lungimea
lui va reprezenta numarul de randuri
-spre deosebire de matrici, se pot stoca
elemente din clase diferite
- Sunt create cu ajutorul functiilor
read.table() sau read.csv()
Functii utile in R
length() # numar de elemente sau componente
str() # structura unui obiect
class() # clasa sau tipul unui obiect
names() # denumirile obiectelor
c() # combina obiecte intr-un vector
cbind() # combina obiecte sub forma de coloane
rbind() # combina obiecte sub forma de randuri
ls() # lista obiectelor curente
rm() # sterge un anumit obiect
newobject <- edit() # editeaza, copiaza,
salveaza un obiect nou
fix() # editeaza pe loc obiectul respectiv
Spatiul de lucru
Obiectele create in timpul unei sesiuni de
lucru in R sunt pastrate in memorie, iar
colectia de obiecte curente se numeste
spatiu de lucru.
Spatiul de lucru nu se salveaza in
calculator pana cand nu se da comanda de
salvare.
Cand se inchide fereastra se solicita
salvarea spatiului de lucru. Salvarea are loc
intr-un fisier .Rdata
Alte comenzi in R
> help (options) # ofera ajutor legat de
optiunile disponibile
> options() # setarile curente ale optiunilor
> options (digits=3) # nr de cifre utilizat
la tiparirea rezultatului
> history() # afiseaza ultimele 25 de
comenzi
> history(max.show=Inf) # afiseaza toate
comenzile precedente
Seturi de date in R
Comanda
> data() permite vizualizarea tuturor
seturilor de date disponibile
Iar comanda
> help(numele setului de date)
afiseaza detalii legate de setul de
date nominalizat
Intrari-iesiri
> source() afiseaza un program din
sesiunea curenta. Daca numele fisierului nu
include o cale, fisierul este luat din
directorul curent
> sink() defineste directia rezultatului
Optiunea append controleaza faptul ca
fisierul suprascrie sau se adauga unui fisier
Optiunea split determina daca rezultatul
este trimis atat spre ecran cat si spre fisier
Rezultate grafice
Functia dev.off() returneaza rezultatul catre
terminal. Mai exista urmatoarele
posibilitati:
Function
Output
pdf("mygraph.pdf")
pdf file
win.metafile("mygraph.w
mf")
windows metafile
png("mygraph.png")
png file
jpeg("mygraph.jpg")
jpeg file
bmp("mygraph.bmp")
bmp file
Importarea datelor
Din Excel
O prima varianta ar fi convertirea intr-un
fisier text cu virgula (comma) ca separator.
Primul rand va contine numele variabilelor
separate prin virgula.
Asociati variabila id cu numele randurilor.
mydata <- read.table("c:/mydata.csv",
header=TRUE, sep=",",
row.names="id")
Exemplu
varsta
sex
1
25 masculin
2
30
feminin
3
56 masculin
greutate
160
110
220
Exportarea datelor
Catre un fisier text cu separator tab
write.table(mydata,
"c:/mydata.txt", sep="\t")
Catre un fisier Excel
library(xlsReadWrite)
write.xls(mydata, "c:/mydata.xls")
Liste
Lista este o colecie de obiecte R care pot fi
de tipuri diferite i de mrimi diferite.
Crearea unei liste se face simplu prin funcia
list urmat ntre paranteze de numele
obiectelor ce o compun.
Baze de date in R
R include i un numr de baze de date care se
pot folosi n diverse aplicaii.
Aceste baze de date sunt de fapt data
frame-uri.
Pentru a vizualiza toate bazele de date
disponibile, se poate folosi funcia data:
> data()
i se va deschide o fereastr n care sunt
enumerate toate bazele de date disponibile.