Sunteți pe pagina 1din 22

Introduccion a la estadstica con Rstudio

Daniel Marn Benjumea.

4 de febrero de 2017

1. Gesti
on de Paquetes

Descripci
on de paquetes

packageDescription()
library(help="nombre del paquete")

Cargar paquetes

library()

Desactivar paquetes

detach("package:nombre.del.paquete")

Instalar paquetes

install.packages("nombre.del.paquete")

Actualizar paquetes

update.packages()

1
Eliminar paquetes

remove.packages("nombre.del.paquete")

2. Estructuras de datos

Objetos de R. Un objeto es una estructura de datos con la que R puede


operar. Existen varios tipos de objetos, los cuales son: Vectores, Matrices y
arrays, Listas, Tablas, Data frame o base de datos

Creaci on de objetos. Esta se lleva acabo realizando una asignacion para


la cual se utilizan los smbolos
< , =

Como ejemplo

x<-4
y=8
3->u

2.1. Vectores

Un vector es un conjunto de objetos que siempre tiene el mismo orden.


Existen vectores Numericos, L
ogicos y de caracter

Creaci on de vectores Para la creacion de vectores se pueden utilizar


cualquiera de los siguientes comandos:

c()
assingn()
Los dos puntos (:)
seq()
Distribucuones estadisticas

2
Como ejemplo

> genero<-c("True","False","Flase","True")
> genero
[1] "True" "False" "Flase" "True" \\

> amigos<-c(1,4,3,7,8,400)
> amigos
[1] 1 4 3 7 8 400\\

> assign("dinero",c(27,474,277,4))\\

> x2<-1:6
> x2
[1] 1 2 3 4 5 6\\

> x3<-seq(from=0,to=50,by=10)
> x3
[1] 0 10 20 30 40 50\\

> normal.aleatorio<-rnorm(6,mean=3,sd=4)
> normal.aleatorio
[1] 4.9856992 2.6796728 -3.8655481
[4] 8.6225182 0.2871521 5.7686200
>

2.2. Matrices y array

Una matriz es considerada una generalizacion bidimencional de vectores y


un array es considerado una generalizacion multi-dimensional de matrices.

Creacion de matrices y arrays Se pueden crear matrices o arrays


utilizando las funciones:

dim()
matrix()
array()

Como ejemplo

3
-Convertir un vector en una matriz:
v<-1:30
> v
[1] 1 2 3 4 5 6 7 8 9 10 11 12
[13] 13 14 15 16 17 18 19 20 21 22 23 24
[25] 25 26 27 28 29 30
> dim(v)<-c(10,3)
> v
[,1] [,2] [,3]
[1,] 1 11 21
[2,] 2 12 22
[3,] 3 13 23
[4,] 4 14 24
[5,] 5 15 25
[6,] 6 16 26
[7,] 7 17 27
[8,] 8 18 28
[9,] 9 19 29
[10,] 10 20 30

> v2<-1:30
> v2
[1] 1 2 3 4 5 6 7 8 9 10 11 12
[13] 13 14 15 16 17 18 19 20 21 22 23 24
[25] 25 26 27 28 29 30

> dim(v2)<-c(5,2,3)
> v2

, , 1

[,1] [,2]
[1,] 1 6
[2,] 2 7
[3,] 3 8
[4,] 4 9
[5,] 5 10

, , 2

[,1] [,2]
[1,] 11 16
[2,] 12 17
[3,] 13 18

4
[4,] 14 19
[5,] 15 20

, , 3

[,1] [,2]
[1,] 21 26
[2,] 22 27
[3,] 23 28
[4,] 24 29
[5,] 25 30

-Generar una matriz:

> m1<-matrix(data=46,nr=2,nc=2)
> m1
[,1] [,2]
[1,] 46 46
[2,] 46 46
> m2<-matrix(1:4,2,2)
> m2
[,1] [,2]
[1,] 1 3
[2,] 2 4

-Generar arrays:

> z<-array(1:16,dim=c(4,4))
> z
[,1] [,2] [,3] [,4]
[1,] 1 5 9 13
[2,] 2 6 10 14
[3,] 3 7 11 15
[4,] 4 8 12 16

2.3. Tablas

Son u
tiles para creacion de graficos estadsticos

5
Creaci
on de tablas Se pueden crear tablas con las siguientes funciones:

table()
Genera una tabla a partir de una objeto

as.table ()
se utiliza para convertir una matriz en una tabla

Como ejemplo

n<-rnorm(1000)
> n<-round(n,0)
> n<-table(n)
> n
n
-3 -2 -1 0 1 2 3
7 62 220 384 254 70 3

2.4. Bases de datos o data frame

Es un tipo de tabla bidimencional donde las columnas representan variables


y las filas casos.

Funciones importantes

data()
Permite llevar una base de datos al espacio de trabajo

str()
Descripci
on breve de la base de datos

head()
Permite ver la parte superior de la base de datos

tail()
Permite ver la parte inferior de la base de datos

view()
Permite observar la base de datos en forma tabulada

6
dim()
Proporciona las dimenciones de la base de datos

data.frame()
Crear base de datos a partir de un objeto

as.data.frame()
Convierte una matriz o una tabla en una base de datos

Como ejemplo

id<-1:6
> id
[1] 1 2 3 4 5 6

> peso<-c(80,75,76,73,85,85)
> peso
[1] 80 75 76 73 85 85

> correcto<-c(TRUE,FALSE,TRUE,TRUE,FALSE,TRUE)
> correcto
[1] TRUE FALSE TRUE TRUE FALSE TRUE

> letras<-c("a","b","c","d","e","f")
> letras
[1] "a" "b" "c" "d" "e" "f"

> datos<-data.frame(id,peso,correcto,letras)
> datos
id peso correcto letras
1 1 80 TRUE a
2 2 75 FALSE b
3 3 76 TRUE c
4 4 73 TRUE d
5 5 85 FALSE e
6 6 85 TRUE f

> str(datos)
data.frame: 6 obs. of 4 variables:
$ id : int 1 2 3 4 5 6
$ peso : num 80 75 76 73 85 85
$ correcto: logi TRUE FALSE TRUE TRUE FALSE TRUE

7
$ letras : Factor w/ 6 levels "a","b","c","d",..: 1 2 3 4 5 6

3. Introducci
on a los gr
aficos

3.1. Funci
on PLOT()

Contiene como argumento basicos X e Y y se utiliza de la siguiente manera:

attach(Base.de.datos)
Se selecciona la base de datos

plot(Variable.seleccionada.de.la.base.de.datos)

Como ejemplo

> attach(iris)
> plot(Sepal.Length)
8.0
7.5
7.0
6.5
Sepal.Length

6.0
5.5
5.0
4.5

0 50 100 150

Index

8
Existe otras asignaciones para la funcion PLOT(), las cuales se obtienen
asignando al comando type algunas de las siguientes letras:

p-Grafico de puntos(por defecto)


l-Grafico de lineas
b-Grafico de puntos y de lineas
o-Grafico superpuesto
h-histograma

Como ejemplos

> attach(iris)
> plot(Sepal.Length,type = "l")
8.0
7.5
7.0
6.5
Sepal.Length

6.0
5.5
5.0
4.5

0 50 100 150

Index

3.2. Gr
afico de dispersi
on

Contiene como argumento basicos X e Y , donde se encuentran relacionadas


dos variables.

9
plot(X,Y)

O tambi
en se puede relacionar la variable (Y,X) con el s
mbolo ~
plot(Y~X)

Como ejemplo

plot(Sepal.Length,Petal.Length)=plot(Petal.Length~Sepal.Length)
7
6
5
Petal.Length

4
3
2
1

4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0

Sepal.Length

3.3. Gr
afico de cajas

Para generar un grafico de cajas es necesario relacionar una variable cuali-


tativa con otra cuantitativa.

plot(Variable.cualitativa,Variable,Cuantitativa)

Como ejemplo

10
plot(Sepal.Length~Species)= plot(Species,Sepal.Length)
8.0
7.5
7.0
6.5
Sepal.Length

6.0
5.5
5.0
4.5

setosa versicolor virginica

Species

3.3.1. Gr
afico de series temporales

Se debe tomar variables que dependen del tiempo.

plot(variable)

Como ejemplo

> plot(EuStockMarkets)

11
EuStockMarkets
6000
5000
4000
DAX
3000
2000
8000
6000
SMI
4000
2000
4000
3500
CAC
3000
2500
2000
1500
6000
5000
FTSE
4000
3000

1992 1993 1994 1995 1996 1997 1998

Time

3.4. Gr
afico de barras

Se pueden generar graficos de barra cuando la variable esta representada


en una tabla.

plot(Variable)

Como ejemplo

plot(table(Sepal.Length))

12
10
8
6
table(Sepal.Length)

4
2
0

4.3 4.5 4.7 4.9 5.1 5.3 5.5 5.7 5.9 6.1 6.3 6.5 6.7 6.9 7.1 7.3 7.6 7.9

Sepal.Length

3.5. Gr
afico de mosaico

Se pueden generar grafico de mosaico con tablas bi o multinacionales.

plot(Variable)

Como ejemplo

plot(HairEyeColor)

13
HairEyeColor

Black Brown Red Blond


Male Female Male Female Male Female Male Female

Brown
Eye

Blue
Hazel
Green

Hair

3.5.1. Gr
afico de densidad

Son mas comunes en la probabilidad y muestras la densidad de una variable.

plot(density(Variable))

Como ejemplo

plot(density(Sepal.Length))

14
density.default(x = Sepal.Length)
0.4
0.3
Density

0.2
0.1
0.0

4 5 6 7 8

N = 150 Bandwidth = 0.2736

3.6. La funci
on hist()

Es una funcion que permite generar histogramas.

Como ejemplo

> h=rnorm(1000,46,3)
> hist(h)

15
Histogram of h
250
200
150
Frequency

100
50
0

35 40 45 50 55

Funciones importantes

breaks()
Se refiere al numero de barras que aparesen representadas en el histograma

density=Numero de lineas
Numero de lineas que se tienen en cada barra del histograma

angle= Angulo.en.grados
Nos da el angulo que toman las lineas generadas por la funci
on density()

border="Color "
Se utiliza para definir el color del border de las barras del histograma

col="Color"
Define el color de las barras

main="Nombre del gr
afico"
Genera el nombre del gr
afico

16
ylab="Nombre", xlab="Nombre"
Dan los nombres de el eje Y y el eje X respectivamente.

Como ejemplo

hist(h,col="green",border = "pink",density = 12,angle = 45,main="Histograma",


ylab ="frecuencia")

Histograma
250
200
150
frecuencia

100
50
0

35 40 45 50 55

3.7. La funci
on pie()

Se utiliza para generar graficos de torta.Como argumento principal se tiene


la variable x.

Como ejemplo

17
> pie(x=c(3,2,5),labels = c("Colores","Lapiceros","marcadores"))

Colores

Lapiceros

marcadores

3.7.1. La funci
on BARPLOT()

Sirve para generar graficos de barras.

Funciones importantes

name.arg= c(Vetor con nombre)


Asignar nombres a las barras

heigth=c(Vector con alturas)


Define las alturas de las barras

colors=c(Vector con colores)


Dar colores.Los n
umeros del 1 al 8 genera colores diferentes.

col=cm.colors(numero de barras)

18
Da colores

col=rainbow(numero de barras)
Colores del arco iris

3.8. La funci
on BOXPLOT

Sirve para generar graficos de cajas

Funciones importantes

Como ejemplo

barplot(height = c(3,5,7),col=c("violet","tan","gray"),
names.arg=c("carne","fruta","verdura") )
7
6
5
4
3
2
1
0

carne fruta verdura

barplot(height = c(3,5,7),col=rainbow(3),
names.arg=c("carne","fruta","verdura"))

19
7
6
5
4
3
2
1
0

carne fruta verdura

3.9. La funcion BOXPLOT()

Sirve para generar graficos de cajas.

Funciones importantes

boxwex=Numero
Sirve para modificar la anchura de la caja

notch=TRUE
Genera un hendidura en el gr
afico de cajas

Como ejemplo

boxplot(rivers,col = cm.colors(1),boxwex=0.7,
notch = TRUE)

20
3500
3000
2500
2000
1500
1000
500
0

3.10. Funciones para personalizar gr


aficos

text(posici
on X,posici
on Y,"texto"
Agregar texto dentro del gr
afico

rep(elemento,numero de veces)
repite un elemento el numero de veces indicadas

pch=Numero de punto
Tipo de punto

points()
sirve para a~
nadir puntos en coordenadas concretas.

lines()
sirve para a~
nadir lineas

abline()

21
22

S-ar putea să vă placă și