Documente Academic
Documente Profesional
Documente Cultură
Instalar R en el ordenador
El software R es totalmente libre y está disponible para Linux, Mac OS X y Windows.
http://cran.r-project.org (Enlace de descarga del software R)
Objeto: Cualquier cosa que se le pueda asignar un valor (int, double, string, vector, matrix…)
help(“name”) ?name
help.search(“name”) ??name
3. Input/Output en R
Input R statements and Output Text
Input statement from R script
Ejecuta script* de R. Si no se especifica ruta
source(“filename.R”) se supone que el archivo está en el actual
directorio de trabajo
Text output
Redirige la salida al archivo filename. Si
sink(“filename”) existe por defecto lo sobrescribe
dev-off()
Library statements
Muestra donde se encuentran las librerías
.libPaths() instaladas
https://cran.r-project.org/web/packages/library_name
Se pueden consultar dos cosas:
6. Modo de programación en R
R utiliza un modo de programación funcional en lugar de programación imperativa. Está
basado en el uso de funciones matemáticas, en contraste con la programación imperativa, que
enfatiza los cambios de estado mediante la mutación de variables.
Por esta razón carecen de transparencia referencial, es decir, la misma expresión sintáctica
puede resultar en valores diferentes en varios momentos de la ejecución del programa. Con
código funcional, en contraste, el valor generado por una función depende exclusivamente de
los argumentos alimentados a la función.
7. Dataset
R tiene distintas estructuras de almacenamiento de datos (objetos) para realizar estudios.
Puede hacer uso de:
Vectors
Matrix
Factors
data.frame
data.table
List
8. Data structure
Las principales estructuras de datos utilizadas en R son las siguientes:
En R un objeto es todo aquello que puede ser almacenado en una variable (constantes,
estructuras de datos, funciones e incluso gráficos).
El objeto viene definido por su modo (describe como está el objeto almacenado en R) y su
clase (informa a funciones genéricas como plot() cómo manejar el objeto)
8.1. Vectors
Los vectores pueden almacenar un único tipo de objeto pudiendo ser datos:
Numéricos
Caracteres
Lógicos
8.2. Matrix
Una matriz es un Array bidimensional. Pueden almacenar un único tipo de objeto pudiendo
ser datos:
Numéricos
Caracteres
Lógicos
Función:
*Notas:
Matrix statements
name_matrix<-matrix() Define una matriz guardándola en una
variable
rowSums()
colSumns()
cbind()
rbind()
8.3. Arrays
Un Array puede traducirse en una matriz de n-dimensionesl. Pueden almacenar un único tipo
de objeto pudiendo ser datos:
Numéricos
Caracteres
Lógicos
Función:
Arrays statements
name_array<-array()
Define un Array guardándolo en una variable
Numéricos
Caracteres
Lógicos
Esta estructura de datos admite diversas tipologías de datos por columnas. Es la más utilizada
en estudios estadísticos pudiendo mostrar variables por columnas y número de observaciones
por fila.
Ejemplo uso attach() y detach() para ahorrar código, recomendable para usos de un único
data.frame donde los nombre de las variables no pueden estar repetidos:
Para cuando pueden repetirse nombres de variables se debe hacer uso de la función with(), al
repetirse nombres de variables predomina la primera que se definió:
Es importante remarcar que with solo toma efecto en la sección de código comprendida entre
{ }. La limitación es que si se asigna un objeto dentro de { } no quedará reflejado en el código
global:
Para crear objetos dentro de { } y que tengan efecto fuera de esta sección de código es
necesario utilizar el operador de asignación especial <<- :
8.5. Factors
Estructura de datos utilizada para definir variables categóricas. Este tipo de variables no son
continuas, definimos un número limitado de categorías.
Es así como le es posible poder reordenar y operar con datos categóricos. Definimos además el
nivel con la función levels() o con la opción ordered=TRUE cuando se tratan de variables
categóricas ordinarias en lugar de nominales.
En el caso de levels() supone escribir una línea más de código con un vector que indique el
orden.
Ej:
Orden predeterminado
vector<-c(“a”,”b”,”c”)
ejemplo<-factor(vector)
levels(factor(vector))=c(“c”,”a”,”b”)
En este caso el orden es c(1), a(2), b(3).
factor(c(“c”,”a”,”b”),ordered=TRUE)
vector<-c(“a”,”b”,”c”)
factor(vector,order=TRUE,levels=c(“c”,”a”,”b”))
Factors statements
Define una variable categórica
factor(alto,bajo,..) definiendo el nivel alfabéticamente
8.6. Lists
Las listas son las estructuras de datos más complejas. Nos permiten agrupar cualquier tipo de
objetos, pudiendo agrupar objetos de distinto tipo. Podemos definir en una única lista un
conjunto de vectores, matrices …
Lists statements
Guarda una lista en la variable mylist
mylist<-list(Ob1,Ob2,..) donde se agrupan Objeto1, Objeto2, ….
mylist[[2]]
mylist[[“name_object”]]
mylist$name_object