Sunteți pe pagina 1din 2

INTRODUCCIÓN AL LENGUAJE EN R – SEMANA 1 – MODULO 05

Leer y escribir datos

Los datos a los que se hace referencia son tabulares. Están organizados por reglones y columnas.

1. Leer datos

Algunas funciones dentro del sistema base de R para leer datos en archivo de texto (no excel, spss, etc.)
read.table
read.csv
readLines
source
dget
load
unserialize

2. Escribir datos

Escribir datos y son análogas a las de lectura.


writeLines
dump
dput
save
serialize

3. read.table
Es una función más importante para leer datos en el sistema. Las otras funciones naces de esta
función.
Los parámetros más importantes de esta función son:
a. file
b. header
c. sep
d. colClasses
e. nrows
f. comment.char
g. skip
h. stringsAsFactors

a) Con los archivos pequeños


Es eficiente con archivos pequeños, porque hace la revisión de archivo de manera rápida y
eficiente. Si es muy grande se debe de utilizar parámetros para mejorar la lectura.
¿Qué hace?
- Por omisión ignora las líneas con #
- Descubre cuántos reglones hay
- Averigua qué tipos de variables va encontrando

datos <- read.table("datos.txt")

b) Con los archivos grandes


No leas los datos que superan la cantidad de memoria RAM
Establece comment.char="" (no hay ningún tipo de cometario) si no hay líneas comentadas en
el archivo. De esa manera disminuyes la cantidad de chequeos.
Consejos
- Utiliza el parámetro colClasses
- Averiguar la clase de cada columna es fácil

inicial <- read.table("datos.txt", nrows = 100)


clases <- sapply(inicial, class)
clases
v1 v2 v3
"integer" "integer" "integer"

datos <- read.table("datos.txt", colClasses = clases)


[aplica la función class a cada una de las columnas del objeto inicial. Este objeto lo guardamos
en el objeto clases]

- Establecer nrow desde el principio (dice cuántos reglones va a leer)

Extra: Tienes un archivo con 1 millón de usuarios y 100 datos por usuario.
- tienes 1 millón de reglones
- tienes 100 columnas
un millón * 100 * 8 (xq son numéricas) bytes  resultado pásalo a MB
Es mejor tener el doble de memoria RAM a lo que estamos cargando al sistema.

4. write.table y escribir objetos


x <- "cadena"
y <- data.frame(a = 2, b = "otra")
dump(c("x", "y"), file = "datos.R") [transcribimos x e y a un archivo llamado datos.R)
rm(x,y) [borramos x e y]
source("datos.R") [Si los llamamos a través de datos.R los objetos van a ir]
x
[1] "cadena"
y
a b
1 2 otra

5. Práctica 04

S-ar putea să vă placă și