Documente Academic
Documente Profesional
Documente Cultură
CHIMBORAZO
FACULTAD DE CIENCIAS
ESCUELA DE FISICA Y MATEMATICAS
INGENIERIA EN ESTADISTICA INFORMATICA
TEMA:
OBJETIVO PRINCIPAL
Conocer todo lo relacionado al lenguaje de programación R
OBJETIVOS ESPECIFICOS
Reconocer todas las funciones que ofrece el lenguaje
Indagar sobre el tema , para comprender su funcionamiento y
propósito
Mediante la investigación adquirir conocimientos básicos sobre R
OBJETIVOS
El término “entorno” lo caracteriza como un sistema
completamente diseñado y coherente, antes que como una
agregación incremental de herramientas muy especificas e
inflexibles, como ocurre frecuentemente con otros programas
de análisis de datos. R es en gran parte un vehículo para el
desarrollo de nuevos métodos de análisis interactivo de datos.
Como tal es muy dinámico y las diferentes versiones no siempre
son totalmente compatibles con las anteriores. Algunos
usuarios prefieren los cambios debido a los nuevos métodos y
tecnología que los acompañan, a otros sin embargo les
molesta ya que algún código anterior deja de funcionar.
Aunque R puede entenderse como un lenguaje de
programación, los programas escritos en R deben considerarse
esencialmente efímeros.
INTRODUCCION
ESTRUCTURA
R es un lenguaje de
programación estadística
desarrollado por Ihaka y
Gentelmen en 1997.
Toma como base las
características del
software comercial S-
PLUS.
R es de código abierto
y de distribución
gratuita
R es un lenguaje de
programación orientado
a objetos, a los cuales se
R dispone de una
comunidad de
R se ejecuta desarrolladores/usuarios
exclusivamente mediante detrás que se dedican
S-Plus es más "amigable": el envío de instrucciones constantemente a la
Precio: R gratuito, S-Plus
HISTORIA
funcionalidad por menús en la línea de comandos: mejora y a la ampliación
comercial
(limitada) curva de aprendizaje más de las funcionalidades y
lenta, aunque más capacidades del
versatilidad programa. Nosotros
mismos podemos ser
desarrolladores de R
almacenamiento y manipulación efectiva de datos,
operadores para calculo sobre variables indexadas (Array),
en particular matrices,
una amplia, coherente e integrada colección de
herramientas para análisis de datos,
posibilidades graficas para análisis de datos, que funcionan
directamente sobre pantalla o impresora, y un lenguaje de
programación bien desarrollado, simple y efectivo, que
incluye condicionales, ciclos, funciones recursivas y
posibilidad de entradas y salidas. (Debe destacarse que
muchas de las funciones suministradas con el sistema están
escritas en el lenguaje R)
CARACTERISTICAS
R TIENE REGLAS SINTÁCTICAS:
REGLAS SINTACTICAS
En la introducción a R no se ha mencionado la
palabra estadística, sin embargo muchas
personas utilizan R como un sistema estadístico.
Nosotros preferimos describirlo como un
entorno en el que se han implementado muchas
técnicas estadísticas, tanto clásicas como
modernas. Algunas están incluidas en el entorno
base de R y otras se acompañan en
forma de bibliotecas (packages). El hecho de
distinguir entre ambos conceptos es
fundamentalmente
una cuestión histórica.
ESTADISTICA CON R
Puede ser instalado en
Los archivos pueden ser diversos sistemas
guardados en varios formatos operativos: IOS de
(jpg,png, bmp, ps, pdf, emf, MAC, Linux o Windows
pictex, xfig, dependiendo del Realiza cálculo
Necesita tener
sistema operativo) Permite estadístico
ordenados los
importar y exportar archivos
datos en
carpetas
Capacidad de
análisis de datos Es un programa de
código abierto y
gratuito
Elabora gráficos de
calidad (dependiendo
VENTAJAS del cálculo realizado)
Interfaz poco Utiliza una sintaxis
amigable Es necesario tener exigente (comandos)
conocimiento de
estadística y
programación o No
presenta un interfaz
gráfico (lineal)
No proporciona pistas
sobre los errores que
suceden
Inglés (aunque permite
elegir el idioma para la
instalación)
DESVENTAJAS
Los operadores aritméticos
toman los valores numéricos
(literales o variables) como sus
operando y devuelve un solo
valor numérico. Los
operadores básicos en R se
clasifican en :
OPERADORES:
OPERADORES ARITMETICOS
Los operadores lógicos nos
proporcionan un resultado a partir
de que se cumpla o no una cierta
condición. Esto genera una serie de
valores que, en los casos más
sencillos, pueden ser
parametrizados con los valores
numéricos 0 y 1
OPERADORES LOGICOS
A continuación se realiza una descripción somera
de los tipos de objetos disponibles en el lenguaje
de programación R, que puede ser útil para
interpretar la información que presentan las salidas
de Rcommander.
1. Tipos básicos
Los tipos de valores básicos en R son: lógicos
(booleanos), numéricos y cadenas de caracteres
Asignación
La asignación de valores a objetos se
realiza mediante los operadores “<-”
o “=” (no confundir con el
comparador de igualdad “==”). El
nombre del objeto puede contener
OBJETOS EN R “.” y “_”:
> a <- 8.5
Lógicos Las constantes lógicas Caracteres Las cadenas pueden
Números Las constantes
son TRUE (verdadero) delimitarse por comillas
numéricas adoptan la
y FALSE (falso). Téngase en (~nombre~) o por apóstrofos
notación habitual en
cuenta que, en los ejemplos, el (’nombre’), lo cual puede
informática: punto
símbolo > al principio de una aprovecharse para incluir
decimal, notación
orden es el inductor de la cómodamente comillas en la
exponencial o científica...
consola de R. cadena sin necesidad
de escaparlas mediante una
retrobarra;
así, ’Lo llamaban ~Trinidad~’ equiv
aldría a ~Lollamaban \~Trinidad\~
Tipos compuestos Vectores Podemos crear un vector mediante la función c,
Hasta ahora los valores considerados que concatena:
son simples; podrían > b <- c(1, 2, 3, 10)
llamarse átomos o escalares. En R hay Los escalares en R son siempre vectores de longitud 1, así
también estructuras compuestas, que la asignación de a en la sección anterior es
entre las que veremos los vectores, los equivalente a:
factores, las matrices, las listas y los > a <- c(8.5)
dataframes. Toda la aritmética en R (así como muchas de sus
funciones) es vectorial. Por ejemplo, se pueden sumar
vectores (aunque no sean de la misma longitud):
>a+b
[1] 9.5 10.5 11.5 18.5
El [1] que aparece al comienzo del renglón es una ayuda
para localizar posiciones en vectores largos:
> 10:50
[1] 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 2
9 30 31 32
[24] 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
Así, el 32 ocupa la posición vigesimotercera.
Por su parte, las variables estadísticas cualitativas
se representan en R mediante factores. Un factor
Factores Las variables estadísticas cuantitativas es un vector al que se asocia un vector de
se representan en R mediante vectores niveles o modalidades (que son cadenas de
numéricos; por ejemplo, al aplicar la texto). La recopilación de los niveles puede
orden summary (resumen estadístico) al vector ocurrir automáticamente (por ejemplo, al crear
definido en el epígrafe anterior se obtiene: un dataframe) o puede forzarse mediante la
> summary(bab) orden factor. Por ejemplo:
Min. 1st Qu. Median Mean 3rd Qu. Max. > mi.vector <-
1.0 2.0 3.0 4.5 8.5 10.0 c(~varón~, ~mujer~, ~mujer~, ~varón~, ~varón~)
> summary(mi.vector)
Length Class Mode
5 character character
> mi.factor <- factor(mi.vector)
> mi.factor
[1] varón mujer mujer varón varón
Levels: mujer varón
> summary(mi.factor)
mujer varón
2 3
Matrices Una matriz es la versión bidimensional de un vector.
Se puede crear una matriz a partir de un vector datos, con la
orden matrix:
> m <- matrix(1:6, nrow = 2)
>m
[,1] [,2] [,3]
[1,] 1 3 5
[2,] 2 4 6
> m <- matrix(1:6, nrow = 2, byrow = T)
>m
[,1] [,2] [,3]
[1,] 1 2 3
[2,] 4 5 6
Arrayes Un array (o tensor) es la > x <- array (c (45,46,65,55,170,167,48,49,68,56,169,165), c (2,3,2))
> dimnames (x) <- list (c (~varones~, ~mujeres~),
generalización de una matriz de dos + c (~edad~, ~peso~, ~altura~),
dimensiones al caso multidimensional. + c (~Villarriba~, ~Villabajo~))
Se pueden crear a partir de vectores > x
(como las matrices con matrix) usando , , Villarriba
FUNCIONES EN R
Estas funciones devuelven un solo valor (o un vector de longitud 1), a excepcion de ´ range() que
retorna un vector de longitud 2, y var(), cov(), y cor() que pueden devolver matrices.
Las siguientes funciones pueden devolver vectores mas complejos:
La tabla a continuación resume algunas de las funciones graficas en R.
FUNCIONES GRAFICAS EN R
Las primeras tres líneas generan una muestra aleatoria
tomada de una distribución normal, ´
la cual es submuestras de tamaño 5, 10, 15, . . . , y 45.
Después viene la llamada a la funcion
densityplot() lo que produce una grafica para cada
sub-muestra. el panel toma una función´
como argumento. En este ejemplo, hemos definido una
funcion que llama a otras dos funciones ´
predefinidas en lattice: panel.densityplot que dibuja la
funcion de densidad empırica, y
panel.mathdensity que dibuja la funcion de densidad
teórica asumiendo una distribución
normal. La funcion´ panel.densityplot es llamada por
defecto si no se especifica ningún
argumento en panel: el comando densityplot(˜x | y)
hubiera dado como resultado la
misma
EJEMPLO
CONCLUSIONES
RECOMENDACIONES
BIBLIOGRAFIA