Sunteți pe pagina 1din 32

ESCUELA SUPERIOR POLITECNICA DE

CHIMBORAZO
FACULTAD DE CIENCIAS
ESCUELA DE FISICA Y MATEMATICAS
INGENIERIA EN ESTADISTICA INFORMATICA
NOMBRE: Shirley Armas
INGENIERA: Lourdes Paredes
FECHA: 20/01/2015

LENGUAJES

DE PROGRAMACION R
ORIENTADOS A LA ESTADISTICA

TEMA:

OBJETIVO PRINCIPAL
Conocer todo lo relacionado al lenguaje de programacin R
OBJETIVOS ESPECIFICOS
Reconocer todas las funciones que ofrece el lenguaje
Indagar sobre el tema , para comprender su funcionamiento y
propsito
Mediante la investigacin adquirir conocimientos bsicos
sobre R

OBJETIVOS

El trmino entorno lo caracteriza como un sistema


completamente diseado y coherente, antes que como una
agregacin incremental de herramientas muy especificas e
inflexibles, como ocurre frecuentemente con otros programas
de anlisis de datos. R es en gran parte un vehculo para el
desarrollo de nuevos mtodos de anlisis interactivo de
datos. Como tal es muy dinmico y las diferentes versiones
no siempre son totalmente compatibles con las anteriores.
Algunos usuarios prefieren los cambios debido a los nuevos
mtodos y tecnologa que los acompaan, a otros sin
embargo les molesta ya que algn cdigo anterior deja de
funcionar. Aunque R puede entenderse como un lenguaje de
programacin, los programas escritos en R deben
considerarse esencialmente efmeros.

INTRODUCCION

ESTRUCTURA

R es un lenguaje de
programacin
estadstica desarrollado
por Ihaka y Gentelmen
en 1997. Toma como
base las caractersticas
del software comercial
S-PLUS.
R es de cdigo abierto
y de distribucin
gratuita

QUE ES ?

R es un lenguaje de
programacin orientado
a objetos, a los cuales
se les asigna una serie
de caractersticas.

R es una implementacin opensource del lenguaje S (Bell Labs principios de los 90), que tambin
es la base del sistema S-Plus
(entorno comercial). R y S-Plus an
comparten una gran mayora de
cdigo
e
instrucciones,
pero
probablemente sern dos entornos
independientes en un futuro a
medio plazo.

HISTORIA

Precio: R gratuito, S-Plus


comercial

S-Plus es ms
"amigable":
funcionalidad por mens
(limitada)

R se ejecuta
exclusivamente mediante
el envo de instrucciones
en la lnea de comandos:
curva de aprendizaje ms
lenta, aunque ms
versatilidad

R dispone de una
comunidad de
desarrolladores/usuarios
detrs que se dedican
constantemente a la
mejora y a la ampliacin
de las funcionalidades y
capacidades del
programa. Nosotros
mismos podemos ser
desarrolladores de R

almacenamiento y manipulacin efectiva de datos,

operadores para calculo sobre


(Array), en particular matrices,

una amplia, coherente e integrada


herramientas para anlisis de datos,

posibilidades graficas para anlisis de datos, que


funcionan directamente sobre pantalla o impresora, y un
lenguaje de programacin bien desarrollado, simple y
efectivo, que incluye condicionales, ciclos, funciones
recursivas y posibilidad de entradas y salidas. (Debe
destacarse que muchas de las funciones suministradas
con el sistema estn escritas en el lenguaje R)

CARACTERISTICAS

variables

indexadas

coleccin

de

R TIENE REGLAS SINTCTICAS:

Distingue entre maysculas y minsculas

El smbolo > aparece antes de recibir cualquier instruccin. Si lo que se muestra es


un resultado, no aparece.

La tecla Enter, cambia de lnea y nos muestra los resultados de la lnea anterior.

El smbolo # comenta lo que se escriba a continuacin.

Si un comando es correcto sintcticamente, pero falta algo para terminarlo,


aparece un smbolo + en la siguiente lnea.

Para escribir varias instrucciones en la misma lnea se separan con ;.

La asignacin se realiza con los smbolos <- =, la igualdad tambin se usa con
otros objetivos, luego es recomendable usar el smbolo <-.

Para agrupar un conjunto de instrucciones usaremos {}.

La flecha hacia arriba del teclado nos permite acceder al historial de instrucciones.

El tabulador completa la instruccin.

REGLAS SINTACTICAS

En la introduccin a R no se ha mencionado la
palabra estadstica, sin embargo muchas
personas utilizan R como un sistema estadstico.
Nosotros preferimos describirlo como un
entorno en el que se han implementado muchas
tcnicas estadsticas, tanto clsicas como
modernas. Algunas estn incluidas en el entorno
base de R y otras se acompaan en
forma de bibliotecas (packages). El hecho de
distinguir entre ambos conceptos es
fundamentalmente
una cuestin histrica.

ESTADISTICA CON R

Los archivos pueden ser


guardados en varios formatos
(jpg,png, bmp, ps, pdf, emf,
pictex, xfig, dependiendo del
sistema operativo) Permite
importar y exportar archivos

Necesita tener
ordenados los
datos en
carpetas

Capacidad de
anlisis de datos

VENTAJAS

Elabora grficos de
calidad (dependiendo
del clculo realizado)

Puede ser instalado en


diversos sistemas
operativos: IOS de
MAC, Linux o Windows
Realiza clculo
estadstico

Es un programa de
cdigo abierto y
gratuito

Interfaz poco
amigable

Es necesario tener
conocimiento de
estadstica y
programacin o No
presenta un interfaz
grfico (lineal)

Utiliza una sintaxis


exigente (comandos)

No proporciona pistas
sobre los errores que
suceden
Ingls (aunque permite
elegir el idioma para la
instalacin)

DESVENTAJAS

Los operadores aritmticos


toman los valores numricos
(literales o variables) como sus
operando y devuelve un solo
valor numrico. Los operadores
bsicos en R se clasifican en :

OPERADORES:
OPERADORES ARITMETICOS

Los operadores lgicos nos


proporcionan un resultado a partir
de que se cumpla o no una cierta
condicin. Esto genera una serie
de valores que, en los casos ms
sencillos, pueden ser
parametrizados con los valores
numricos 0 y 1

OPERADORES LOGICOS

A continuacin se realiza una descripcin somera


de los tipos de objetosdisponibles en el lenguaje
de programacin R, que puede ser til para
interpretar la informacin que presentan las
salidas de Rcommander.
1.Tipos bsicos
Los tipos de valores bsicos en R son: lgicos
(booleanos), numricos y cadenas de caracteres

OBJETOS EN R

Asignacin
La asignacin de valores a objetos
se realiza mediante los operadores
<- o = (no confundir con el
comparador de igualdad ==). El
nombre del objeto puede contener
. y _:
>a<-8.5

LgicosLas constantes lgicas


sonTRUE(verdadero)
yFALSE(falso). Tngase en
cuenta que, en los ejemplos, el
smbolo>al principio de una
orden es el inductor de la
consola de R.

NmerosLas
constantes numricas
adoptan la notacin
habitual en informtica:
punto decimal, notacin
exponencial o
cientfica...

CaracteresLas cadenas pueden


delimitarse por comillas
(~nombre~) o por apstrofos
(nombre), lo cual puede
aprovecharse para incluir
cmodamente comillas en la
cadena sin necesidad
deescaparlas mediante una
retrobarra;
as,Lollamaban~Trinidad~
equivaldra
a~Lollamaban\~Trinidad\~

Tipos compuestos
Hasta ahora los valores
considerados son simples; podran
llamarsetomosoescalares. En R
hay tambin estructuras
compuestas, entre las que veremos
los vectores, los factores, las
matrices, las listas y los dataframes.

VectoresPodemos crear un vector mediante la


funcinc, que concatena:
>b<-c(1,2,3,10)
Los escalares en R son siempre vectores de longitud 1,
as que la asignacin deaen la seccin anterior es
equivalente a:
>a<-c(8.5)
Toda la aritmtica en R (as como muchas de sus
funciones) es vectorial. Por ejemplo, se pueden sumar
vectores (aunque no sean de la misma longitud):
>a+b
[1]9.510.511.518.5
El[1]que aparece al comienzo del rengln es una ayuda
para localizar posiciones en vectores largos:
>10:50
[1]1011121314151617181920212223242526
272829303132
[24]333435363738394041424344454647484
950
As, el 32 ocupa la posicin vigesimotercera.

FactoresLas variables estadsticas


cuantitativas se representan en R mediante
vectores numricos; por ejemplo, al aplicar la
ordensummary(resumen estadstico) al
vector definido en el epgrafe anterior se
obtiene:
>summary(bab)
Min.1stQu.MedianMean3rdQu.Max.

1.02.03.04.58.510.0

Por su parte, las variables estadsticas


cualitativas se representan en R mediante
factores. Un factor es un vector al que se
asocia un vector de niveles o modalidades (que
son cadenas de texto). La recopilacin de los
niveles puede ocurrir automticamente (por
ejemplo, al crear un dataframe) o puede
forzarse mediante la ordenfactor. Por ejemplo:
>mi.vector<-c(~varn~,~mujer~,~mujer~,
~varn~,~varn~)
>summary(mi.vector)
LengthClassMode
5charactercharacter
>mi.factor<-factor(mi.vector)
>mi.factor
[1]varnmujermujervarnvarn
Levels:mujervarn
>summary(mi.factor)
mujervarn
23

MatricesUna matriz es la versin bidimensional de un


vector. Se puede crear una matriz a partir de un
vectordatos, con la ordenmatrix:
>m<-matrix(1:6,nrow=2)
>m
[,1][,2][,3]
[1,]135
[2,]246
>m<-matrix(1:6,nrow=2,byrow=T)
>m
[,1][,2][,3]
[1,]123
[2,]456

ArrayesUn array (o tensor) es la


generalizacin de una matriz de dos
dimensiones al caso
multidimensional. Se pueden crear a
partir de vectores (como las matrices
conmatrix) usando la ordenarray,
cuyo primer argumento es un vector
de datos y, el segundo, un vector de
dimensiones. Los comandos para
manejar arrayes son similares a los
que manejan matrices.

>x<-array(c(45,46,65,55,170,167,48,49,68,56,169,165),c(2,3,2))
>dimnames(x)<-list(c(~varones~,~mujeres~),
+c(~edad~,~peso~,~altura~),
+c(~Villarriba~,~Villabajo~))
>x
,,Villarriba

edadpesoaltura
varones4565170
mujeres4655167

,,Villabajo

edadpesoaltura
varones4868169
mujeres4956165
>x[~mujeres~,,]#Datosdetodaslasmujeres
VillarribaVillabajo
edad4649
peso5556
altura167165
>x[,~altura~,]#Todaslasalturas
VillarribaVillabajo
varones170169
mujeres167165
>x[,,~Villabajo~]#Datosparalapoblacin~Villabajo~
edadpesoaltura
varones4868169
mujeres4956165

DataframesLos dataframes son un tipo de


lista que sirve para generalizar a las
matrices, en el sentido de que las columnas
(que a menudo representan variables
estadsticas) pueden ser de tipos diferentes
(unas numricas y otras factores, por
ejemplo); sin embargo, todos los elementos
de una misma columna deben ser del
mismo tipo. Al igual que las columnas de
una matriz, todas las columnas de un
dataframe deben ser de la misma longitud;
lo mismo pasa con las filas. Por tanto, a un
dataframe se le pueden aplicar los
operadores de listas y los de matrices. Es la
estructura esencial para guardar valores de
variables estadsticas:

>d<-data.frame(v1=c(2,4,8,9),v2=c(~v~,
~v~,~m~,
+~m~))
>d
v1v2
12v
24v
38m
49m
>d[2,1]
[1]4
>d[1,]
v1v2
12v
>d[,2]
[1]vvmm
Levels:mv
>d$v1
[1]2489

FuncionesUn objeto de R tambin puede almacenar una


funcin:
>f<-function(x)x^2
que puede usarse como argumento de otras funciones:
>sapply(5:10,f)
[1]2536496481100
>sapply(5:10,sqrt)
[1]2.2360682.4494902.6457512.8284273.0000003.16227
8
al igual que las funciones predefinidas de R, comosqrt(raz
cuadrada). Como se ve, la funcinsapplyaplica una funcin
a cada elemento de un vector (o lista), y devuelve un vector
(o lista) de resultados.
A partir de aqu se incluye una serie de tablas que contienen
muchas de las funciones ms habituales en R.

Cada funcion en R tiene una tarea especifica que permite al usuario realizar lo que
necesite. El numero de funciones disponibles en R es demasiado grande para ser
listado en este documento. Se pueden encontrar todas las funciones matematicas
simples ( log, exp, log10, log2,sin, cos, tan, asin, acos, atan, abs, sqrt, . . . ), funciones
especiales (gamma, digamma,beta, besselI, . . . ), as como diversas funciones utiles
en estadstica. Algunas de estas funciones se detallan en la siguiente tabla.

FUNCIONES EN R

Estas funciones devuelven un solo valor (o un vector de longitud 1), a excepcion de range()
que retorna un vector de longitud 2, y var(), cov(), y cor() que pueden devolver matrices.
Las siguientes funciones pueden devolver vectores mas complejos:

La tabla a continuacin resume algunas de las funciones graficas en R.

FUNCIONES GRAFICAS EN R

Las primeras tres lneas generan una muestra


aleatoria tomada de una distribucin normal,
la cual es submuestras de tamao 5, 10, 15, . . . , y
45. Despus viene la llamada a la funcion
densityplot() lo que produce una grafica para cada
sub-muestra. el panel toma una funcin
como argumento. En este ejemplo, hemos definido
una funcion que llama a otras dos funciones
predefinidas en lattice: panel.densityplot que dibuja la
funcion de densidad emprica, y
panel.mathdensity que dibuja la funcion de densidad
terica asumiendo una distribucin
normal. La funcion panel.densityplot es llamada por
defecto si no se especifica ningn
argumento en panel: el comando densityplot(x | y)
hubiera dado como resultado la
misma

EJEMPLO

CONCLUSIONES

El lenguaje de programacin R es un lenguaje potente con un


gran objetivo orientado a la estadstica es por eso que si nos
profundizamos en el podremos conocerlo y analizarlo mas,
para asi poder aplicarlo en nuestra carrera.

RECOMENDACIONES

Revisar la interfaz grafica del programa para asi poder


conocerlo y poder compartir opiniones y experiencias en
clases , interactuando entre compaeros e ingeniero.

http://cran.r-project.org/doc/contrib/R-intro-1.1.0-espanol.1.pdf
http://areaestadistica.uclm.es/events/Sesion1/Sesion1.html
http://www.ecured.cu/index.php/Lenguaje_de_programaci
%C3%B3n_R
http://www.slideshare.net/ccccarlos/leccin-2-uso-deoperadores-en-r
http://www.uv.es/conesa/CursoR/material/handout-sesion2.pdf

http://uce.uniovi.es/CURSOICE/Informese6.html

BIBLIOGRAFIA

S-ar putea să vă placă și