Documente Academic
Documente Profesional
Documente Cultură
Presentado por:
ALONSO ARVALO
JEFFERSON PINZN
LERMAN CARABALLO
Profesor:
LUIS CARLOS SARMIENTO VELA.
TABLA DE CONTENIDO
3...33
4...34
5...35
Ejercicios Captulo 2
1- El ejercicio 1 requiere crear una variable con la funcin c para el largo, de
cabeza a tronco, de siete venados. Tambin se requiere agrupar en una variable
los valores sobre la presencia de tuberculosis en dichos animales:
Por ltimo pide calcular la media del largo de los siete animales:
2- El ejercicio 2 solicita crear las variables granja y mes. Teniendo en cuenta que
los valores de Granja son cadenas de caracteres se deben poner entre comillas.
Se us la funcin rep para especificar cuntas veces se repeta cada valor en la
variable Granja dentro de ella c para concatenarlos:
Luego se solicita usar cbind para combinar mes, largo, y datos de tuberculosis
bajo una variable a llamar Boar. Por ltimo se deben usar nrow y ncol para
especificar nmero de animales y de variables en Boar
(Dimensin 7x3. 3
En nuestro caso,
3- El ejercicio 3 pide
Luego, se pide
respectivamente:
Por ltimo se pide el total de casos por ao, para lo que se utiliza sum:
el
objetivo
de
crear
un
marco
de
datos
que
permita
omitirlas.
Luego se solicita extraer los datos de 2002, lo que nos arroja las filas desde la 385
a la 789:
Luego nos pide extraer los datos de abril de todos los aos, lo que nos arroja 109
observaciones:
Luego solicita extraer los datos obtenidos a una profundidad mayor de 2000
metros, en todos los meses y aos:
..
Por ltimo pide mostrar las observaciones hechas a ms de 2000 metros slo para
los meses de abril:
(No se muestran todos los datos por razones de espacio debido al tamao de la
base de datos, pero se muestra el comando utilizado y los primeros ejemplos que
aparecen).
3- El ejercicio 3 solicita exportar los datos extrados de solo abril a un archivo asci i
nuevo:
posterior
en
ingls:
Ejercicios captulo 4
1- Para el ejercicio cuatro se presentan una base de datos de observaciones
climticas hechas en la lnea costera holandesa durante 16 aos (1990-2005).
Dependiendo de la estacin, la frecuencia de toma de muestras oscil entre 0 a 4.
Se pide realizar una matriz para calcular las medias de tomas mensuales
dependiendo de la temporada. Tambin se debe calcular la desviacin estndar y
el nmero de observaciones mensuales.
Primero se procede a convertir los datos en archivo txt separado por tabulaciones
para
poder
importarlo
se
crea
el
data
frame.
meses y
con la variable temperatura dentro del ndice mes para calcular la media (FUN).
Este proceso se repiti de igual manera para la desviacin estndar cambiando
solamente FUN=sd. Para calcular el nmero de observaciones por mes se aplic
la funcin length a la variable Month del bucle TPi creado.
MEDIA
DESVIACIN ESTNDAR
2- El segundo ejercicio de este apartado, solicita calcular con los mismos datos
climticos el nmero de observaciones por puestos de observacin, por ao, y por
puesto de observacin en cada ao. Para este efecto simplemente se vuelve a
leer el marco completo de la tabla y se le pide al programa que muestre las tablas
para variable Station (TP$Station), luego la variable ao(TP$Year), y por ltimo
una de los dos ejes (TP$Station, TP$Year):
4- Como ejercicio cuatro para este captulo, se aplic la funcin sapply a la base
de EFT para calcular la media, la desviacin estndar, y el vector de longitud de la
muestra en las 11 preguntas de la escala de autoeficacia:
el
Ejercicio captulo 5
1- Se trabaja con una base de datos sobre animales arrollados en una carretera
en Portugal. Se solicita tomar el nmero de animales muertos (variable TOT_N), el
nmero de olivos (#OLIVE) y la distancia de los puntos de observacin a un
parque natural vecino (D_park), para realizar un grfico con los ejes TOT_N y
D_park. El grafico debe llevar una curva de error y las etiquetas adecuadas.
Una vez convertido el archivo .xls a archivo de texto separado por tabulaciones, se
lee la tabla en R y se ejecutan las lneas de comando, sin embargo se observan
los siguientes errores:
5- Como ltimo ejercicio de este apartado nos referimos a otro libro de los mismos
autores Analyzing Ecological Data (2007), para elaborar un diagrama de cajas
sobre especies de algas marinas en la Argentina:
se encuentra un
Ejercicios Captulo 6
1- El primer ejercicio solicita tomar el archivo sobre mediciones de temperatura
del ejercicio 4 y graficar la temperatura versus el tiempo de medicin en cada
estacin, y exportar las grficas como archivos .jpg.
Se Genera primero la funcin AllStations para pedir que seleccione los datos de
cada una, y se crea el bucle para cada estacin usando for e i, aclarando que
debe tomar todos los datos como numricos y as evitar errores. Luego se crea
GE (Grficos estaciones) y se especfica nombre de los archivos y tipo de archivo.
Se dan los valores a las ordenadas y se les otorgan etiquetas, as como ttulo con
main. Por ltimo se cierra el archivo jpg con dev.off().
2- El ejercicio 2 solicita crear una variable con Ifelse y paste que permita
seleccionar las observaciones de un solo nido de bhos y un solo tratamiento
dietario de manera que se puedan sacar en limpio las observaciones de una sola
noche. Por ltimo se pide usar el cdigo del ejercicio anterior para crear un grfico
de negociaciones entre hermanos versus el tiempo de llegada de los padres.
Ifelse y paste para crear la variable
Como primera medida se importa la base, y luego se crea la condicin para el
nido satiated (Tambin se podra generar con deprived) y la noche 1 (tambin
podra hacerse con noche 2):
De este modo el programa arroja las 598 observaciones totales para cada nido, y
mediante el comando head(Bhos) nos da los detalles que requerimos en la
condicin para el primer nido:
3- Este ejercicio pide replicar los pasos dados en el apartado 6.4 del captulo, en lo
referente a ndices de diversidad. Primero se solicita importar el archivo RIKZ.txt y
extraer las columnas 2 a 76.
::::::::::::
::::::::::::
::::::::::::::
Luego se pide encontrar una funcin que permita efectuar el total de varios sitios
de una sola vez. Esto se logra creando un loop:
Y luego encontrar una funcin que haga esto todo a la vez, usando el ciclo y
despus la suma de filas:
Por ltimo, se pide crear una funcin para todos los ndices de diversidad, que
permita seleccionar el ndice calculado y que permita manejar valores perdidos:
5- Como ltimo ejercicio para este apartado proponemos crear una variable con
Ifelse y paste que permita seleccionar las observaciones de los estudiantes con
puntaje mayor a 32 en el EFT, y de manera que se puedan sacar en limpio sus
resultados en todas las categoras:
Ejercicios Captulo 7
1- El ejercicio 1 pide retomar la base de datos de gripe aviar en el sudeste
asitico para crear un diagrama de torta con los casos por pas. Luego uno con el
total de muertes por ao, y por ltimo uno con las muertes por pas. Ya en el
ejercicio 1 del captulo 3 se haban calculado estos totales, por lo que se procede
a crear los diagramas con estos datos. Primero se elabora el total de casos por
pas:
2-
Este ejercicio requiere hacer un grfico de barras para las ocho medias
Para la siguiente grfica, se le pide que conserve los ruidos de los datos de
riqueza mediante jitter, luego se le pide que grafique con puntos los datos totales
del transecto 1 al 8 (1:8) (se usan los parmetros para forma y tamao
proporcional del punto respectivamente pch y cex), y se procede de igual manera
para la media sin desviacin y con desviacin estndar:
3- En este punto debe trabajarse con los mismos datos de vegetacin, para
elaborar un diagrama de cajas con los valores de R(Richness):
con la
con la
intensidad:
Del mismo modo se observa que la etapa 1 se ve ms afectada dentro del rea 3
que en otras reas. Lo que parece sugerir que los sujetos ms inmaduros se ven
ms propensos a ser afectados por los parsitos. Este aserto podra comprobarse
si se observa mayor presencia de sujetos inmaduros en el rea 3, lo que explicara
los grficos generados.
Se procede por ltimo a relacionar rea y Edad mediante el operador *, con la
intensidad:
b) Tiempo de llegada
Ejercicios captulo 8
1- Se debe cargar el paquete lattice
En este caso se observa que al usar el cdigo xyplot(T ~ MyTime | Station, type =
"l",
col.line =
El error se debe a que los valores de Area son raw bytes, es decir que no
representan valores, sino que solo etiquetan muestras especficas, por lo que no
tendra sentido representarlas en un grfico de dispersin (son variables
nominales) y as lo interpreta el programa.
Por tanto, la solucin consiste en ordenar los datos correspondientes a datos por
rea y datos por tiempo mediante
Nuevo<- order(Data$Area,Data$MyTime) y
Data2 <- Data[Nuevo,] para poder pedirle as que mejor haga los grficos de
dispersin
posteriormente la curva:
Curva de normalizacin
3 En el ejercicio 3
temperatura versus mes en cada rea. Luego se debe para poder comparar con
la figura 8.3 presentada en el captulo para datos de salinidad y comentar las
diferencias en los patrones.
Temperatura vs. Mes en cada rea (Ejercicio 3)
Comentario
Usando los diagramas de cajas comparados en la rejilla, es ms fcil establecer
patrones estacionales y variaciones de temperatura entre meses y reas
respectivamente.
4- Para este ejercicio se debe crear un diagrama de puntos Cleveland para
descubrir si hay ms outliers en los datos de salinidad de los presentados en la
misma grfica de captulo presentada en el ejercicio anterior. Para este efecto se
pide hacer una rejilla con todas las estaciones y comparar con la figura del
captulo notando diferencias en eje y. Se utiliza el cdigo:
dotplot(SAL ~ factor(Month) | Station,
strip = strip.custom(bg = 'white'),
cex=.5,pch=16,
data = Data, xlab = "Mes",
ylab = "Salinidad")
Se observa que existen outliers en DANT, MARS, HUB, NO2, adems de los que
ya haban sido presentados en las cuatro estaciones de la grfica del captulo.
Tambin se observa que el eje y permite reducir los estimados de temperatura que
se tenan en la grfica del captulo, puesto que el mximo ni siquiera se acerca a
35 en ninguna de las estaciones o meses.
Por ltimo, se pide consultar el argumento relation entrando a ?xyplot y aplicarlo.
Este argumento sirve para determinar los lmites de cada panel dentro de la rejilla,
dependiendo de la longitud de caracteres de las variables. En este caso se usa
relation= free, lo que nos permite observar con mayor precisin los valores reales
de temperatura, y corregir la apreciacin de que los mximos no se acercaban a