Sunteți pe pagina 1din 42

Fase 3 - Elaborar documento de aplicación de conceptos de probabilidad

Presentado por:

Cesar rincón

Código: 1002587563

Universidad Nacional Abierta y a Distancia UNAD

Estadística descriptiva (Para agrarias)

30/04/2019
Introducción

Esta actividad se hace a través de un programa llamado R siendo este mismo el que nos
ayuda a nosotros como estudiantes a obtener un conocimiento acerca de probabilidades,
como también los tipos de variables aleatorias discretas y continuas. También podemos
analizar las distribuciones de probabilidad aplicadas a las ciencias agrarias.
Objetivos

 Definir conceptos de variables aleatorias y probabilidades


 Analizar distribuciones sobre probabilidad aplicada a ciencias agrarias
 Aprender a aplicar modelos probabilísticos
PREGUNTAS ORIENTADORAS

 Espacio muestral y con qué letra se denota.

Conjunto de todos los valores que potencialmente pueden asumir en un estudio


aleatorio. Tal conjunto de resultados posibles se denomina espacio muestral y es
usualmente denotado con la letra griega omega ().

 Punto muestral.

Se denomina punto muestral a cada uno de los posibles resultados de un estudio aleatorio,
es decir a cada elemento de 

 Evento muestral.

Se llama evento muestral a cualquier subconjunto de elementos de 

 Explique en sus propias palabras el experimento aleatorio del dado deben descargar
el CODIGODADO disponible en la siguiente columna. El estudiante debe entender
que, aunque no es un experimento agropecuario nos ayuda a entender los conceptos
planteados

Ejecución del codigodados en el programa R;


Se inicia el programa con la explicación de este en donde se puede observar el espacio
muestral de tirar dos dados, en él se ejecutan los eventos muéstrales respectivos y sus
puntos muéstrales.
En esta ocasión se suman el valor de las parejas respectivas de dados, dando como valores
mínimo y máximo 2 y 12 respectivamente
Se ejecuta la tabla para las frecuencias absolutas, absolutas acumuladas y relativas.
Por ultimo en cuanto a las tablas se ejecuta la de frecuencias relativas acumuladas, con las
conclusiones que nos da el código.
Se tiene el resultado del diagrama de barras de las frecuencias absolutas.
El grafico de las frecuencias relativas.
Y por último el grafico de frecuencias relativas acumuladas.

 Defina Variable aleatoria

Definiremos a una variable aleatoria como una función que asocia a cada elemento del
espacio muestral  un número real y luego a cada uno de estos valores le asignaremos
probabilidades de ocurrencia.

 ¿Qué significa que el espacio muestral de una variable aleatoria continua es no


contable?,¿que son variables aleatorias discretas proporcionales y que son
variables aleatorias discretas de conteo no acotado? De ejemplos este tipo de
variables.
El espacio muestral asociado a una variable aleatoria de tipo continua es no contable,
queriendo significar que, entre dos valores de la variable, pueden realizarse un número
infinito de otros valores.

 Variables aleatorias discretas proporcionales

Las proporciones que provienen de conteos que no pueden superar el número de elementos
evaluados, por ejemplo; número de semillas germinadas en cajas de Petri con 25 semillas
cada caja.

 Variables aleatorias discretas de conteo no acotado

Ejemplo; número de pústulas de roya por m^2 de cultivo.

 Existe dos conceptos de probabilidad el clásico y concepto frecuencial,


defina cada uno, en el caso del frecuencial explique el experimento de
germinación de una semilla cuál es el experimento aleatorio, cuál es el
evento, cuantos puntos muéstrales tiene.
 PROBABILIDAD CLASICA

Cuando  es finito (el número de puntos muéstrales es contable) se puede dar una
definición de probabilidad que se basa en la observación de los elementos del espacio
muestral. Ésta se desarrolló originariamente estudiando los juegos de azar. y se conoce
como el concepto o enfoque clásico de probabilidad: Si A es un subconjunto de puntos
muéstrales de , entonces la probabilidad de ocurrencia del evento A, denotada por P(A)
es:

 PROBABILIDAD (CONCEPTO FRECUENCIAL)

La definición frecuencial de probabilidad es distinta ya que se refiere a una serie repetida


de estudios aleatorios. Generalmente se usa cuando el espacio muestral es infinito y por
tanto no se pueden enumerar todos los resultados posibles del estudio. Así, se repite el
estudio un número grande de veces y se registra la frecuencia relativa de ocurrencia de cada
resultado, la que es luego usada como un estimador de probabilidad. La definición
frecuencial de probabilidad establece que: Si A es un evento y n^A es el número de veces
que A ocurre en N repeticiones independientes del experimento, la probabilidad del evento
A, denotada por P(A), se define como el límite, cuando el número de repeticiones del
experimento es grande, de la frecuencia relativa asociada con el evento.

EJEMPLO

consideremos que la germinación de una semilla es un experimento aleatorio (puede


germinar o no). Supongamos que con A se representa el evento “encontrar la semilla
germinada”.

Experimento aleatorio

Si se observan 1000 semillas, es decir se repite 1000 veces el ensayo de germinación


(N=1000) en condiciones tales que cada observación no afecte a las otras y 600 semillas
germinan (nA=600).

Evento aleatorio

Semillas que germinan

Puntos muéstrales

1000 semillas (germinan o no)

 ¿Qué diferencia existe entre el concepto de frecuencia relativa y el de


probabilidad?

Si bien la analogía es fundamental, las frecuencias se entienden como probabilidades


sólo cuando N tiende a infinito. Si el número de veces que se repite un experimento no
es grande, entonces hablaremos de frecuencia relativa y diremos que ésta “aproxima”
una probabilidad.

 ¿Que son eventos mutuamente excluyentes?, ¿cómo es la intersección de dos


eventos mutuamente excluyentes, si son excluyentes, dado un evento A y uno B,
a que es igual la P(AꓴB)?
Eventos mutuamente excluyentes

Se dice que dos eventos son mutuamente excluyentes si cada uno está formado por
puntos muéstrales distintos, es decir no existe ningún punto muestral en la intersección
de los subconjuntos que representan los eventos.

Cuando dos eventos son excluyentes, la intersección es cero y por tanto la probabilidad
de la unión de esos eventos, P(AB), es la suma de las probabilidades de cada evento.

 En el caso de distribuciones de variables aleatorias cuando una variable es


continua y simétrica que modelo se usa.

Para una variable continua y de distribución simétrica unimodal, es común el uso del
modelo normal.

 ¿Para una variable de conteo no acotado que modelo se utiliza?

Modelo de Poisson.

 ¿Para variables de proporciones que modelo se utiliza?

Modelo probabilístico Binomial

 Que variables tienen función de probabilidad y que variables tienen función de


densidad.

La función de distribución de probabilidad de una variable aleatoria discreta y la


función de densidad de una variable aleatoria continúa denotada como f(.) contienen
exhaustivamente toda la información sobre la variable.

 Cuáles son los parámetros más usados en estadística para estudiar y utilizar
funciones de distribución de variables aleatorias.

El valor esperado y la varianza son los parámetros más usados en estadística para
estudiar y utilizar funciones de distribución de variables aleatorias.

 ¿Qué es la esperanza matemática de una variable aleatoria, como se denota?

La esperanza matemática de una variable aleatoria, usualmente denotada por E(.) o la


letra griega Mu (µ) es, desde un punto de vista intuitivo, un promedio de los valores
asumidos por la variable, donde cada valor es ponderado por su probabilidad de
ocurrencia.

 ¿Qué es la varianza de una variable aleatoria, como se denota?

La varianza de una variable aleatoria, denotada por Var(.) o la letra griega Sigma al
cuadrado ( ^2 ), es una medida de dispersión. Su raíz cuadrada, denominada desvío
estándar (  ) es usada para expresar la dispersión en término de diferencias (o desvíos)
de cada dato respecto a la esperanza.

DISTRIBUCION NORMAL

 Qué tipo de histograma se seleccionar un modelo probabilístico para una


variable aleatoria continua cuando se tienen datos de esa variable

 Que es la estandarización, cuál es su fórmula.

nos permite llevar cualquier distribución normal a la distribución normal estándar. La


transformación, estandarización, tiene la siguiente forma:

Donde Y es el valor de la variable aleatoria que define el evento de interés,  y ^2 son
la media y la varianza de la distribución de Y.
DISTRIBUCIÓN BINOMIAL

 Qué tipo de conteos se trabajan con la distribución Binomial

La distribución Binomial puede usarse para el cálculo de probabilidades de eventos


provenientes de conteos acotados.

 En la distribución binomial que es n y que es P.

Número (n) de experimentos aleatorios.

Probabilidad (P) de ocurrencia.

 A que es igual la esperanza y la varianza en esta distribución.

La E(Y) y la V(Y) cuando Y tiene distribución Binomial son:

DISTRIBUCION DE POISSON

 Que tipos de conteos se trabaja con la distribución de Poisson.

La distribución de Poisson también sirve como modelo probabilístico para variables


discretas de tipo conteo. A diferencia de la Binomial, donde el conteo se realizaba sobre
n experimentos independientes, en el caso de la Poisson, los conteos se refieren al
número de veces que un evento ocurre en una unidad de tiempo o espacio dada (hora,
kilo, m^2, m^3, planta, etc.) y por tanto los valores de la variable no están acotados.

 En agronomía se usa para qué tipo de conteos, les recuerdo los ácaros por
ejemplo se pueden trabajar con esta distribución.

En Agronomía, la distribución Poisson suele usarse para modelar el número de insectos


sobre una planta, o en un golpe de red, el número de manchas defectuosas en un
mosaico, o en un metro cuadrado de piso, el número de colémbolos en 100 g de suelo, o
en 1000 cm^3 de suelo o el número de coliformes en 1 ml de agua, entre otros conteos
de interés

 Como se denota el único parámetro de esta distribución, a que es igual la


media y la varianza.

Esta distribución tiene un único parámetro, que representa la esperanza y también a la


varianza, es decir que cuando Y~ Poisson(), se cumple:

 Revisando el ejercicio de la tabla 3.1 del libro de Balzarini como se obtiene λ en


este caso a que es igual la media y la varianza.

Como;

Se tiene;

𝜇 = 37 𝑉(𝑌) = 37

Media y varianza respectivamente.


2. Aplicación de conceptos

Estudie el ejercicio de velocidad del viento y explicar por qué hay un


sitio mejor para el objeto del estudio.

Figura 2.3: Gráfico de la distribución empírica de la velocidad del viento


(km/h) en dos zonas de un establecimiento agrícola, denominadas zona sur
(izquierda) y zona norte (derecha). Balzarini, M. (2013), Estadística y
biometría. Pag 77.

De acuerdo con el texto, y teniendo en cuenta que un molino de viento


para generar electricidad comienza a funcionar cuando el viento alcanza
una velocidad de unos 19 km/h, logra su máximo rendimiento con vientos
entre 40 y 48 km/h y deja de funcionar cuando los vientos alcanzan los
100 km/h. y si lo que se busca es extracción de agua subterránea, se
espera una velocidad del viento promedio de 26 km/h.

En función de la velocidad del viento, la zona norte como aquella con


mejores aptitudes para usar la energía eólica puesto que la velocidad del
viento es aproximadamente de 46 km/h, esto es equivalente a decir que el
50% de las veces, el viento alcanzó una velocidad promedio de 46 km/h o
menor. El 10% de las veces, la velocidad del viento superó 48 km/h. El
rango de velocidades en la zona norte varió entre 37 km/h hasta 54 km/h,
mientras que, en la zona sur se registraron velocidades del viento que
oscilaron entre los 18 y 29 km/h. Sólo el 10% de las veces la velocidad del
viento superó los 26 km/h.

Ejercicio 2.1: Supongamos que se toma una muestra aleatoria con


reposición de tamaño n=2 a partir del conjunto {1,2,3} y se produce el
siguiente espacio muestral con 9 puntos muéstrales:

Ω= {(1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1), (3,2), (3,3)}

Supongamos además que definimos la variable aleatoria Y=suma de los dos


números. que conforma un nuevo espacio probabilístico y que estamos
interesados en los siguientes eventos:

El evento A conformado por los puntos muéstrales cuya suma sea un


número par, es decir:

A= {(1,1), (1,3), (2,2), (3,1), (3,3)} y P(A)=5/9

El evento B conformado por los puntos muéstrales cuya suma sea número
impar, siendo:

B= {(1,2), (2,1), (2,3), (3,2)} y P(B)=4/9

El evento C conformad por los elementos


cuya suma es 5. Preguntas:
a) ¿Qué tipo de concepto de probabilidad aplicaría
para calcular probabilidades?

Para este caso aplica el concepto clásico ya que es cuando Ω es


finito la definición de probabilidad se basa en la observación de los
elementos del espacio muestral.

b) Los eventos A y B, ¿son independientes?

 No son independientes pues A y B son subconjuntos.


c) ¿Cuál es la probabilidad de que ocurra A o B?

1, porque:
5
𝑃(𝐴) =
9
4
𝑃(𝐵) =
9
5 4
𝑃(𝐴𝑜𝐵) = + =1
9 9

d) ¿Cuál es la probabilidad de que ocurra B o C?

4/9

e) Representar tabularmente a F(Y)

Y F(Y)
2 1/9
3 3/9
4 6/9
5 8/9
6 1

Ejercicio 2.3: Los siguientes datos corresponden a la venta de tractores que registra una empresa
de maquinarias agrícolas en los días laborables del último año:

Tractores vendidos Cantidad de días


0 110
1 80
2 35
3 25
4 10
Total 260

Preguntas:

a) ¿Cuál es la variable en estudio?

X= Cantidad de tractores vendidos por día

b) ¿Cuántos resultados posibles tiene la variable? ¿Qué tipo de variable es?

La variable tiene 5 posibles resultados y es de tipo discreta


c) ¿Cuál es la probabilidad que hoy no venda ningún tractor?

110
𝑃(𝐴) =

260

d) ¿Cuál es la probabilidad que un día, seleccionado al azar dentro de los días


laborables del año, venda 3 o más tractores?

25 10 35
(𝐴) = (𝑥 = 3) + 𝑃(𝑥 = 4 𝑜 𝑚á𝑠) = = 0,1346
+ =
260

260 260

e) ¿Cuál es la probabilidad que en los próximos dos días venda 3 tractores?

(𝐴 = 𝑣𝑒𝑛𝑑𝑒𝑟 3 𝑡𝑟𝑎𝑐𝑡𝑜𝑟𝑒𝑠 𝑚𝑎ñ𝑎𝑛𝑎 𝑦 𝑣𝑒𝑛𝑑𝑒𝑟 3 𝑡𝑟𝑎𝑐𝑡𝑜𝑟𝑒𝑠 𝑝𝑎𝑠𝑎𝑑𝑜 𝑚𝑎ñ𝑎𝑛𝑎)


25 24
= × = 0,0088
260 260

Trabajo con variables de ciencias agrarias

Cada estudiante debe correr el modelo para una variable discreta y una continúa dando
conclusiones de lo encontrado acorde a su profesión. ¿cuál es conteo de más alta probabilidad?
En el caso de la variable continua el 50% de los datos de sus variables serán menores o iguales a
que a valor?
Variable discreta: HOGARES5

Para HOGARES5 se cuenta con MIN (5) y MAX (30). Se puede decir que en la mayoría de los
casos obtendremos un 13% como resultado en la frecuencia relativa.

La frecuencia absoluta permite identificar el número de veces que aparece un determinado valor
en el estudio HOGARES5. También, la suma de las frecuencias absolutas es igual al número
total de datos.

La frecuencia acumulada es la suma de todas las frecuencias absolutas de todos los valores
inferiores o igual al valor considerado para HOGARES5. La frecuencia relativa es el cociente
entre la frecuencia absoluta de un determinado valor y el número total de datos.

Entonces, un valor mayo o igual a 4 pero menor de 5 tiene una probabilidad de 0.13 o 13% para
la variable discreta HOGARES5. Y, mayor o igual a 5 pero menor de 6 su probabilidad será 0.25
o 25% de probabilidad.
Graficas para HOGARES5
Variable continua: PM5

Teniendo como tabla de frecuencias

Histogramas y poligono de frecuencias absolutas


Histograma de frecuencias relativas y polígono de frecuencias relativas acumuladas en
porcentajes
Donde se unen las líneas rojas es la mediana, podemos decir que el 50%.
3. En este punto se pretende que el estudiante aprenda a aplicar modelos probabilísticos
debe revisar en el capítulo tres modelos probabilísticos, en este los ejercicios de
aplicación de los modelos normal, binomial y Poisson, para lo cuál el estudiante debe
descargar el código MODELOS y ubicarlo en la carpeta estadística descriptiva, para
correrlo desde el programa R.
MODELO NORMAL

a. Deben revisar en el texto el ejercicio de las vacas del tambo en el texto, en el


código de MODELOS, deben correr el código para este ejercicio que esta con
los datos del texto, adicionalmente deben hacer la gráfica de la función de
densidad con una media de 28 y 23 ambas con una varianza de 10 misma
varianza en ambos casos, y hacer el ejercicio con un media de 32 y dos
varianzas una de 10 y otra de 8, es el caso de la misma media y dos varianzas,
que pasa cuando se cambia le media y hay la misma varianza, hacia donde se
desplaza la figura y que pasa cuando se cambia la varianza en que se afecta la
figura.

Media=28

Varianza=10

Media2=23
Media=32

Varianza=10

Varianza1=8
Lo que pasa cuando se cambia la media y se deja la misma varianza la esperanza aumenta,
pasa lo contrario cuando se cambia la varianza

b. En el texto revisar el ejercicio de los híbridos de maíz y en el código


MODELOS correr el código para los datos registrados en este código que son
los mismos del libro, adicionalmente determinar la probabilidad de un valor
entre 62 y 51 para el rendimiento, también la probabilidad de un valor menor
de 59 y un valor mayor a 53.

Rta: Probabilidad de un menor 59= 0.4432015

Probabilidad de un mayor 53= 0.8413447

Probabilidad del rango de valores 62 y 51= -0.5131801


MODELO BINOMIAL

c. En el texto deben revisar en tema de modelo binomial el ejercicio de la


germinación de semillas de panicum correrlo con los datos del código
MODELOS que son los mismos del libro, adicionalmente CON AYUDA DEL
CÓDIGO determinar la probabilidad de germinar 5 semillas, por lo menos
cuatro y a lo sumo 4.
Rta: 0.0583992 la probabilidad de que germinen 5 semillas.

Probabilidad al menos 4= 0.9218731

Probabilidad a lo sumo= 0.07812691

MODELO POISSON

d. El estudiante debe revisar del texto el ejercicio de las picaduras del Gorgojo,
correr el código MODELOS que está con los datos del texto, y adicionalmente
determinar cuantas de 100 semillas tendrán 3 picaduras y cuantas 6 o más, en
este caso saque las probabilidades de 0,1,2,3,4,5 las suma y se las resta a uno.

0.20 𝑒 −0.2
Rta: 𝑃(𝑌 = 0) = = 0.819
0

0.21 𝑒 −0.2
𝑃(𝑌 = 1) = = 0.164
1

0.22 𝑒 −0.2
𝑃(𝑌 = 2) = = 0.016
2

0.23 𝑒 −0.2
𝑃(𝑌 = 3) = = 0.002
3
0.24 𝑒 −0.2
𝑃(𝑌 = 4) = = 0.000
4

0.25 𝑒 −0.2
𝑃(𝑌 = 5) = = 0.000
5

1 − (𝑃(𝑌 = 1) + 𝑃(𝑌 = 2) + 𝑃(𝑌 = 3) + 𝑃(𝑌 = 4) + 𝑃(𝑌 = 5) = −0.001

La probabilidad de que de las 100 semillas tenga de 3 a 6 picaduras es de 0.998


Bibliografías

 Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat en


problemas de agronomía. Recuperado
de http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?docID=32217
75&query=bioestadistica

 Deaza D. (2018). OVI Distribuciones de probabilidad en el programa R.


Recuperado de: http://hdl.handle.net/10596/23235

S-ar putea să vă placă și