Documente Academic
Documente Profesional
Documente Cultură
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
CONTENIDO
PRESENTACIN.................................................................................................................................... 7
1.
2.
3.
4.
6.
7.1.2
7.1.3
7.1.4
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
8.
7.1.5
Distribucin Binomial:................................................................................................... 84
7.1.6
7.1.7
8.2.
8.3.
8.4.
9.2.
9.3.
10.1
10.2
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
PRESENTACIN
Dentro del mbito de la Estadstica como ciencia aplicada, un estudiante de Ingeniera debe adquirir
conocimientos que abarcan temas de anlisis descriptivo de variables, problemas de probabilidad,
estimacin de modelos probabilstico y simulacin de distribuciones de probabilidad, adems de la
inferencia estadstica y el estudio de modelos estadsticos multivariados.
El propsito de este material de apoyo es proveer al estudiante de Ingeniera (y de otras carreras) los
conocimientos aplicados en software para desarrollar y comprender los contenidos del curso Estadstica I
(Estadstica Aplicada) impartido por el Departamento de Matemtica y Fsica para la Facultad de Ingeniera y
Administracin. El software a utilizar ser Microsoft Excel. Se ha seleccionado Excel dado que es un
programa de uso masivo que cuenta con las herramientas bsicas suficientes para realizar tablas, grficos,
anlisis de dados y que nuestro futuro profesional Ingeniero sin duda, podr utilizar en el campo laboral.
La organizacin de este documento sigue el orden de un programa de Estadstica Matemtica habitual y que
es similar al orden de los contenidos que se tratan el curso de Estadstica I (Estadstica Aplicada). Incluye en
un principio los pasos para activar la herramienta Anlisis de datos que dispone Excel para Estadstica,
luego, se concentra el documento en el anlisis descriptivos de datos y el anlisis grfico, luego, ejemplifica
el clculo de probabilidad abarcando hasta el importante Teorema de Bayes, para luego, entrar en el anlisis
de las variables aleatorias discretas y continuas haciendo nfasis en la capacidad de Excel para realizar
simulaciones de este tipo de variables. Finalmente se complementa con la construccin de tablas bivariadas
para datos continuos (y discretos) como extensin al caso de variables cualitativas.
Este material es de carcter indito, pues corresponde a la recoleccin de cursos y experiencias de anlisis
en el software Excel realizada por los autores en distintos cursos de estadstica realizados en distintas casas
de estudio. Algunos de los problemas propuestos se recopilaron de textos de Estadstica que son citados
habitualmente en la bibliografa de un curso formal de Estadstica Matemtica.
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Figura 3. Esquema de pasos para seleccionar la herramienta de anlisis del men complementos.
En la ventana siguiente debe hacer click en la opcin herramienta para anlisis y luego aceptar.
La herramienta de anlisis de datos ha sido activada. Para visualizarla se debe ir a la opcin Datos de la
barra superior de la hoja de Excel. En la parte final aparecer activada la opcin Anlisis de datos.
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
La siguiente tabla dinmica, ser confeccionada con la base de datos dado.xlsx , la cual representa el
resultado obtenido del lanzamiento en 100 oportunidades de un dado equilibrado.
1. Ir a la opcin Insertar, en la parte superior de la planilla Excel que contiene los datos a trabajar.
2. Seleccionar la opcin Tabla dinmica.
10
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
3. Ingresar los datos en la opcin Tabla o rango. Cabe destacar que por defecto Excel usar el dato
ubicado en la primera fila como el ttulo de la tabla dinmica.
4. Por defecto las opciones de la tabla dinmica aparecern en la hoja de trabajo actual, pero es
posible indicar que aparezcan en una hoja nueva.
11
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
2.1
3.
En el recuadro Seleccionar campos para agregar al informe desplazar el campo con el nombre de la
variable (NcaraDado) hasta el recuadro Etiqueta de fila.
12
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
4.
Luego, en el recuadro valores hacer click sobre la opcin por defecto Suma de NcaraDado, y
seleccionar la opcin configuracin de campo de valor.
5.
6.
Con esto se ha generado una tabla de frecuencias absolutas para la variable de estudio NcaraDado, la cual,
resume la cantidad de veces que se obtuvo cierta cara del dado.
Por ejemplo, la cara del dado con el valor 1, se obtuvo 22 veces de los 100 lanzamientos.
13
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
3.
El objetivo de este video es mostrar el uso de la herramienta Anlisis de Datos para la obtencin de
estadsticas descriptivas y confeccin de un histograma de frecuencias.
Primero debemos seleccionar el men de DATOS y hacer click en la herramienta Anlisis de Datos
Cabe notar que cuando se utiliza un programa estadstico para los clculos de estadsticos descriptivos, no es
necesario confeccionar tablas de frecuencias.
Las tablas de frecuencias sern de utilidad para la confeccin de grficos y para presentar resumen de la
informacin en el informe final.
Para nuestro ejemplo utilizaremos la informacin que tenemos de las estaturas de 100 personas, disponibles
2
en el archivo Ejemplo descriptivas.xlsx .
Abrimos el archivo y tenemos:
14
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Con esta base de datos mostraremos lo que entrega la herramienta Anlisis de Datos en su opcin,
Estadsticas Descriptivas.
Vamos al men DATOS, hacemos click en Anlisis de Datos, posteriormente hacemos click en la
opcin Estadsticas Descriptivas y finalmente click en aceptar.
15
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
En esta ventana debemos ingresar el rango de datos que analizaremos, en este caso sern la columna donde
se encuentran las estaturas de las 100 personas, si se incluye en el rango de entrada el nombre de la
variable, entonces se debe marcar la opcin Rtulos en la primera fila.
16
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Para las opciones de salida, marcaremos la opcin Rango de Salida, y le indicamos una celda contigua a la
columna de datos, por ejemplo la D1, entonces los resultados que nos entregue Excel quedarn a partir de
esta celda.
Tambin si se estima por orden, podemos optar por dejar los resultados en una nueva hoja.
Marcamos Resumen de estadsticas y Aceptar.
17
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Las estaturas estn medidas con dos decimales que indican los centmetros, podemos entonces dejar las
estadsticas descriptivas que obtuvimos tambin con dos decimales, esto facilitar la interpretacin.
Seleccionamos el rango de los valores de las medidas y con el botn derecho seleccionamos Formato de
celdas.
18
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Queda la siguiente presentacin:
19
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
4.
Construccin de un Histograma.
Veamos ahora la construccin del histograma de frecuencia para los datos disponibles en la planilla
Ejemplo descriptivas.
Vamos al men DATOS, hacemos click en Anlisis de Datos, posteriormente hacemos click en la
opcin Histograma y finalmente click en aceptar.
20
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Aqu en el rango de entrada seleccionamos los datos que tenemos de las estaturas, en la opcin Rango
de clase no ingresaremos informacin, ya que queremos que el programa determine el nmero de clases
de nuestro Histograma, marcamos rtulo, seleccionamos un rango de salida, finalmente marcamos las
opciones Porcentaje acumulado , Crear grfico y aceptamos.
21
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Excel nos entrega una tabla de frecuencias con los porcentajes acumulados de dichas frecuencias, asociados
a una clase que Excel determina, aqu el programa para las 100 estaturas determin un resumen
construyendo 11 intervalos.
22
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
El histograma de frecuencias, adems, muestra el grfico de lneas con los porcentajes acumulados.
Para visualizar mejor, agrandamos el grfico y nos posesionamos sobre las barras para cambiar el ancho de
estas, recordemos que la variable estaturas es continua y las barras se deben visualizar juntas formando un
polgono de frecuencias.
Hacemos click con el botn derecho del mouse sobre una de las barras, seleccionamos dar formato a
serie de datos
23
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Con esta misma opcin, seleccionamos ahora el cono del balde que es para relleno y lneas, y hacemos
click.
24
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Luego elegimos un color negro para las lneas de las barras, cerramos la ventana.
Lo nico que falta es escribir un ttulo adecuado y dar nombre al eje de las clases.
Hacemos click sobre el ttulo y lo modificamos, escribiremos Histograma de frecuencia de las Edades, de
igual forma hacemos click sobre clase en el eje de las abscisas y lo modificamos, escribiremos all clase de
las edades.
Tenemos finalizado el histograma de frecuencias.
25
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
26
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
4.1
Una sociedad de Ingenieros consultores, decidi adquirir un nuevo Odmetro para tomar mediciones de
larga distancia, la decisin de hacer esta inversin fue necesaria dado que el que tienen actualmente ya
tiene 6 aos de antigedad y las ltimas muestras de medicin a un cierto punto que se han hecho con tal
instrumento, han tenido diferencias notorias.
La medicin que la empresa entrega entre dos puntos es el promedio de las mediciones hechas en tres
das distintos y a distintas horas del da, esto para no tener sesgo por factores como clima, luminosidad o
interrupciones externas.
El nuevo instrumento es tecnolgicamente ms avanzado y de mayor precisin (menor margen de error,+/0,5% ), segn lo que asegura la compaa que lo vendi.
La empresa adems de empezar a utilizar el nuevo odmetro, sigue utilizando el antiguo, dado la gran
demanda de proyectos en los cuales sus servicios de medicin han sido contratados.
Los ingenieros est consciente de la necesita contar con dos de estos instrumentos pero quieren tener
alguna evidencia de que las mediciones tomadas por el antiguo odmetro son realmente ms inexactas
con respecto a su media, que las mediciones tomadas por el nuevo.
Para esto los ingenieros deciden, ya conociendo una distancia entre dos puntos de 61,5 metros, tomar dos
muestras donde se harn 10 mediciones de esta distancia conocida, (10 das distintos), cada una con los dos
odmetros respectivamente (en metros), con las que calcularan medidas descriptivas, principalmente para
comparar medidas de tendencia central y de dispersin.
Los resultados de estos clculos ayudaran a tomar la decisin de desechar o seguir utilizando el antiguo
odmetro
3
27
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Para los clculos de las medidas de tendencia central, utilizaremos la herramienta de anlisis de datos
Estadsticas descriptivas.
En el men principal, elegimos la opcin datos, luego Anlisis de datos, y Estadstica descriptiva
28
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Calculamos primero las estadsticas descriptivas de las mediciones hechas con el odmetro antiguo, en el
rango de entrada marcamos el rango donde estn las medidas que se tomaron con el odmetro antiguo, de
la B2 a la B11, y en el rango de salida la celda F1, desde esa celda se desplegarn, los resultados y ACEPTAR
29
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Hacemos doble click entre las columna F y G, para ajustar el tamao de la columna F al contenido.
Tenemos entonces:
El mismo procedimiento hacemos ahora para obtener las estadsticas descriptivas de las medidas tomadas
con el odmetro Nuevo, los ubicamos a partir de la celda I1 para poder tener una mirada conjunta de los
clculos obtenidos, tenemos entonces:
30
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Observado los resultados obtenidos, marcaremos con un color de relleno gris, las estadsticas relevantes
Con respecto a las medias obtenidas, tenemos entre ellas una diferencia de 0,425 metros, es decir 42, 5 cm,
puede ser bastante dependiendo del contexto de la medicin, y lo ms importante que en relacin al valor
exacto, el odmetro nuevo, entrega una media ms cercana a la medida real que es 61,5.
Con respecto a la desviacin estndar obtenida, claramente las medidas tomadas por el odmetro antiguo,
presentan una mayor dispersin entre ellas, esto puede generar una mayor diferencia entre los promedios
finales cuando se tomen slo tres medidas.
Otro dato importante ac es el Rango, indicador tambin de dispersin de los datos, el rango que se dan en
las medidas tomadas por el odmetro antiguo es un metro superior con respecto a lo que presentan las
medidas tomadas por el odmetro nuevo.
Si observamos tambin el coeficiente de asimetra, nos podemos dar cuenta de que las mediciones tomadas
con el odmetro nuevo presentan una marcada asimetra negativa, esto quiere decir que los tatos en su
mayora, se presentan superiores al promedio
31
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Ahora obtendremos los histogramas de frecuencias para visualizar mejor el comportamiento de los datos.
Usando la misma herramienta Datos, Anlisis de Datos , Histograma
Para las medidas tomadas con el odmetro antiguo, el rango de entrada es desde la celda B2 a la B11, y el
rango de salida desde la celda F17, ACEPTAR
Excel para confeccionar el histograma de frecuencias, genera intervalos para agrupar las frecuencias, en este
caso gener cuatro intervalos, donde las marcas de clases se muestran a partir de la celda que indicamos
32
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
para la salida.
Como las variables son continuas, corresponde ajustar el histograma con intervalos continuos, nos
posesionamos sobre las barras y haciendo clic con el botn derecho elegimos la opcin Dar formato a la
serie de datos.
33
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Con la misma opcin Formato serie de datos, ahora elegimos Relleno y Lneas, marcamos lnea slida,
color negro, para visualizar mejor las barras en el histograma
34
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
35
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
La grfica aqu se visualiza ms simtrica con respecto al su promedio, y se corrobora con el coeficiente de
asimetra obtenido que es de 0,3266, que en este caso sera una leve asimetra positiva.
Con la informacin obtenida se puede concluir que de acuerdo a la diferencia que se presenta en el
promedio calculado por el odmetro antiguo respecto de la verdadera distancia y adems respecto del
promedio ms preciso entregado por el odmetro nuevo, ms la mayor dispersin indicada tanto por la
desviacin estndar, como por el rango de los datos de las mediciones obtenidas tambin por el odmetro
antiguo y la marcada asimetra negativa que se genera en la distribucin de estos, se debera dar de baja el
odmetro antiguo y comprar otro nuevo.
36
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
4.2
37
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
5
38
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
5.
Tablas de contingencia
El objetivo de este video es mostrar la forma de construir una tabla de contingencia a partir de una tabla
bivariada para dos variables cualitativas y que posteriormente servir de base para la construccin de una
tabla de contingencia.
Recordemos que una tabla bivariada es aquella que resume las frecuencias absolutas conjuntas y
marginales, a partir de ellas se pueden obtener medidas de estadsticos marginales y condicionales, adems
la tabla de contingencia resume la misma informacin pero en trminos de probabilidades.
Abriremos el archivo Ejemplo tabla contingencia, que contiene la base de datos que utilizaremos, esta
base contiene dos variables que son: el sexo y el nivel de estudios de 20 personas.
Lo primero que haremos es construir la tabla bivariada, para estos utilizaremos una Tabla dinmica.
Tomando posicin en cualquiera de las celdas donde se encuentran los datos, seleccionamos del men la
opcin insertar y posteriormente la opcin Tablas dinmicas, (primera opcin que aparece en el men).
39
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Al habernos posicionado en una celda de los datos Excel toma por defecto los datos adyacentes que no
tienen celdas vacas y es lo que muestra marcado con las lneas punteadas y que adems aparece como
rango de entrada en el recuadro. Cuando se trabaja con este tipo de tablas la base de datos no puede tener
celdas vacas.
En este recuadro tambin se solicita que se elija dnde queremos que est la tabla, aqu seleccionaremos
una celda adyacente a los datos, a veces por orden los ms conveniente ser una nueva hoja.
Seleccionamos aceptar y se crea automticamente la tabla dinmica, pero vaca
40
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Figura 47. Pantalla de campos de tabla dinmica.
Excel muestra a la derecha las opciones de la tabla dinmica, agrega automticamente los campos que
identific de la base de datos, que son justamente los nombres de los rtulos de cada variables.
La tabla dinmica espera que le indiquemos cuales de estos campos incluiremos en ella. Como queremos
construir una tabla bivariada debemos incluir las dos variables, dejando una de ellas asociada a rea de las
filas y la otra al rea de las columnas.
Seleccionamos entonces ambas variables, por defecto la tabla dinmica las deja automticamente
asociadas a las columnas, pero slo dejamos ah la variable Nivel de Estudios y arrastramos la variable
Sexo, hacia el rea de las filas.
Para que aparezcan el conteo de los datos debemos arrastrar nuevamente cualquiera de los dos campos a la
casilla Valores, para este ejemplo arrastraremos el campo Sexo.
41
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
En esta tabla de doble entrada podemos observar las frecuencias conjuntas absolutas y marginales.
Por ejemplo tenemos que 6 mujeres tienen un nivel de estudios Medio, tambin del total de las personas 10
son hombres y 10 son mujeres.
Ahora llevaremos esta tabla en trminos de probabilidades, que es la tabla de contingencia.
Posicionndonos sobre la tabla dinmica construida, hacemos click sobre el botn derecho y elegimos la
opcin, Mostrar valores como y luego % del total general.
42
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Finalmente posicionados nuevamente sobre la tabla, hacemos click con el botn derecho del Mouse y
elegimos la opcin Formato del nmero y luego nmero y dos decimales.
43
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Ahora esta tabla de contingencia contiene las probabilidades conjuntas y marginales calculadas a partir de
las frecuencias conjuntas y marginales que tenamos en la tabla bivariada.
44
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
45
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
5.1
El objetivo de este video es mostrar la forma de construir una tabla de contingencia con la funcin
Tabla dinmica
Abriremos el archivo Ejemplo tabla contingencia, que contiene la base de datos que utilizaremos.
Esta base contiene dos variables que son: gnero y nivel de estudios de 20 personas.
1. Ir a la opcin Insertar, en la parte superior de la planilla Excel que contiene los datos a
2.
3.
4.
5.
trabajar.
Seleccionar la opcin Tabla dinmica.
Ingresar los datos en la opcin Tabla o rango.
Por defecto las opciones de la tabla dinmica aparecern en la hoja de trabajo actual, pero es
posible indicar que aparezcan en una hoja nueva.
Hacer click en Aceptar
46
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
6.
El objetivo de este video es estudiar la obtencin de probabilidades condicionales y a travs del el teorema
de Bayes.
Ya en el video 3, se estudi el clculo de probabilidades simples, obtenidas las frecuencias marginales de una
tabla de contingencia. Recordemos tambin que la tabla de contingencia fue construida con una tabla
dinmica.
Rescatando la tabla de contingencia construida en el video 3, ahora la utilizaremos para obtener
probabilidades condicionales y aplicar el teorema de Bayes.
Las variables asociadas son sexo y nivel de estudios de 20 personas, construiremos el diagrama de rbol
para mostrar las probabilidades conjuntas y condicionales.
Lo primero que haremos es escribir las probabilidades conjuntas como la probabilidad de la interseccin de
los eventos
47
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Ahora utilizando la herramienta para escribir formulas, escribiremos las probabilidades conjuntas en
trminos de la interseccin de los eventos.
48
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Entonces:
La probabilidad de que la persona tenga educacin bsica y sea de gnero femenino es igual a 0,1
La probabilidad de que la persona tenga educacin media sea de gnero femenino es igual a 0,3
La probabilidad de que la persona tenga educacin superior y sea de gnero femenino es igual a 0,1
De igual forma:
La probabilidad de que la persona tenga educacin bsica y sea de gnero masculino es igual a 0,1
La probabilidad de que la persona tenga educacin media y sea de gnero masculino es igual a 0,15
La probabilidad de que la persona tenga educacin superior y sea de gnero masculino es igual a 0,25
49
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
50
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
En la siguiente columna y celda por medio, colocamos los tipos de educacin definidos en los eventos, estos
son EB, EM, ES, y los alineamos estos a la derecha.
51
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Para dibujar las flechas del diagrama de rbol, usando del men principal la opcin Insertar y luego
elegimos la opcin formas, y el icono de la flecha
52
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Una vez dibujadas las flechas, colocaremos en la columna siguiente, las probabilidades condicionales
asociada a cada evento, debemos recordar que cuando dos eventos son independientes se cumple que la
probabilidad de la interseccin de ellos es igual a la multiplicacin de las probabilidades de cada evento.
Dejando una columna de separacin y nuevamente haciendo uso de la herramienta para escribir
ecuaciones, expresamos y obtenemos las probabilidades condicionales que corresponden a cada rama del
diagrama de rbol segn la propiedad vista en clases.
Hacemos click en Insertar y luego ecuacin, arrastramos el cuadro hasta la celda contigua a la primera
rama del rbol, y escribimos
La probabilidad de que la persona tenga educacin bsica dado que es de gnero femenino es igual a la
probabilidad de que tenga educacin bsica y sea de gnero femenino dividido por la probabilidad de que la
persona sea de gnero femenino, esto es 0,1 dividido por 0,5, igual a 0,2.
Conviene copiar las frmulas y solo cambiar los eventos correspondientes. Con el botn derecho hacemos
click en copiar y luego pegamos frente a la segunda rama del rbol y as sucesivamente.
Ahora modificamos cada formula quedando:
La probabilidad de que la persona tenga educacin media dado que es de gnero femenino es igual a la
probabilidad de que tenga educacin media y sea de gnero femenino dividido por la probabilidad de que la
persona sea de gnero femenino, esto es 0,3 dividido por 0,5, igual a 0,6
Para la tercera rama:
La probabilidad de que la persona tenga educacin superior dado que es de gnero femenino es igual a la
probabilidad de que tenga educacin superior y sea de gnero femenino dividido por la probabilidad de que
la persona sea de gnero femenino, esto es 0,1 dividido por 0,5, igual a 0,2
De igual forma para la cuarta rama:
La probabilidad de que la persona tenga educacin bsica dado que es de gnero masculino es igual a la
probabilidad de que tenga educacin bsica y sea de gnero masculino dividido por la probabilidad de que la
persona sea de gnero masculino, esto es 0,1 dividido por 0,5, igual a 0,2
Para la quinta rama:
La probabilidad de que la persona tenga educacin media dado que es de gnero masculino es igual a la
probabilidad de que tenga educacin media y sea de gnero masculino dividido por la probabilidad de que la
persona sea de gnero masculino, esto es 0,15 dividido por 0,5, igual a 0,3
Y para la sexta rama:
La probabilidad de que la persona tenga educacin superior dado que es de gnero masculino es igual a la
probabilidad de que tenga educacin superior y sea de gnero masculino dividido por la probabilidad de que
la persona sea de gnero masculino, esto es 0,25 dividido por 0,5, igual a 0,5
53
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Observemos ac que la suma de las probabilidades condicionales de los niveles de educacin dado los
gneros Femenino y Masculino indistintamente, tambin suman uno.
Entonces podemos decir por ejemplo que:
La probabilidad de que una persona tenga un nivel de educacin medio, dado que es de sexo femenino es
de un 60%
La probabilidad de que una persona tenga nivel de educacin superior dado que es de sexo masculino es de
un 50%.
54
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
P de EB, educacin bsica, es igual a P de EB inter F(femenino), ms P de EB y M(masculino) y esto de
acuerdo a la propiedad de la probabilidad condicional, es igual a P de F por P de EB dado F, ms P de M
por P de EB dado F
Una vez ms utilizando la herramienta para escribir ecuaciones, escribiremos la probabilidad que deseamos
obtener
Elegimos insertar, ecuacin y arrastramos la ecuacin para responder la pregunta
Escribimos, probabilidad de que una persona sea de gnero femenino, sabiendo que tiene educacin bsica
es igual, seleccionamos en el men superior herramientas de ecuaciones y luego fraccin, en el numerador
colocamos la probabilidad conjunta P de F inter EB, educacin bsica y en el denominador P de ED,
educacin bsica, que es la probabilidad de lo que est dado o conocido.
Y es igual a la probabilidad de que la persona sea de gnero femenino por la probabilidad de que tenga
estudios bsicos sabiendo que es de gnero femenino, dividido por la probabilidad total de tener estudios
bsicos.
55
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
6.1
56
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
57
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
6.2
1.
Considere la base de datos Favoritos.xlsx la cual contiene informacin sobre 23 personas a las
cuales se les consult respecto a color y mascota favoritos. Con los datos confecciones una tabla de
contingencia utilizando la funcin Tabla dinmica, luego ingrese el documento en el buzn
habilitado en la plataforma de laboratorio.
2.
Considere la base de datos Favoritos.xlsx la cual contiene informacin sobre 23 personas a las
cuales se les consult respecto a color y mascota favoritos. Con los datos confeccione una tabla de
probabilidades, luego ingrese el documento en el buzn habilitado en la plataforma de laboratorio.
3.
Cul es la probabilidad que un individuo seleccionado al azar le guste el color rojo y su mascota
preferida sea un perro?
4.
5.
6.
Cul es la probabilidad que un individuo seleccionado al azar su mascota preferida sea un conejo?
7.
Si se sabe que a una persona seleccionada al azar le gusta el color amarillo. Cul es la probabilidad
de que su mascota favorita sea un hmster?
8.
Si se sabe que a una persona seleccionada al azar le gusta el color azul. Cul es la probabilidad de
que su mascota favorita sea un gato?
9.
Si se sabe que una persona seleccionada al azar su animal favorito es un conejo . Cul es la
probabilidad de que su color favorito sea negro?
58
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
El caso es el siguiente:
Una Empresa minera adquiri instal hace una un ao una estacin de monitoreo para medir la
concentracin de material particulado en el aire, esta estacin est programada para tomar mediciones
cada 8 hora y en caso de que la medicin detecte que los niveles de polucin superan los 150 g/m
(PM10), la alarma se activar automticamente.
De sonar la alarma, la empresa debe parar la faena hasta lograr bajar los niveles de polucin bajo el nivel
mximo permitido, de lo contrario se venir una inspeccin en ese momento, la empresa ser multada.
Ya con un ao de funcionamiento, la empresa minera ha detectado errores en el funcionamiento de la
estacin de monitoreo, pero no tiene presupuestado la renovacin de esta, por el alto costo de inversin.
Por lo anterior la empresa pide al departamento de prevencin de riesgos que de acuerdo a los registros de
las mediciones tomadas por dicha estacin en relacin al funcionamiento de la alarma en los ltimos 6
meses, determine por una parte
1. Cul es la probabilidad de que la empresa sea multada?
2. Cul es la probabilidad de la empresa detenga sus faenas sin haber sido necesario?
3. Cul es la probabilidad de que los trabajadores estn respirando aire con mucha polucin sin tener
alerta ninguna?
4. Cul es la probabilidad de que la medida de parar las faenas est bien aplicada, despus de que se
activa la alarma?
La informacin antes pedida servir como evidencia para tomar la decisin de quedarse con esta estacin de
monitoreo o adquirir otra.
Para dar respuesta a los requerimientos de la gerencia se pueden obtener por una parte, preguntas 1 y 2,
calculando una probabilidad condicional y por otra parte, preguntas 3 y 4, utilizando el teorema de Bayes.
Veamos como:
Abrimos el archivo que contiene la base de datos Monitoreo_polucion.xlsx
Observamos que tenemos cuatro campos de informacin, que son, la Fecha, la hora, el nivel de polucin y el
registro de si activ o no la alarma.
Para generar la tabla de contingencia no es adecuado usar la variable cuantitativa Nivel de polucin dado
que se har el conteo segn categoras y estas no existen, por lo que ser conveniente antes categorizarlas.
Recordemos que la empresa tiene establecido como norma, que los niveles de polucin P10, no pueden
sobrepasar los 150 g/m, entonces de acuerdo a esto categorizaremos.
59
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Para esto utilizaremos la funcin SI, insertamos una nueva columna adyacente a la que tiene los registros
del Nivel de Polucin
La nueva variable la llamaremos Condicin del Nivel de Polucin, que tendr como recorrido
P: si el nivel de polucin cumple con la norma establecida, <=150 g/m
NP: Si el nivel de polucin supera la norma establecida, es decir >150 g/m
Escribimos el nombre al inicio de la columna
60
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Posicionados en la celda B2, insertamos la funcin lgica SI, esta funcin permitir categorizar la variable
numrica, asociando la categora P o NP, segn corresponda
61
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
La funcin SI, requiere de ingresar la prueba lgica, y la asignacin que se har en caso de que la evaluacin
sea verdadera o falsa
En nuestro ejemplo la prueba lgica es evaluar si cada dato de la variable nivel de polucin cumple con la
norma establecida por la empresa, luego escribiremos
62
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Hacemos clic en aceptar y nos queda para la primera celda asociado P, permitido cuando la medicin fue
127.
Posicionados en la esquina inferior derecha de la celda evaluada, arrastramos el mouse para copiar en el
resto de las celdas
63
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
La base de datos ahora se presenta
Ya estamos listos para crear la tabla de contingencia que finalmente nos permitir obtener las
probabilidades condicionales.
En la tabla de contingencia estarn resumidas las frecuencias de las variables
Condicin del nivel de polucin (Permitido/ No Permitido)
Activacin de la alarma ( SI / NO)
Posicionados en la primera celda de nuestra base de datos, insertamos la tabla dinmica, recordemos que
este procedimiento ya fue estudiado en el video 3 , de construccin de tablas de contingencia.
64
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Qued seleccionado el rango que contempla nuestra base de datos, y le indicamos que la tabla dinmica
quede en la misma hoja donde estn los datos, dando como referencia la celda G2
65
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Se crea la tabla dinmica
Arrastramos el campo activacin de la alarma hacia las columnas y luego para completar la tabla con los
valores resumidos, debemos arrastrar cualquiera de los campos incluidos en la tabla hacia el recuadro
Valores.
Aparece ahora completa la tabla bivariada con las frecuencias conjuntas, marginales y totales.
66
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
La tabla se muestra ahora con porcentajes del total, nuevamente hacemos click con el boton derecho para
elegir la opcin formato nmero
67
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
68
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Lo primero que haremos es escribir las probabilidades conjuntas como la probabilidad de la interseccin de
los eventos y las probabilidades totales
Nuestros eventos son:
NP: Nivel de Polucin no permitido
P : Nivel de Polucin Permitido
NO : No se activa la alarma
SI : Se activa la alarma
Probabilidades conjuntas
P(
P(
P(
(
)
)
)
)
81
Probabilidades Totales
( )
( )
( )
( )
69
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Antes de calcular las probabilidades pedidas, contruiremos el arbol de las probabilidades condicionales que
nos permitirn aplicar el teorema de bayes.
Partiremos el rbol con la variable Nivel de Polucin, dado que es natural entender que la alarma sonar
dependiendo del nivel de polucin que haya en la faena.
Confeccionamos el rbol, utilizando herramientas de dibujo e insertando las frmulas correspondientes.
Para responder a las pregunta de la gerencia, antes debemos plantear las probabilidades que darn las
respuesta.
70
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
1.
Debemos entender que la empresa ser multada slo si los trabajadores siguen trabajando con niveles de
polucin no permitidos, y esto ocurrir si en ese momento no suena la alarma.
Entonces debemos calcular la probabilidad condicional de que no suene la alarma, sabiendo que hay niveles
de polucin no permitido.
(
)
(
)
(
)
( )
La probabilidad de que la empresa detenga sus faenas sin haber sido necesario es de un 10%
Para completar el rbol con las otras probabilidades condicionales, las calcularemos
(
)
(
)
)
( )
71
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Al plantear la probabilidad nos damos cuenta que es a priori, es decir segn lo planteado en el diagrama de
rbol, necesitamos saber cul es la probabilidad de que suene la alarma sabiendo que no ha sonado la
alarma.
Utilizando el teorema de Bayes
(
(
)
)
(
(
(
)
)
( )
La probabilidad de que los trabajadores estn respirando un aire con nivel de polucin no permitida, sin
que haya sonado la alarma es de un 8%
72
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
El mismo clculo nos resulta, aplicando las probabilidad conjunta y marginal, de acuerdo a la informacin
que tenemos en la tabla de contingencia
(
)
(
La probabilidad de que los trabajadores estn respirando niveles de polucin no permitidos, sabiendo que la
alarma no se ha activado es de un 8%
Finalmente respondemos a la ltima pregunta:
4.-Cul es la probabilidad de que la medida de parar las faenas est bien aplicada, despus de que se
activa la alarma?
Aqu debemos calcular la probabilidad de que realmente los niveles de polucin son altos cuando sabemos
que ha sonado la alarma, es decir
(
Esta probabilidad segn nuestro diagrama de rbol, tambin es a priori, por lo que debemos aplicar el
teorema de Bayes
(
(
(
)
)
(
(
)
)
( )
73
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
El mismo clculo nos resulta, aplicando las probabilidad conjunta y marginal, de acuerdo a la informacin
que tenemos en la tabla de contingencia
(
)
( )
La probabilidad de que los niveles de polucin realmente no estn dentro de la norma permitida, sabiendo
que la alarma se ha activado es de un 25%
Conclusin:
De acuerdo a las probabilidades obtenidas, por una parte en relacin a la empresa, la alta probabilidad de
ser multados 70%, aun cuando el riesgo tener prdidas al detener las faenas no siendo necesario sea de un
10%, conjuntamente con un 25% de probabilidad de que los niveles de polucin realmente no estn dentro
de la norma permitida, sabiendo que la alarma se ha activado , y , en relacin a la seguridad de los
trabajadores, baja probabilidad, un 8% , de tener niveles de polucin no permitidos cuando la alarma no se
ha activado, se puede concluir que la sugerencia, para evitar multas y perdidas, considerando que ya
existiendo aunque sea un 1% de riesgo para los trabajadores, la empresa debe tomar la decisin de invertir
en un nuevo instrumento que alerte con precisin sobre los niveles de polucin no permitidos.
74
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
7.
1: nmero de variables: Corresponde a la cantidad de columnas de datos que queremos generar. En este
caso, ingresaremos el valor 1 para as generar una sola columna con datos simulados.
75
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
2: cantidad de nmeros aleatorios: indica la cantidad de datos por columna que sern simulados. En este
caso ingresaremos 100, es decir, por cada columna de datos ingresada en la parte anterior, aparecern 100
datos asociados.
4: Parmetros: Esta opcin depende de la distribucin seleccionada. Como hemos seleccionado la opcin
Normal dejaremos los valores por defecto de la opcin, es decir, el valor 0 para la media y 1 para la
desviacin estndar.
5: Iniciar con: Corresponde al valor semilla con el cual se genera la secuencia de nmeros aleatorios, si se
ingresa un valor, entonces Excel guardar la misma secuencia de nmeros cada vez que en este campo se
ingrese tal nmero. En este caso, lo dejaremos en blanco.
6: Opciones de salida:
Rango de salida: se debe ingresar una celda donde se desea que se inicie la presentacin de los
resultados del anlisis. Es una opcin til si se quiere visualizar el resultado de la generacin de nmeros
aleatorios en la misma hoja donde se est trabajando.
En una hoja nueva: Corresponde a la opcin por defecto, el resultado aparecer en una hoja nueva
dentro de la misma planilla de Excel.
En un libro nuevo: Los resultado de la simulacin de datos aparecern en un libro nuevo de Excel.
En este caso seleccionaremos la opcin Rango de Salida, luego, seleccionaremos la celda A1.
76
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
77
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
7.1
Revisaremos en esta seccin las distintas opciones para generar nmeros aleatorios disponibles en la opcin
Anlisis de datos.
La opcin Generacin de nmeros aleatorios permite simular nmeros aleatorios para ocho distribuciones
que se describen a continuacin:
78
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
7.1.1
Distribucin discreta:
Se generan nmeros aleatorios para un conjunto de valores enteros a los cuales se asocia a priori una
probabilidad de aparicin del valor de la variable.
Para utilizar esta opcin, se debe tener una tabla de probabilidades a priori para una variable aleatoria
discreta.
A modo de ejemplo simularemos el lanzamiento en 100 oportunidades de un dado de seis caras equilibrado.
A esta variable se le asocia en la literatura la distribucin Uniforme Discreta.
Construiremos la Tabla de probabilidades a priori relacionada al problema:
X
P(X=x)
0,16666667
0,16666667
0,16666667
0,16666667
0,16666667
0,16666667
79
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Ingreso de datos en la ventana de opciones:
80
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
7.1.2
Distribucin Uniforme:
Genera nmeros con igual probabilidad en un intervalo de valores predeterminado. Por defecto los
valores aparecen entre 0 y 1, lo cual, es equivalente a la funcin =ALEATORIO().
81
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
7.1.3
Distribucin Normal:
Simula nmeros aleatorios de una distribucin Normal con media y desviacin estndar definidas por el
usuario. Por defecto el programa proporciona una media 0 y desviacin estndar 1, la cual, corresponde a
los valores de la distribucin Normal Estndar.
82
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
7.1.4
Distribucin de Bernoulli:
A modo de ejemplo se simularn 100 valores correspondientes al lanzamiento de una moneda honesta, es
decir con Probabilidad = 0,5 donde la variable recibe el valor 0 si se obtiene un sello y un 1 si se obtiene
cara. Es decir, la variable de estudio sera: X: nmero de veces que se obtiene una cara al lanzar una
moneda 1 vez.
83
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Ingresar en la opcin probabilidad el valor 0,5. El cul indica la probabilidad de obtener una cara al lanzar
una moneda honesta.
Hacer click en Aceptar.
7.1.5
Distribucin Binomial:
Genera nmeros aleatorios correspondientes a una distribucin Binomial. Es decir, para N experimentos
de Bernoulli independientes, con probabilidad de xito p.
A modo de ejemplo se simularn 100 valores correspondientes al lanzamiento de una moneda honesta, es
decir probabilidad=0,5 en 5 ocasiones, donde los valores representan el nmero de caras obtenidas en los 5
lanzamientos.
84
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Ingresar en la opcin probabilidad el valor 0,5. El cul indica la probabilidad de obtener una cara al lanzar
una moneda honesta.
En la opcin Nmero de muestras ingresar el valor 5, el cual indica la cantidad de veces que se lanza la
moneda, es decir, el nmero de experimentos de Bernoulli independientes.
Hacer click en Aceptar.
85
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
7.1.6
Distribucin Poisson:
A modo de ejemplo, se simularan 100 valores correspondientes a una distribucin de Poisson con valor
esperado de la variable igual a 2. Esta simulacin podra representar, por ejemplo, a una variable aleatoria X:
nmero de hermanos que tiene un alumno del curso de Estadstica.
En la opcin Lambda ingresar el valor 2, el cual indica el valor esperado de hermanos que tiene un alumno
del curso de Estadstica.
Hacer click en Aceptar.
86
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
7.1.7
Frecuencia Relativa:
A modo de ejemplo, se simular una serie de valores entre 1 y 4, con incrementos de 1 unidad donde el
nmero ser repetido dos veces y la secuencia en 3 ocasiones.
87
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
De: es el mnimo de los valores a generar
A: es el mximo valor a generar
Incremento: indica la cantidad a incrementar luego de generar el mnimo
En este caso se define De: 1 a 4 , incremento 1, es decir, se generarn nmeros del 1 al 4, de 1 en 1.
Repitiendo cada nmero: indica la cantidad de veces que se repetir un nmero antes de pasar al siguiente.
En este caso ingresamos el valor 2.
Repitiendo la secuencia: indica la cantidad de veces que se repite la secuencia de valores, es decir, nmeros
de 1 a 4, con incremento 1, repetidos 2 veces. En este caso ingresamos el valor 3.
Hacer click en Aceptar.
Observacin: En este ejemplo se han simulado tres secuencias de nmeros del 1 al 4 con incremento 1 y
repeticin 2 veces para cada nmero. Con un clculo simple notamos que la cantidad de nmeros a
generar sern 24, por lo que no coincidir con los 100 valores ingresados en la opcin cantidad de
nmeros aleatorios, o sea, si los parmetros ingresados generan una secuencia superior a la cantidad de
nmeros aleatorios predefinida, la secuencia finalizar en este valor.
88
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
8.
En esta seccin analizaremos algunas opciones disponibles para el clculo de probabilidad en variables
aleatorias discretas.
A las funciones asociadas a estos clculos se puede acceder haciendo click en el cono
Luego , en la opcin O seleccionar una categora elegir Estadsticas. En este men se encuentran
disponibles las funciones asociadas al tema a tratar.
89
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Realizaremos ahora una serie de problemas que involucra el clculo de probabilidad discreta.
Si usted desea replicar estos clculos, descargue la planilla Video 6-Ejercicios de variable discreta.
8.1.
Ejemplos:
2.
3.
4.
5.
90
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
4. Luego, la probabilidad de xito asociada al problema
5. Finalmente escribimos la palabra VERDADERO, la cual indica que deseamos que la probabilidad
entregada, sea la acumulada hasta el valor ingresado
8.2.
1.
2.
3.
4.
8.3.
91
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
1.
2.
3.
4.
5.
6.
8.4.
1.
2.
3.
4.
92
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
1.
2.
3.
4.
93
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
8.1
1.
2.
3.
En 7 lanzamientos, Cul es el nmero ms grande de caras que se puede esperar, con una
probabilidad de 0.98?
4.
Genera 100 observaciones provenientes de una distribucin binomial con probabilidad de xito 0.4
y n=7.
5.
Si X es binomial con probabilidad de xito 0.4 y n=7. Cul es la probabilidad de que X sea a lo ms
4. Es decir P(X 4)?
6.
Si X es binomial con probabilidad de xito 0.9 y n=6. Cul es la probabilidad de que X sea 4. Es
decir P(X = 4) ?
7.
Qu valor tiene una distribucin de Poisson con varianza 6, cuya probabilidad acumulada es 0.92?
8.
9.
Calcule la probabilidad de que una variable que tiene distribucin Hipergeomtrica de parmetros
N=9 r=4 y n=3 sea igual a 2.
10. Genere 100 observaciones provenientes de una distribucin Poisson con probabilidad de xito 0.9.
11. Si X es Poisson con media 6. Cul es la probabilidad de que X sea a lo ms 4. Es decir P(X 4)?
94
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
9.
En esta seccin analizaremos algunas opciones disponibles para el clculo de probabilidad para variables
aleatorias continuas.
A las funciones asociadas a estos clculos se puede acceder haciendo click en el cono
Luego , en la opcin O seleccionar una categora elegir Estadsticas. En este men se encuentran
disponibles las funciones asociadas al tema a tratar.
95
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Realizaremos ahora una serie de problemas que involucra el clculo de probabilidad continua.
Si usted desea replicar estos clculos, descargue la planilla Video 7-Ejercicios de variable continua.
9.1.
1.
2.
3.
4.
Nota: Si se ingresa la opcin FALSO solo entregar la imagen del valor de la variable en la funcin de
densidad exponencial, esto, no es una probabilidad.
96
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
9.2.
1.
2.
3.
4.
5.
9.3.
97
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
1.
2.
3.
4.
98
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
9.1
1.
2.
3.
Sea X una variable aleatoria con distribucin Normal de media 100 y desviacin estndar 50. Simule
1000 observaciones aleatorias desde X, calcula su promedio y varianza. Compara con los resultados
tericos.
4.
Si X es una variable aleatoria con distribucin Uniforme, donde 0<x<2. Determine la probabilidad de
que tal variable tome valores entre 1 y 1,5.
5.
Sea X una distribucin Uniforme entre 0 y 1. Simule 1000 observaciones aleatorias desde X, calcula
su promedio y varianza. Compara con los resultados tericos.
6.
Sea X una distribucin Uniforme entre 0 y 1. Determine la probabilidad de que tal variable tome
valores entre 0,2 y 0,3.
7.
Sea X una variable aleatoria con distribucin Exponencial con valor esperado igual a 0,2. Simule 10
observaciones aleatorias desde X, calcula su promedio y varianza. Compara con los resultados
tericos. Luego repita lo mismo para 100 y 1000 simulaciones.
8.
Sea X una variable aleatoria con distribucin Exponencial con valor esperado igual a 1. Determine la
probabilidad de que la variable aleatoria tome valores de al menos 0,5.
9.
Sea X una variable aleatoria con distribucin Exponencial con valor Varianza igual a 1/25.
Determine la probabilidad de que la variable aleatoria tome valores de al menos 5.
99
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
10.
El objetivo de este video es mostrar la construccin de tablas bivariadas utilizando la herramienta de Excel,
tablas dinmicas.
En nuestro ejemplo tenemos la fluctuacin del dlar y el euro en un mismo mes, las variables con las que
trabajaremos son continuas y el inters ser poder ver las frecuencias conjuntas en intervalos del mes.
Construiremos una tabla bivariada con 4 intervalos, entonces las frecuencias conjuntas resumidas en la
tabla mostrar la cantidad de das en que las monedas en conjunto tienen segn su valor.
Lo primero que haremos es abrir el archivo datos tabla bivariada, hacemos click en abrir, archivo
Ahora que tenemos los datos, observamos que son 20 datos correspondientes a las variaciones de dlar y
euro en 20 das del mes de diciembre de 2014.
Posesionndonos en la primera celda de los datos hacemos click en insertar, tabla dinmica, tal como lo
hemos hecho en el video 3 referido a tablas bivariadas para variables cualitativas.
La primera columna corresponde al da del mes en que ocurri la variacin, este dato no es variable en
estudio, por lo que modificaremos el rango de entrada, incluyendo solo las columnas donde estn los
valores del dlar y el euro.
La tabla la dejaremos en la misma hoja donde estn los datos, para esto indicaremos en el rango de salida la
celda F1, y aceptamos.
100
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Tenemos ahora la tabla dinmica, debemos indicarle los campos o variables que se incluirn, para este
ejemplo sern ambas variables.
Arrastramos el campo dlar hacia la casilla de las filas y el campo euros hacia la casilla de las columnas.
101
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Observamos que la presentacin de la tabla no es adecuada, dado que por ser variables continuas los datos
en su mayora son distintos.
Lo que haremos ser construir intervalos para ambos recorridos a modo de poder tener una mejor
presentacin y resumen de las frecuencias conjuntas y marginales.
El nmero de intervalos se puede determinar por una formula conocida o bien segn el objetivo del estudio.
En este caso ser de inters visualizar el comportamiento de la variacin de las monedas en cuatro niveles
de sus valores, entonces tendremos las frecuencias conjuntas resumidas en cuatro intervalos para ambas
variables.
Necesitaremos obtener los valores extremos y el rango, antes de construir los intervalos.
Para esto nos ubicaremos en las celdas por debajo de los datos, usted puede colocarlas donde desee o sea
ms conveniente.
Colocaremos las frmulas que permiten obtener el mximo, mnimo, rango y amplitud de lo s intervalos.
En la columna A a partir de la fila 23, escribiremos Mximo, Mnimo, Rango y amplitud.
102
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
En la celda B23, escribimos la frmula igual MAX, parntesis y marcamos el rango de los datos, en este caso
de la variacin del dlar, ENTER
103
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
En celda B24, escribimos la formula igual MIN, parntesis el rango de los datos, cierre de parntesis
En celda B25, escribimos la frmula para obtener el Rango, igual B23 menos B24, ENTER
104
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Finalmente escribimos la frmula para obtener la amplitud de los intervalos, es igual B25 dividido por 4,
ENTER
105
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Ahora copiamos estas mismas frmulas para obtener mximo, mnimo, rango y amplitud de los intervalos,
para la variable variacin del euro. Marcamos las celdas B23 a B26 y ubicando la cruz negra en la esquina
inferior derecha, arrastramos hacia las celdas C23 a C26, ENTER
106
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Ahora que ya conocemos la amplitud de los intervalos de ambas variables, volveremos a la tabla dinmica
para generar los intervalos que resumirn las frecuencias conjuntas.
Primero nos posesionamos sobre cualquier valor de variacin del dlar, con el botn derecho elegimos
agrupar
107
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Luego aparece un recuadro que muestra el mximo, el mnimo y pide que ingresemos la amplitud de los
intervalos, fijarse que son los mismos valores de mximo y mnimo que ya habamos obtenido, en POR,
colocaremos la amplitud 3,99, y ACEPTAR
108
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
109
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
Para finalizar solo basta arrastrar cualquiera de los campos a la casilla valores, esto har que la tabla
entregue las frecuencias conjuntas que deseamos tener
110
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
En cuatro de los 20 das del mes en que hubo variacin de ambas monedas, estas estuvieron ambas en su
valor ms bajo.
De igual forma, en tres de los 20 das del mes en que hubo variacin de ambas monedas, estas estuvieron
ambas en su valor ms alto.
111
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
10.1
Analizaremos la construccin de una tabla bivariada para el caso donde las variables de origen
son de naturaleza continua. Si una variable de estudio es continua, esta debe ser segmentada en
intervalos.
Previo a la construccin de la tabla como tal, se debe realizar el clculo de la amplitud de los
intervalos que se utilizarn para la representacin de la tabla bivariada. Debemos recordar que la
amplitud de un intervalo se determina dividiendo el rango de la variable por la cantidad de
intervalos que deseamos. Para nuestro ejemplo calcularemos 4 intervalos para cada variable.
Ahora, realizamos los mismos pasos que para una tabla bivariada discreta, es decir:
1.
2.
3.
4.
5.
6.
7.
Como se observa la tabla hasta ahora construida no es muy esttica, para mejorarla se har el
ingreso de los intervalos para las variables continuas.
8.
9.
10.
11.
112
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
10.2
1.
Utilice la base de datos PruebaEst.xls para confeccionar una tabla de frecuencias bivariada. Esta
base de datos contiene tres variables: Sexo (H: hombre, M: mujer), Edad (en aos) y Prueba
(Puntaje obtenido) de un grupo de personas que rindieron una prueba de conocimientos bsicos de
estadstica. Se pide ingresar en el buzn de la plataforma de laboratorio la tabla bivariada para las
variables Edad y Prueba. Nota: usted debe determinar la cantidad de cortes sobre las variables
continuas.
2.
Utilice la base de datos PruebaEst.xls para confeccionar una tabla de frecuencias bivariada. Esta
base de datos contiene tres variables: Sexo (H: hombre, M: mujer), Edad (en aos) y Prueba
(Puntaje obtenido) de un grupo de personas que rindieron una prueba de conocimientos bsicos de
estadstica. Se pide ingresar en el buzn de la plataforma de laboratorio la tabla bivariada para las
variables Sexo y Prueba. Nota: usted debe determinar la cantidad de cortes sobre las variables
continuas.
3.
4.
Utilice la base de datos SalarioUSA.xls la cual contiene las siguientes variables: SEXO (0: hombre,
1:mujer), SALARIO HORA (dlares por hora de trabajo), EDAD (en aos) e HIJOS (nmero de hijos
del encuestado). Confecciones una tabla bivariada para las variables SALARIO HORA y EDAD. Esta
tabla debe ser ingresada en el buzn habilitado en la plataforma de laboratorio. Nota: usted debe
determinar la cantidad de cortes sobre las variables continuas.
5.
Utilice la base de datos SalarioUSA.xls la cual contiene las siguientes variables: SEXO (0: hombre,
1:mujer), SALARIO HORA (dlares por hora de trabajo), EDAD (en aos) e HIJOS (nmero de hijos
del encuestado). Confecciones una tabla bivariada para las variables SEXO y SALARIO HORA. Esta
tabla debe ser ingresada en el buzn habilitado en la plataforma de laboratorio. Nota: usted debe
determinar la cantidad de cortes sobre las variables continuas.
10
11
Base de datos PruebaEst.xls disponible en la pgina web del Departamento de Matemtica y Fsica.
10
Base de datos Examenes.xlsx disponible en la pgina web del Departamento de Matemtica y Fsica.
11
Base de datos SalarioUSA.xls disponible en la pgina web del Departamento de Matemtica y Fsica.
113
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
CONCLUSIN
El anlisis de datos es una habilidad fundamental que cualquier ingeniero debe dominar. La herramienta
anlisis de datos presenta una solucin eficaz y de fcil manejo para tratar un conjunto de datos dado. La
tabulacin de datos (tema 2 del apunte) es el punto inicial en la presentacin de un informe pues resume en
forma esttica los datos, el resumen descriptivo (tal como se trato en el tema 3) es de gran relevancia pues
permite dar una primera mirada al comportamiento de los datos, cabe notar que Excel en esta opcin
(Estadstica Descriptiva) no proporciona medidas de posicin por lo que, el alumno debe internalizar en la
obtencin de tales medidas. El anlisis grfico aqu presentado en la forma del Histograma es uno de los
tantos tipos de presentacin grfica que se pueden realizar. Se recomienda al alumno internalizar en la
opciones de grfico en Excel disponible en el men superior, especficamente en la opcin Insertar). El
cruce de variables tambin es un complemento importante en una investigacin, buscar relaciones entre
variable de naturaleza cualitativa y/o cuantitativa podra denotar comportamientos no observados a simple
vista en los resmenes individuales de informacin, por ello se present en el tema 5 (caso cualitativo) y
tema 10 (caso cuantitativo) la funcin Tabla dinmica. Se recomienda al alumno internalizar en el uso de
tablas bivariadas, por ejemplo, para un alumno de Ingeniera comercial podra interesarle la aplicacin en
Carteras de Inversin y a un alumno de otras ingenieras los test Estadsticos asociados a la independencia de
variables u homogeneidad de sta (Test Chi-cuadrado).
Los temas relacionados a variables discretas y continua, adems de los mtodos de simulacin son el punto
inicial de las teoras que se desarrollan es cursos de Investigacin de Mercados, Econometra y Simulacin. El
alumno debe interiorizar el uso de distribuciones de probabilidad discreta y continua, ya que, muchos
fenmenos estn relacionados con estos en otras ciencias. En este Apunte slo se muestran las
distribuciones que son de uso habitual en cursos de Estadstica, por lo que, se recomienda investigar sobre
otras distribuciones de probabilidad (ejemplo: Distribucin Geomtrica, Binomial Negativa, Gamma, Beta,
Triangular, ente otras) y la relacin con las tratadas en este apunte que son las que dispone Excel en la
opcin Generacin de nmeros aleatorios.
Finalmente se espera que este apunte sea el pie para el desarrollo de habilidades computacionales y
estadsticas en los futuros ingenieros de la Universidad Bernardo OHiggins. Tambin, que desarrolle inters
por temas de estadstica avanzada y sea motivacin para internalizar temas de inferencia estadstica los
cuales se tratan en el curso de Estadstica II.
114
Vicerrectora Acadmica
Facultad de Ingeniera y Administracin
Departamento de Matemtica y Fsica
BIBLIOGRAFA
Jay L. Devore. (2001). Probabilidad y Estadstica para Ingeniera y Ciencias. Mxico: Thomson Learning.
Richard I. Levine y David S. Rubin. (2010). Estadstica para la Administracin. Mxico: Pearson.
Robert Johnson y Patricia Kuby. (2004). Estadstica elemental, Lo esencial. Mxico: Thomson.
Ronald E. Walpole, et al. (2007). Probabilidad y Estadstica para ingeniera y ciencias. Mxico: Pearson
Prentice Hall.
Paul Newbold, Williams L. Carlson y Betty Thorne. (2008). Estadstica para administracin y economa.
Espaa: Pearson Prentice Hall.
115