Sunteți pe pagina 1din 11

Docencia en Estadstica con Microsoft Excel: Probabilidad

DOCENCIA EN ESTADSTICA CON MICROSOFT EXCEL: PROBABILIDAD

M Teresa Daz Delfa, Fuensanta Arnaldos Garca, Ursula Faura Martnez, Lourdes Molera Peris, Isabel Parra Frutos Universidad de Murcia

RESUMEN
Con la finalidad de que los alumnos comprendan mejor los conceptos tericos desarrollados en cualquier curso de estadstica y, adems, dotar a los futuros profesionales de recursos que les ayuden a manejar y tratar datos del mundo real, es conveniente estudiar la estadstica desde una perspectiva ms prctica apoyndonos en herramientas informticas como las hojas de clculo. Estas presentan la ventaja de que son mucho ms verstiles a nivel bsico que el software puramente estadstico (SPSS, Statgraphics, S-PLUS,...), puesto que, en general, permiten obtener los resultados deseados no slo utilizando funciones y herramientas especficas, sino tambin a travs de un enfoque ms intuitivo y similar al clculo manual que se realizara sin ordenador. En particular, centramos nuestra atencin en Microsoft Excel, dada su amplia implantacin actual. As, se pueden estudiar los modelos de variables aleatorias, tanto discretas como continuas, mediante el uso de un paquete informtico, pudiendo calcular desde probabilidades hasta la forma grfica de las distribuciones, lo que permitira al alumno comprender mejor las caractersticas de los modelos estudiados. Palabras clave: clculo de probabilidades, modelos de distribuciones, hoja de clculo.
1

XII Jornadas de ASEPUMA

Daz, M.T.; Arnaldos, F.; Faura, U.; Molera, L. y Parra, I.

1. INTRODUCCIN
En una materia como la Estadstica en las titulaciones de Ciencias Sociales es indiscutible la necesidad de trabajar con programas informticos. Los clculos que pretenden sintetizar las masas de datos ya no se realizan con lpiz y papel debido, principalmente, a la gran cantidad de datos, a la rapidez de las herramientas informticas y a la accesibilidad a los medios informticos de los estudiantes y profesionales. Sin embargo, es necesario usar estos programas con precaucin, ya que nuestro objetivo no se debe limitar a la simple interpretacin de las salidas proporcionadas por el software que se decida utilizar, sino que es importante que los alumnos conozcan los fundamentos tericos y los procedimientos prcticos que conducen a esos resultados, para as lograr un mejor entendimiento de stos. La eleccin de la hoja de clculo como herramienta informtica frente a programas estadsticos especficos estriba sobre todo en su disponibilidad, ya que sta se puede encontrar en casi todos los ordenadores a los que tiene acceso el alumno mientras cursa sus estudios, as como en la mayora de puestos de trabajo. Adems, presenta la ventaja de que es mucho ms verstil que el software puramente estadstico. En general, permite obtener los resultados deseados no slo utilizando funciones y herramientas especficas, sino tambin a travs de un enfoque ms intuitivo y similar al clculo manual que se realizara sin ordenador. Se puede comenzar utilizando la hoja de clculo bsicamente como una calculadora potente y verstil, en la que es necesario controlar todo el proceso de obtencin de un resultado, tal y como hara el alumno para resolver el problema manualmente. Esta manera de actuar puede complementarse, de una forma ms directa, utilizando las funciones y macros disponibles que permiten obtener los resultados sin necesidad de programar todo el proceso. Las prcticas con ordenador nos ayudan a abordar dos aspectos que consideramos muy importantes: Potenciar el papel de la visualizacin. Evitar la limitacin que, a la hora de realizar clculos, supone emplear una gran cantidad de datos. Con el ordenador podemos, por tanto, proponer prcticas a nuestros alumnos mucho ms interesantes y realistas.

XII Jornadas de ASEPUMA

Docencia en Estadstica con Microsoft Excel: Probabilidad

El uso de este tipo de sesiones prcticas depende de la materia que se imparte. En el caso de los contenidos de Estadstica Descriptiva e Inferencia Estadstica, la hoja de clculo facilita enormemente los clculos a realizar dadas sus prestaciones, entre las que se incluyen disponibilidades grficas suficientes. Por otra parte, aunque los contenidos correspondientes a la Teora de la Probabilidad son posiblemente los que resultan ms complicados de enfocar desde un punto de vista prctico, se puede utilizar Microsoft Excel para estudiar los principales modelos de distribuciones de probabilidad. Esta hoja de clculo permite obtener los valores de las funciones de probabilidad (en modelos de variables discretas) y de las funciones de densidad (en modelos de variables continuas), as como los de las funciones de distribucin en ambos casos. Por ejemplo, se pueden representar grficamente dichas funciones para observar y experimentar el cambio de forma de las mismas ante modificaciones en los valores de los parmetros de la distribucin correspondiente. As, se puede incidir en la relacin que existe entre los valores de los parmetros y la forma que adquiere la representacin grfica de la distribucin. Otras utilidades son visualizar la probabilidad de un intervalo de valores como rea encerrada por la funcin de densidad en el intervalo correspondiente en un modelo de variable continua, y desarrollar distintas ideas intuitivas relacionadas con los teoremas lmite. El objetivo de esta comunicacin es, por tanto, ilustrar cmo el uso de esta hoja de clculo puede ayudar a clarificar conceptos tratados en la docencia en Teora de la Probabilidad, centrndonos para ello en dos distribuciones muy usuales, la distribucin Binomial y la distribucin Normal.

2. ESTUDIO DE LAS DISTRIBUCIONES BINOMIAL Y NORMAL UTILIZANDO MICROSOFT EXCEL


Microsoft Excel dispone de funciones muy tiles para trabajar con los modelos de variables aleatorias ms comunes, tanto discretas como continuas. A modo de ejemplo, introducimos en este caso prctico las funciones relativas a las distribuciones Binomial y Normal. DISTR.BINOM(nm_xito;ensayos;prob_xito;acumulado). Proporciona,
3

para una variable aleatoria Binomial de parmetros n (ensayos) y p


XII Jornadas de ASEPUMA

Daz, M.T.; Arnaldos, F.; Faura, U.; Molera, L. y Parra, I.

(prob_xito), denotada por B(n,p), el valor de la funcin de probabilidad en el punto x (nm_xito), en el caso de acumulado igual a FALSO, y el de la probabilidad acumulada en el mismo punto (funcin de distribucin), en el caso de acumulado igual a VERDADERO. DISTR.NORM(x;media;desv_estndar;acum). Calcula, para una variable aleatoria Normal de parmetros (media) y (desv_estndar), denotada por N(,), el valor de la funcin de densidad en el punto x, en el caso de acum igual a FALSO, y el de la probabilidad acumulada en el mismo punto (funcin de distribucin), en el caso de acum igual a VERDADERO. Utilizando ambas funciones se puede explicar a los alumnos cmo obtener a travs de la hoja de clculo cualquier probabilidad que nos interese para ambos tipos de distribuciones, mostrando este clculo como una alternativa al uso de las tradicionales tablas estadsticas. Tambin podemos representar grficamente las probabilidades que se han calculado y dejar los clculos referenciados a celdas en las que aparezcan los valores de los parmetros, observando cmo cambian las probabilidades y sus representaciones grficas cuando se alteran los valores de dichos parmetros. Esta comunicacin est orientada a clarificar conceptos que suelen ser complicados de entender utilizando, bsicamente, las funciones de Excel anteriormente citadas y las representaciones grficas disponibles en la hoja de clculo. En concreto, la aplicacin que presentamos est basada en un fichero de Microsoft Excel que se ha estructurado en cinco hojas. La primera de ellas muestra los objetivos que se persiguen con el mismo, as como el contenido de cada una de las cuatro hojas restantes (vase figura 1). Pulsando en el botn correspondiente al contenido que se desee trabajar se activa la hoja correspondiente. En las restantes hojas aparece el botn INDICE que permite, por su parte, volver a esta primera hoja de introduccin. Para mostrar esta aplicacin a nuestros alumnos recurrimos al uso combinado del ordenador y el can de vdeo, disponible para uso del profesor en las aulas de los centros en los que impartimos docencia. Adicionalmente, el fichero se puede facilitar a los alumnos en la pgina web de la asignatura para que puedan experimentar por su cuenta.

XII Jornadas de ASEPUMA

Docencia en Estadstica con Microsoft Excel: Probabilidad

Figura 1: Hoja de clculo ndice

2.1. Familia de distribuciones. Caractersticas de una variable aleatoria El objetivo que se persigue con esta hoja de clculo es que los alumnos comprendan el concepto de familia de distribuciones. Bajo esta denominacin se agrupan variables aleatorias que tienen la misma distribucin de probabilidad aunque con diferentes valores en uno o ms parmetros presentes en la misma. Cada una de estas familias de distribuciones sigue un patrn de comportamiento probabilstico que se ajusta a un experimento aleatorio genrico y bajo el que tienen cabida numerosos fenmenos aleatorios. Todos los miembros de un misma familia estn caracterizados por la misma funcin de probabilidad (caso discreto) o de densidad (caso continuo) diferencindose nicamente en una serie de valores denominados parmetros. Segn el valor o valores que tomen estos parmetros, la representacin grfica de las distribuciones para una misma familia variar, pudiendo alterarse caractersticas como la asimetra. En esta hoja de clculo (vase figura 2) buscamos mostrar visualmente cmo influyen los valores de los parmetros en la forma de la grfica de la funcin de
XII Jornadas de ASEPUMA

Daz, M.T.; Arnaldos, F.; Faura, U.; Molera, L. y Parra, I.

probabilidad de la Binomial y de la funcin de densidad de la Normal, as como en los valores de distintas caractersticas, como son la media, la varianza, el coeficiente de asimetra y el de curtosis. En el caso de la Binomial, si el parmetro p est cercano a cero, la probabilidad de que el suceso de inters ocurra es baja, por lo que los valores pequeos de la variable aleatoria sern ms probables que los valores grandes y la distribucin ser asimtrica a la derecha. Por el contrario, si p est prximo a uno, los valores de la variable aleatoria grandes sern ms probables que los pequeos, y el grfico corresponder a una distribucin asimtrica a la izquierda. En el caso de la Normal, su representacin grfica corresponde siempre a una distribucin simtrica respecto al parmetro y con forma de campana, y cuya altura en torno a depende del valor que toma el parmetro . Por ejemplo, si ste es pequeo, esto es, existe poca dispersin, los valores prximos a sern ms probables y la representacin grfica ser ms apuntada.

Figura 2: Hoja de clculo Familia

Finalizamos con la obtencin de la probabilidad con que una variable aleatoria toma un valor concreto, que en el caso continuo es siempre cero, mientras que en el caso discreto puede no serlo.
6
XII Jornadas de ASEPUMA

Docencia en Estadstica con Microsoft Excel: Probabilidad

2.2. Relacin entre la funcin de distribucin y las funciones de probabilidad y de densidad El objeto de esta hoja (vase figura 3) es insistir en la relacin que existe entre la funcin de distribucin y las funciones de probabilidad o de densidad, segn la variable aleatoria sea discreta o continua. En el primer caso, la funcin de distribucin en un punto es la suma de las probabilidades puntuales de la variable aleatoria hasta ese valor inclusive, mientras que en el segundo caso es el rea limitada por la funcin de densidad y a la izquierda de la recta perpendicular al eje de abcisas en dicho punto.

Figura 3: Hoja de clculo Funciones

Adems, se puede calcular el valor de la funcin de distribucin en un punto (a modificar en la celda en blanco), tanto para una variable aleatoria B(n,p) como para una N(,). En el caso de la distribucin B(n,p) el valor de la funcin de distribucin en dicho punto est representado utilizando un color diferente en la funcin de probabilidad (sera la suma de las columnas de color rojo), as como en la propia funcin de distribucin. Por su parte, en la N(,) se puede observar el rea rayada bajo la funcin de densidad y el valor de la funcin de distribucin.
XII Jornadas de ASEPUMA

Daz, M.T.; Arnaldos, F.; Faura, U.; Molera, L. y Parra, I.

Todos los clculos de la hoja estn referenciados a las celdas que contienen los valores de los parmetros, pudiendo alterar stos utilizando las barras de desplazamiento disponibles al efecto.

2.3. Cuantiles En esta hoja (vase figura 4) nicamente se pretende mostrar grficamente cmo en el caso de una variable aleatoria continua siempre es posible encontrar un valor de la variable (cuantil) para el cual la probabilidad acumulada a la izquierda sea igual a un valor fijado de antemano, pero que en el caso de una variable discreta slo es factible en algunos casos. Por ello, en el caso de variables aleatorias discretas debemos recurrir a localizar el primer valor de la variable para el que la probabilidad acumulada a la izquierda es mayor o igual a la especificada.

Figura 4: Hoja de clculo Cuantiles

XII Jornadas de ASEPUMA

Docencia en Estadstica con Microsoft Excel: Probabilidad

La hoja est diseada para obtener y representar simultneamente hasta 3 cuantiles1 simplemente pinchando en la casilla de verificacin correspondiente e introduciendo en la celda el orden de los mismos. Tambin es posible observar los cambios que se producen en los cuantiles para diferentes valores de los parmetros de las distribuciones Binomial y Normal (utilizando las barras de desplazamiento).

2.4. Convergencia de la distribucin Binomial a la Normal Por ltimo, como una aplicacin del teorema central del lmite estudiamos la convergencia de una distribucin Binomial a una distribucin Normal. En estos teoremas se estudia cmo la suma de variables aleatorias con media y varianza finitas se aproxima bajo ciertas condiciones a una distribucin conocida cuando el nmero de variables aleatorias es suficientemente grande. La distribucin Binomial de parmetros n y p puede entenderse como la suma de n variables aleatorias independientes, todas ellas Bernouilli de igual parmetro p. A medida que aumenta el parmetro n, la distribucin Binomial se aproxima a una Normal de media y varianza iguales a las de la Binomial. En la hoja Convergencia se puede comparar grficamente (vase figura 5) la funcin de probabilidad de la distribucin B(n,p) con la funcin de densidad de la distribucin N = np, = npq , observando la mayor o menor semejanza de las mismas para distintos valores de los parmetros de la distribucin Binomial (seleccionados utilizando las barras de desplazamiento). Adicionalmente, se puede activar o desactivar el clculo y representacin grfica de la probabilidad de un intervalo de valores. El valor de dicha probabilidad se ofrece tanto para la distribucin B(n,p), como para su aproximacin bajo la distribucin N = np, = npq . En este ltimo caso se emplea la correccin por continuidad, pudiendo observarse de forma grfica esta probabilidad.

En la figura 4 se ha elegido como ilustracin los cuartiles (tres valores de la variable aleatoria

para los que se verifica que la probabilidad acumulada es al menos 0,25; 0,5 y 0,75, respectivamente).
XII Jornadas de ASEPUMA

Daz, M.T.; Arnaldos, F.; Faura, U.; Molera, L. y Parra, I.

Figura 5: Hoja de clculo Convergencia

3. CONCLUSIONES
Actualmente existe una gran variedad de programas informticos que pueden ser de gran utilidad en la docencia de asignaturas de estadstica. Entre ellos nos hemos decantado por la utilizacin de la hoja clculo Microsoft Excel frente a otro software especfico de estadstica debido, fundamentalmente, a su versatilidad y accesibilidad. En el caso concreto de la Teora de la Probabilidad su uso puede sustituir a las tradicionales tablas estadsticas y dar un soporte visual a conceptos tericos que puedan resultar complicados de entender para los alumnos. As, y entre otras cosas, permite incidir en: (1) el cambio de forma de las funciones de probabilidad, densidad y distribucin ante modificaciones en los valores de los parmetros de las distribuciones; (2) la visualizacin de la probabilidad de un intervalo de valores como rea encerrada por la funcin de densidad en el intervalo correspondiente en un modelo de variable continua ; (3) el desarrollo de ideas intuitivas relacionadas con los teoremas lmite; etc.

10

XII Jornadas de ASEPUMA

Docencia en Estadstica con Microsoft Excel: Probabilidad

El uso de la hoja de clculo para propiciar la visualizacin y experimentacin nos ayuda a captar la atencin de nuestros alumnos, a desarrollar clases ms dinmicas, a aumentar su motivacin al hacer la estadstica ms cercana y accesible, y a fomentar un aprendizaje activo y cooperativo.

4. REFERENCIAS BIBLIOGRFICAS
ARNALDOS, F.; DAZ, M.T.; FAURA, U.; MOLERA, L. y PARRA, I. (2003). Estadstica descriptiva para economa y administracin de empresas: cuestiones tipo test y ejercicios con Microsoft Excel. Madrid: AC. CASAS SNCHEZ, J.M. y SANTOS PEAS, J. (1996). Introduccin a la estadstica para administracin y direccin de empresas. Madrid: Editorial Centro de estudios Ramn Areces. FERNNDEZ-ABASCAL, H.; GUIJARRO, M. M.; ROJO, J. L. y SANZ, J. A. (1994). Clculo de probabilidades y estadstica. Barcelona: Ariel. PARRA FRUTOS, I. (2003). Estadstica empresarial con Microsoft Excel: Problemas de inferencia. Segunda edicin. Madrid: AC. PIOLE, R.; MORENO, A. y CABALLERO, A. (2002). Anlisis de datos y probabilidad. Excel como instrumento de clculo. Madrid: Civitas.

XII Jornadas de ASEPUMA

11

S-ar putea să vă placă și