Sunteți pe pagina 1din 107

UNIDAD 1 DISTRIBUCIONES DE FRECUENCIA

1.1 CONCEPTO DE ESTADSTICA Y SU CLASIFICACION

Qu es la estadst !a" Cuando coloquialmente se habla de estadstica, se suele pensar en una relacin de datos numricos presentada de forma ordenada y sistemtica. Esta idea es la consecuencia del concepto popular que existe sobre el trmino y que cada vez est ms extendido debido a la influencia de nuestro entorno, ya que hoy da es casi imposible que cualquier medio de difusin, peridico, radio, televisin, etc, no nos aborde diariamente con cualquier tipo de informacin estadstica sobre accidentes de trfico, ndices de crecimiento de poblacin, turismo, tendencias polticas, etc. lo cuando nos adentramos en un mundo ms especfico como es el campo de la investi!acin de las Ciencias ociales" #edicina, $iolo!a, %sicolo!a, ... empezamos a percibir que la Estadstica no slo es al!o ms, sino que se convierte en la &nica herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrnseca, no puedan ser abordadas desde la perspectiva de las leyes deterministas. %odramos, desde un punto de vista ms amplio, definir la estadstica como la ciencia que estudia cmo debe emplearse la informacin y cmo dar una !ua de accin en situaciones prcticas que entra'an incertidumbre. (a Estadst !a se ocupa de los mtodos y procedimientos para reco!er, clasificar, resumir, hallar re!ularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrnseca de los mismos) as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. %odramos por tanto clasificar la Estadstica en descriptiva, cuando los resultados del anlisis no pretenden ir ms all del con*unto de datos, e inferencial cuando el ob*etivo del estudio es derivar las conclusiones obtenidas a un con*unto de datos ms amplio. Clas # !a! $% de la Estadst !a Estadst !a Ciencia que reco!e y or!aniza datos de forma sistemtica. +atos numricos sistemticamente recolectados y or!anizados.

Estadst !a des!& 't (a

,r!anizacin de los datos en tablas y !rficas. e encar!a de establecer los parmetros que definen una poblacin. Comparacin de medidas calculadas mediante distribuciones de probabilidades"

Estadst !a )ate)*t !a

Estadst !a %+ 'a&a)t& !a %ruebas estadsticas aplicadas cuando se supone que los datos -no- se distribuyen normalmente. Estadst !a 'a&a)t& !a %ruebas estadsticas aplicadas cuando se supone que los datos se distribuyen normalmente.

1.,

RECOPILACION DE DATOS

Re!+' la! $% de dat+s- +eber diri!irse al re!istro de aquellos hechos que permitan conocer y analizar lo que realmente sucede en la unidad o tema que se investi!a. Esto consiste en la recoleccin, sntesis, or!anizacin y comprensin de los datos que se requieren. e conocen dos tipos de fuentes" %rimarias" que contienen informacin ori!inal no abreviada ni traducida. ecundarias" obras de referencia que auxilian al proceso de investi!acin. e conoce otra divisin que se conforma por las si!uientes fuentes +ocumentales +e campo. FIC.AS BIBLIO/R0FICAS1 DE TRABA2O Y .E3ERO/R0FICAS (as fuentes de recoleccin de datos son todos los re!istros de aquellos hechos que permitan conocer y analizar lo que realmente sucede en el tema que se investi!a. Concluida la parte preparatoria de la investi!acin se inicia la fase de recopilacin de datos. %ara recabar la informacin existente sobre el tema, el investi!ador se auxilia de instrumentos como las fichas de traba*o) hay diversos tipos de fichas de traba*o como" .ichas de traba*o para fuentes documentales, fichas de traba*o de una revista, fichas de traba*o de un peridico, para investi!acin de campo, para observacin, fichas biblio!rficas y hemero!rficas. ENCUESTA1 CUESTIONARIO Y ENTRE4ISTA /Entrevista" esta herramienta consiste bsicamente en reunirse una o varias personas y cuestionarlas en forma adecuada para obtener informacin.

/Cuestionario" estn constituidos por series de pre!untas escritas, predefinidas, secuenciadas y separadas por captulos o temtica especfica. /Encuesta" la recoleccin de informacin se hace a travs de formularios, los cuales tienen aplicacin en aquellos problemas que se pueden investi!ar por mtodos de observacin, anlisis de fuentes documentales y dems sistemas de conocimiento. AN0LISIS E INTERPRETACI5N DE INFOR3ACI5N (a interpretacin de los resultados de la inda!acin lleva inmediatamente a la solucin. El anlisis del instrumento de recoleccin de informacin de campo 0encuesta1, fue utilizando el anlisis individual de pre!untas que se realiza con base en los porcenta*es que alcanzan las distintas respuestas de cada pre!unta. %ara llevar a cabo este tipo de anlisis se dise'o una forma donde se tabulan las respuestas en base a la cantidad de personas que contestaron cada respuesta y el porcenta*e que representa del total de la muestra. REDACCI5N Y PRESENTACI5N DEL INFOR3E El ob*etivo del informe es presentar a los lectores el proceso que se realiz para presentar una solucin al problema planteado, para lo cual es necesario hacer la presentacin del problema, los mtodos empleados para su estudio, los resultados obtenidos, las conclusiones a las que se lle!aron y las recomendaciones en base a estas. Con respecto a la estructura del informe, sta es sencilla y si!ue fielmente los pasos fundamentales del dise'o de la investi!acin, ya que el informe debe ser la respuesta a lo planteado por el dise'o de investi!acin. 1.6 DISTRIBUCION DE FRECUENCIA

D st& 7u! $% de F&e!ue%! as Cuando la informacin que se tiene es un !ran volumen, resulta muy conveniente ordenar y a!rupar los datos para mane*arlos de acuerdo a la distribucin de frecuencias la cual consiste en a!rupar los datos en clases o cate!oras que estarn definidas por un lmite mnimo y uno mximo de variacin, mostrando en cada clase el n&mero de elementos que contiene o sea la frecuencia. 1.6.1 .ISTO/RA3AS1 POL/ONOS DE FRECUENCIA1 O2I4A Representacin Grfica El patrn de variacin de los datos puede apreciarse me*or representando !rficamente la informacin contenida en el cuadro.

2eneralmente los !rficos empleados para representar distribuciones de frecuencias son " los pol!onos de frecuencias, !rficos de barras, histo!ramas, o*ivas y !rficos de bastones . st+8&a)a on !rficos construidos de barras verticales sin separaciones entre s. %ara construir un histo!rama, se define una escala horizontal apropiada y en ella se marcan los lmites reales de todas las clases de la distribucin que se quiere representar. (a escala no necesita comenzar en cero, pero si un intervalo de clase antes del lmite inferior de la clase ms ba*a. (as frecuencias se representan en la escala vertical, la cual si debe comenzar en cero, no tener cortes o interrupciones y ser lo suficientemente amplia para incluir la mayor de las frecuencias. +efinidas las escalas, se procede a trazar el !rfico como en el e*emplo. P+l8+%+ de #&e!ue%! as El pol!ono consiste en marcar sobre cada clase un punto, tomando como occisa el punto medio de la clase y como ordenada la frecuencia. Esos puntos se unen lue!o con secciones de rectas y la fi!ura resultante es el pol!ono.

Las O9 (as Estas son en realidad pol!onos que utilizan las frecuencias acumuladas con la salvedad de que las ordenadas no se levanten sobre el punto medio de la clase, sino sobre el lmite inferior o superior se!&n se haya acumulado 0ascendente o descendente1. Esto se hace porque debido al procedimiento de acumulacin, la frecuencia -menos-, para un cierta clase, incluye todas las frecuencias menores que el lmite superior de esa clase) y la acumulada -mas de-, todas las frecuencias mayores que el lmite inferior de la clase.

1.:

3EDIDAS DE TENDENCIA CENTRAL PARA UN CON2UNTO DE DATOS Y DATOS A/RUPADOS

(os fenmenos biol!icos no suelen ser constantes, por lo que ser necesario que *unto a una medida que indique el valor alrededor del cual se a!rupan los datos, se asocie una medida que ha!a referencia a la variabilidad que refle*e dicha fluctuacin. En este sentido pueden examinarse varias caractersticas, siendo las ms comunes" (a tendencia central de los datos) (a dispersin o variacin con respecto a este centro) (os datos que ocupan ciertas posiciones. (a simetra de los datos. (a forma en la que los datos se a!rupan.

F 8u&a- #edidas representativas de un con*unto de datos estadsticos

3 lo lar!o de este captulo, y si!uiendo este orden, iremos estudiando los estadsticos que nos van a orientar sobre cada uno de estos niveles de informacin" valores alrededor de los cuales se a!rupa la muestra, la mayor o menor fluctuacin alrededor de esos valores, nos interesaremos en ciertos valores que marcan posiciones caractersticas de una distribucin de frecuencias as como su simetra y su forma. 1.:.1 3EDIA1 3EDIA PONDERADA (a )ed a a& t)t !a de una variable estadstica es la suma de todos sus posibles valores, ponderada por las frecuencias de los mismos. Es decir, si la tabla de valores de una variable X es 4 ni x5 ... xk n5 ... nk fi f5 ... fk

la media es el valor que podemos escribir de las si!uientes formas equivalentes"

i los datos no estn ordenados en una tabla, entonces

(a media tiene las si!uientes caractersticas" Es el centro de !ravedad de la distribucin y es &nica para cada distribucin. Cuando aparecen valores extremos y poco si!nificativos 0demasiado !randes o demasiado peque'os1, la media puede de*ar de ser representativa. 6o tiene sentido en el caso de una variable cualitativa ni cuando existen datos a!rupados con al!&n intervalo no acotado. %ara variables a!rupadas, los xi sern las marcas declase de cada intervalo. 3dems, la media cumple las si!uientes propiedades" i se suma una constante a todos los valores, la media aumenta en dicha constante. i se multiplican todos los valores de la variable por una constante, la media queda multiplicada por dicha constante. O7se&(a! $% 7emos supuesto implcitamente en la definicin de media que tratbamos con una variable X discreta. i la variable es continua tendremos que cambiar los valores de xi por las marcas de clase correspondientes. En !eneral, la media aritmtica obtenida a partir de las marcas de clase ci, diferir de la media obtenida con los valores reales, xi. Es decir, habr una perdida de precisin que ser tanto mayor cuanto mayor sea la diferencia entre los valores reales y las marcas de clase, o sea, cuanto mayores sean las lon!itudes ai, de los intervalos.

P&+'+s ! $% (a suma de las diferencias de la variable con respecto a la media es nula, es decir,

+emostracin $asta desarrollar la sumatoria para obtener

Este resultado nos indica que el error cometido al aproximar un valor cualquiera de la variable, por e*emplo x5, mediante el valor central , es compensado por los dems errores"

i los errores se consideran con si!no positivo, en este caso no pueden compensarse. Esto ocurre si tomamos como medida de error al!una de las si!uientes"

que son cantidades estrictamente positivas si al!&n

E9e)'l+ ,btener las desviaciones con respecto a la media en la si!uiente distribucin y comprobar que su suma es cero. li85 8 li 9 8 59 ni 5

59 8 :9 :

:9 8 ;9 < ;9 8 <9 ;

S+lu! $%li85 8 li 9 8 59 ni 5 xi = xi ni = 85> 8> @5 @55 85> 85? @< @;;

59 8 :9 : :9 8 ;9 < ;9 8 <9 ; nA59 (a media aritmtica es"

5= ;9 := 599 ;= 59=

Como se puede comprobar sumando los elementos de la &ltima columna,

3ed as 8e%e&al ;adas En funcin del tipo de problema varias !eneralizaciones de la media pueden ser consideradas. 7e aqu al!unas de ellas aplicadas a unas observaciones x5, ..., xn" La )ed a 8e+)t& !a , es la media de los lo!aritmos de los valores de la variable"

(ue!o

i los datos estn a!rupados en una tabla, entonces se tiene"

La )ed a a&)$% !a , se define como el recproco de la media aritmtica de los recprocos, es decir,

%or tanto,

La )ed a !uad&*t !a , es la raz cuadrada de la media aritmtica de los cuadrados"

1.:., 3EDINA Consideramos una variable discreta X cuyas observaciones en una tabla estadstica han sido ordenadas de menor a mayor. (lamaremos )ed a%a, Medal primer valor de la variable que de*a por deba*o de s al de las observaciones. %or tanto, si n es el n&mero de observaciones, la mediana corresponder a la observacin BnC:D@5, donde representamos por la parte entera de un n&mero.

F 8u&a- Clculo !eomtrico de la mediana

En el caso de variables continuas, las clases vienen dadas por intervalos, y aqu la frmula de la mediana se complica un poco ms 0pero no demasiado1" ea 0 li85,liD el intervalo donde hemos encontrado que por deba*o estn el de las observaciones. Entonces se obtiene la mediana a partir de las frecuencias absolutas acumuladas, mediante interpolacin lineal 0teorema de Ehales1.

O7se&(a! $% (a relacin Corresponde a definir para cada posible observacin, , su frecuencia relativa acumulada, F0x1, por interpolacin lineal entre los valores F0lj851 A Fj85 y F0lj1 A Fj de forma que

+e este modo, Med es el punto donde

. Esto equivale a decir que la .

mediana divide al histo!rama en dos partes de reas i!uales a

O7se&(a! $% Entre las propiedades de la mediana, vamos a destacar las si!uientes" Como medida descriptiva, tiene la venta*a de no estar afectada por las observaciones extremas, ya que no depende de los valores que toma la variable, sino del orden de las mismas. %or ello es adecuado su uso en distribuciones asimtricas. Es de clculo rpido y de interpretacin sencilla. 3 diferencia de la media, la mediana de una variable discreta es siempre un valor de la variable que estudiamos 0e*. (a mediana de una variable nmero de hijos toma siempre valores enteros1. i una poblacin est formada por : subpoblaciones de medianas Med5 y Med:, slo se puede afirmar que la mediana, Med, de la poblacin est comprendida entre Med5 y Med:

El mayor defecto de la mediana es que tiene unas propiedades matemticas complicadas, lo que hace que sea muy difcil de utilizar en inferencia estadstica. Es funcin de los intervalos esco!idos. %uede ser calculada aunque el intervalo inferior o el superior no ten!a lmites. (a suma de las diferencias de los valores absolutos de n puntuaciones respecto a su mediana es menor o i!ual que cualquier otro valor. Este es el equivalente al teorema de FGni! 0proposicin :.51 con respecto a la media, pero donde se considera como medida de dispersin a"

E9e)'l+ ea X una variable discreta que ha presentado sobre una muestra las modalidades

i cambiamos la &ltima observacin por otra anormalmente !rande, esto no afecta a la mediana, pero si a la media"

En este caso la media no es un posible valor de la variable 0discreta1, y se ha visto muy afectada por la observacin extrema. Este no ha sido el caso para la mediana. E9e)'l+ ,btener la media aritmtica y la mediana en la distribucin ad*unta. +eterminar !rficamente cul de los dos promedios es ms si!nificativo. li85 8 li 9 8 59 59 8 :9 :9 8 ;9 ;9 8 599 ni H9 ?9 ;9 :9

599 8 =99 59 S+lu! $%li85 8 li 9 8 59 59 8 :9 :9 8 ;9 ;9 8 599 ni H9 ?9 ;9 :9 ai 59 59 59 I9 xi = 5= := H= xi ni ;99 5.:99 I=9 5.;99 Ni H9 H9

5<9 ?9 5I9 ;9 5>9 :,> :99 9,:=

599 8 =99 59 nA:99 (a media aritmtica es"

<99 ;99 ;.999

(a primera frecuencia absoluta acumulada que supera el valor nC:A599 es NiA5<9. %or ello el intervalo mediano es B59):91. 3s"

%ara ver la representatividad de ambos promedios, realizamos el histo!rama de la fi!ura :.;, y observamos que dada la forma de la distribucin, la mediana es ms representativa que la media. F 8u&a- %ara esta distribucin de frecuencias es ms representativo usar como estadstico de tendencia central la mediana que la media.

1.:.6 3ODA (a moda se suele definir como el valor ms frecuente. En el caso de una variable no a!rupada, es el valor de la variable que ms se repite. En el caso de una variable a!rupada por intervalos de i!ual amplitud se busca el intervalo de mayor frecuencia 0intervalo o clase modal1 y se aproxima la moda por el valor obtenido al aplicar la frmula

donde" (i85 es el lmite inferior del intervalo modal. ni es la frecuencia absoluta del intervalo modal. ni85 es la frecuencia absoluta del intervalo anterior al intervalo modal. ni@5 es la frecuencia absoluta del intervalo posterior al intervalo modal. ci es la amplitud del intervalo. (a moda cumple que

%uede ser que exista ms de una moda. En dicho caso, se dice que la distribucin es bimodal, trimodal, ..., se!&n el n&mero de valores que presentan la mayor frecuencia absoluta. (a moda es menos representativa que la media, a excepcin de las distribuciones con datos cualitativos. i los intervalos no tienen la misma amplitud, se busca el intervalo de mayor densidad de frecuencia 0que es el cociente entre la frecuencia absoluta y la amplitud del intervalo" 1 y se calcula con la frmula anterior.

(lamaremos )+da a cualquier mximo relativo de la distribucin de frecuencias, es decir, cualquier valor de la variable que posea una frecuencia mayor que su anterior y su posterior. F 8u&a- Clculo !eomtrico de la moda

En el caso de variables continuas es ms correcto hablar de intervalos modales. Jna vez que este intervalo, 0 li85, liD, se ha obtenido, se utiliza la si!uiente frmula para calcular la moda, que est motivada en la fi!ura :.<"

O7se&(a! $% +e la moda destacamos las si!uientes propiedades" Es muy fcil de calcular. %uede no ser &nica. Es funcin de los intervalos ele!idos a travs de su amplitud, n&mero y lmites de los mismos. 3unque el primero o el &ltimo de los intervalos no posean extremos inferior o superior respectivamente, la moda puede ser calculada.

1.:.: RELACION ENTRE 3EDIA1 3EDIANA Y 3ODA En el caso de distribuciones unimodales, la mediana est con frecuencia comprendida entre la media y la moda 0incluso ms cerca de la media1. En distribuciones que presentan cierta inclinacin, es ms aconse*able el uso de la mediana. in embar!o en estudios relacionados con propsitos estadsticos y de inferencia suele ser ms apta la media. Keamos un e*emplo de clculo de estas tres ma!nitudes. E9e)'l+ Consideramos una tabla estadstica relativa a una variable continua, de la que nos dan los intervalos, las marcas de clase ci, y las frecuencias absolutas, ni. Lntervalo ci ni s 9 88 : : 88 < < 88 H 5 : ; 5 = <

H 88 ? ? 8 59

I ; > : . (a

%ara calcular la media podemos a'adir una columna con las cantidades suma de los trminos de esa columna dividida por nA5: es la media" Lntervalo ci s 9 88 : : 88 < < 88 H H 88 ? ? 8 59 5 ; = I > 5: ni Ni : : 5 ; < < : ; :9

; 59 :5 : 5: 5? H<

(a mediana es el valor de la variable que de*a por deba*o de s a la mitad de las n observaciones, es decir H. Construimos la tabla de las frecuencias absolutas acumuladas, Ni, y vemos que eso ocurre en la modalidad tercera, es decir,

%ara el clculo de la , lo primero es encontrar los intervalos modales, buscando los mximos relativos en la columna de las frecuencias absolutas, ni. Kemos que hay dos modas, correspondientes a las modalidades iA5, iA;. En el primer intervalo modal, 0l9,5DA09,:D, la moda se calcula como

El se!undo intervalo modal es 0 l:,l;DA0<)HD, siendo la moda el punto perteneciente al mismo que se obtiene como"

En este caso, como se ve en la fi!ura :.=, la moda no toma un valor &nico, sino el con*unto

1.=

3EDIDAS DE DISPERSI5N PARA UN CON2UNTO DE DATOS Y DATOS A/RUPADOS

Lma!ina que tenemos ; con*untos de personas y nos dicen que en todos los casos, la media del peso es ==. M i!nifica esto que los tres con*untos de datos son i!uales o similaresN Conse!uimos los datos ori!inales y nos encontramos con que las observaciones son las si!uientes" 2rupo 5" 2rupo :" 2rupo ;" == == == == == == == <I =5 =< == =H => H; ;> <I =; == =I H; I5

vemos que, aunque la media es la misma, los con*untos de datos son muy diferentes. .*ate si hacemos el dia!rama de tallo y ho*as lo que obtenemos = = = = = = = ; < = H I > H = < I 5 ; ; < = H I I = > I 5 ; 5 ; < = H I

Entonces Mcmo podemos detectar esas diferencias entre los con*untos de datosN %arece que las medidas de centralizacin no nos proporcionan informacin suficiente en muchas situaciones, as que debemos encontrar al!una otra cantidad que nos di!a cmo de le*os estn los datos entre ellos y de la media, es decir, nos sur*e la necesidad de medir la dispersin de los datos. (o primero que vemos es que en el primer caso todos los datos son i!uales, en el se!undo hay ms diferencia entre el mayor y el menor, y en el tercero ms a&n que en el se!undo. Exactamente tenemos que ==8==A9 H;8<IA5H I58;>A;: 3 esta cantidad la llamamos rango de los datos. in embar!o, aunque es muy fcil de calcular, no se usa demasiado, porque si hay un slo valor muy !rande o muy peque'o, el ran!o vara mucho, as que no siempre es una medida &til. MCmo podramos encontrar un n&mero que nos d una aproximacin de la distancia de los datos a la mediaN %ues podemos calcular todas las diferencias 0en valor absoluto1 entre las observaciones y la media y lue!o calcular la media de esas diferencias. 3 esta cantidad la llamamos desviacin media. Calculemos la desviacin media del !rupo : de datos, tenemos

in embar!o, habitualmente se usa otra medida de la variabilidad, que responde a la media de los cuadrados de las desviaciones de los datos respecto a la media, as conse!uimos que las desviaciones mayores influyan ms que las peque'as. %ero vamos a ver la definicin ri!urosa de todos estos conceptos. 1.=.1 RAN/O Ra%8+" mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor ms elevado y el valor ms ba*o. 1.=., DES4IACION 3EDIA

1.=.6 4ARIAN>A 4a& a%;a" #ide la distancia existente entre los valores de la serie y la media. e calcula como sumatoria de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el n&mero de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tama'o de la muestra.

(a varianza siempre ser mayor que cero. #ientras ms se aproxima a cero, ms concentrados estn los valores de la serie alrededor de la media. %or el contrario, mientras mayor sea la varianza, ms dispersos estn.

1.=.: DES4IACION ESTANADAR

1.?

COEFICIENTE DE 4ARIACI5N

1.<

COEFICIENTE DE ASI3ETRA DE PEARSON

+iremos que una distribucin es simtrica cuando su mediana, su moda y su media aritmtica coincidan. Claramente las distribuciones de los e*emplos de los niveles de colinesterasa y del n de hijos no son por tanto, simtricas. +iremos que una distribucin es asim!trica a la derecha si las frecuencias 0absolutas o relativas1 descienden ms lentamente por la derecha que por la izquierda. i las frecuencias descienden ms lentamente por la izquierda que por la derecha diremos que la distribucin es asim!trica a la i"#uierda. Existen varias medidas de la asimetra de una distribucin de frecuencias. 3qu estudiaremos dos de ellas. a. C+e# ! e%te de As )et&a de Pea&s+% e define como"

siendo cero cuando la distribucin es simtrica, positivo cuando existe asimetra a la derecha y ne!ativo cuando existe asimetra a la izquierda. En el e*emplo del nmero de hijos 3p es i!ual a

indicando una li!era asimetra a la izquierda en la distribucin de frecuencias correspondiente. +e la misma manera, para el e*emplo de los niveles de colinesterasa tambin se observa una li!era asimetra a la izquierda, al ser

+e la definicin se observa que este coeficiente solo se podr utilizar cuando la distribucin sea unimodal. (a otra medida de asimetra que veremos no presenta este inconveniente UNIDAD , INTREODUCCION A LA PROBABILIDAD Y 4ALOR ESPERADO

,.1 INTRODUCCION A LA PROBABILIDAD En la sociedad francesa de 5H=9 el *ue!o era un entretenimiento corriente, sin demasiadas restricciones le!ales. En este entretenimiento estn las races de la teora de la probabilidad , pues cada vez se introducido *ue!os mas complicados que de*aron de sentir la necesidad de un mtodo para calcularla probabilidad de !anar en cada *ue!o. (a probabilidad se obtiene dividiendo el n&mero de casos favorables entre el n&mero de los casos posibles, por tanto la probabilidad de obtener oros al extraer al azar una carta de una bara*a es 59C<9 A 5C< y se admitan que al repetir la fraccin <99 veces, devolviendo la carta a la bara*a tras cada extraccin, sera muy poco usual que la frecuencia relativa de los oros obtenidos estuviesen ale*adas de 5C<. Jn *u!ador apasionado, el caballero +e #r, encontr un desacuerdo entre las frecuencias relativas de la veces que !anaba 8 valores observados realmente 8 y el valor de la correspondiente probabilidad de !anar que el mismo haba calculado. Consult esta discrepancia en %ars con el famoso matemtico y filsofo %ascal, quien se interes por los problemas que le propona +e #r y comenz una correspondencia epistolar sobre cuestiones probabilsticas con otros matemticos ami!os, sobre todo con .ermat. Esta correspondencia puede considerarse el ori!en de la teora de probabilidades. %ronto %ascal y .ermat probaron el desacuerdo de +e #r se deba a que era errneo el calculo de probabilidad que haba hecho, ya que +e #r se haba equivocado al considerar como equiprobables casos que no le eran, y slo cuando los casos posibles son equiprobables tiene sentido aplicar la definicin dada de probabilidad. El desarrollo de la teora de probabilidades tiene otro punto de referencia en 5I5;, en que se publica la obra $%rs conjectandi$ 0El arte de la Con*etura1 de O. $ernoulli, donde estudia la distribucin binominal y su clebre teora que da para esta distribucin la expresin matemtica de la propiedad de estabilidad de las frecuencias relativas. ,tro hito es la se!unda edicin de la obra -Ehe +octrine of Chances- 0(a doctrina de las probabilidades1 aparecidas en 5I;? y debida al hu!onote francs +e #oivre, que por motivos reli!iosos huy de .rancia refu!indose en Ln!laterra, donde vivi de la resolucin de problemas de *ue!os de azar. En la obra se'alada aparecen las primeras indicaciones sobre las distribucin normal de probabilidades.

En 5?5: (aplace publica su famosa - &heore %nal'ti#ue des probabilit!s$, que contiene una exposicin completa y sistemtica de la teora matemtica de los *ue!os de azar, adems de una !ran cantidad de aplicaciones de la teora de la probabilidad a muchas cuestiones cientficas y prcticas. Eras la obra de (aplace se extendieron las aplicaciones de su obra otras ramas de la Ciencia durante el si!lo 4L4, y as, 2auss y (aplace independientemente aplicaron la teora de la probabilidad al anlisis de los errores de medida en las observaciones fsicas y astronmicas, #axPell, $oltzmann y 2ibbs aplicaron la probabilidad en su obra $Mec(nica )stadstica$* que ha sido fundamental en distintas partes de la .sica moderna. Qa durante nuestro si!lo las aplicaciones de la teora de la probabilidad se han extendido por los ms variados campos, como !entica, economa, psicolo!a... Eambin, y pese al xito de las aplicaciones, se oyeron voces crticas a la definicin clsica de probabilidad, que exi!a -a priori- saber, o suponer, que todos los casos posibles eran i!ualmente favorables. 3dems en ciertos casos era imposible aplicar la definicin clsica de probabilidad, como puede suceder al intentar calcular la probabilidad de que una chincheta cai!a con la punta hacia arriba, o de que un hombre de ;9 a'os muera el prximo a'o. i bien la matemtica cambi profundamente de forma entre las dos !uerras mundiales, tambin es cierto que buena parte de la matemtica que si!ui a la e!unda 2uerra #undial consista en el comienzo de al!o radicalmente nuevo que anunciaba una nueva era. (a teora de con*untos y la teora de la medida han ido invadiendo a lo lar!o del si!lo 44 una parte cada vez ms extensa de la matemtica, pero pocas de sus ramas se han visto afectadas tan profundamente por esta tendencia como la teora de probabilidades, a la que $orel haba dedicado ya en 5>9> sus $)l!ments de la th!orie des probabilit!s$ . El primer a'o del nuevo si!lo se anunciaba ya propicio para las aplicaciones de la teora de probabilidades tanto a la fisica como a la !entica, puesto que en 5>95 publicaba 2lbbs su obra )lementar' +rinciples in ,tatistical Mechanics* y el mismo a'o fue fundada la revista -iometrika por Farl %earson 05?=I85>;H1. .rancis 2alton 05?::85>551 fue muy precoz y un estadstico nato que estudi los fenmenos de re!resin) en 5>99 %earson en la universidad de (ondres populariz el criterio de la Rchi8cuadradoS. Jno de los ttulos de %oincar haba sido el de -profesor de clculo de probabilidades-, lo que indicaba un inters creciente por el tema. En Tusia se inici el estudio de las cadenas de sucesos eslabonados, especialmente en 5>9H85>9I, por obra de 3ndrei 3ndreyevich #arUov 0o #arUoff, 5?=H85>::1, discpulo de Echebycheff y coeditor de las .euvres 0: vols., 5?>>8 5>9<1 de su maestro. En la teora cintica de los !ases y en muchos fenmenos sociales y biol!icos, la probabilidad de un suceso depende frecuentemente de los resultados anteriores, y especialmente desde mediados de este si!lo las cadenas de #arUov de probabilidades eslabonadas se han estudiado muy detalladamente.

En su b&squeda de una fundamentacin matemtica para la teora de probabilidades en expansin, los estadsticos encontraron a mano las herramientas necesarias, y hoy no es posible ya dar una exposicin ri!urosa de la teora de probabilidades sin utilizar los conceptos de funcin medible y de las teoras de inte!racin modernas. En Tusia mismo, por e*emplo, A%d&el N !+lae( !@ A+l)+8+&+## hizo importantes pro!resos en la teora de procesos de #arUov 05>;51 y dio solucin a una parte del sexto problema de 7ilbert, en el que se peda una fundamentacin axiom(tico de la teora de probabilidades, utilizando la medida de (ebes!ue. El anlisis clsico se haba ocupado principalmente de funciones continuas, mientras que los problemas de probabilidades !eneralmente se refieren a casos discretos. (a teora de la medida y las sucesivas extensiones del concepto de inte!ral se adaptaban perfectamente a conse!uir una asociacin ms estrecha entre el anlisis y la teora de probabilidades, especialmente a partir de mediados del si!lo, cuando (aurent chPartz 05>5=8 1, de la universidad de %ars, !eneraliz el concepto de diferenciacin mediante su teora de distribuciones 05>=985>=51. ,.1.1 DEFINICION Y EBPRESI5N P&+7a7 l dad1 rama de las matemticas que se ocupa de medir o determinar cuantitativamente la posibilidad de que ocurra un determinado suceso. (a probabilidad est basada en el estudio de la combinatoria y es fundamento necesario de la estadstica. (a probabilidad de un resultado se representa con un n&mero entre 9 y 5, ambos inclusive. (a probabilidad 9 indica que el resultado no ocurrir nunca, y la probabilidad 5, que el resultado ocurrir siempre. El clculo matemtico de probabilidades se basa en situaciones tericas en las cuales puede confi!urarse un espacio muestral cuyos sucesos elementales ten!an todos la misma probabilidad. %or e*emplo, al lanzar un dado ideal, la probabilidad de cada una de las caras es 5CH. 3l lanzar dos dados, la probabilidad de cada uno de los resultados es 5C;H. En estos casos, la probabilidad de un suceso cualquiera , se calcula mediante la re!la de (aplace"

%B D A n&mero de sucesos elementales de elementales

C n&mero total de sucesos

(a expresin anterior se suele expresar del si!uiente modo"

%B D A n&mero de casos favorables a

C n&mero de casos posibles

(a aplicacin de la re!la de (aplace en casos elementales es muy sencilla. %or e*emplo, en la experiencia de lanzar un dado" %BV:, ;, <, =WD A <CH pues V:, ;, <, =W tiene < sucesos elementales y la experiencia admita, en total, seis posibilidades. in embar!o, la aplicacin de esta re!la en experimentos ms comple*os requiere el uso de la combinatoria. %or e*emplo, al extraer tres cartas de una bara*a y ver la probabilidad de que las tres sean trboles, el n&mero total de sucesos elementales es C=:; A 0=:X=5X=91C0;X:X51 A ::.599. (os casos favorables son C5;;A 05;X5:X551C0;X:X51 A :?H. %or tanto, la probabilidad pedida es" %BETE ETY$,(E D A :?HC::.599 A 5<;C55.9=9 (a resolucin de este tipo de problemas se simplifica notablemente si consideramos Zsacar tres naipes[ como una experiencia compuesta por tres experiencias simples" Zsacar un naipe y despus otro y despus otro[. ,., E4ENTOS 3UTUA3ENTE EBCLUYENTES Y NO EBCLUYENTES Cuando se realiza un experimento, que es cualquier proceso que produce un resultado o una observacin, se van a obtener un con*unto de valores. 3 este con*unto de valores que puede tomar una variable se le denomina espacio muestral. %or e*emplo" i se tiene un dado cualquiera, el espacio muestral 0 )M1 es )MAV5,:,;,<,=,HW. i existen ms de una variable, el espacio muestral est formado por las combinaciones de valores de cada una de las variables. i tomamos un subcon*unto cualquiera del espacio muestral tenemos lo que se denomina un evento, y si ste consta de un solo elemento entonces es un evento elemental. Como se puede uno ima!inar, existen eventos que siempre, no importa el n&mero de experimentos o su situacin, ocurren, y en cambio existen otros que nunca ocurren. (os que siempre ocurren son los eventos se!uros, y los que nunca son los eventos imposibles. in embar!o, no todos los resultados son al azar, pues si un experimento es cualquier proceso entonces los resultados pueden tomar cualquier tipo de valor.

%or esta razn, se define como experimento aleatorio al proceso en el que se pueden predecir con certeza la ocurrencia de sus eventos, con excepcin del se!uro o del imposible. 7ay que hacer la observacin que esta definicin habla en trminos !enerales y no especficamente sobre al!&n experimento en particular. 3 aqulla variable que est asociada a un experimento de este tipo se le denomina variable aleatoria. En cambio, a un experimento no aleatorio se le denomina experimento determinstico. Cuando hablamos de varios eventos dentro del mismo experimento se pueden dar varios casos. i dos o ms eventos no pueden ocurrir simultneamente, se llaman eventos mutuamente excluyentes, es decir, que la interseccin de ambos eventos es vaca. %or otro lado, en ocasiones un evento o ms eventos dependen de otro evento previo, es decir, un evento % ocurre dado que ocurri un evento -. i existe este tipo de relacin entre eventos se dice que son eventos dependientes o condicionados 0el evento % depende del evento -, o el resultado del evento % est condicionado al resultado del evento -1. %or otro lado, si no existe tal relacin entre eventos se dice que son eventos independientes. (os criterios de dependencia o de independencia se definirn ms adelante, en trminos de probabilidad condicional. ,.6 RE/LAS DE ADICION P& %! ' + de ad ! $% upon!amos que un evento 3 se puede realizar de -m- maneras y otro evento $ se puede realizar de -n- maneras diferentes, adems, no es posible que ambos eventos se realicen *untos 03\ $ A \ 1, entonces el evento 3 o el evento $ se realizarn de 0 m @ n1 maneras. E9e)'l+ 1Jn repuesto de automvil se venden en H tiendas en la Kictoria o en ? tiendas de $re'a.M+e cuntas formas se puede adquirir el repuestoN S+lu! $% %or el principio de adicin" Kictoria $re'a

H formas @ ? formas A 5< formas E9e)'l+ ,e desea cruzar un ro, para ello se dispone de ; botes, : lanchas y 5 deslizador. M+e cuantas formas se puede cruzar el ro utilizando los medios de transporte se'aladosN S+lu! $% 3plicando el principio de adicin se tiene" $ote , lancha , deslizador ;:5 ] maneras A ; @ : @ 5 A H ,.: E4ENTOS CONDICIONAL INDEPENDIENTES 1 DEPEDIENTES 1 PROBABILIDAD

Eventos independientes" dos eventos 3 y $ son independientes sis la ocurrencia o no ocurrencia afecta la probabilidad asi!nada a la ocurrencia del otro. 3l!unas veces es sencillo determinar la independencia por e*emplo los dos eventos considerados se refieren a ensayos no relacionados tales como el lanzamiento de dos monedas de diferente denominacin en consecuencia los resultados con ambas monedas son independientes. (a falta de independencia o sea la dependencia es demostrada por la si!uiente ilustracin considrese el experimento donde se lanzan dos dados y se observa los dos eventos la suma es i!ual a 59 y n&mero doble que se establece %0591A;C;HA5C5:, %0doble1AHC;HA5CH Mla ocurrencia de 59 afecta la probabilidad de dobleN Considrese esta pre!unta de la manera si!uiente" a ocurrido una suma i!ual a 59 debe de ser uno de los resultados si!uientes B0<,H1,0=,=1,0H,<1D una de estas tres posibilidades es n&mero doble. En consecuencia debe concluirse que -%- 0doble sabiendo que ha ocurrido un diez1, escrita %0dobleC591, es i!ual a 5C; ya que un tercio es distinta a la probabilidad de un doble puede concluirse que el evento 59 afecta la probabilidad de un n&mero doble as un doble y 59 son eventos dependientes. El smbolo %03C$1A%0$C31A%$. Considrese la probabilidad condicional. Emese, por e*emplo, el experimento donde se lanza un dado" AB5,:,;,<,=,HD en este experimento pueden definirse dos

eventos como 3 A-ocurre un <-, y $A-ocurre un n&mero par-. Entonces %031A5CH, el evento 3 se satisface exactamente por uno de los seis mustrales i!ualmente probables en . (a probabilidad condicional de 3 dado $, %03C$1, se encuentra de manera similar, pero ya no es este caso el espacio muestral. Esto puede verse de la manera si!uiente" se lanza un dado sin que se pueda ver, aunque recibe la informacin de que el n&mero obtenido sea par, es decir que ha ocurrido el evento $. Esta es la condicin dada, conocindola a uno se la pide asi!nar la probabilidad del evento -ocurre un <-. lo haqy tres posibilidades en el nuevo espacio muestral 0reducido1, B:,<,HD. Cada uno de los tres resultados es i!ualmente probable" en consecuencia %03 $1A5C;. ,.= RE/LAS DE 3ULTIPLICACI5N Te!la de la multiplicacin C3 , 2E6ET3( ean 3 y $ dos eventos definidos en el espacio muestral . Entonces " %03 y $1A%031.%0$C31 o bien %03 y $1A%0$1.%03C$1 i los eventos 3 y $ son independientes, el caso !eneral de la re!la de la multiplicacin 0la frmula anterior1. Te!la de la multiplicacin C3 , E %ECL3( ean 3 y $ dos eventos definidos en el espacio muestral independientes entonces" %03 y $1A%031.%0$1 Esta frmula puede ser !eneralizada. entonces" i 3,$,C)...)! son eventos independientes, . i 3 y $ son eventos

%03 y $ y C y ... y 21A%031.%0$1.%0C1...%02A 7ay al!unos problemas, o parte de al!unos problemas en los que la respuesta tiene que ver con multiplicar probabilidades. Keamos un e*emplo. El producto que nos surte el proveedor 3 tiene un =^ de probabilidad de estar defectuoso, mientras que el que nos surte el proveedor $ tiene un 5=^ de probabilidad de estar defectuoso. +ebido al empaque, es

imposible distin!uir entre el producto del proveedor 3 y el del $. En el almacn hay 599 unidades del producto y vamos a seleccionar una al azar. abiendo que <9^ de las unidades nos las surti 3 y el resto $, Mqu probabilidad hay de que la unidad seleccionada sea defectuosaN %ara calcular la probabilidad, es conveniente ver que lo que estamos haciendo tiene dos etapas que se van a cubrir de manera secuencial" %rimero se esco!e una unidad que puede ser del proveedor 3 o del $. Jna vez esco!ida la unidad sta puede ser defectuosa o n. ,btener una unidad defectuosa se puede hacer por cualquiera de estos dos caminos" En la primera etapa esco!emos un producto del proveedor 3 y en la se!unda etapa resulta defectuoso. %rimero esco!emos del $ y lue!o resulta defectuoso. Esta particin del problema se ve me*or en lo que se llama un dia!rama de rbol. +etalles en el pizarrn. (a probabilidad de obtener un producto defectuoso es la suma de las probabilidades de los dos eventos se'alados. %ara calcular la probabilidad del primer evento necesitamos combinar las probabilidades de ambas etapas" %0proveedor 31 A 9.<9 y %0defect._provedor 31 A 9.9=. (a manera correcta de combinarlas es multiplicndolas. 3hora vamos a ver por qu) de los cien productos, <9 son del proveedor 3 y de ellos el =^ es defectuoso. Esto nos da : artculos, del total de 599, que son defectuosos y surtidos por el proveedor 3. +e la misma manera, la probabilidad de la se!unda posibilidad es" %0proveedor $1 A 9.H9 multiplicada por %0defect._proveedor $1 A 9.5= lo cual nos da >^. (a probabilidad que necesitbamos" %0defect.1 A 9.9: @ 9.9> A 9.55 En la solucin de este problema usamos la re!la de que para calcular la probabilidad de un evento que se hace en dos etapas hay que multiplicar la probabilidad de la primera etapa por la condicional de la se!unda etapa dado el resultado de la primera. ,tro e*emplo es el si!uiente) una mecan!rafa muy eficiente tiene una probabilidad de 9.95 de producir al!&n error por cada p!ina que escribe y cada p!ina es independiente. i nos escribe un documento de ; p!inas, que

probabilidad hay de que no ten!a nin!&n error. 3qu nuestro resultado involucra ; etapas 0no nada ms dos1" 5a., :a. y ;a. p!inas. (a probabilidad de un documento perfecto es" %05a.bien1%0:a.bien_5a.bien1%0;a.bien_5a.y:a.bien1 y, por la independencia de la p!inas, las ; probabilidades son i!uales a 9.>>. Esto da 9.>I. Cuando los eventos en sucesin, son independientes, el clculo de la probabilidad `se simplificaa

,.? DIA/RA3A DEL ARBOL D a8&a)as de *&7+l Tepresenta !rficamente la re!la de la multiplicacin. +e un punto a la izquierda salen n5 rectas de 5ra !eneracin. +e cada una de estas ramas salen n : de :da !eneracin y asi sucesivamente. (a re!la de la multiplicacin muestra el numero total de ramas que tiene el rbol.

En los problemas de probabilidad y en especial en los de probabilidad condicionada, resulta interesante y prctico or!anizar la informacin en una tabla de contin!encia o en un dia!rama de rbol. (as tablas de contin!encia y los dia!ramas de rbol estn ntimamente relacionados, dado uno de ellos podemos construir el otro. Jnas veces, los datos del problema permiten construir fcilmente uno de ellos y a partir de l podemos construir el otro, que nos ayudar en la resolucin del problema. Conversin de una tabla en dia!rama de rbol (as tablas de contin!encia estn referidas a dos caractersticas que presentan cada una dos o ms sucesos.

% En el caso de los sucesos %* *-y +0 % -1 +0 -1

E,E3( +0 - 1 1

+0 % , expresados en frecuencias absolutas, relativas o probabilidades E,E3( +0 % 1 la tabla, adopta la forma ad*unta.

1 +0 +0 1

1 +0 5

+icha tabla adopta la forma del dia!rama de rbol del dibu*o. En ste, a cada uno de los sucesos % y se les ha asociado los sucesos - y .

obre las ramas del dia!rama de rbol se han anotado las probabilidades condicionadas correspondientes, deducidas de las relaciones anlo!as a"

,.< CO3BINACIONES Y PER3UTACIONES C+)7 %a! +%es Es una seleccin de r ob*etos de n dados sin atender a la ordenacin de los mismos. Es decir, es la obtencin de subco*untos, de r elementos cada uno, a partir de un con*unto inicial de n elementos. (a denotaremos con /nr, n/r .

P+& e9e)'l+- i tomamos el mismo con*unto %AVa,b,c,dW, Mcuntos subcon*untos de : elementos cada uno se pueden obtenerN 7acindolos se obtienen" Va,bW, Va,cW, Va,dW, Vb,cW, Vb,dW, Vc,dW. subcon*untos. on seis los

En !eneral, si de n ob*etos dados se hacen combinaciones de r ob*etos cada una, el n&mero de combinaciones obtenidas son"

/nr A n/r A o, que es lo mismo,

/nr A n/r A En )xcel la funcin C,#$L63E0n,r1 calcula las combinaciones de n ob*etos tomando r de ellos. Es cada uno de los diferentes arre!los que se pueden hacer con parte o todos los elementos de un con*unto dado sin considerar el orden en su ubicacin El n&mero de combinaciones de -%- elementos diferentes tomados de CDC e% CDC , con DE % ,est dada por"

E9e)'l+ 1i disponemos de = puntos no colineales ,Mcul es el mximo n&mero de trin!ulos que se podrn formarN S+lu! $% %ara dibu*ar un trin!ulo solo es necesario ; puntos en el plano, lue!o se esco!ern ; puntos 0U A ;1 de un total de ? puntos 0n A =1. 3dems no importa el orden, ya que el trian!ulo 3$C es i!ual al C$3) por lo tanto se trata de una combinacin.

%ara ver el !rfico seleccione la opcin b$a*ar traba*ob del men& superior E9e)'l+ ,-

Jna se'ora tiene ; frutas " manzana, fresa y pi'a. MCuntos sabores diferentes de *u!o podr preparar con estas frutas N %ara ver el !rfico seleccione la opcin b$a*ar traba*ob del men& superior .resa 0.1 , %i'a 0%1 , #anzana 0#1 S+lu! $%3t+d+ 1 - Fe% #+&)a 8&*# !aG Cuando se esco!e una fruta de las tres, los sabores son ;" F1 P 13 Cuando se esco!e : de las tres frutas, los sabores son ;" FP1 F31 P3 Cuando se esco!e las ; frutas los sabores son 5" FP3 T+tal de sa7+&es d #e&e%tes - 6 H 6 H 1 I < 3t+d+ , - FE)'lea%d+ !+)7 %a! +%esG e puede esco!er una fruta de las tres $ : frutas de las tres $ las tres frutas de las tres, adems en este caso no importa el orden) por lo tanto usamos el principio de adicin aplicado a la combinacin" ] maneras diferentes A

] maneras diferentes A T+tal de sa7+&es d #e&e%tes - 6 H 6 H 1 I < E9e)'l+ 6e desea formar un comit de I seleccionando < fsicos y ; matemticos de un !rupo de ? fsicos y H matemticos.M+e cuantas maneras podr seleccionarseN S+lu! $%5 formas eleccionamos < fsicos entre ? en

:o eleccionamos ; matemticos entre H en

3plico el principio de multiplicacin x A I9 x :9 A 5<99

Pe&)uta! $% Es un arre!lo de todos o parte de un con*unto de ob*etos considerando el orden en su ubicacin) cuando en el arre!lo solo entran parte de los elementos del con*unto se llama (a& a! $% . Es importante resaltar que el orden es una caracterstica importante en la permutacin, cuando variamos el orden de los elementos se dice que permutamos dichos elementos. E9e)'l+ +eterminar los diferentes arre!los o permutaciones que se pueden hacer con las letras a, b y c tomadas de dos en dos S+lu! $% 3t+d+ 1ea el con*unto " Va, b, cW , entonces los arre!los pueden ser" a71 7a. a!1 !a1 7!1 !7 6&mero de arre!los A H 3t+d+ ,- F'& %! ' + de )ult 'l !a! $%G %ara ver el !rfico seleccione la opcin b$a*ar traba*ob del men& superior ] arre!los A ; x : A H

Te+&e)a 1- FPe&)uta! $% l %eal !+% ele)e%t+s d #e&e%tesG -El n&mero de permutaciones de - %- ob*etos diferentes, tomados en !rupos de D elementos 0siendo U \ n1 y denotado por , estar dado por"

%ara ver el !rfico seleccione la opcin b$a*ar traba*ob del men& superior ) donde" n, U 6 y 9 \ U \ n Estas permutaciones son llamados lineales , porque los ob*etos son ordenados en una lnea recta de referencia E9e)'l+En una carrera de <99metros participan 5: atletas. M+e cuantas formas distintas podrn ser premiados los tres primeros lu!ares con medalla de oro , plata y bronceN S+lu! $% 3t+d+ 1 - E)'lea%d+ el '& %! ' + de )ult 'l !a! $% ,ro %lata $ronce %ara ver el !rfico seleccione la opcin b$a*ar traba*ob del men& superior 59 x > x ? ] maneras A I:9 3t+d+ ,- Fusa%d+ la #$&)ula de 'e&)uta! $% l %ealG e busca las diferentes ternas 0U A ;1 que se pueden formar con los 59 atletas 0n A 591

%ara ver el !rfico seleccione la opcin b$a*ar traba*ob del men& superior Te+&e)a ,- FPe&)uta! $% l %eal !+% ele)e%t+s &e'et d+sG El n&mero de permutaciones 0%1 distintas de -n- elementos tomados de -n- en -nen donde hay un primer !rupo de n5 ob*etos i!uales entre si) n: ob*etos i!uales

entre si de un se!undo tipo y as sucesivamente hasta n U ob*etos i!uales entre si de un &ltimo tipo, entonces" E9e)'l+ M+e cuntas maneras distintas se podrn ordenar las si!uientes fi!urasN %ara ver el !rfico seleccione la opcin b$a*ar traba*ob del men& superior S+lu! $%Como entran todos los elementos del con*unto y estos se repiten, se trata de una permutacin con repeticin, donde n 5 A ; 0tres crculos1, n: A : 0dos cuadrados1 , n; A 5 0un trin!ulo1, n< A 50 un rombo1, lue!o"

Pe&)uta! $% C &!ula& on a!rupaciones donde no hay primero ni &ltimo elemento, por hallarse todos en una lnea cerrada. %ara hallar el n&mero de permutaciones circulares que se pueden formar con -n- ob*etos distintos de un con*unto, hay que considerar fi*a la posicin de un elemento, los n c 5 restantes podrn cambiar de lu!ar de 0n c 51a .ormas diferentes tomando todas las posiciones sobre la circunferencia relativa al primer punto. El n&mero de permutaciones circulares ser"

E9e)'l+1 M+e cuntas formas diferentes puede sentarse al rededor de una mesa circular un padre y sus = hi*osN S+lu! $% -

e trata de una permutacin circular " E9e)'l+ ,M+e cuntas maneras diferentes se podrn ubicar las cifras del 5 al I en la si!uiente fi!uraN %ara ver el !rfico seleccione la opcin b$a*ar traba*ob del men& superior S+lu! $% Este problema se puede resolver como la con*uncin de dos eventos" '& )e&+ ubico una cifra en el centro 0I posibilidades1 J se8u%d+ las otras H cifras, las cuales por ordenarse en una circunferencia se podrn permutar de 0H c5 1a .ormas , por lo tanto" ] de maneras A I x =a A I x 5:9 A ?<9

,.K ANALISIS CO3BINATORIO En ocasiones el traba*o de enumerar los posibles sucesos que ocurren en una situacin dada se convierte en al!o difcil de lo!rar o, simplemente, tedioso. El anlisis combinatorio, o clculo combinatorio, permite enumerar tales casos o sucesos y as obtener la probabilidad de eventos ms comple*os. En el caso de que existan ms de un suceso a observar, habra que contar el n&mero de veces que pueden ocurrir todos los sucesos que se desean observar, para ello se utiliza el '& %! ' + #u%da)e%tal de !+%te+" i un suceso se puede presentar de n5 formas, y otro se puede presentar de n: formas, entonces el n&mero de formas en que ambos sucesos pueden presentarse en ese orden es de n5Xn:. En otras palabras, basta multiplicar el n&mero de formas en que se pueden presentar cada uno de los sucesos a observar. Este principio nos remite automticamente al #a!t+& al de un n&mero natural, que se puede pensar como una funcin con dominio los n&meros naturales *unto con el cero y codominio los n&meros naturales. El factorial de un n&mero n, denotado na, se define como"

3hora, n es muy !rande el proceso de clculo se vuelve tedioso y muy car!ado, incluso para una computadora, por lo que se utiliza la a'&+L )a! $% de St &l %8 a nM"

donde e2:.I5?:?..., que es la base de los lo!aritmos neperianos. En )xcel existe la funcin .3CE0n1 que calcula el factorial de un n&mero entero no ne!ativo n. En el anlisis combinatorio se definen las permutaciones, con o sin repeticin, y las combinaciones. ,.N TEORE3A DE BAYES En el a'o 5IH;, dos a'os despus de la muerte de &homas -a'es 05I9:85IH51, se public una memoria en la que aparece, por vez primera, la determinacin de la probabilidad de las causas a partir de los efectos que han podido ser observados. El clculo de dichas probabilidades recibe el nombre de teorema de $ayes.

Te+&e)a de BaJes ea %3* %4* ...*%n un sistema completo de sucesos, tales que la probabilidad de cada uno de ellos es distinta de cero, y sea - un suceso cualquier del que se conocen las probabilidades condicionales +0-5%i1. entonces la probabilidad +0%i5-1 viene dada por la expresin"

En los problemas relacionados con la probabilidad, y en particular con la probabilidad condicionada, as como con la probabilidad total y el teorema de $ayes, es aconse*able que, con la informacin del problema, construyas una tabla de contin!encia o un dia!rama de rbol. El Te+&e)a de BaJes viene a se!uir el proceso inverso al que hemos visto en el Eeorema de la probabilidad total"

Eeorema de la probabilidad total" a partir de las probabilidades del suceso 3 0probabilidad de que llueva o de que ha!a buen tiempo1 deducimos la probabilidad del suceso $ 0que ocurra un accidente1. Eeorema de $ayes" a partir de que ha ocurrido el suceso $ 0ha ocurrido un accidente1 deducimos las probabilidades del suceso 3 0Mestaba lloviendo o haca buen tiempoN1. (a frmula del Eeorema de $ayes es"

Eratar de explicar estar frmula con palabras es un !alimatas, as que vamos a intentar explicarla con un e*emplo. +e todos modos, antes de entrar en el e*ercicio, recordar que este teorema tambin exi!e que el suceso 3 forme un sistema completo.

E*ercicio 5d" El parte meteorol!ico ha anunciado tres posibilidades para el fin de semana" a1 eue llueva" probabilidad del =9^. b1 eue nieve" probabilidad del ;9^ c1 eue haya niebla" probabilidad del :9^. e!&n estos posibles estados meteorol!icos, la posibilidad de que ocurra un accidente es la si!uiente" a1 i llueve" probabilidad de accidente del 59^. b1 i nieva" probabilidad de accidente del :9^ c1 i hay niebla" probabilidad de accidente del =^. Tesulta que efectivamente ocurre un accidente y como no estabamos en la ciudad no sabemos que tiempo hizo 0nev, llovo o hubo niebla1. El teorema de $ayes nos permite calcular estas probabilidades" (as probabilidades que mane*amos antes de conocer que ha ocurrido un accidente se denominan -probabilidades a priori- 0lluvia con el H9^, nieve con el ;9^ y niebla con el 59^1.

Jna vez que incorporamos la informacin de que ha ocurrido un accidente, las probabilidades del suceso 3 cambian" son probabilidades condicionadas % 03C$1, que se denominan -probabilidades a posteriori-. Kamos a aplicar la frmula"

a1 %robabilidad de que estuviera lloviendo"

(a probabilidad de que efectivamente estuviera lloviendo el da del accidente 0probabilidad a posteriori1 es del I5,<^. b1 %robabilidad de que estuviera nevando"

(a probabilidad de que estuviera nevando es del :5,<^. c1 %robabilidad de que hubiera niebla"

(a probabilidad de que hubiera niebla es del I,5^.

,.1O 4ALOR ESPERADO O ESPERAN>A 3ATE30TICA ea X una v.a. discreta. es'e&ad+, y se denota bien e denomina es'e&a%;a )ate)*t !a de X o (al+& o bien , a la cantidad que se expresa como"

donde

es el con*unto numerable de ndices de los valores que puede tomar la

variable 0por e*emplo para un n&mero finito de valores de la v.a. o bien para una cantidad infinita numerable de los mismos. i X es una v.a. continua, se define su esperanza a partir de la funcin de densidad como si!ue"

O7se&(a! $% Tecordamos que si

y por tanto tiene sentido calcular su esperanza matemtica"

%or las analo!as existente entre la definicin de media aritmtica y esperanza matemtica, las propiedades de linealidad de la primera se trasladan a la se!unda, como es inmediato comprobar"

UNIDAD 6

TIPOS DE DISTRIBUCIONES 4ARIABLES ALEATORIAS DISCRETAS Y CONTINUAS


6.1 BINO3IAL e dice que una v.a. X si!ue una leJ 7 %+) al de parmetros n y p, si es la suma de n v.a. independientes de $ernouilli con el mismo parmetro, p" ,

Esta definicin puede interpretarse en el si!uiente sentido" upon!amos que realizamos n pruebas de $ernouilli, Xi, donde en todas ellas, la probabilidad de xito es la misma 0 p1, y queremos calcular el n&mero de xitos, X, obtenidos el el H.5 total de las n pruebas. u ley de probabilidad es . 6.11 PROPIEDADES- 3EDIA1 4ARIAN>A Y DES4IACI5N ESTANDAR upon!amos que un experimento aleatorio tiene las si!uientes caractersticas" En cada prueba del experimento slo son posibles dos resultados" el suceso 3 0xito1 y su contrario 0fracaso1. El resultado obtenido en cada prueba es independiente de los resultados obtenidos anteriormente. (a probabilidad del suceso 3 es constante, la representamos por p, y no vara de una prueba a otra. (a probabilidad de es 58 p y la representamos por # . El experimento consta de un n&mero n de pruebas. Eodo experimento que ten!a estas caractersticas diremos que si!ue el modelo de la distribucin $inomial. 3 la variable X que expresa el n&mero de xitos obtenidos en cada prueba del experimento, la llamaremos variable aleatoria binomial. (a variable binomial es una variable aleatoria discreta, slo puede tomar los valores 9, 5, :, ;, <, ..., n suponiendo que se han realizado n pruebas. Como hay que considerar todas las maneras posibles de obtener U8xitos y 0n8U1 fracasos debemos calcular stas por combinaciones 0n&mero combinatorio n sobre U1.

(a distribucin $inomial se suele representar por -0n*p1 siendo n y p los parmetros de dicha distribucin. .uncin de %robabilidad de la v.a. $inomial .uncin de probabilidad de la distribucin $inomial o tambin denominada funcin de la distribucin de $ernoulli 0para nA51. Kerificndose" 9 \ p \ 5

Como el clculo de estas probabilidades puede resultar al!o tedioso se han construido tablas para al!unos valores de n y p que nos facilitan el traba*o. %armetros de la +istribucin $inomial

.uncin de +istribucin de la v.a. $inomial

siendo U el mayor n&mero entero menor o i!ual a x i. Esta funcin de distribucin proporciona, para cada n&mero real x i, la probabilidad de que la variable 4 tome valores menores o i!uales que x i. El clculo de las .0x1 A p0 4 \x1 puede resultar laborioso, por ello se han construido tablas para al!unos valores de n y p que nos facilitan el traba*o. ea 4 una variable aleatoria discreta correspondiente a una distribucin binomial.

%or tanto, su funcin de distribucin es

El modo ms simple de calcular la funcin afirma que la funcin caracterstica de la suma de variables independientes es el producto de las funciones caractersticas de estas"

(os principales momentos de X los calculamos ms fcilmente a partir de 0prop. p!ina =1 que de su propia definicin"

E9e)'l+ Jn mdico aplica un Ees. a 59 alumnos de un cole!io para detectar una enfermedad cuya incidencia sobre una poblacin de ni'os es del . (a

sensibilidad del test es del y la especificidad del . MCual es la probabilidad de que exactamente a cuatro personas le de un resultado positivoN i en la muestra hay cuatro personas a las que el test le da positivo, Mcul es la probabilidad de que entre estas, exactamente dos estn sanasN Calcular la probabilidad de que el test suministre un resultado incorrecto para dos personas. Calcular la probabilidad de que el resultado sea correcto para ms de I personas. S+lu! $%(os datos de que disponemos son"

donde ), &@, y &8 tienen el sentido que es obvio.

i queremos saber a cuantas

personas el test le dar un resultado positivo, tendremos que calcular , para lo que podemos usar el teorema de la probabilidad total 0estar enfermo y no estarlo forman una coleccin exhaustiva y excluyente de sucesos1"

ea X5 la v.a. que contabiliza el n&mero de resultados positivos. Es claro que llamando , se tiene que X si!ue una distribucin binomial

%or ello la probabilidad de que a cuatro personas le de el resultado del test positivo es"

i queremos calcular a cuantas personas les dar el test un resultado positivo aunque en realidad estn sanas, hemos de calcular previamente el ndice predictivo de falsos positivos" , o sea,

Es importante observar este resultado. 3ntes de hacer los clculos no era previsible que si a una persona el test le da positivo, en realidad tiene una probabilidad aproximadamente del de estar sana. ea X: la variable aleatoria que contabiliza al n&mero de personas al que el test le da positivo, pero que estn sanas en realidad. Entonces

%or &ltimo vamos a calcular la probabilidad p; de que el test de un resultado errneo, que es"

(a variable aleatoria que contabiliza el n&mero de resultados errneos del test es

Como la probabilidad de que el test sea correcto para ms de siete personas, es la de que sea incorrecto para menos de ;, se tiene

6.1., /RAFICA F 8u&a- .uncin de probabilidad de una variable binomial cundo n es peque'o.

F 8u&a- .uncin de probabilidad de una variable binomial cuando n es !rande.

6., POISSON

(a +istribucin de %oisson se llama as en honor a imen +ennis %oisson 05I?585?<91, francs que desarroll esta distribucin basndose en estudios efectuados en la &ltima parte de su vida. (a distribucin de %oisson se emplea para describir varios procesos, entre otros la distribucin de las llamadas telefnicas que lla!an a un conmutador, la demanda 0necesidades1 de servicios en una institucin asistencial por parte de los pacientes, los arribos de los camiones y automviles a la caseta de cobro y el n&mero de accidentes en un cruce. (os e*emplos citados tienen un elemento en com&n, pueden ser descritos por una variable aleatoria discreta que asume valores enteros 09,5,:,;,<,= y as sucesivamente1. 6.,.1 PROPIEDADES- 3EDIA1 4ARIAN>A Y DES4IACI5N ESTANDAR El n&mero de enfermos que lle!an a un consultorio en cierto intervalo de tiempo ser de 9,5,:,;,<,= o al!&n otro n&mero entero. +e manera anlo!a, si se cuenta el n&mero de automviles que lle!an a una caseta de cobro durante un periodo de diez minutos, el n&mero ser entero. Caractersticas de los procesos que producen una distribucin de la probabilidad de %oisson. El n&mero de vehculos que pasan por una caseta de cobro en las horas de mayor trfico sirve como e*emplo para mostrar las caractersticas de una distribucin de probabilidad de %oisson. El promedio 0media1 de los arribos de vehculos por hora de !ran trfico puede estimarse a partir de los datos anteriores del trfico. i dividimos las horas de !ran trfico en periodos 0intervalos1 de un se!undo cada uno, encontraremos que los si!uientes enunciados son verdaderos" a1 (a probabilidad de que exactamente un vehculo lle!ue por se!undo a una caseta individual es un n&mero muy peque'o y es constante para que cada intervalo de un se!undo. b1 (a probabilidad de que dos o ms vehculos lle!uen en un intervalo de un se!undo es tan reducida que podemos asi!narle un valor cero. c1 El n&mero de vehculos que lle!an en determinado intervalo de un se!undo es independiente del momento en que el intervalo de un se!undo ocurre durante la hora de !ran trfico. d1 El n&mero de lle!adas en cualquier intervalo de un se!undo no depende del n&mero de arribos de cualquier otro intervalo de un se!undo. 3hora bien, podemos !eneralizar partiendo de las cuatro condiciones que hemos descrito en este e*emplo, si estas condiciones se cumplen nos apoyaremos en una distribucin de probabilidad de %oisson para describirlos.

C*l!ul+ de '&+7a7 l dades )ed a%te la d st& 7u! $% de P+ ss+%. (a distribucin de %oisson, se!&n hemos se'alado, se refiere a ciertos procesos que pueden ser descritos con una variable aleatoria discreta. (a letra 4 suele representar esa variable y puede adems asumir valores enteros 09,5,:,; etc..1 . Jtilizamos la letra 4 may&scula para representar la variable aleatoria y la x min&scula para desi!nar un valor especfico que puede asumir la 4 may&scula. (a probabilidad de exactamente x ocurrencias en una distribucin de %oisson se calcula mediante la frmula" %0x1 A x / e8 C xa x A (ambda 0n&mero medio de ocurrencias por intervalo de tiempo1 elevada a la potencia x. e8 A eA :.I5?:? elevado a la potencia de lambda ne!ativa. xa A x factorial. E*emplo " upn!ase que estamos investi!ando la se!uridad de un crucero muy peli!roso. (os archivos de la polica indican una media de cinco accidentes por mes en l. El n&mero de accidentes est distribuido conforme a la distribucin de %oisson, y la divisin de se!uridad en carreteras quiere calcular la probabilidad de exactamente 9,5,:,; y < accidentes en un mes determinado. 3plicando la frmula anterior" %091 A 0=19 0e8=1 C9a A 9.99HI< %051 A 0=15 0e8=1 C5a A 9.9;;I9 %0:1 A 0=1: 0e8=1 C:a A 9.9?<:= %0;1 A 0=1; 0e8=1 C;a A 9.5<9<: %0<1 A 0=1< 0e8=1 C<a A 9.5I==: %ara saber cual es la probabilidad en ; o menos, sumaremos las probabilidades de 9,5,:,; lo que ser i!ual a " %091 A 9.99HI<

%051 A 9.9;;I9 %0:1 A 9.9?<:= %0;1 A 9.5<9<: %0; o menos1 A 9.:H=55 +ado que la probabilidad de que haya ; o menos accidentes es de 9.:H=55 entonces la probabilidad de que ocurran ms de tres debe ser A 5 c9.:H=55 A 9.I;<?>. (a distribucin de %oisson como una aproximacin a la distribucin binomial. 3l!unas veces, si se desea evitar el tedioso traba*o de calcular las distribuciones binomiales, se puede usar a cambio la de %oisson, pero debe cumplir con ciertas condiciones como " nAf:9 pAg9.9= En los casos en que se satisfacen tales condiciones, podemos sustituir la media de la distribucin binomial en lu!ar de la media de la distribucin de %oisson de modo que la frmula quedara as" %0x1 A 0np1 4 / e8np Cxa

6.,., /RAFICA

6.6 .IPER/EO3ETRICA (os experimentos que tienen este tipo de distribucin tienen las si!uientes caractersticas" a1 3l realizar un experimento con este tipo de distribucin, se esperan dos tipos de resultados. b1 (as probabilidades asociadas a cada uno de los resultados no son constantes. c1 Cada ensayo o repeticin del experimento no es independiente de los dems. d1 El n&mero de repeticiones del experimento 0n1 es constante. 6.6.1 PROPIEDADES- 3EDIA1 4ARIAN>A Y DES4IACI5N ESTANDAR E*emplo" En una urna o recipiente hay un total de N ob*etos, entre los cuales hay una cantidad a de ob*etos que son defectuosos, si se seleccionan de esta urna n ob*etos al azar, y sin reemplazo, Mcul es la probabilidad de obtener x ob*etos defectuososN

olucin" (ue!o)
C x * N a C n x N Cn

p( x , n ) =

donde" p0x,n1 A probabilidad de obtener x ob*etos defectuosos de entre n seleccionados C x * N a C n x = muestras de n ob*etos en donde hay x que son defectuosos y n6x buenos
a

C n = = todas las muestras posibles de seleccionar de n ob*etos tomadas de entre N ob*etos en total A espacio muestral
N

Considerando que en la urna hay un total de 59 ob*etos, ; de los cuales son defectuosos, si de seleccionan < ob*etos al azar, Mcul es la probabilidad de que : sean defectuososN olucin" 6 A 59 ob*etos en total a A ; ob*etos defectuosos n A < ob*etos seleccionados en muestra x A : ob*etos defectuosos deseados en la muestra p( x = 2, n = 4 ) =
3

C2*10 3 C4 2 10 C4

3! 7! * C* C ( 3 2 )!2! ( 7 2 )!2! = 3 2 7 2 = = 10! 10 C4 ( 10 4 )!4!

3! 7! 3x 2 x1! 7 x6 x5! * * 1 ! 2 ! 5 ! 2 ! 1 ! 2 ! 5!2! = 3 x 2 x7 x6 * 4! = = = 10! 10 x9 x8 x7 x6! 10 x9 x8 x 7 2!2! 6!4! 6! 4! donde"

3 x 2 x7 x6 = 10 x9 x8 x7 probabilidad asociada a cada muestra de < ob*etos que se seleccionaron, con lo que se demuestra que las probabilidades no son constantes 4! = 2!2! formas o maneras de obtener : ob*etos defectuosos entre los < seleccionados A muestras de < ob*etos entre los que : son defectuosos

Como se observa en el desarrollo de la solucin del problema, la pretensin es demostrar que las probabilidades asociadas a cada uno de los resultados no son constantes. (ue!o la probabilidad de obtener : ob*etos defectuosos entre los < seleccionados al azar sera"
3 x 2 x7 x 6 4! 252 24 6048 * = * = = 0.30 10 x9 x8 x7 2!2! 5040 4 20160

E9e)'l+s5. %ara evitar que lo descubran en la aduana, un via*ero ha colocado H tabletas de narctico en una botella que contiene > pldoras de vitamina que son similares en apariencia. i el oficial de la aduana selecciona ; tabletas aleatoriamente para analizarlas, a1 MCul es la probabilidad de que el via*ero sea arrestado por posesin de narcticosN, b1 MCul es la probabilidad de que no sea arrestado por posesin de narcticosN.

olucin" a1 6 A >@H A5= total de tabletas a A H tabletas de narctico n A ; tabletas seleccionadas x A 9, 5, :, o ; tabletas de narctico A variable que nos indica el n&mero de tabletas de narctico que se puede encontrar al seleccionar las ; tabletas p0via*ero sea arrestado por posesin de narcticos1 A p0de que entre las ; tabletas seleccionadas haya 5 o ms tabletas de narctico1
= p( x = 1,23tabletas ; n = 3 ) =
6

C1* 9 C2 6 C2* 9 C1 6 C3* 9 C0 + + = 15 C3 15 C3 15 C3

( 6 )( 36 ) ( 15 )( 9 ) ( 20 )( 1 ) 216 + 135 + 20 371 + + = = = 0.81538 455 455 455 455 455

otra forma de resolver) p0el via*ero sea arrestado por posesin de narcticos1 A 5 c p0de que entre las tabletas seleccionadas no haya una sola de narctico1
= 1 p( x = 0; n = 3 ) = 1
6

C0* 9 C3 = 15 C3

( 1 )( 84 ) = 0.184615 = 0.815385 455 a1 p0no sea arrestado por posesin de narcticos1 = 1 = p( x = 0; n = 3 ) =


6

C0* 9 C3 = 15 C3

( 1 )( 84 ) = 0.184615 455

:. +e un lote de 59 proyectiles, < se seleccionan al azar y se disparan. i el lote contiene ; proyectiles defectuosos que no explotarn, Mcul es la probabilidad de que , a1 los < explotenN, b1 al menos : no explotenN olucin" a1 6 A 59 proyectiles en total a A I proyectiles que explotan n A < proyectiles seleccionados x A 9, 5, :, ; o < proyectiles que explotan A variable que nos define el n&mero de proyectiles que explotan entre la muestra que se dispara
p( x = 4; n = 4 ) =
7

C4* 3 C0 ( 35 )( 1 ) 35 = = = 0.16667 210 210 10 C4

b1 6 A 59 proyectiles en total a A ; proyectiles que no explotan n A < proyectiles seleccionados x A 9, 5, : o ; proyectiles que no explotan p0al menos : no exploten1 A p0 : o ms proyectiles no exploten1 A p0x A : o ;) nA<1 A

C2* 7 C2 + 3 C3* 7 C1 ( 3 )( 21 ) + ( 1 )( 7 ) 63 + 7 70 = = = = 0.333333 210 210 210 10 C4

;. a1 MCul es la probabilidad de que una mesera se reh&se a servir bebidas alcohlicas &nicamente a dos menores de edad si verifica aleatoriamente solo = identificaciones de entre > estudiantes, de los cuales < no tienen la edad suficienteN, b1 MCual es la probabilidad de que como mximo : de las identificaciones pertenezcan a menores de edadN olucin" a1 6 A > total de estudiantes a A < estudiantes menores de edad n A = identificaciones seleccionadas x A variable que nos define el n&mero de identificaciones que pertenecen a personas menores de edad x A 9, 5, :, ; o < identificaciones de personas menores de edad
p( x = 2,n = 5 ) =
4

C2 * 5 C3
9

C5

( 3 )( 10 ) = 0.238095 126

7G

6 A > total de estudiantes a A < estudiantes menores de edad n A = identificaciones seleccionadas x A variable que nos define el n&mero de identificaciones que pertenecen a personas menores de edad x A 9, 5, :, ; o < identificaciones de personas menores de edad
C0* 5 C5 + 4 C1* 5 C4 + 4 C2* 5 C3 ( 1 )( 1 ) + ( 4 )( 5 ) + ( 6 )( 10 ) = = 126 9 C5 = 1 + 20 + 60 81 = = 0.64286 126 126

p( x = 0 ,1,2; n = 5 ) =

6.6., /RAFICA 6.: NOR3AL En otras ocasiones, al considerar distribuciones binomiales, tipo $0n,p1, para un mismo valor de p y valores de n cada vez mayores, se ve que sus pol!onos de frecuencias se aproximan a una curva en -forma de campana-. 6.:.1 PROPIEDADES- 3EDIA1 4ARIAN>A Y DES4IACI5N ESTANDAR

DISTRIBUCI5N NOR3AL + !a)'a%a de /aussPLa'la!e En resumen, la importancia de la distribucin normal se debe principalmente a que hay muchas variables asociadas a fenmenos naturales que si!uen el modelo de la normal /aracteres morfolgicos de individuos 0personas, animales, plantas,...1 de una especie, p.e*m. tallas, pesos, enver!aduras, dimetros, permetros,... /aracteres fisiolgicos, por e*emplo" efecto de una misma dosis de un frmaco, o de una misma cantidad de abono. /aracteres sociolgicos, por e*emplo" consumo de cierto producto por un mismo !rupo de individuos, puntuaciones de examen. /aracteres psicolgicos, por e*emplo" cociente intelectual, !rado de adaptacin a un medio,... )rrores cometidos al medir ciertas ma!nitudes. 7alores estadsticos muestrales, por e*emplo " la media. .tras distribuciones como la binomial o la de %oisson son aproximaciones normales, ... Q en !eneral cualquier caracterstica que se obten!a como suma de muchos factores. FUNCI5N DE DENSIDAD Empleando clculos bastante laboriosos, puede demostrarse que el modelo de la #u%! $% de de%s dad que corresponde a tales distribuciones viene dado por la frmula

(a distribucin normal queda definida por dos 'a&*)et&+s, su media y su desviacin tpica y la representamos as

FUNCI5N DE DISTRIBUCI5N %uede tomar cualquier valor 08 \, @ \1 on ms probables los valores cercanos a uno central que llamamos media

Conforme nos separamos de ese valor , la probabilidad va decreciendo de i!ual forma a derecha e izquierda 0es simtrica1. Conforme nos separamos de ese valor , la probabilidad va decreciendo de forma ms o menos rpida dependiendo de un parmetro , que es la desviacin tpica. TIPIFICACI5N

%or tanto su funcin de densidad es

y su funcin de distribucin es

siendo la representacin !rfica de esta funcin

a la variable h se la denomina variable tipificada de X, y a la curva de su funcin de densidad curva normal tipificada. Ca&a!te&st !a de la d st& 7u! $% %+&)al t ' # !ada F&edu! da1 est*%da&G

6o depende de nin!&n parmetro u media es 9, su varianza es 5 y su desviacin tpica es 5. (a curva f0x1 es simtrica respecto del e*e ,Q Eiene un mximo en este e*e Eiene dos puntos de inflexin en z A5 y z A 85

6.:., /RAFICA

FUNCION DE DENSIDAD

Representacin grfica de esta funcin de densidad

FUNCION DE DISTRIBUCI5N .0x1 es el rea sombreada de esta !rfica

TIPIFICACI5N

3 la variable h se la denomina variable tipificada de X, y a la curva de su funcin de densidad curva normal tipificada. 6.= APROBI3ACION DE LO NOR3AL A LA BINO3IAL

A'&+L )a! $% de la d st& 7u! $% 7 %+) al '+& la %+&)al Jna dstribucin binomial -0n*p1 se puede aproximar por una distribucin normal, siempre que n sea !rande y p no est muy prxima a 8 o a 3. (a aproximacin consiste en utilizar una distribucin normal con la misma media y desviacin tpica que la distribucin binomial. En la practica se utiliza la aproximacin cuando "

En cuyo caso "

Q tipificando se obtiene la normal estndar correspondiente"

6.=.1 PROPIEDADES- 3EDIA1 4ARIAN>A Y DES4IACI5N ESTANDAR A'&+L )a! $% de la B %+) al '+& la N+&)al FTe+&e)a de De Moivre) +emostr que ba*o determinadas condiciones 0para n !rande y tanto p como # no estn prximos a cero1 la distribucin $inomial $0n, p1 se puede aproximar mediante una distribucin normal

+ebemos tener en cuenta que cuanto mayor sea el valor de n, y cuanto ms prximo sea p a 9.=, tanto me*or ser la aproximacin realizada. Es decir, basta con que se verifique

!racias a esta aproximacin es fcil hallar probabilidades binomiales, que para valores !randes de n resulten muy laboriosos de calcular. 7ay que tener en cuenta que para realizar correctamente esta transformacin de una variable discreta 0binomial1 en una variable continua 0normal1 es necesario hacer una correccin de continuidad.

6.=., /RAFICA A'&+L )a! $% de la d st& 7u! $% 7 %+) al '+& la %+&)al Kamos a representar en un sistema de referencia distribuciones binomiales para distintos valores de n y pA9,;.

eueremos aproximar estas distribuciones a una distribucin normal estndar "

e puede apreciar en los !rficos anteriores como a medida que aumenta n me*ora el parecido de las !rficas de barras de las distribuciones binomiales 0discretas1 a la !rfica de la distribucin normal estndar 0continua1, pero con el inconveniente de que se produce un desplazamiento hacia la derecha de la distribucin binomial a medida que aumenta n. Este inconveniente se evita, corri!iendo la variable aleatoria, j, restando la media 0para corre!ir el desplazamiento1 y dividiendo por la desviacin tpica0para a*ustar la dispersin1 "

3 la nueva variable, xj le asi!namos b0n,p,*1. (a representacin, para el caso, n A :I9 y pA9,; , del dia!rama de barras de la binomial corre!ida y de la funcin de densidad de la distribucin normal estndar es "

Cuando n aumenta, la lon!itud de las barras disminuye, cosa l!ica, porque la suma de las lon!itudes de todas las barras es 5 0funcin de probabilidad definida sobre una variable aleatoria discreta1 ) mientras que el rea ba*o la funcin de densidad 0definida sobre una variable aleatoria continua1 de la distribucin normal estandar, tambin es 5. %ara a*ustar ambas funciones, tendramos que conse!uir que la suma de las reas de los rectn!ulos que forman el dia!rama de barras fuera 5. Como la distancia entre las barras es constante y la suma de las alturas de todas las barras es 5, el rea ba*o los rectn!ulos del dia!rama de barras es i!ual a la distancia entre barras consecutivas.

:.1 DEFINICION DE 3UESTREO C+%!e't+ de )uest&e+

El muestreo es una herramienta de la investi!acin cientfica. u funcin bsica es determinar que parte de una realidad en estudio 0poblacin o universo1 debe examinarse con la finalidad de hacer inferencias sobre dicha poblacin. El error que se comete debido a hecho de que se obtienen conclusiones sobre cierta realidad a partir de la observacin de slo una parte de ella, se denomina error de muestreo. ,btener una muestra adecuada si!nifica lo!rar una versin simplificada de la poblacin, que reproduzca de al!&n modo sus ras!os bsicos. :.1.1 TIPOS DE 3UESTREOS ESTRATIFICADO Y CON/LO3ERADO 3uest&e+ aleat+& + s )'le El procedimiento empleado es el si!uiente" 51 e asi!na un n&mero a cada individuo de la poblacin. ALEATORIO1 SISTE3ATI>ADOS1

:1 3 travs de al!&n medio mecnico 0bolas dentro de una bolsa, tablas de n&meros aleatorios, n&meros aleatorios !enerados con una calculadora u ordenador, etc.1 se eli!en tantos su*etos como sea necesario para completar el tama'o de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la poblacin que estamos mane*ando es muy !rande. Empezaremos definiendo Poblacin, como un con*unto de individuos que se pueden identificar por separado. e puede pensar en una poblacin concreta que realmente existe, como en una conceptual que no exista ni que existir *ams. En ambos casos, el inters se centrar casi exclusivamente en las poblaciones n&meros. Jna poblacin puede ser discreta o continua, dependiendo de que el con*unto de n&meros referidos sea discreto o continuo. Jna poblacin es discreta si consta de un n&mero finito o fi*o de elementos, medidas u observaciones. %or e*emplo los pesos netos de :9 latas de at&n. 3 diferencia de las poblaciones discretas, las poblaciones continuas contienen una infinidad de elementos. Este es el caso de cuando observamos una variable continua y hay una infinidad de resultados distintos. Eambin es el caso de las alturas de los estudiantes de la Jniversidad. Jn mtodo para obtener una muestra sencilla aleatoria de una poblacin es el si!uiente" el empleo de una tabla de n&meros aleatorios. Estas tablas son listas de cifras del 9 al >, colocados de tal manera que si se eli!e al azar una posicin

cualquiera de la tabla, cada d!ito tiene una posibilidad i!ual de aparecer en dicha posicin. Es fcil seleccionar una muestra al azar de un con*unto de n&meros, empleando estas tablas como se muestra en el si!uiente e*emplo" .btener una muestra sencilla aleatoria de tama9o : de una clase de ;8 estudiantes. ,uponer #ue los estudiantes est(n numerados del 3 al ;8 en la listad de la clase. olucin " vamos a una tabla de n&meros aleatorios, y esco!emos un punto de comienzo. Entonces leemos a lo lar!o de la fila desde este punto, tomando las cifras por pare*as 0o de una columna de dos cifras hacia aba*o1, obteniendo los n&meros as" O1, =;, ,=, I;, <>, ?:, ;=, 1=, 1O, ;:, >I, OK En la serie ele!imos slo los n&meros comprendidos entre el 5 y el ;9, i!norando los otros //// %ara ver la idea de muestreo aleatorio en una poblacin finita de tama'o 6, primero veamos cuantas muestras distintas se pueden tomar de tama'o n. El n&mero de muestras distintas es

%or e*emplo si 6A5: y nA :

muestras distintas. Con base en el resultado de que hay

muestras distintas de tama'o n de una poblacin finita de tama'o 6, podemos definir como muestra aleatoria o muestra aleatoria simple de una poblacin finita" <=na muestra de tama9o n de una poblacin finita de tama9o N es una variable aleatoria si se selecciona de manera tal #ue cada una de las

muestras posibles tienen la misma probabilidad

de ser seleccionada. %or e*emplo si una poblacin consistente en lo 6A = elementos a*e*i* o* u 0que podran ser los in!resos anuales de cinco personas, los pesos de = vacas,.....1 hay

muestras posibles de tama'o n A ; . estas constan de los elementos"

aei

aeo

aeu

aio

aiu

aou

eio

eiu

eou

iou

si seleccionamos una de esas muestras de forma que esta muestra ten!a probabilidad 5C59 de ser ele!ida, decimos que dicha muestra es aleatoria. En la prctica el describir todas las posibles muestras seria complicado si 6 y n son !randes. %or e*emplo si n A < y 6 A :99 tendramos H<,H?<,>=9 muestras distintas. %or suerte podemos realizar una muestra aleatoria, sin necesidad de describirlas todas. $asta con numerar los 6 elementos de la poblacin y retirar una a una hasta completar los n8 elementos de la muestra. Este procedimiento tambin da una probabilidad de

de ser seleccionada la muestra por los que sera aleatoria. 3hora bien si la poblacin es infinita" diremos que" =na muestra de tama9o n de una poblacin infinita es aleatoria si consta de valores de variables aleatorias independientes #ue tienen la misma distribucin. %or e*emplo si lanzamos un dado 5: veces y obtenemos :, =, =, ;, ;, ;, =, 5, H, 5,<, 5. Estos n&meros constituyen una variable aleatoria si son valores aleatoria

independientes que tienen la misma distribucin de probabilidad f0x1 A 5CH para xA 5,:,;,<,=,H

3uest&e+ aleat+& + s ste)*t !+ Este procedimiento exi!e, como el anterior, numerar todos los elementos de la poblacin, pero en lu!ar de extraer n n&meros aleatorios slo se extrae uno. e parte de ese n&mero aleatorio i, que es un n&mero ele!ido al azar, y los elementos que inte!ran la muestra son los que ocupa los lu!ares i, i@U, i@:U, i@;U,...,i@0n851U, es decir se toman los individuos de U en U, siendo U el resultado de dividir el tama'o de la poblacin entre el tama'o de la muestra" UA 6Cn. El n&mero i que empleamos como punto de partida ser un n&mero al azar entre 5 y U. El ries!o este tipo de muestreo est en los casos en que se dan periodicidades en la poblacin ya que al ele!ir a los miembros de la muestra con una periodicidad constante 0U1 podemos introducir una homo!eneidad que no se da en la poblacin. Lma!inemos que estamos seleccionando una muestra sobre listas de 59 individuos en los que los = primeros son varones y los = &ltimos mu*eres, si empleamos un muestreo aleatorio sistemtico con UA59 siempre seleccionaramos o slo hombres o slo mu*eres, no podra haber una representacin de los dos sexos. 3uest&e+ aleat+& + est&at # !ad+ Erata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tama'o dado de la muestra. Consiste en considerar cate!oras tpicas diferentes entre s 0estratos1 que poseen !ran homo!eneidad respecto a al!una caracterstica 0se puede estratificar, por e*emplo, se!&n la profesin, el municipio de residencia, el sexo, el estado civil, etc.1. (o que se pretende con este tipo de muestreo es ase!urarse de que todos los estratos de inters estarn representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para ele!ir los elementos concretos que formarn parte de la muestra. En ocasiones las dificultades que plantean son demasiado !randes, pues exi!e un conocimiento detallado de la poblacin. 0Eama'o !eo!rfico, sexos, edades,...1. (a distribucin de la muestra en funcin de los diferentes estratos se denomina afi*acin, y puede ser de diferentes tipos"

3fi*acin imple" 3 cada estrato le corresponde i!ual n&mero de elementos mustrales. 3fi*acin %roporcional" (a distribucin se hace de acuerdo con el peso 0tama'o1 de la poblacin en cada estrato. 3fi*acin ,ptima" e tiene en cuenta la previsible dispersin de los resultados, de modo que se considera la proporcin y la desviacin tpica. Eiene poca aplicacin ya que no se suele conocer la desviacin. i tenemos informacin a cerca de una poblacin 0es decir de su composicin1 y esta es importante para nuestra investi!acin, podemos me*orar el muestreo aleatorio por medio de la estratificacin. Este es un procedimiento que consiste en estratificar o dividir la poblacin en un numero de subpoblaciones o estratos. Q seleccionamos de cada estrato una muestra aleatoria. Este procedimiento se conoce como muestreo aleatorio 0simple1 estratificado. upon!amos una poblacin de tama'o 6 que se divide en U estratos cuyos tama'os son" 65, 6:, .....,6U 065 @6: @.....@6U A61 %ara obtener una distribucin proporcional hemos de tener en cuenta que "

de donde se obtiene que

para yA5,:,;,<,.... U donde nA tama'o de la muestra. Esta seria una distribucin proporcional, pero hay otras formas de distribuir porciones de una muestra entre los distintos estratos, que seran" 8 +istribucin ptima. 8 Estratificacin cruzada. 8 #uestreo por cuotas.

D st& 7u! $% $'t )aEn la +istribucin optima, no slo se mane*a el tama'o del estrato, como en la distribucin proporcional, sino que tambin se mane*a la variabilidad 0o cualquier otra caracterstica pertinente1 del estrato. (a idea de la +istribucin ptima, trata de *u!ar no slo con el tama'o del estrato, sino que tambin pretende *u!ar con la variabilidad del mismo, de forma que parece l!ico que los estratos de mayor variabilidad le correspondan muestras mayores. i 5, :, ;, ...., U son las desviaciones tpicas de los U8estratos podemos explicar tanto los tama'os de los estratos, as como su variabilidad.

de donde se obtienen los tama'os muestrales de la distribucin ptima o +istribucin de 6eyman 0su inventor1 que se obtienen por la frmula"

para yA5,:,...., U nA n5@n:@.......@nU Est&at # !a! $% !&u;ada(a estratificacin no se limita a una variable &nica de clasificacin o una caracterstica y las poblaciones a menudo se estratifican atendiendo a diversos criterios de ordenacin o clasificacin. 3s por e*emplo si queremos realizar un estudio entre los alumnos de distintos centros de EE. ##. podramos estratificar la muestra atendiendo al nivel de estudios, al sexo, a la especialidad,.... 3s parte de la muestra se dedicara a los alumnos de sexo femenino del 5d de $achillerato tcnico, otra parte a los alumnos de sexo masculino de 5d $achillerato artstico, y as sucesivamente. 3s y hasta cierto punto una estratificacin de este tipo, llamada estratificacin cruzada, incrementar la precisin de las estimaciones y otras !eneralizaciones que se usan com&nmente en el muestreo de opinin y las investi!aciones de mercado. 3uest&e+ '+& !u+tasEn el muestreo estratificado, el costo de la toma de muestras aleatorias de los estratos individuales es tan alto, que a los encuestadores slo se les dan cuotas que deben cubrir de los diferentes estratos, con al!una restricciones 0si no es que nin!una1 %or e*emplo si se quiere hacer un sondeo sobre la me*ora de los servicios de salud, por e*emplo se le pide que encueste a 59 mu*eres de entre ;= y

<= a'os que sean asalariadas, :9 hombres de entre ;9 y <= a'os que vivan en pisos de ; o < habitaciones, a ; hombres de mas de H9 a'os que estn *ubilados.... esto es lo que se determina un muestreo por cuotas y es relativamente econmico, lo &nico es que las muestras resultantes no cumplen las caractersticas esenciales de las muestras aleatorias. %or tanto estos muestreos, por cuotas en esencia son muestras de opinin, pero no son vlidos para realizar un estudio estadstico formal.

3uest&e+ aleat+& + '+& !+%8l+)e&ad+s (os mtodos presentados hasta ahora estn pensados para seleccionar directamente los elementos de la poblacin, es decir, que las unidades mustrales son los elementos de la poblacin. En el muestreo por con!lomerados la unidad muestral es un !rupo de elementos de la poblacin que forman una unidad, a la que llamamos con!lomerado. (as unidades hospitalarias, los departamentos universitarios, una ca*a de determinado producto, etc., son con!lomerados naturales. En otras ocasiones se pueden utilizar con!lomerados no naturales como, por e*emplo, las urnas electorales. Cuando los con!lomerados son reas !eo!rficas suele hablarse de -muestreo por reas-. El muestreo por con!lomerados consiste en seleccionar aleatoriamente un cierto numero de con!lomerados 0el necesario para alcanzar el tama'o muestral establecido1 y en investi!ar despus todos los elementos pertenecientes a los con!lomerados ele!idos. %ara ilustrar esta clase de muestreo, supon!amos que una !ran empresa quiere estudiar los patrones variables de los !astos familiares de una ciudad como $uenos 3ires. 3l intentar elaborar los pro!ramas de !astos de una muestra de 5:99 familias, nos encontramos con la dificultad de realizar un muestreo aleatorio simple, 0es complicado tener una lista actualizada de todos los habitantes de una ciudad1. Jna manera de tomar una muestra en esta situacin es dividir el rea total 0$uenos 3ires en este caso1 en reas ms peque'as que no se solapen 0%or e*emplo cdi!o postal, barrios, manzanas etc..1 En este caso seleccionaramos al!unas reas al azar y todas las familias 0o muestras de stas1 que residen en estos cdi!os postales, barrios o manzanas, constituiran la muestra definitiva. En este tipo de muestreo, llamado )uest&e+ '+& !+%8l+)e&ad+s, se divide la poblacin total en un n&mero determinado de subdivisiones relativamente peque'as y se seleccionan al azar al!unas de estas subdivisiones o con!lomerados, para incluirlos en la muestra total. i estos con!lomerados coinciden con reas !eo!rficas, este muestreo se llama tambin )uest&e+ '+& *&eas.

3unque las estimaciones basadas en el muestreo por con!lomerados, por lo !eneral no son tan fiables como las obtenidas por muestreos aleatorios simples del mismo tama'o, son ms baratas. Kolviendo al e*emplo anterior, es mucho ms econmico visitar a familias que viven en el mismo vecindario, que ir visitando a familias que viven en un rea muy extensa. En la prctica se pueden combinar el uso de varios de los mtodos de muestreo que hemos analizados para un mismo estudio.

4e%ta9as e %!+%(e% e%tes de l+s d st %t+s t '+s de )uest&e+ '&+7a7 lst !+

C3T3CEETL ELC3

KE6E3O3 encillo y de fcil comprensin.

L6C,6KE6LE6EE

Aleat+& + s )'le

e selecciona una muestra de tama'o n de una poblacin de 6 unidades, cada elemento tiene una probabilidad de inclusin i!ual y conocida de nC6.

Tequiere que se Clculo rpido posea de antemano de medias y un listado completo varianzas. de toda la poblacin. Cuando e basa en la se traba*a con teora muestras peque'as estadstica, y es posible que no por tanto represente a la existen poblacin paquetes adecuadamente. informticos para analizar los datos .cil de aplicar. i la constante de est 6o siempre es muestreo asociada con el necesario tener de un listado de fenmeno inters, las toda la estimaciones poblacin. obtenidas a partir la muestra Cuando la de pueden contener poblacin est ses!o de seleccin ordenada si!uiendo una

S ste)*t !+

Conse!uir un listado de los 6 elementos de la poblacin +eterminar muestral n. tama'o

+efinir un intervalo UA 6Cn. Ele!ir un n&mero aleatorio, r, entre 5 y U

0rA arranque aleatorio1. eleccionar los elementos de la lista.

tendencia conocida, ase!ura una cobertura de unidades de todos los tipos. Eiende a ase!urar que la muestra represente adecuadamente a la poblacin en funcin de unas variables seleccionadas. e obtienen estimaciones ms precisa u ob*etivo es conse!uir una muestra lo ms seme*ante posible a la poblacin en lo que a la o las variables estratificadoras se refiere. Es muy eficiente cuando la poblacin es muy !rande y dispersa. 6o es preciso tener un listado de toda la poblacin, slo de las unidades primarias de muestreo.

Est&at # !ad+

En ciertas ocasiones resultar conveniente estratificar la muestra se!&n ciertas variables de inters. %ara ello debemos conocer la composicin estratificada de la poblacin ob*etivo a hacer un muestreo. Jna vez calculado el tama'o muestral apropiado, este se reparte de manera proporcional entre los distintos estratos definidos en la poblacin usando una simple re!la de tres.

e ha de conocer la distribucin en la poblacin de las variables utilizadas para la estratificaci n.

e realizan varias fases de muestreo sucesivas 0polietpico1 (a necesidad de C+%8l+)e&ad+ listados de las unidades s de una etapa se limita a aquellas unidades de muestreo seleccionadas en la etapa anterior.

El error estndar es mayor que en el muestreo aleatorio simple o estratificado. El clculo del error estndar es comple*o.

UNIDAD : 3UESTREO Y ESTI3ACIONES


:., CONCEPTO DE DISTRIBUCI5N DE 3UESTREO DE LA 3EDIA :.,.1 DISTRIBUCION 3UESTRAL DE LA 3EDIA CON DES4IACI5N ESTANDAR CONOCIDA Y DESCONOCIDAD i tenemos una muestra aleatoria de una poblacin 60, 1, se sabe 0Eeorema del lmite central1 que la fdp de la media muestral es tambin normal con media y varianza :Cn. Esto es exacto para poblaciones normales y aproximado 0buena aproximacin con nf;91 para poblaciones cualesquiera. Es decir tpico, o error estndar de la media. MCmo usamos esto en nuestro problema de estimacinN 5d problema" 6o hay tablas para cualquier normal, slo para la normal A9 y A5 0la llamada z1) pero haciendo la transformacin 0llamada tipificacin1 es el error

una normal de media y desviacin se transforma en una z. (lamando z al valor de una variable normal tipificada que de*a a su derecha un rea ba*o la curva de , es decir, que la probabilidad que la variable sea mayor que ese valor es 0estos son los valores que ofrece la tabla de la normal1

podremos construir intervalos de la forma

para los que la probabilidad es 5 8 .

Eeniendo en cuenta la simetra de la normal y manipulando al!ebracamente

que tambin se puede escribir

o, haciendo nfasis en que

es el error estndar de la media,

Tecurdese que la probabilidad de que est en este intervalo es 5 8 . 3 un intervalo de este tipo se le denomina intervalo de confianza con un nivel de confianza del 59905 8 1^, o nivel de si!nificacin de 599 ^. El nivel de confianza habitual es el >=^, en cuyo caso A9,9= y z C:A5,>H. 3l valor estimacin puntual y se dice que E*emplo" es un estimador de . se le denomina

i de una poblacin normal con varianza < se extrae una muestra

aleatoria de tama'o :9 en la que se calcula se puede decir que tiene una probabilidad de 9,>= de estar comprendida en el intervalo

que sera el intervalo de confianza al >=^ para

En !eneral esto es poco &til, en los casos en que no se conoce tampoco suele conocerse :) en el caso ms realista de : desconocida los intervalos de confianza se construyen con la t de tudent 0otra fdp continua para la que hay tablas1 en lu!ar de la z.

o, haciendo nfasis en que

es el error estndar estimado de la media,

Este manera de construir los intervalos de confianza slo es vlido si la variable es normal. Cuando n es !rande 0f;91 se puede sustituir t por z sin mucho error. :.,., DISTRIBUCION 3UESTRAL DE LA DIFERENCIA ENTRE DOS 3EDIAS CON DES4IACI5N ESTANDAR CONOCIDAD Y DESCONOCIDA D st& 7u! $% 3uest&al de D #e&e%! a de 3ed as upon!a que se tienen dos poblaciones distintas, la primera con media 5 y desviacin estndar 5, y la se!unda con media : y desviacin estndar :. #s a&n, se eli!e una muestra aleatoria de tama'o n 5 de la primera poblacin y una muestra independiente aleatoria de tama'o n : de la se!unda poblacin) se calcula la media muestral para cada muestra y la diferencia entre dichas medias. (a coleccin de todas esas diferencias se llama distribucin muestral de las diferencias entre medias o la distribucin muestral del estadstico

(a distribucin es aproximadamente normal para n 5 ;9 y n: ;9. i las poblaciones son normales, entonces la distribucin muestral de medias es normal sin importar los tama'os de las muestras. E*emplo" En un estudio para comparar los pesos promedio de ni'os y ni'as de sexto !rado en una escuela primaria se usar una muestra aleatoria de :9 ni'os y otra de := ni'as. e sabe que tanto para ni'os como para ni'as los pesos si!uen una distribucin normal. El promedio de los pesos de todos los ni'os de sexto !rado de esa escuela es de 599 libras y su desviacin estndar es de 5<.5<:, mientras que el promedio de los pesos de todas las ni'as del sexto !rado de esa escuela es de ?= libras y su desviacin estndar es de 5:.:<I libras. i representa el promedio de los pesos de :9 ni'os y es el promedio de los pesos de una muestra de := ni'as, encuentre la probabilidad de que el promedio de los pesos de los :9 ni'os sea al menos :9 libras ms !rande que el de las := ni'as. ,olucin> +atos"
5

A 599 libras A ?= libras A 5<.5<: libras A 5:.:<I libras

n5 A :9 ni'os n: A := ni'as %or lo tanto, la probabilidad de que el promedio de los pesos de la muestra de ni'os sea al menos :9 libras ms !rande que el de la muestra de las ni'as es 9.59=H.

E*emplo" Jno de los principales fabricantes de televisores compra los tubos de rayos catdicos a dos compa'as. (os tubos de la compa'a 3 tienen una vida media de I.: a'os con una desviacin estndar de 9.? a'os, mientras que los de la $ tienen una vida media de H.I a'os con una desviacin estndar de 9.I. +etermine la probabilidad de que una muestra aleatoria de ;< tubos de la compa'a 3 ten!a una vida promedio de al menos un a'o ms que la de una muestra aleatoria de <9 tubos de la compa'a $. ,olucin> +atos"
3

A I.: a'os A H.I a'os A 9.? a'os A 9.I a'os

n3 A ;< tubos n$ A <9 tubos

E*emplo" e prueba el rendimiento en UmC( de : tipos de !asolina, encontrndose una desviacin estndar de 5.:;UmC( para la primera !asolina y una desviacin estndar de 5.;IUmC( para la se!unda !asolina) se prueba la primera !asolina en ;= autos y la se!unda en <: autos.

a. MCul es la probabilidad de que la primera !asolina de un rendimiento promedio mayor de 9.<=UmC( que la se!unda !asolinaN b. MCul es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 9.H= y 9.?;UmC( a favor de la !asolina 5N. ,olucin> En este e*ercicio no se cuenta con los parmetros de las medias en nin!una de las dos poblaciones, por lo que se supondrn que son i!uales. +atos"
5

A 5.:; FmC(to
:

A 5.;I FmC(to

n5 A ;= autos n: A <: autos

(a probabilidad de que la diferencia en rendimientos promedio en las muestras se encuentre entre 9.H= y 9.?; FmC(to a favor de la !asolina 5 es de 9.955I.

:.,.6 DISTRIBUCION 3UESTRAL DE LA PROPORCION D st& 7u! $% )uest&al de P&+'+&! +%es

Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que queremos investi!ar la proporcin de artculos defectuosos o la proporcin de alumnos reprobados en la muestra. (a distribucin muestral de proporciones es la adecuada para dar respuesta a estas situaciones. Esta distribucin se !enera de i!ual manera que la distribucin muestral de medias, a excepcin de que al extraer las muestras de la poblacin se calcula el estadstico proporcin 0pAxCn en donde -x- es el n&mero de xitos u observaciones de inters y -n- el tama'o de la muestra1 en lu!ar del estadsitico media.

Jna poblacin binomial est estrechamente relacionada con la distribucin muestral de proporciones) una poblacin binomial es una coleccin de xitos y fracasos, mientras que una distribucin muestral de proporciones contiene las posibilidades o proporciones de todos los n&meros posibles de xitos en un experimento binomial, y como consecuencia de esta relacin, las afirmaciones probabilsticas referentes a la proporcin muestral pueden evaluarse usando la aproximacin normal a la binomial, siempre que np = y n058p1 =. Cualquier evento se puede convertir en una proporcin si se divide el n&mero obtenido entre el n&mero de intentos. /e%e&a! $% de la D st& 7u! $% 3uest&al de P&+'+&! +%es upon!a que se cuenta con un lote de 5: piezas, el cual tiene < artculos defectuosos. e van a seleccionar = artculos al azar de ese lote sin reemplazo. 2enere la distribucin muestral de proporciones para el n&mero de piezas defectuosas. Como se puede observar en este e*ercicio la %roporcin de artculos defectuosos de esta poblacin es <C5:A5C;. %or lo que podemos decir que el ;;^ de las piezas de este lote estn defectuosas. El n&mero posible de muestras de tama'o = a extraer de una poblacin de 5: elementos es 5:C=AI>:, las cuales se pueden des!losar de la si!uiente manera"

A&t!ul+s Bue%+s

A&t!ul+s 3al+s

NQ)e&+ de P&+'+&! $% )a%e&as e% las de a&t!ul+s Rue se 'uede de#e!tu+s+ +7te%e& la )uest&a

<

<C=A9.?

C5/<C<A?

;C=A9.H

C:/<C;A55:

:C=A9.<

C;/<C:A;;H

<

5C=A9.:

C</<C5A:?9

9C=A9

?C=/<C9A=H

T+tal

<N,

%ara calcular la media de la distribucin muestral de proporciones se tendra que hacer la sumatoria de la frecuencia por el valor de la proporcin muestral y dividirla entre el n&mero total de muestras. Como podemos observar la media de la distribucin muestral de proporciones es i!ual a la %roporcin de la poblacin.
'

IP

Eambin se puede calcular la desviacin estndar de la distribucin muestral de proporciones"


: (a varianza de la distribucin binomial es A npq, por lo que la varianza de la : distribucin muestral de proporciones es A0%q1Cn. i se sustituten los valores p en esta frmula tenemos que , este valor no coincide con el de 9.5H?5, ya que nos falta a!re!ar el factor de correccin para una poblacin finita y un muestreo sin reemplazo"

(a frmula que se utilizar para el clculo de probabilidad en una distribucin muestral de proporciones est basada en la aproximacin de la distribucin normal a la binomial . Esta frmula nos servir para calcular la probabilidad del comportamiento de la proporcin en la muestra. E*emplo" e ha determinado que H9^ de los estudiantes de una universidad !rande fuman ci!arrillos. e toma una muestra aleatoria de ?99 estudiantes. Calcule la probabilidad de que la proporcin de la muestra de la !ente que fuma ci!arrillos sea menor que 9.==. olucin" Este e*ercicio se puede solucionar por dos mtodos. El primero puede ser con la aproximacin de la distribucin normal a la binomial y el se!undo utilizando la frmula de la distribucin muestral de proporciones. 3proximacin de la distribucin normal a la binomial" +atos" nA?99 estudiantes pA9.H9 xA 0.==10?991 A <<9 estudiantes p0x <<91 A N #ediaA npA 0?99109.H91A <?9

p0x <<91 A 9.995I. Este valor si!nifica que existe una probabilidad del 9.5I^ de que al extraer una muestra de ?99 estudiantes, menos de <<9 fuman ci!arrillos.

D st& 7u! $% 3uest&al de P&+'+&! +%es +atos" nA?99 estudiantes %A9.H9 pA 9.== p0p 9.==1 A N

:.,.: DISTRIBUCION 3UESTRAL DE LA DIFERENCIA DE DOS PROPORCIONES D st& 7u! $% 3uest&al de D #e&e%! a de P&+'+&! +%es #uchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse utilizando proporciones o porcenta*es. 3 continuacin se citan al!unos e*emplos"

Educacin.8 MEs mayor la proporcin de los estudiantes que aprueban matemticas que las de los que aprueban in!lsN #edicina.8 MEs menor el porcenta*e de los usuarios del medicamento 3 que presentan una reaccin adversa que el de los usuarios del frmaco $ que tambin presentan una reaccin de ese tipoN 3dministracin.8 M7ay diferencia entre los porcenta*es de hombres y mu*eres en posiciones !erenciales. Ln!eniera.8 MExiste diferencia entre la proporcin de artculos defectuosos que !enera la mquina 3 a los que !enera la mquina $N Cuando el muestreo procede de dos poblaciones binomiales y se traba*a con dos proporciones muestrales, la distribucin muestral de diferencia de proporciones es aproximadamente normal para tama'os de muestra !rande 0n 5p5 =, n5q5 =,n:p: = y n:q: =1. Entonces p5 y p: tienen distribuciones muestrales aproximadamente normales, as que su diferencia p 58p: tambin tiene una distribucin muestral aproximadamente normal.

E*emplo" (os hombres y mu*eres adultos radicados en una ciudad !rande del norte difieren en sus opiniones sobre la promul!acin de la pena de muerte para personas culpables de asesinato. e cree que el 5:^ de los hombres adultos estn a favor de la pena de muerte, mientras que slo 59^ de las mu*eres adultas lo estn. i se pre!unta a dos muestras aleatorias de 599 hombres y 599 mu*eres su opinin sobre la promul!acin de la pena de muerte, determine la probabilidad de que el porcenta*e de hombres a favor sea al menos ;^ mayor que el de las mu*eres. ,olucin> +atos"

%7 A 9.5: %# A 9.59 n7 A 599 n# A 599 p0p78p# 9.9;1 A N

e recuerda que se est incluyendo el factor de correccin de 9.= por ser una distribucin binomial y se est utilizando la distribucin normal.

e concluye que la probabilidad de que el porcenta*e de hombres a favor de la pena de muerte, al menos ;^ mayor que el de mu*eres es de 9.<=H:. E*emplo" Jna encuesta del $oston Colle!e const de ;:9 traba*adores de #ichi!an que fueron despedidos entre 5>I> y 5>?<, encontr que :9^ haban estado sin traba*o durante por lo menos dos a'os. upn!ase que tuviera que seleccionar otra muestra aleatoria de ;:9 traba*adores de entre todos los empleados despedidos entre 5>I> y 5>?<. MCul sera la probabilidad de que su porcenta*e muestral de traba*adores sin empleo durante por lo menos dos a'os, difiera del porcenta*e obtenido en la encuesta de $oston Colle!e, en =^ o msN olucin" En este e*ercicio se cuenta &nicamente con una poblacin, de la cual se estn extrayendo dos muestras y se quiere saber la probabilidad de la diferencia de los

porcenta*es en esas dos muestras, por lo que se debe de utilizar la distribucin muestral de proporciones con %5A %:, ya que es una misma poblacin. ,tra de las situaciones con la cual nos topamos es que desconocemos la proporcin de traba*adores despedidos entre 5>I> y 5>?< que estuvieron desempleados por un perodo de por lo menos dos a'os, slo se conoce la p 5A 9.:9 ya que al tomar una muestra de ;:9 traba*adores se observ esa proporcin. En la frmula de la distribucin muestral de proporciones para el clculo de probabilidad se necesita saber las proporciones de las poblaciones, las cuales en este e*ercicio las desconocemos, por lo que se utilizar el valor de 9.:9 como una estimacin puntual de %. En el si!uiente tema se abordar el tema de estimacin estadstica y se comprender el porque estamos utilizando de esa manera el dato. Eambin debe de comprenderse la pre!unta que nos hace este problema, Mcul sera la probabilidad de que su porcenta*e muestral de traba*adores sin empleo durante por lo menos dos a'os, difiera del porcenta*e obtenido en la encuesta de $oston Colle!e, en =^ o msN, la palabra difiera quiere decir que puede existir una diferencia a favor de la muestra uno, o a favor de la muestra dos, por lo que se tendrn que calcular dos reas en la distribucin y al final sumarlas.

+atos" p5 A 9.:9 n5 A ;:9 traba*adores n: A ;:9 traba*adores %5 A % :

(a probabilidad de que su proporcion muestral de traba*adores sin empleo durante por lo menos dos a'os, difiera del porcenta*e obtenido en la encuesta de $oston Colle!e, en 9.9= o ms es de 9.5:H9. E*emplo" e sabe que ; de cada H productos fabricados por la mquina 5 son defectuosos y que : de cada = ob*etos fabricados por la mquina : son defectuosos) se toman muestras de 5:9 ob*etos de cada mquina" a. Mcul es la probabilidad de que la proporcin de artculos defectuosos de la mquina : rebase a la mquina 5 en por lo menos 9.59N b. Mcul es la probabilidad de que la proporcin de artculos defectuosos de la mquina 5 rebase a la mquina : en por lo menos 9.5=N ,olucin> +atos" %5 A ;CH A 9.= %: A :C= A 9.< n5 A 5:9 ob*etos n: A 5:9 ob*etos a. p0p:8p5 9.591 A N

,tra manera de hacer este e*ercicio es poner %58%:"

(a probabilidad de que exista una diferencia de proporciones de artculos defectuosos de por lo menos 59^ a favor de la mquina : es de 9.9955. b. p0p58p: 9.5=1AN

(a probabilidad de que exista una diferencia de proporciones de artculos defectuosos de por lo menos 5=^ a favor de la mquina 5 es de 9.:;=I.

:.6 TEORE3A DEL L3ITE CENTRAL %ara muestras !randes, se puede obtener una aproximacin cercana de la distribucin muestral de la media con una distribucin normal. Eeniendo en cuenta que ya sabemos la media y desviacin tpica de la distribucin muestral, podemos decir que"

xAy

para muestras aleatorias infinitas con media entonces"

y desviacin tpica

y n !rande,

es un valor de una variable 609,51 Este teorema es muy importante, puesto que *ustifica el uso de los mtodos de la curva normal en una !ran cantidad de problemas. se utiliza para poblaciones infinitas y para poblaciones finitas cuando n a pesar de ser !rande representa una porcin muy peque'a de la poblacin. Es difcil se'alar con precisin qu tan !rande debe ser n de modo que podamos aplicar el Eeorema Central del lmite, pero a no ser que la distribucin sea muy Lnusual, por lo !eneral se considera que n A;9 es lo suficientemente alto. Keamos el mismo e*emplo anterior aplicando el Eeorema Central del (mite.

(a probabilidad se obtiene por medio del rea marcada de la zona !ris, especficamente por medio del rea de la 609,51 entre"

lo que consultando en las tablas da una probabilidad de 9,>=<<. 3s sustituimos la afirmacin de que la probabilidad es Zcomo mnimo 9,I=[ por una aseveracin ms firme de que la probabilidad es aproximadamente de 9,>= 0 de que la muestra aleatoria de tama'o nAH< de la poblacin de referencia difiera de la de la poblacin menos de = unidades1 Eambin se puede usar el teorema Central del lmite para poblaciones finitas, pero una descripcin precisa de las situaciones en que se puede hacer esto, sera ms bien complicada. El uso apropiado ms com&n es en el caso en que n es !rande y nC6 es peque'a. Este es el caso de la mayora de las encuestas polticas. :.:. TIPOS DE ESTI3ACI5N Y SUS CARACTERSTICAS ESTI3ACION

El ob*etivo principal de la estadstica inferencial es la est )a! $%, esto es que mediante el estudio de una muestra de una poblacin se quiere !eneralizar las conclusiones al total de la misma. Como vimos en la seccin anterior, los estadsticos varan mucho dentro de sus distribuciones mustrales, y mientras menor sea el error estndar de un estadstico, ms cercanos sern unos de otros sus valores. Existen dos tipos de estimaciones para parmetros) puntuales y por intervalo. Jna est )a! $% 'u%tual es un &nico valor estadstico y se usa para estimar un parmetro. El estadstico usado se denomina est )ad+&. Jna est )a! $% '+& %te&(al+ es un ran!o, !eneralmente de ancho finito, que se espera que conten!a el parmetro.

Est )a! $% Pu%tual (a inferencia estadstica est casi siempre concentrada en obtener al!&n tipo de conclusin acerca de uno o ms parmetros 0caractersticas poblacionales1. %ara hacerlo, se requiere que un investi!ador obten!a datos muestrales de cada una de las poblaciones en estudio. Entonces, las conclusiones pueden estar basadas en los valores calculados de varias cantidades muestrales . %o e*emplo, representamos con 0parmetro1 el verdadero promedio de resistencia a la ruptura de conexiones de alambres utilizados para unir obleas de semiconductores. %odra tomarse una muestra aleatoria de 59 conexiones para determinar la resistencia a la ruptura de cada una, y la media muestral de la resistencia a la ruptura se poda emplear para sacar una conclusin acerca del valor de . +e forma similar, si es la varianza de la distribucin de resistencia a la ruptura, el valor de la varianza muestral s : se podra utilizar pra inferir al!o acerca de .

Cuando se analizan conceptos !enerales y mtodos de inferencia es conveniente tener un smbolo !enrico para el parmetro de inters. e utilizar la letra !rie!a para este propsito. )l objetivo de la estimacin puntual es seleccionar slo un nmero* basados en datos de la muestra* #ue represente el valor m(s ra"onable de . Jna muestra aleatoria de ; bateras para calculadora podra presentar duraciones observadas en horas de x5A=.9, x:AH.< y x;A=.>. El valor calculado de la duracin media muestral es A =.II, y es razonable considerar =.II como el valor ms adecuado de .

Jna est )a! $% 'u%tual de un parmetro es un slo n&mero que se puede considerar como el valor ms razonable de . (a estimacin puntual se obtiene al seleccionar una estadstica apropiada y calcular su valor a partir de datos de la muestra dada. (a estadstica seleccionada se llama est )ad+& 'u%tual de .

El smbolo

0theta sombrero1 suele utilizarse para representar el estimador de

la estimacin puntual resultante de una muestra dada. Entonces se lee como -el estimador puntual de es la media muestral -. El enunciado -la estimacin puntual de E*emplo" En el futuro habr cada vez ms inters en desarrollar aleaciones de #! de ba*o costo, para varios procesos de fundicin. En consecuencia, es importante contar con mtodos prcticos para determinar varias propiedades mecnicas de esas aleaciones. Examine la si!uiente muestra de mediciones del mdulo de elasticidad obtenidos de un proceso de fundicin a presin" <<.: <;.> <<.I <<.: <<.9 <;.? <<.H <;.5 upon!a que esas observaciones son el resultado de una muestra aleatoria. desea estimar la varianza poblacional muestral" e es =.II- se puede escribir en forma abreviada .

. Jn estimador natural es la varianza

En el me*or de los casos, se encontrar un estimador

para el cual

siempre.

in embar!o, es una funcin de las 4i muestrales, por lo que en s misma una variable aleatoria. Entonces el estimador preciso sera uno que produzca slo peque'as diferencias de estimacin, de modo que los valores estimados se acerquen al valor verdadero. %ropiedades de un $uen Estimador I%ses8ad+.P e dice que un estimador puntual es un estimador inses!ado de si

, para todo valor posible de . En otras palabras, un estimador inses!ado es aquel para el cual la media de la distribucin muestral es el parmetro estimado. i se usa la media muestral para estimar la media poblacional , se sabe que la , por lo tanto la media es un estimador inses!ado.

E# ! e%te + !+% (a& a%;a )% )a.P upon!a que 5 y : son dos estimadores inses!ados de . Entonces, aun cuando la distribucin de cada estimador est centrada en el valor verdadero de , las dispersiones de las distribuciones alrededor del valor verdadero pueden ser diferentes. Entre todos los estimadores de que son inses!ados, seleccione al que ten!a

varianza mnima. El resultante recibe el nombre de est )ad+& %ses8ad+ !+% (a& a%;a )% )a 0#KJE, minimum variance unbiased estimator1 de . En otras palabras, la eficiencia se refiere al tama'o de error estndar de la estadstica. i comparamos dos estaisticas de una muestra del mismo tama'o y tratamos de decidir cual de ellas es un estimador mas eficiente, esco!eramos la estadstica que tuviera el menor error estndar, o la menor desviacin estndar de la distribucin de muestreo. Eiene sentido pensar que un estimador con un error estndar menor tendr una mayor oportunidad de producir una estimacin mas cercana al parmetro de poblacin que se esta considerando.

Como se puede observar las dos distribuciones tienen un mismo valor en el parmetro slo que la distribucin muestral de medias tiene una menor varianza, por lo que la media se convierte en un estimador eficiente e inses!ado. C+@e&e%! a.P Jna estadstica es un estimador coherente de un parmetro de poblacin, si al aumentar el tama'o de la muestra se tiene casi la certeza de que el valor de la estadstica se aproxima bastante al valor del parmetro de la poblacin. i un estimador es coherente se vuelve mas confiable si tenemos tama'os de muestras mas !randes. Su# ! e%! a.P Jn estimador es suficiente si utiliza una cantidad de la informacin contenida de la muestra que nin!&n otro estimador podra extraer informacin adicional de la muestra sobre el parmetro de la poblacin que se esta estimando.

Es decir se pretende que al extraer la muestra el estadstico calculado conten!a toda la informacin de esa muestra. %or e*emplo, cuando se calcula la media de la muestra, se necesitan todos los datos. Cuando se calcula la mediana de una muestra slo se utiliza a un dato o a dos. Esto es solo el dato o los datos del centro son los que van a representar la muestra. Con esto se deduce que si utilizamos a todos los datos de la muestra como es en el caso de la media, la varianza, desviacin estndar, etc) se tendr un estimador suficiente. Est )a! $% '+& I%te&(al+s Jn estimado puntual, por ser un slo n&mero, no proporciona por s mismo informacin al!una sobre la precisin y confiabilidad de la estimacin. %or e*emplo, ima!ine que se usa el estadstico para calcular un estimado puntual de la resistencia real a la ruptura de toallas de papel de cierta marca, y supon!a que A >;::.I. +ebido a la variabilidad de la muestra, nunca se tendr el caso de que A . El estimado puntual nada dice sobre lo cercano que esta de . Jna alternativa para reportar un solo valor del parmetro que se est estimando es calcular e informar todo un intervalo de valores factibles, un estimado de intervalo o intervalo de confian"a 0?/1. Jn intervalo de confianza se calcula siempre seleccionando primero un nivel de confianza, que es una medida de el !rado de fiabilidad en el intervalo. Jn intervalo de confianza con un nivel de confianza de >=^ de la resistencia real promedio a la ruptura podra tener un lmite inferior de >5H:.= y uno superior de ><?:.>. Entonces, en un nivel de confianza de >=^, es posible tener cualquier valor de entre >5H:.= y ><?:.>. Jn nivel de confianza de >=^ implica que >=^ de todas las muestras dara lu!ar a un intervalo que incluye o cualquier otro parmetro que se est estimando, y slo =^ de las muestras producir un intervalo errneo. Cuanto mayor sea el nivel de confianza podremos creer que el valor del parmetro que se estima est dentro del intervalo. Jna interpretacin correcta de la -confianza de >=^- radica en la interpretacin frecuente de probabilidad a lar!o plazo" decir que un evento 3 tiene una probabilidad de 9.>=, es decir que si el experimento donde 3 est definido re realiza una y otra vez, a lar!o plazo 3 ocurrir >=^ de las veces. %ara este caso el >=^ de los intervalos de confianza calculados contendrn a .

Esta es una construccin repetida de intervalos de confianza de >=^ y se puede observar que de los 55 intervalos calculados slo el tercero y el &ltimo no contienen el valor de . +e acuerdo con esta interpretacin, el nivel de confianza de >=^ no es tanto un enunciado sobre cualquier intervalo en particular, ms bien se refiere a lo que sucedera si se tuvieran que construir un !ran n&mero de intervalos seme*antes. E%!+%t&a& ; a 'a&t & de u% % (el de !+%# a%;a Existen varias tablas en las cuales podemos encontrar el valor de z, se!&n sea el rea proporcionada por la misma. En esta seccin se realizar un e*emplo para encontrar el valor de z utilizando tres tablas diferentes. E*emplo" Encuentre el valor de z para un nivel de confianza del >=^. ,olucin 3> e utilizar la tabla que tiene el rea ba*o la curva de 8 !rficamente sera" hasta z. i lo vemos

El nivel de confianza bilateral est dividido en partes i!uales ba*o la curva"

En base a la tabla que se esta utilizando, se tendr que buscar el rea de 9.>I=, ya que cada extremo o cola de la curva tiene un valor de 9.9:=.

%or lo que el valor de z es de 5.>H. ,olucin 4> i se utiliza una tabla en donde el rea ba*o la curva es de 9 a z"

En este caso slo se tendr que buscar adentro de la tabla el rea de 9.<I= y el resultado del valor de z ser el mismo, para este e*emplo 5.>H.

,olucin ;> %ara la tabla en donde el rea ba*o la curva va desde z hasta "

e busca el valor de 9.9:= para encontrar z de 5.>H.

Lndependientemente del valor del 6ivel de Confianza este ser el procedimiento a se!uir para localizar a z. En el caso de que no se encuentre el valor exacto se tendr que interpolar. Est )a! $% 'a&a la 3ed a Es conocido de nosotros durante este curso, que en base a la distribucin muestral de medias que se !ener en el tema anterior, la formula para el calculo

de probabilidad es la si!uiente" . Como en este caso no conocemos el parmetro y lo queremos estimar por medio de la media de la muestra, slo se despe*ar de la formula anterior, quedando lo si!uiente"

+e esta formula se puede observar que tanto el tama'o de la muestra como el valor de z se conocern. h se puede obtener de la tabla de la distribucin normal a partir del nivel de confianza establecido. %ero en ocasiones se desconoce por lo que en esos casos lo correcto es utilizar otra distribucin llamada -t- de student si la poblacin de donde provienen los datos es normal. %ara el caso de tama'os de muestra !rande se puede utilizar una estimacin puntual de la desviacin estndar, es decir i!ualar la desviacin estndar de la muestra a la de la poblacin 0sA 1. E*emplos" 5. e encuentra que la concentracin promedio de zinc que se saca del a!ua a partir de una muestra de mediciones de zinc en ;H sitios diferentes es de :.H !ramos por mililitro. Encuentre los intervalos de confianza de >=^ y >>^ para la concentracin media de zinc en el ro. upon!a que la desviacin estndar de la poblacin es 9.;. ,olucin> (a estimacin puntual de es A :.H. El valor de z para un nivel de confianza del >=^ es 5.>H, por lo tanto"

%ara un nivel de confianza de >>^ el valor de z es de :.=I= por lo que el intervalo ser ms amplio"

El intervalo de confianza proporciona una estimacin de la presicin de nuestra estimacin puntual. i es realmente el valor central de intervalo, entonces estima sin error. (a mayor parte de las veces, sin embar!o, no ser exactamente i!ual a y la estimacin puntual es errnea. (a ma!nitud de este error ser el valor absoluto de la diferencia entre y , y podemos tener el nivel de confianza de que esta diferencia no exceder

. Como se puede observar en los resultados del e*ercicio se tiene un error de estimacin mayor cuando el nivel de confianza es del >>^ y ms peque'o cuando se reduce a un nivel de confianza del >=^. :. Jna empresa elctrica fabrica focos que tienen una duracin aproximadamente distribuida de forma normal con una desviacin estndar de <9 horas. i una muestra de ;9 focos tiene una duracin promedio de I?9 horas, encuentre un intervalos de confianza de >H^ para la media de la poblacin de todos los focos que produce esta empresa. ,olucin> Con un nivel de confianza del >H^ se sabe que la duracin media de los focos que produce la empresa est entre IH= y IH= horas.

;. (a prueba de corte ses!ado es el procedimiento ms aceptado para evaluar la calidad de una unin entre un material de reparacin y su sustrato de concreto. El artculo -Eestin! the $ond $etPeen Tepair #aterials and Concrete ubstrate- informa que, en cierta investi!acin, se obtuvo una resistencia promedio muestral de 5I.5I 6Cmm:, con una muestra de <? observaciones de resistencia al corte, y la desviacin estndar muestral fue ;.:? 6Cmm:. Jtilice un nivel de confianza inferior del >=^ para estimar la media real de la resistencia al corte. ,olucin> En este e*ercicio se nos presentan dos situaciones diferentes a los e*ercicios anteriores. (a primera que desconoce la desviacin estndar de la poblacin y la se!unda que nos piden un intervalo de confianza unilateral. El primer caso ya se haba comentado y se solucionar utilizando la desviacin estndar de la muestra como estimacin puntual de si!ma. %ara el intervalo de confianza unilateral, se car!ar el rea ba*o la curva hacia un solo lado como si!ue"

Esto quiere decir que con un nivel de confianza de >=^, el valor de la media est en el intervalo 05H.;>, 1.

UNIDAD = CONTROL ESTADSTICO DE PROCESO

=., CONTROL ESTADSTICO

(a idea tradicional de inspeccionar el producto final y eliminar las unidades que no cumplen con las especificaciones una vez terminado el proceso, se reemplaza por una estrate!ia ms econmica de prevencin antes y durante del proceso industrial con el fin de lo!rar que precisamente estos productos lle!uen al consumidor sin defectos. 3s las variaciones de calidad producidas antes y durante el proceso pueden ser detectadas y corre!idas !racias al empleo masivo de 2rficas de Control. e!&n este nuevo enfoque, existen dos tipos de variabilidad. El primer tipo es una variabilidad aleatoria debido a -causas al azar- o tambin conocida como -causas comunes-. El se!undo tipo de variabilidad, en cambio, representa un cambio real en el proceso atribuible a -causas especiales-, las cuales, por lo menos tericamente, pueden ser identificadas y eliminadas. (os !rficos de control ayudan en la deteccin de modelos no naturales de variacin en los datos que resultan de procesos repetitivos y dan criterios para detectar una falta de control estadstico. Jn proceso se encuentra ba*o control estadstico cuando la variabilidad se debe slo a -causas comunes-. (os !rficos de control de hePart son bsicamente de dos tipos) !rficos de control por variables y !rficos de control por atributos. %ara cada uno de los !rficos de control, existen dos situaciones diferentes) a1 cuando no existen valores especificados y b1 cuando existen valores especificados. e denominan -por variables- cuando las medidas pueden adoptar un intervalo continuo de valores) por e*emplo, la lon!itud, el peso, la concentracin, etc. e denomina -por atributos- cuando las medidas adoptadas no son continuas) e*emplo, tres tornillos defectuosos cada cien, ; paradas en un mes en la fbrica, seis personas cada ;99, etc. 3ntes de utilizar las 2rficas de Control por variables, debe tenerse en consideracin lo si!uiente" a.8 El proceso debe ser estable b.8 (os datos del proceso deben obedecer a una distribucin normal c.8 El n&mero de datos a considerar debe ser de aproximadamente :9 a := sub!rupos con un tama'o de muestras de < a =, para que las muestras consideradas sean representativas de la poblacin. d.8 (os datos deben ser clasificados teniendo en cuenta que, la dispersin debe ser mnima dentro de cada sub!rupo y mxima entre sub!rupos e.8 e deben disponer de tablas estadsticas

(as etapas que deben tomarse en cuenta para me*orar el proceso estn esquematizadas en la si!uiente fi!ura"

El si!uiente e*emplo ense'a cmo utilizar estas !rficas 2rficas de Control 4 y T, por variables 0sin valores especificados1 En la si!uiente tabla se muestran los pesos de los sobres de un determinado alimento. Cada media hora se realizan < mediciones por muestra, sumando un total de :9 muestras. (os lmites de tolerancia son 9,=;H9 0( E1 y 9,<=?9 0(LE1 Con esto se pretende evaluar el comportamiento del proceso y hacer un control del mismo respecto a su localizacin y dispersin, con el ob*eto que el proceso cumpla con las especificaciones preestablecidas.

%rimero debemos calcular las medias tanto de la media de cada muestra 04 doble raya1 como la de su amplitud o recorrido 0T1

%ara

ello

utilizamos

las

si!uientes

frmulas"

donde 4 0doble raya1 A 9,<>I9 y T 0raya1 A 9,9::< %ara construir los 2rficos de Control por variables, se tiene que tener en cuenta que al determinar si un proceso est ba*o -control estadstico-, siempre se debe analizar primero la !rfica T. Como los lmites de control en la !rfica 4 0raya1dependen de la amplitud promedio, podran haber causas especiales en la !rfica T que produzcan comportamientos anmalos en la !rfica 4 0raya1, a&n cuando el centrado del proceso est ba*o control. %ara el !rfico T, se tiene que" (mite Central 0(C1 A T 0raya1A 9,9::< (mite uperior de Control 0( C1 %ara ver la frmula seleccione la opcin b$a*ar traba*ob del men& superior

donde ( C A 9,9=55, el valor de + se consi!ue en una tabla estadstica 0para este caso es :,:?: con un tama'o de !rupo n A <1. (mite Lnferior de Control 0(LC1 %ara ver la frmula seleccione la opcin b$a*ar traba*ob del men& superior donde (LC A 9, porque para todo proceso en que se considera un n g I, el (LC no se indica en la !rfica. El !rfico T es el si!uiente"

Como se puede apreciar, el !rfico T no presenta variaciones fuera del lmite superior,por lo tanto la dispersin de los datos es aceptable para calcular el !rfico 4 0raya1. %ara el !rfico 4 0raya1, se tiene que" (mite Central 0(C1 A 4 0doble raya1A 9,<>I9 %ara ver la frmula seleccione la opcin b$a*ar traba*ob del men& superior (mite uperior de Control 0( C1 donde ( C A 9,=5;;, el valor de 3: se consi!ue en una tabla estadstica 0para este casoel valor es 9,I:> con un tama'o n A<1.

(mite Lnferior de Control 0(LC1 donde (LC A 9,<?9I El !rfico 4 0raya1es el si!uiente"

Como se puede apreciar un punto queda fuera del ran!o calculado, por lo tanto el proceso se encuentra fuera de control estadstico. En este caso, habra que investi!ar y eliminar la causa asi!nable, que podra haberse debido al uso de al!&n material defectuoso o una mala lectura del instrumento. Este dato debe eliminarse de la !rfica y recalcular todo de nuevo pero sin considerar el sub!rupo ?. 6ota.8 Esto no siempre es as, si los puntos fuera de control son de tal ma!nitud, entonces no queda ms remedio que una vez encontrada y eliminadas las causas en la prctica, habra que repetir el proceso, reco!iendo nuevos datos. +espus de la correccin, los resultados son" 2rfico T corre!ido T 0raya1 A (C A 9,9:;5 ( C A 9,9=:I y (LC A 9 2rfico 4 0raya1 corre!ido 4 0doble raya1 A (C A 9,<>I> ( C A 9,=5<I y (LC A 9,<?55 (os !rficos son los si!uientes"

%ara ver la frmula seleccione la opcin b$a*ar traba*ob del men& superior Como se puede apreciar en ambos !rficos, ahora el proceso se encuentra en -control estadstico-. Clculo de la Capacidad del %roceso (a capacidad del proceso slo puede ser evaluada en el caso de que el proceso se encuentre ba*o control estadstico. y se puede definir como aquellos lmites dentro de los cuales la &nica fuente de variacin son las causas comunes o aleatorias del sistema. %or lo tanto, es un estado ideal para el buen funcionamiento de todo el sistema lo!rar que todos sus procesos sean estables. LC% A Cp A Lndice de Capacidad del %roceso %ara ver la frmula seleccione la opcin b$a*ar traba*ob del men& superior donde ( E es el lmite superior de tolerancia y (LE el lmite inferior de tolerancia. i!ma sombrero es la desviacin estndar estimada, y es i!ual a" %ara ver la frmula seleccione la opcin b$a*ar traba*ob del men& superior El valor de la constante d: se obtiene a partir de tablas estadsticas. En este caso d: A :,9=> para n A <. i!ma sombrero A 9,955: y Cp A 5,5=> e!&n el convenio, un proceso" Es capaz si Cp f A 5 6o es capaz si Cp g 5 %or lo tanto, el %T,CE , E C3%3h (o que se debe conse!uir para lo!rar una me*ora sustancial es que el Cp sea mayor que 5,;;. 3l!unos autores se'alan incluso que un Cp f 5,= es ms fiable para dar -se!uridad- acerca de la estabilidad del proceso. in embar!o, antes de cualquier me*ora debemos primero calcular el centramiento del proceso. Centramiento del %roceso Es evidente que el valor de Cp no depende del promedio del proceso, ya que este promedio puede ser el resultado de un error sistemtico en el sistema, es decir,

que los datos obtenidos estn ms ba*o o ms alto de la media poblacional real o del valor que hemos fi*ado como centro. %ara determinar si el proceso est o no centrado existen diversas frmulas para resolverlo, una de ellas, a*usta el valor de Cp con un factor 05 c F1, como si!ue" CpU A Cp 05 c U1,en la cual" %ara ver la frmula seleccione la opcin b$a*ar traba*ob del men& superior F A _9,=;H9 @ 9,<=?9 c 0: x 9,<>I>1_ C 09,=;H9 c 9<=?91 F A 9,599 CpU A Cp 05 c U1 CpU A 5,5=> x 05 c 9,5991 CpU A 5,:? (a frmula para obtener F se entiende me*or si la rescribimos de otra manera" F A : _ promedio c ob*etivo _ C tolerancia 3qu podemos apreciar que si el promedio es i!ual al ob*etivo, que es lo ideal, el proceso queda totalmente centrado, ya que U A 9, y por tanto CpU A Cp.

S-ar putea să vă placă și