Sunteți pe pagina 1din 20

CAPITULO II TEORIA DE PROBABILIDADES En cualquier actividad diaria, suele ser necesario cuantificar algn parmetro, como: determinar un peso,

una distancia, un volumen, etc. Esto es especialmente crtico, en los trabajos de laboratorios de anlisis, en los que existe la necesidad de determinar el valor de una magnitud, de manera que proporcione un resultado confiable. En estos casos es comn encontrar que los resultados difcilmente se repiten fielmente, por lo que, la calidad de esas cuantificaciones generalmente es puesta en duda. I.- TERMINOS ESTADISTICOS a.- Variabilidad e incertidumbre. La variabilidad es inherente a las mediciones, y determina que para una medida y su resultado de medicin no exista un solo valor, sino un grupo de valores alrededor del resultado: a esa variabilidad en metrologa se le conoce como incertidumbre. En el lenguaje coloquial, la palabra incertidumbre se relaciona con el concepto de duda o conocimiento limitado. En metrologa el trmino incertidumbre es indicativo del nivel de limitacin en las mediciones y es sinnimo de variabilidad de las medidas o los resultados, y que no se trata de un error, ya que no es una equivocacin que resulta de la actividad de medir. b.- Incertidumbre de las medidas Al realizar el proceso de medicin, el valor obtenido y asignado a la medida diferir probablemente del valor verdadero debido a causas diversas. El llamado valor verdadero es en realidad un concepto puramente terico y absolutamente inaccesible. En el proceso de medicin nicamente pretendemos estimar de forma aproximada el valor de la magnitud medida. Para ello debemos dar un nmero con sus unidades y una estimacin del error. Dicho de otra manera, el resultado de cualquier medida es siempre incierto y a lo ms que podemos aspirar es a estimar su grado de incertidumbre. c.- Error de las medidas Llamamos error de una medida a la discrepancia entre el valor verdadero de la magnitud y el valor medido. Esta discrepancia puede ser debida a diversas causas Sus caractersticas son: - Es un concepto idealizado. - No puede ser conocido exactamente, pero si se toman conceptos como el valor convencionalmente verdadero o valores de referencia, el error es obtenido a partir del clculo correspondiente e implica una desviacin. - Toma un simple valor.

Fig. 2.1. Diferentes niveles de incertidumbre

En la figura, el caso A presenta los resultados en un intervalo menor, que el caso B, por tanto los puntos en A tienen menor incertidumbre que en B. d.- El concepto de incertidumbre El Vocabulario de Metrologa Internacional, VIM, define la incertidumbre como un parmetro, asociado al resultado de una medida, que caracteriza el intervalo de valores que puede ser razonablemente atribuidos al mensurando. En esta definicin el mensurando indica: la propiedad sujeta a medida. El contenido de zinc en un acero o el ndice de octano en gasolina son dos ejemplos de mensurandos. Es una forma de expresar el hecho de que para un mensurando y un resultado de medicin dados, no hay un nico valor, sino un numero infinito de valores dispersos alrededor del resultado, que son consistentes con todas las observaciones, datos y conocimientos que se tengan del mundo fsico, y que con diversos grados de credibilidad, pueden atribuirse al mensurando. Por tanto, la incertidumbre nos da una idea de la calidad del resultado ya que nos muestra un intervalo alrededor del valor estimado dentro del cual se encuentra el valor considerado verdadero. Sus caractersticas son: - Es estimada para un proceso de medicin. - Puede aplicarse a todas las determinaciones realizadas mediante el procedimiento descrito. - Toma la forma de un rango. - No puede utilizarse para corregir el resultado de una medicin. Hoy en da, los laboratorios deben demostrar que sus mtodos analticos proporcionan resultados fiables y adecuados para la finalidad o propsitos perseguidos, ya que muchas de las decisiones que se toman estn basadas en la informacin que estos resultados proporcionan. Por ejemplo, si pidiramos a dos laboratorios que analizaran el mercurio en un agua residual, podemos afirmar que, muy probablemente, no obtendran el mismo resultado. La incertidumbre permite solucionar este problema. Es decir, nos permite comparar resultados obtenidos por varios laboratorios u obtenidos con diferentes metodologas analticas. Sin duda, si el laboratorio A proporciona un resultado de 14 ppb de mercurio y el laboratorio B de 15 ppb, no podremos decir si proporcionan o no resultados comparables. Por otro lado, si el laboratorio A da un resultado de 141 ppb y el laboratorio B de 15.0 0.5 ppb, ya podemos afirmar que ambos resultados son comparables.

e.- Precisin. Es el grado de concordancia entre el resultado y el valor de referencia aceptado. Se refiere al grado de concordancia entre los resultados de ensayos, obtenidos bajo ciertas condiciones especificadas. Estas condiciones dependen de los factores que se varen entre cada uno de los ensayos. Por ejemplo, algunos de los factores que se pueden variar son: el laboratorio, el analista, el equipo, la calibracin del equipo, los reactivos y el da en que se hace el ensayo. Las dos medidas de precisin extremas son la reproducibilidad (que proporciona la mayor variabilidad ya que los ensayos se obtienen por diferentes laboratorios) y la repetibilidad (que proporciona la menor variabilidad ya que los ensayos se obtienen en intervalos cortos de tiempo sin variar ningn factor). b.- Repetibilidad Es el grado de concordancia entre resultados de sucesivas mediciones efectuadas con aplicacin de la totalidad de las mismas condiciones de medicin, donde los resultados de ensayos son obtenidos con un mismo mtodo, en una misma muestra, en el mismo laboratorio, el mismo analista, en un intervalo corto de tiempo. c.- Reproducibilidad. Grado de concordancia entre resultados de las mediciones efectuadas bajo diferentes condiciones de medicin. Que pueden ser, con diversos analistas o por varios laboratorios. La reproducibilidad y la repetibilidad pueden ser expresadas en trminos de desviacin estndar Fig.2.2. Diferencia entre incertidumbre y precisin.

c.- Robustez Variacin de la precisin dentro de un laboratorio cuando uno o ms de los siguientes factores es o son diferentes: tiempo, calibracin, operador, equipo (reactivos). (Referencia: NTP-ISO: 5725-3) e.- Veracidad. La cercana del acuerdo entre el valor promedio obtenido de un conjunto grande de resultados de anlisis y un valor de referencia aceptado. Es la proximidad de concordancia entre el valor promedio obtenido de una serie de resultados de prueba y un valor de referencia aceptado. La medida de veracidad se expresa por lo general en trminos de sesgo.

Fig.2.3. Una representacin de precisin y veracidad en ensayo de tiro al blanco.

El blanco a la izquierda representa una buena exactitud ya que las marcas estn cerca de la diana, pero mala precisin; mientras que el blanco de la derecha representa buena precisin ya que las marcas estn agrupadas estrechamente, pero mala exactitud. f.- Exactitud Es el grado de concordancia entre el resultado de la medicin y el valor de referencia aceptado. Por tanto, la exactitud se expresa como suma de dos trminos: la precisin (que tiene en cuenta la variabilidad de los resultados) y la veracidad (es decir, que los resultados no tengan un error sistemtico). Combinacin de la precisin y el sesgo de un procedimiento analtico, la cual refleja la cercana entre el valor medido y el valor de consenso. El trmino exactitud, cuando se aplica a un conjunto de resultados de la prueba, implica una combinacin de componentes aleatorios y un error sistemtico o componente de sesgo comn. II.- TIPOS DE ERROR Un problema en el tratamiento de datos es la variabilidad y el error que ellos llevan implcito. Sin embargo, es necesario diferenciar entre error aleatorio y error sistemtico. Un error sistemtico es aquel que se produce de igual modo en todas las mediciones que se realizan de una magnitud, se le conoce tambin como desviacin. Puede estar originado en un defecto del instrumento, en una particularidad del operador o del proceso de medicin, etc. Sus caractersticas son: - Es la variacin que permanece constante en magnitud y sentido durante varias mediciones. - Es producto de las imperfecciones de los equipos, de los mtodos o del operador. - Si es causado por un efecto identificado y conocido, puede cuantificarse y puede aplicarse una correccin. - Es posible eliminarlo. El error aleatorio es aquel error inevitable que se produce por eventos nicos imposibles de controlar durante el proceso de medicin. Se define tambin como el resultado de una medicin menos la media que resultara de un numero infinito de mediciones del mismo mensurando, bajo condiciones de repetibilidad. Ejemplo. 1. En una prctica de laboratorio, se desea titular 10 ml de una solucin de Na(OH) 0.1 N con solucin HCl 0.1N. El profesor de prctica encarga a 4 alumnos

efectuar la titulacin repitiendo 5 veces cada uno, y se obtienen los siguientes volmenes de gasto. ALUMNO A B C D MEDICIONES 10.08 10.11 9.83 10.14 10.19 9.79 10.04 9.98 Media 10.10 10.01 10.01 10.01 Rango 0.04 0.41 0.50 0.07

10.09 10.20 9.69 10.02

10.10 9.80 10.05 9.97

10.12 10.21 9.78 10.04

Sin conocimientos se dira que al no coincidir todos los resultados, estn mal. Con slo estadstica descriptiva estaramos tentados a decir que A y C son mas confiables por presentar menor dispersin. Pero el alumno A comete error sistemtico (posiblemente por no saber hacer la lectura). En los otros casos hay error aleatorio. III.- ALEATORIZACION. Alear significa mezclar. Una medida adecuada para reducir el error sistemtico es hacer que el orden de realizacin de los experimentos sea al azar aleatorio. Por tanto siempre que sea posible, y no origine ningn problema serio o costo adicional, es conveniente aleatorizar el orden de realizacin del experimento, ya que ello protege contra posibles efectos de factores no considerados en el experimento e ignorados por el experimentador. Una variable que ha sido sometida al proceso de aleatorizacin se conoce como variable aleatoria. Ejemplo. 2. Se toman 50 muestras de agua del ri Chili para conocer la variacin en la composicin a lo largo de su recorrido. Las muestras deben numerarse y en laboratorio someterlas a anlisis sin ningn orden. IV.- PROBABILIDAD. Es el grado de creencia de que ocurra un resultado esperado. Matemticamente, si un suceso o evento ( E) tiene (h) posibilidades de ocurrir entre un total de (n) posibilidades, cada una de ellas con la misma oportunidad. Entonces la posibilidad de que ocurra (E ) o probabilidad de xito esta dada por: p = Pr(E ) = h/n (ec. 2.1) La posibilidad de que no ocurra (noE), probabilidad de no xito esta dada por: q =Pr(noE) = (n-h)/n = 1 h/n (ec. 2.2) Ejemplo. 3. Un distribuidor de componentes electrnicos, tiene en una caja un lote de 100 aislantes de diversos colores. Un cliente desea adquirir un aislante de color blanco y se conoce que solo 30 de los 100 son blancos. Si se toma de la caja un aislante al azar, cual es la probabilidad que este sea blanco. n = 100 p = 30/100 = 0.3 h= 30 Expresado en % ser: 30%

V.- DISTRIBUCION DE PROBABILIDAD. Teniendo un conjunto de datos mayores a 20 se puede construir un histograma, y luego a partir de l, el correspondiente polgono de frecuencia. Fig.2. 4 distribucin de frecuencia en histograma y polgono
14 12 10 8 6 4 2 0 1 2 3 4 5 6 7 8 9 14 12 10 8 6 4 2 0 1 2 3 4 5 6 7 8 9

En el polgono de frecuencias, se tiene que la altura en cada punto representa la frecuencia o nmero de eventos para ese punto en particular. Si el ensayo se repite infinito numero de veces, el polgono se transforma en una curva, de modo que cada punto en la curva representa la frecuencia con que se presenta el valor Xi. Esta distribucin de frecuencia se puede hacer equivalente a una distribucin de probabilidad, donde la probabilidad sea equivalente a la frecuencia relativa, con que se puede presentar ese valor de la variable. Fig. 2.5. Conversin de un histograma en curva de distribucin de probabilidad

fdp.dx = 1.0

(ec. 2.3)

Las distribuciones de probabilidad pueden representarse a travs de una grfica, una frmula, o una tabla, en cuyo caso tal regla de correspondencia se le denomina funcin de probabilidad.

Numero de caras 0 1 2 3 4

frecuencia 1 4 6 4 1

Distribucin de probabilidad 1/16 4/16 6/16 4/16 1/16

Ejemplo 4. En base a datos histricos se sabe que en una empresa, la probabilidad de que haya un empleado enfermo es de 0,02. Sabiendo que hay 300 empleados hallar la esperanza matemtica de la distribucin correspondiente. Solucin Reemplazando en la ec.2.1 se tiene: h = Pr(E).n = 0.02*300 = 6 Es decir que para una probabilidad del 2%, se espera encontrar a 6 empleados enfermos. 4.1.- Distribucin y Funcin de probabilidad. Una funcin de probabilidad no es ms que la asignacin a cada valor de la variable de la probabilidad que le corresponde. 4.2.- Generacin de una distribucin de probabilidad. Ejemplo 5. Supongamos que se quiere saber el nmero de caras que se obtienen al lanzar cuatro veces una moneda al aire. Los posibles resultados son: cero caras, una cara, dos caras, tres caras y cuatro caras. Si realizamos el experimento obtenemos el siguiente espacio muestral:

De lo anterior se puede observar que: - El polgono de frecuencias se aproxima a una curva suave que sirve para representar grficamente las distribuciones de probabilidad de una variable aleatoria continua. - El rea total bajo la curva es igual a 1 y, es equivalente al rea bajo el histograma. - El clculo de probabilidad se basa en el clculo integral del rea bajo la curva entre dos puntos cualesquiera del eje de abscisas, generndose la funcin de densidad de probabilidad. V.- DISTRIBUCION EQUILIBRADA. Cuando la curva de distribucin contiene variables aleatorizadas, la curva es equilibrada. Si la curva muestra algn sesgo se dice que presenta curtosis e indica presencia de error sistemtico. Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central. La asimetra presenta tres estados diferentes [Fig.2.3], cada uno de los cuales define de forma concisa como estn distribuidos los datos respecto al eje de simetra. Se dice que la asimetra es positiva cuando la mayora de los datos se encuentran por encima del valor de la media aritmtica, la curva es Simtrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media

y se conoce como asimetra negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media. Fig. 2.6. Distribuciones simtricas y asimtricas.

Hay varias propuestas de modelos de distribucin equilibrada para variables aleatorias como la campana de Gauss, cuya funcin vara segn que se trate de variables discretas o continuas. - para variables discretas.

Donde: = n promedio de ocurrencias - para variables continuas.


( x u ) 2

e .x f ( x) x!

(ec. 2.4)

1.e 2. f ( x) . 2
2

(ec. 2.5)

VI.- DISTRIBUCION MORMAL En una curva Gaussiana puede haber diferentes grados de variabilidad. Esta variabilidad, si se expresa en trminos de desviacin estndar respecto de la media, dar lugar a campanas con diferente grado de extensin. Fig. 2.7. Distribuciones normales con diferente desviacin estndar

La curva gaussiana mas cercana a la realidad es aquella que tiene desviacin estndar 1.0 y se le conoce como curva normal o curva estndar, se le representa como N(0,1), y se denomina distribucin normal estndar o normal con media cero y desviacin 1.0. Cualquier ensayo con variable aleatoria, que por tanto haya eliminado el error sistemtico debe tener una distribucin normal, con media cero N(0,1), donde la variable (x) es reemplazada por la variable normalizada (Z). VII.- PROBABILIDADES EN LA CURVA NORMAL. Si el rea bajo la curva normal representa una probabilidad total de 100% p=1.0, y se desea conocer la probabilidad de que la variable X tome valores entre a y b, esto se puede representar en una curva normal, y se tiene: Fig. 2.8. Probabilidad entre intervalos.

El rea sombreada se calcula por integracin de la funcin entre los lmites sealados,

(ec. 2.6) Si hacemos que z = ( X - )/, X = + z y derivamos X con respecto a z, tenemos: dx/dz = dx = dz. Si reemplazamos en la Ec. 2.6, se tiene:

Ec. 2.7 En esta ecuacin se introduce una nueva variable aleatoria z que se le conoce como: denominada variable aleatoria normal estndar, con la cual se tipifica o estandariza cualquier variable X. Se puede observar que la integral de la ecuacin 2.7 no es fcil de determinar por lo que se recurre al uso de mtodos numricos. En las tablas aparecen tabulados los valores de esta integral para una distribucin N(0,1)(funcin Estndar de Distribucin Normal).

Sin embargo, se ha encontrado que en una curva normal, las reas comprendidas entre 1, 2, y 3 desviaciones estndar tienen valores determinados, que son:

P(- < X < - ) = 0.6827 P ((- 2 < X < -2 ) = 0.9545 P(- 3 < X < - 3) = 0.9973 y que se pueden representar en la fig. 2.9. Fig. 2.9. reas bajo la curva normal

De igual modo, las reas evaluadas a partir de la media (=0) sern: Fig. 2.10. Desviaciones Estndar en una distribucin normal

A partir de estos datos, se han construido tablas estadsticas (tablas de variable z) que presentan la probabilidad para diferentes intervalos de valores de la variable estandarizada, y que equivalen al que se obtiene aplicando la ec 2.6. Si un fenmeno determinado se conoce suficientemente, y en l se han eliminado los errores sistemticos, se puede usar este tipo de curvas para hacer proyecciones futuras sobre el fenmeno en particular. En este caso, una distribucin de probabilidad la podemos concebir como una distribucin terica de frecuencia, es decir, es una distribucin que describe, como se espera que varen los resultados. Dado que esta clase de distribuciones se ocupan de las expectativas, son modelos de gran utilidad, para hacer inferencias y tomar decisiones en condiciones de incertidumbre. Ejemplo 6. En una curva de distribucin estandarizada hallar la probabilidad comprendida a distancias de 1, 2 y 3 . Uso de tablas de variable estandarizada. Para el caso de tablas de rea acumulada a cola inferior, se tiene los siguientes casos:

a) Uso directo de las tablas

b). ) Clculo de la cola superior.

c) para intervalos internos.

APLICACIN DE LAS TABLAS DE PROBABILIDAD ESTANDARIZADA. Las tablas de variable estandarizada (z), se pueden utilizar para hallar la distribucin de probabilidad de cualquier variable aleatoria (x), para lo cual es necesario previamente convertirla a variable estandarizada, mediante la relacin z= (x- )/ (ec. 2.7)

Ejemplo. 7. Si x es una variable aleatoria normal con media 10 y desviacin estndar 2.1 calcule: a) p(x >= 11), y b) p (7.6 <=x <= 12.2). Solucin: a).- estandarizando o normalizando la variable se tiene: de la ec. 2.3 z =(10-11)/2.1 =0.47 Representando en la curva normalizada se tiene:

P(z >= 0.47) = 1- 0.6808 = 0.31 b) Normalizando las variables se tiene: Z1 = (7.6-10)/2.1 = -1.14 Z2 = (12.2-10)/2.1 = 1.05 Luego representando en la curva normalizada.

Para; P(-1.14 <= z >= 1.05)= 0.8531-0.1271 = 0.726 Ejemplo 8. Si los dimetros de la bolas de un tipo de cojinetes se distribuyen normalmente con =0,6140 pulg. y =0,0025 pulg. Determinar el porcentaje de bolas con dimetro entre 0,610 y 0,618 pulg. Datos: N(0,6140 ; 0,0025) P(0,610 <= x <= 0,618) =? P(-1.6 <= z <= 1.6) = 0,9452-0,0548 = 0,8904 = 89,04%

Ejemplo 9. El tiempo de incapacidad por enfermedad de los empleados de una compaa en un mes tiene una distribucin normal con media 100 horas y desviacin estndar 20 hr. a.- Cual es la probabilidad de que el tiempo por incapacidad del siguiente mes se encuentre entre 50 y 80 hr.? b.- Cuanto tiempo de incapacidad deber planearse para que la probabilidad de excederla sea slo de 10%?. DATOS. SOLUCION. = 100 hr. a) z1 = (50-100)/20 = -2.5 = 20 hr z2 = (80-100)/20 = -1.0

p(-2.5<= z>=-1.0) = 0.1586-0.0062 = 0.1524 = 15.2%

b) graficando se encuentra que

De tablas se tiene: z= 1.28, y x= z. + = 1.28*20 + 100 = 125.7 hr LECTURA. La incertidumbre y el error en la prctica la datacin por carbono 14 Los arquelogos, paleontlogos y otros investigadores se han interesado durante mucho tiempo en la datacin de objetos y artefactos, en un esfuerzo de comprender su historia y sus usos. Desafortunadamente, los registros escritos son una invencin humana Relativamente reciente y hay pocos artefactos histricos acompaados de historias escritas precisas. En la primera mitad del siglo XX, un qumico nuclear americano llamado Willard F. Libby, se interes en el uso del istopo radioactivo 14C para datar ciertos objetos. La teora de la datacin por radiocarbono es relativamente sencilla. La mayora del carbono en la estratosfera de la Tierra est como 12C, pero una pequea cantidad del istopo 14C, est producido naturalmente a travs del bombardeo del 14N con rayos csmicos (W. F. Libby, 1946). A medida que las plantas captan carbono de la atmsfera a travs de la respiracin, incorporan el 14C, as como el ms abundante 12C en sus tejidos. Los animales tambin toman los istopos de carbono a travs de la comida que comen. Por consiguiente, todos los organismos vivos tienen la misma proporcin de istopos de 14C y 12C en sus cuerpos, que los que tiene la atmsfera. Al contrario del 12C, el 14C es un istopo radioactivo que en su producto 14N est constantemente sufriendo descomposicin a un ndice conocido. Mientras que un organismo est vivo, toma nuevo 14C del ambiente y as se mantiene en equilibrio con ste. Cuando los organismos mueren, sin embargo, el carbono en sus tejidos ya no se sustituye, y la cantidad de 14C disminuye lentamente con el tiempo al descomponerse en 14 N. Por consiguiente, la cantidad del 14C radioactivo que se conserva en un pedazo de madera o hueso animal puede ser usado para determinar cundo muri ese organismo. Esencialmente, a mayor tiempo de muerte del organismo, menores niveles de 14C. La cantidad de material radioactivo (como el 14C) en un ejemplar, puede ser cuantificada al contar la cantidad de descomposicin que sufre el material en un tiempo especfico, usualmente presentados en cuentas por minuto (cpm). Cuando Libby empez su trabajo sobre el radiocarbono, en los aos 1940, la tecnologa disponible todava era muy reciente. El sencillo contador Geiger se invent recin en 1908 por el cientfico alemn Hans Wilhelm Geiger, un estudiante de Ernest Rutherford, y no fue perfeccionado hasta 1928, cuando Walther Mller, un alumno de Geiger, mejor el diseo permitiendo la deteccin de todos los tipos de radiacin. Se le atribuye al mismo Libby la construccin del primer contador Geiger en los Estados Unidos en los aos 1930. Pero se enfrent a un gran obstculo al usar el instrumento para medir la radiacin del istopo 14C de los rayos csmicos de fondo y de la Tierra que ocurren naturalmente, y la variabilidad asociada con la seal de fondo que poda inundar la pequea seal del 14 C que l esperaba detectar. En 1949, Libby inform sobre un mtodo para deducir la

seal de fondo y la variabilidad. Puso el ejemplar entero y el detector dentro de un tubo cubierto de 2 pulgadas de plomo y 4 pulgadas de hierro (W. F. Libby, Anderson, & Arnold, 1949). De esta manera, Libby y sus colegas redujeron la seal de fondo de 150 cpm a 10 cpm y minimizaron la variabilidad asociada a la seal a alrededor de 5-10% de error, o menos de 1 cpm. Libby y sus colegas no usan la palabra error como lo hacemos en el lenguaje comn, donde se refiere a un error como el error tipogrfico o de baseball. El origen latino de la palabra error (errorem) significa deambular o perdido, y el uso cientfico de la palabra est ms cercano a su significado original. Libby calcul el error asociado a sus medidas al contar la cantidad de eventos de descomposicin en el ejemplo, durante una cantidad de tiempo conocida, repitiendo las medidas durante mltiples periodos y usando tcnicas estadsticas para cuantificar el error, despus. En 1949, Libby, trabajando con su estudiante posdoctoral James Arnold, present el primer uso de la datacin de radiocarbono para determinar la edad de los fragmentos de madera de sitios arqueolgicos alrededor del mundo. Debido a que el mtodo era nuevo, Arnold y Libby tuvieron cuidado en replicar sus medidas para proveer un estimado detallado de diferentes tipos de error, y compararon los resultados de sus mtodos con los ejemplares de una edad conocida como el control (Tabla a). Table a. Las determinaciones de la edad en ejemplares de edad conocidas de Arnold y Libby (1949).
Specific activity Sample Age (years) (cpm/g of carbon) Found 11.10 0.31 11.52 0.35 11.34 0.25 10.15 0.44 11.08 0.31 Average : 10.99 0.15 Found 1100 150 Expected 1372 50

Tree Ring

En la tabla a, se ven las actividades especificas para cinco duplicados diferentes de un ejemplar de madera de un abeto Douglas, excavado en el Valle Red Rock. Cada medida individual tiene un error a su derecha, indicado con el signo . Arnold y Libby describen estas medidas en su trabajo, planteando que Los errores citados para una medida de una actividad especfica son desviaciones estndares computadas de las estadsticas Poisson del conteo de eventos aleatorios. En otras palabras, el error individual est calculado sobre la base de incertidumbres esperadas, asociadas a la descomposicin radioactiva para cada ejemplar. Tal como se ve en la Tabla 1, en la parte inferior se provee un error general de un valor promedio de una actividad especfica (10.99). El error general (0.15) es menor al error individual presentado con cada medida. Esta es una importante caracterstica del clculo estadstico del error asociado con los datos cientficos a medida que aumentamos el nmero de medidas para un valor, disminuye la incertidumbre y aumenta la seguridad asociada con la aproximacin del valor. El error presentado junto a la actividad especfica provee una medida de la precisin del valor y es referido comnmente como un error estadstico. El error estadstico es lo que Pearson describe como la incertidumbre inherente de la medida. Est causada por las fluctuaciones aleatorias de la descomposicin radioactiva

y a veces se lo conoce como error aleatorio, ya que el investigador tiene poco control sobre el mismo. El error estadstico no puede ser eliminado, como describi Pearson, pero si puede ser medido y reducido cuando se hacen repetidas observaciones de un evento especfico. En la columna 3 de la tabla a, Arnold y Libby estiman la edad del ejemplar del abeto Douglas, basndose en la actividad del 14C como de 1100 aos (datando su primera temporada de crecimiento en el ao 849 de nuestra era). En la columna 4 de tabla 1, informan de la edad real del abeto Douglas, calculada al contar los tres anillos en el ejemplar como de 1372 aos (datando su primera temporada en el ao 577 de nuestra era). Al comparar la edad del 14C al valor tericamente correcto determinado al contar los tres anillos, Arnold y Libby le permiten al lector evaluar la exactitud de su mtodo, y esto provee la medida de un segundo tipo de error que se encuentra en la ciencia: el error sistemtico. Basndose en sus datos, Arnold y Libby plantean que el acuerdo entre la prediccin y la observacin parece ser satisfactorio. Sin embargo, a medida que Libby continu investigando para establecer el mtodo de la datacin por 14C, Libby empez a reconocer que la discrepancia entre la datacin del radiocarbono y otros mtodos era an mayor para los objetos ms antiguos, especialmente aquellos de ms de 4000 aos (W.F. Libby, 1963). Mientras que las fechas tericamente correctas en los objetos muy antiguos pueden establecerse por otros medios, como en los ejemplares de los templos de Egipto donde exista un sistema de calendario bien establecido, las edades obtenidas a travs de la datacin por radiocarbono eran constantemente mayores a las fechas registradas, frecuentemente, tanto como 500 aos. Libby saba que habra errores estadsticos en estas medidas y haba anticipado el uso de la datacin por 14C para calcular una gama de fechas para los objetos. Pero el problema que encontr fue diferente: la datacin por 14C calculaba sistemticamente las edades que diferan tanto como 500 aos de las edades reales de los objetos ms antiguos. El error sistemtico, como Libby encontr, se deba a una fluctuacin desconocida pero no aleatoria, como el sesgo instrumental o una presuncin fallida. El mtodo de datacin por radiocarbono ha logrado una buena precisin. Los anlisis duplicados produjeron fechas separadas entre s por 150 aos, como se puede ver en la Tabla 1; pero inicialmente demostr una precisin mala la fecha del abeto de Douglas por 14C era casi 300 aos diferente que la edad real, y otros objetos estaban errados como por 500 aos. Al contrario del error estadstico, el error sistemtico puede ser compensado, o algunas veces eliminado, si su fuente puede ser identificada. En el caso de la datacin por 14C, se descubri con posterioridad que la razn del error sistemtico era una asuncin fallida: Libby y muchos otros cientficos haban asumido que el ndice de produccin del 14C en la atmsfera se mantena constante en el tiempo, pero no es as. Al contrario, flucta con los cambios en el campo magntico terrestre, la toma de carbn por las plantas y otros factores. Adicionalmente, los niveles radioactivos de 14C aumentaron a lo largo del siglo XX, debido a que el ensayo de las armas nucleares despidi altos niveles de radiacin a la atmsfera. Desde que Libby public su mtodo, los investigadores han recalibrado el mtodo de datacin por radiocarbono con la datacin por los anillos de los rboles de pino, y de corales para corregir las fluctuaciones en la produccin de 14C en la atmsfera. Como consecuencia, la precisin y la exactitud de las fechas de radiocarbono han aumentado drsticamente. Por ejemplo, en el ao 2000, Xiaohong Wung y sus colegas de la Universidad de Pekn en Beijing, usaron la datacin por radiocarbono en los huesos de

los marqueses de Jin rescatados de un cementerio en la provincia Shanxi en China (vea la Tabla b) (Wu et al., 2000). Tal como se puede ver en la Tabla b, no slo la precisin de los estimados (que van de los 18 a los 44 aos) es ms justa que la gama de error de 150 aos que Libby present sobre los ejemplares de abetos de Douglas, sino que las fechas de radiocarbono concuerdan precisamente con las fechas reportadas de la muerte de Jin (los valores tericamente correctos) que estn dentro de la gama del error estadstico en los tres casos. Tabla b. Los estimados de radiocarbono y las fechas documentadas de la muerte de tres de los marqueses de Jin, por Wu et al. (2000). Name of Jin Marquis Radiocarbon Date (BCE) Documented Death Date (BCE) Jing 860-816 841 Li 834-804 823 Xian 814-796 812 La confiabilidad: la presentacin de la incertidumbre y el error Como consecuencia del error, las medidas cientficas no se reportan como valores sencillos, sino como gamas o promedios con barras de errores en un grfico o signos de en una tabla. Karl Pearson primero describi los mtodos matemticos para determinar la distribucin de la probabilidad de las medidas cientficas, y estos mtodos forman la base de las aplicaciones estadsticas en la investigacin cientfica. Las tcnicas estadsticas nos permiten estimar y reportar el error que rodea un valor, despus de que se han repetido las medidas de ese valor. Por ejemplo, Libby y Wu reportaron sus estimados como registros de una desviacin estndar, alrededor de la medida media, o promedio. La desviacin estndar provee una medida del registro de variabilidad de medidas individuales y especficamente, define un registro que contiene un 34.1% de las medidas individuales por encima del valor medio y 34.1% de aquellos por debajo de la media. La desviacin estndar de un registro de medidas puede ser usada para calcular un intervalo de confiabilidad alrededor del valor. Las declaraciones de confiabilidad no proveen, como creen algunos, un clculo de cun correcta es una medida. Por el contrario, una declaracin de confiabilidad describe la probabilidad por la cual un registro de medidas se superpondr al valor medio de la medida cuando se repite un estudio. Esto puede sonar un poco confuso, pero considere un estudio de Yoshikata Morimoto y sus colegas, quienes examinaron el promedio de la velocidad del lanzamiento de ocho jugadores de baseball de la universidad (Morimoto et al., 2003). Cada uno de los pitchers tena que hacer seis lanzamientos y el promedio de la velocidad fue de 34.6 m/s (77.4 mph) con un 95% de intervalo de confianza de 34.6 0.2 m/s (34.4 m/s a 34.8 m/s). Ms adelante, cuando repiti este estudio y cada uno de los 8 pitchers tena que hacer 18 lanzamientos, el promedio de la velocidad fue de 34.7 m/s, exactamente dentro del intervalo de confianza obtenido durante el primer estudio. En este caso, no hay un valor tericamente correcto, sino que el intervalo de confianza provee un estimado de la probabilidad de que se encontrar un resultado similar si se repite el estudio. Debido a que Morimoto determin un intervalo de confianza de 95%, si repitiese su estudio 100 veces (sin agotar a sus pitchers), su intervalo de confianza se superpondra con la media de la velocidad del lanzamiento 95 veces, y los otros cinco estudios probablemente, produciran velocidades de lanzamiento que estaran fuera del intervalo de confianza.

En la ciencia, un indicador importante de la confiabilidad para la medida es la cantidad reportada de cifras significativas. Morimoto report sus medidas a una dcima (34.6 m/s) ya que su instrumentacin tena este nivel de precisin. Pudo distinguir las diferencias en los lanzamientos de 34.6 m/s a 34.7 m/s. Si hubiese redondeado sus medidas a 35 m/s, hubiese perdido una cantidad de detalles contenidos en sus datos. Es ms, su instrumentacin no tena la precisin necesaria para reportar figuras significativas adicionales (por ejemplo, 34.62 m/s).Cuando se reportan figuras significativas, se puede introducir errores substanciales en un conjunto de datos. La propagacin del error Como reconoci Pearson, la incertidumbre en la investigacin cientfica es inherente, y por esta razn es clave para los cientficos reconocer y tomar en cuenta los errores dentro de un conjunto de datos. Ignorar la fuente de un error puede conducir a la propagacin y magnificacin de ese error. Por ejemplo, en 1960 el matemtico y meteorlogo americano Edward Norton Lorenz estaba trabajando en un modelo matemtico para predecir el clima. Lorenz estaba usando una computadora Royal McBee para resolver iterativamente 12 ecuaciones que expresaban relaciones como las que existen entre la presin atmosfrica y la velocidad del viento. Lorenz introduca en la computadora valores de punto de partida para diferentes variables, como temperatura, velocidad del viento y presin atmosfrica en cualquier da en varias ubicaciones. El modelo calculaba los cambios de temperatura durante un periodo definido de tiempo. El modelo recalculaba los cambios climticos de un da en incrementos de cada minuto e imprima nuevos parmetros. En una ocasin, Lorenz decidi repetir un modelo de escenario particular. En vez de empezar al principio, lo que hubiese tomado muchas horas, decidi empezar a la mitad del proceso, consultando la impresin de los parmetros y reintroducindolos en su computadora. Despus dej su computadora durante la hora que le tomara recalcular el modelo, esperando volver y encontrar un patrn climtico similar al que se haba predicho previamente. Inesperadamente, Lorenz encontr que el resultado de las predicciones climticas era completamente diferente de los patrones originales que haba observado. De lo que no se dio cuenta Lorenz en ese momento, fue que mientras su computadora guardaba los valores numricos de los parmetros modelo de seis cifras significativas (por ejemplo 0.639172), su impresin, y por consiguiente los nmeros que el introduca cuando volva a empezar su modelo, estaba redondeados a tres figuras significativas (0.639). La diferencia entre los dos nmeros es mnima, representando un margen de error sistemtico inferior a 0.1% - menor que una milsima del valor de cada parmetro. Sin embargo, con cada iteracin de su modelo (y haba miles de iteraciones), este error se acrecentaba, multiplicndose varias veces, haciendo que su resultado final fuese completamente diferente de la primera ejecucin del modelo. Como se puede observar en la Figura i, el error se mantiene aparentemente pequeo, pero despus de unos cuantos cientos de iteraciones, crece exponencialmente hasta llegar a una magnitud equivalente al valor de la medida en s (~0.6).

Figura i: Representacin de la propagacin del error en un sistema iterativo dinmico. Despus de ~1,000 iteraciones, el error equivale al valor de la medida en s (~0.6), haciendo que el clculo flucte completamente. Lorenz public sus observaciones en el trabajo clsico Deterministic Nonperiodic Flow (Lorenz, 1963). Sus observaciones lo llevaron a concluir que las predicciones acertadas del clima en el curso de un periodo superior a unas cuantas semanas, era extremadamente difcil tal vez imposible - debido a que hasta los pequesimos errores en la medida de las condiciones naturales se acrecentaban y alcanzaban rpidamente niveles equivalentes a las medidas en s. El trabajo motiv a otros investigadores a empezar a observar otros sistemas dinmicos que son similarmente sensibles a las iniciales condiciones del comienzo, como el flujo del agua en un ro o la dinmica del cambio de poblacin. En 1975, el matemtico y fsico americano James Yorke y su colaborador, el matemtico nacido en China Tien-Yien Li, acuaron el trmino caos para describir estos sistemas (Li & Yorke, 1975). De nuevo, al contrario del uso comn del trmino caos, que implica aleatoriedad o un estado de confusin, la ciencia del caos no trata sobre lo aleatorio. Por el contrario, como Lorenz lo hizo primeramente, los investigadores del caos trabajan para entender los patrones subyacentes del compartimento en los sistemas complejos para entender y cuantificar esta incertidumbre. El reconocimiento y la reduccin del error La propagacin del error no est limitada al modelado matemtico. Siempre es una preocupacin en la investigacin cientfica, especialmente en los estudios que proceden en pasos de incrementacin mltiple, debido a que el error en un paso puede incrementarse fcilmente en el siguiente paso. Como consecuencia, los cientficos han desarrollado varias tcnicas para ayudar en la cuantificacin del error. El uso de los controles en la experimentacin cientfica ayuda a cuantificar el error en un experimento e identifica el error sistemtico, ya sea para medirlo o eliminarlo. En la investigacin que implica el juicio humano, como en los estudios que tratan de cuantificar la percepcin del alivio del dolor despus de que se haya administrado un analgsico, los cientficos trabajan frecuentemente para minimizar el error al usar pruebas ciegas. En las pruebas ciegas, se compara el tratamiento (i.e. el medicamento) al control (i.e. otro medicamento o un placebo); ni el paciente ni el investigador saben si el paciente est

recibiendo el tratamiento o el control. De esta manera, se evita el error sistemtico, debido a las preconcepciones sobre la utilidad del tratamiento. A veces se llama garanta de calidad, o control de calidad, a la reduccin del error y los esfuerzos para medir en la investigacin cientfica. La garanta de calidad generalmente se refiere a los planes del investigador para minimizar o medir el error en su investigacin; el control de calidad se refiere a los procesos mismos implementados en la investigacin. Los trminos son comnmente intercambiados y unidos, como garanta de calidad/ control de calidad" (GC/CC). La GC y el CC incluyen pasos tales como el calibrado de instrumentos o medidas comparados a estndares conocidos, el reporte de todos los lmites de deteccin de instrumentos, la implementacin de procedimientos estndares para minimizar el error humano, la documentacin completa de los mtodos de investigacin, la duplicacin de las medidas para determinar la precisin y muchas otras tcnicas, frecuentemente especficas al tipo de investigacin que se est realizando. La reduccin del error estadstico es frecuentemente tan simple, como la repeticin de una medida de investigacin u observacin variada para reducir la incertidumbre en el registro de valores obtenidos. El error sistemtico puede ser ms difcil de precisar, introducindose sigilosamente en la investigacin, debido al sesgo instrumental, errores humanos, diseo pobre de investigacin o presunciones erradas sobre el comportamiento de las variables en un sistema. Desde este punto de partida, la identificacin y cuantificacin de la fuente del error sistemtico en una investigacin, puede ayudarles a los cientficos a entender mejor el comportamiento del sistema en s.

EJERCICIOS DE APLICACION 1.- La resistencia a la compresin de una serie de muestras de cemento puede modelarse con una distribucin normal con media 6000 Kg/cm2, y una desviacin estndar de 100 Kg/cm2. a). Cual es la probabilidad de que la resistencia de una muestra sea menor que 6250 Kg/cm2?. b). Cual es la probabilidad de que la resistencia de una muestra se encuentre entre 5800 y 5900 Kg/cm2?, c). Cual es el valor de resistencia que excede el 95% de las muestras?. R: a.0.994 b.0.136 c.5836 2.- La resistencia a la traccin de un papel esta modelada por una distribucin normal con media 35 lb/pul2, desviacin estndar de 2 lb/pulg2. a) cual es la probabilidad que la resistencia de una muestra sea menor que 40 lb/in2. b). si las especificaciones requieren que la resistencia sea mayor que 30 lb/in2 Qu proporcin de las muestras ser desechada?. 3.- Se supone que el ancho de una herramienta utilizada en la fabricacin de semiconductores tiene una distribucin normal con media 0,5 micrones y desviacin estndar de 0.05 micrones. a) cual es la probabilidad de que el ancho de la herramienta sea mayor que 0.62 m. b) cual es la probabilidad de que al ancho de la herramienta se encuentre entre 0.47 y 0.36 m c) debajo de que valor esta el ancho de la herramienta en el 90 % de las muestras?. R: a.0.001 b.0.721 c. 0.564. 4.- La longitud de un estuche moldeado por inyeccin para una cinta magntica tiene una distribucin normal con una media de 90.2 mm y desviacin estndar de 0.1 mm. a). cual es la probabilidad de que la longitud de una pieza sea mayor que 90.3 mm o menor que 89.7 mm. b). A que valor debe ajustarse la media del proceso para que el mayor nmero de partes tenga una longitud entre 89.7 y 90.3 mm c). Si se desechan los estuches cuya longitud no est entre 89.7 y 90.3 mm Cul es el rendimiento del proceso para el valor de la media determinada en el inciso b? 5.- El dimetro del punto producido por una impresora tiene una distribucin normal con media 0.002 pulg y desviacin estndar de 0.0004 pulg. a). cual es la probabilidad de que el dimetro del punto sea mayor que 0.0026 pulg? b). cual es la probabilidad que el dimetro del punto est entre 0.0014 y 0.0026 pulg c). Que valor debe tener la desviacin estndar del dimetro para que la probabilidad del inciso c sea 0.995?. Rptas: a. 0.067 b. 0.866 c. 0.000214 6.- Un vendedor ofrece un producto qumico para eliminar el amargor de jugos ctricos y asegura que su producto elimina el 50% del amargor total, y una desviacin estndar de 10.4. Un productor de jugos interesado en el producto, desea probarlo en jugos envasados en botellas. Para probar la afirmacin del vendedor se toma una botella de jugo al azar, cual es la probabilidad de que el proceso elimine al menos 33.7% del amargor? Rpta. P=0.94 7.- Al preguntar a 100 familias por el nmero de hijos, hemos obtenido los siguientes resultados:

Estudia si es aceptable considerar que estos datos provienen de una distribucin normal. 8.- Comente la evolucin de los conceptos de precisin y exactitud en el desarrollo de la tcnica de datacin con carbono 14.

S-ar putea să vă placă și