Documente Academic
Documente Profesional
Documente Cultură
ESTADISTICA Y LA ESTIMACION
DE LA INCERTIDUMBRE
ALVARO BERMUDEZ CORONEL
ING. QUIMICO Esp.
ESTADISTICA
La estadstica es una ciencia que se encarga de la
coleccin, clasificacin, sntesis, organizacin, anlisis e
interpolacin de los datos de una manera cientfica.
Estadstica descriptiva: se encarga de la organizacin,
sntesis y descripcin de los datos.
Estadstica no paramtrica: la rama de la estadstica
inferencial dedicada a las pruebas libres de distribucin.
Inferencia estadstica: Conjunto de tcnicas que nos
permite sacar conclusiones sobre la Poblacin a partir
de la informacin que nos da la muestra.
TECNICAS INFERENCIALES
Se apoya en el conocimiento de las
muestras y utiliza ciertas distribuciones de
probabilidad como herramientas de
anlisis.
a) paramtricas y no paramtricas
b) estimacin y contrastacin
c) clsicas y Bayesianas
DATOS
Poblacin: es un conjunto de datos, objetivo del estudio en
inters.
Muestra: es el subconjunto de datos seleccionados de una
poblacin.
Datos: los datos pueden ser de tipo cuantitativo (escala numrica)
o de tipo cualitativo o categricos, no tienen una interpolacin
cuantitativa, solo pueden clasificarse.
Estadstica: Medidas descriptivas numricas calculadas a partir
de los datos de las muestras.
Parmetro: medidas descriptivas numricas calculadas a partir de
la poblacin (para esto generalmente se emplean letras griegas).
Estimador: Es aquel estadstico que toma valores en el espacio
paramtrico. Tienen la propiedad de informar sobre el valor de los
parmetros poblacionales desconocidos.
VARIABLES
Variable aleatoria: cuando una medicin de una variable
se realiza es prcticamente imposible lograr la misma
combinacin de factores de cada combinacin. Para la
variable aleatoria se emplea generalmente la letra X y para
la medicin de la variable x.
Variable aleatoria continua: Cuando una variable aleatoria
puede tomar valores en una escala continua, se le
denomina variable continua. Esto es, el conjunto es un
intervalo sobre R.
Variable discreta: Para una variable aleatoria discreta
siempre es posible contar su conjunto de resultados
posibles. Valores finitos contables o no contables.
Distribuciones muestrales: La distribucin de probabilidad
de un estadstico muestral, se llama distribucin muestral
REPRESENTACION DE DATOS
GRAFICA DE PUNTOS
HISTOGRAMAS
GRAFICA DE BARRAS
HISTOGRAMAS
TECNICAS DE CONSTRUCCION
EJERCICIO
1,2
1,57
0,74
1,32
0,96
1,23
3,75
1,16
1,38
1,59
0,16
2,47
1,94
0,03
2,01
0,19
1,32
0,71
0,02
1,4
0,89
0,82
0,47
3,07
4,12
DESCRIBIPCION DE DATOS
CUANTITATIVOS
Estos se pueden clasificar en tres grupos:
Los que ayudan a encontrar el centro
(medidas de tendencia central) de la
distribucin de puntos.
Las que miden su dispersin (medidas de
variacin)
Las que describen la posicin relativa de
un observacin dentro de un conjunto de
datos, (medidas de posicin relativa)
MEDIDAS DE TENDENCIA
CENTRAL
y
i 1
m y( n / 2) y( n / 21)
par
MEDIDA DE TENDENCIA
CENTRAL
La moda. Si tenemos n mediciones y1, y2 . yn,
denominamos moda al valor que mas se repite.
La moda puede no existir, e incluso no ser nica, en
caso de existir, en este caso estamos frente a una
distribucin multimodal o bimodal ( joroba de camello).
En el caso de metrologa, puede ser muy til para un
estudio de repetibilidad.
Para frecuencias unimodales que sean poco asimtricas
se tiene l a siguiente relacin emprica:
Media moda = 3 (media mediana)
MEDIDAS DE DISPERSION
Intervalo. El intervalo para un conjunto de valores es la
diferencia entre el valor mayor y el menor.
Intervalo = ymax ymin
Dos conjuntos de datos pueden tener el mismo intervalo
pero diferente agrupacin. El intervalo es insensible a la
variacin de los datos dentro de sus lmites.
Varianza. La varianza de un conjunto de mediciones y1,
y2 . yn es la medida del cuadrado de la desviaciones
de las mediciones
respecto a su media.
n
n
s2
(y
i 1
y)
n 1
(y
i 1
MEDIDAS DE DISPERSION
La desviacin estndar o desviacin
tpica. Se define como la raz cuadrada de
la varianza.
n
( y y)
i 1
n 1
( y )
i 1
DESVIACION TIPICA
1 68 %
2 95 %
3 99 %
68%
95%
99%
EJEMPLO
El contenido de
sulfatos en una
muestra de un
efluente lquido
industrial arroja los
siguientes resultados
en mg/L obtenidos a
lo largo de un mes.
8,34
41,70
31,84
25,02
34,87
21,99
11,37
45,49
34,12
20,47
28,81
21,99
13,65
15,16
29,57
41,70
30,33
23,50
25,78
22,74
9,10
43,97
32,60
34,12
14,40
21,99
12,13
47,00
16,68
25,78
SOLUCION
MEDIA
26,21
INTERVALO
38,66
MEDIANA
25,40
VARIANZA
122,59
MODA
21,99
DES. TIPICA
11,07
EL MUNDO DE LAS
PROBABILIDADES
MODELO NO DETERMINISTICO.
EXPERIMENTO ESTADISTICO
Un experimento es el proceso de obtener una observacin o realizar
una determinacin. Un experimento que tiene las siguientes
caractersticas es llamado experimento aleatorio o estadstico.
1. Todos los posibles resultados del experimento son conocidos
antes de hacer una realizacin del experimento.
2. El resultado exacto en cualquier ejecucin del experimento no es
predecible (aleatoriedad)
3. El experimento puede ser repetido bajo (ms o menos) idnticas
condiciones.
4. Existe un patrn predictible a lo largo de muchas ejecuciones
(regularidad estadstica)
Ejemplo: Una bombilla manufacturada en una planta es expuesta a una prueba
de vida y el tiempo de duracin de una bombilla es registrado... En este caso no
se conoce cual ser el tiempo de duracin de la bombilla seleccionada, pero
claramente se puede conocer de antemano que ser un valor entre 0 e horas.
ESPACIO MUESTRAL
S
E2
E1
E4
E3
LA FUNCION DE
PROBABILIDAD.
RECTANGULAR
TRIANGULAR
T ESTUDEN
NORMAL
DISTRIBUCION RECTANGULAR
O UNIFORME
En una distribucin rectangular cada valor en un
intervalo dado tiene la misma probabilidad, o
sea la funcin de densidad de probabilidad es
constante en este intervalo.
Ejemplos tpicos son la resolucin de un
instrumento digital o la informacin tcnica
sobre tolerancias de un instrumento.
En general, cuando exclusivamente hay
conocimiento de los lmites superior e inferior
del intervalo de variabilidad de la magnitud de
entrada, lo ms conservador es suponer una
distribucin rectangular.
FUNCION DE PROBABILIDAD
RECTANGULAR O UNIFORME
Se dice que una variable X posee una distribucin
uniforme en el intervalo [a,b], si y solo si esta definida por
la siguiente funcin de densidad y funcin de distribucin:
f ( x)
1
a b
0
a xb
en otra parte
ab
E ( x)
2
2
(
b
a
)
2
12
V ( x) 2 E ( x ) 2 E ( x 2 ) 2
VARIANZA
DISTRIBUCION TRIANGULAR
Si adems del conocimiento de los lmites superior e
inferior hay evidencia de que la probabilidad es ms alta
para valores en el centro del intervalo y se reduce haca
los lmites, puede ser ms adecuado basar la estimacin
de la incertidumbre en una distribucin triangular.
Por ejemplo, en un bao termostatito, que se utiliza para
medir la densidad de un lquido, la temperatura puede
tener una ligera deriva. Si se mide la temperatura antes
y despus de la medicin de la densidad resultando en
T1 y T2), se pude suponer para el momento de la
medicin de la densidad una temperatura de (T1+T2)/2
con una distribucin triangular entre T1 y T2 .
DISTRIBUCION TRIANGULAR
(c ) x
c2
(c ) x
f ( x)
c2
(c )
Si c x
Si x c
En otra parte
ab
V (c ) c
DISTRIBUCION NORMAL
Los resultados de una medicin repetida
afectada por magnitudes de influencia que
varan
aleatoriamente,
generalmente
siguen en buena aproximacin una
distribucin normal. En particular, la
distribucin de la media de una serie de
mediciones repetidas se prxima a una
normal
independientemente
de
la
distribucin de las lecturas individuales
IMPORTANCIA DE LA
DISTRIBUCION NORMAL
FUNCION DE PROBABILIDAD
Frecuencia
100
=8,5
0,1
50
unidades
8.0
8.1
8.2
8.3
8.4
8.5
8.6
8.7
8.8
8.9
DATOS
-4
-3
-2
-1
FUNCION DE T STUDENT
Definicin. Una variable aleatoria se distribuye segn el
modelo de probabilidad t o T de Student con k grados de
libertad , donde k es un entero positivo, si su funcin de
densidad es la siguiente :
FUNCION DE T STUDENT
RESUMEN DE ESTIMADORES
LA NORMAL ESTANDAR
Distribucin Normal
Estndar
La distribucin de
probabilidad de una
variable aleatoria
normal con media
cero y varianza 1 se
llama distribucin
normal estndar.
Funcin de Densidad
Normal (0,1)
INTERVALOS DE CONFIANZA
La tcnica de la estimacin confidencial consiste
en asociar a cada muestra un intervalo que se
sospecha que debe contener al parmetro de
inters. A ste se le denomina intervalo de
confianza.
Tambin se denomina nivel de significacin a la
probabilidad de equivocarnos.
Para una distribucin normal el 95% de los
datos (es decir el 95% del rea bajo la curva)
cae dentro de los lmites z = -1,96 a z = 1,96.
Puede decirse que el 95% de los datos estarn
dentro de los lmites: m 1,96s
INTERVALOS DE CONFIANZA
1,96
x 1,96
n
n
xz
NORMAL O T-STUDENT
De acuerdo con el numero de datos
podemos considerar o no que estos
tienen una distribucin normal o de tstudent
x z
2
x t
2
para n 30
para n 30
PRUBAS DE HIPOTESIS
Decisin Tomada
Aceptar H0
Rechazar H0
H0 verdadera
No existe error
Tipo I (falso
positivo, )
H0 falsa
Tipo II (falso
negativo, )
No existe error
Resultado
verdadero
EJEMPLO
Se efectuaron seis rplicas y dieron los
siguientes resultados:
98,9; 100,3; 99, 7- 99,0; 100,6; 98,6
(n = 6; x = 99,5; s= 0,81).
Como es desconocida, entonces
usaremos el valor de t para calcular el
intervalo de confianza:
99,5 t 0.025 , 5 s
99,5 2,57
0,81
6
99,5 0,85
APLICACIN EN EXCEL
VALIDACION
t
x 0
s
99,5 100,0
0,813
1,51
EJEMPLO
Se efectuaron cuatro rplicas (n= 4).
El promedio = 98,2 mg y = 0,80.
Se necesita saber si el promedio obtenido
es estadsticamente diferente de la
cantidad 0 = 100,0 mg que se esperaba
encontrar.
H: = 0
= 100,0 mg
H1: 100,0 mg
SOLUCION
El rea fuera de este intervalo de confianza es del 5 %
(a = 0,05) y como la curva de distribucin es simtrica
con la media (98,2) como centro este, 5 % debe
distribuirse a ambos lados (colas) de las curvas (2,5 %
para cada lado).
98, z
2
n 98,2 1.96
LA APLICACIN EN EXCEL
x 0
98,2 100,0
0,8 2
4,50
COMPARACION DE VARIANZAS
La comparacin de dos varianzas 1 y 2,
estimadas por s1 y s2 se lleva a cabo
empleando el test F (a dos colas):
F
s12
s 22
s12
Si F 2 3 las varianzas son estadsticamente iguales
s2
s12
Si F 2 3 las varianzas son estadsticamente distintas
s2
H0: 1 = 2
H1: 1 2
1
s
1
s
1
2
2
s2 1
n1 n2 2
x1 x 2
s 2 1 n1 1 n 2
ANALISIS DE REGRESION Y
CORRELACION
b
x x
i
a y bx
y
n
media
s e2
yi yi
n2
media
EJEMPLO
30
25
20
15
10
5
0
0
10
[Hg] / ug/L
15
Respuesta Instrumental
Respuesta Instrumental
SOLUCION
30
25
20
15
10
5
0
0
y = 1.9886x + 1.0133
R2 = 0.9989
10
15
[Hg] / ug/L
tcal = 47,6 en tablas obtenemos para un test a dos colas, = 0,05 y n = 5 que:
tcrt = 2,57
Como tcal > tcrt , rechazamos la hiptesis nula y por tanto concluimos que existe
correlacin lineal, para nuestra calibracin al 96 % de confianza.
INCERTIDUMBRE DE MEDICION
Un parmetro
asociado con los
resultados de una
medicin que
representa la
dispersin de los
valores que pueden
ser razonablemente
atribuidos al
mensurando.
INCERTIDUMBRE Y TOLERANCIA
Incertidumbre: Un parmetro asociado con los
resultados de una medicin que representa la
dispersin de los valores que pueden ser
razonablemente atribuidos al mensurando.
Tolerancia: Intervalo en donde puede ser
admitido como conforme un producto o un
resultado de la medicin de una magnitud.
INCERTIDUMBRE Y
TOLERANCIA
MEDICION
INCERTIDUMBRE
ERROR O INCERTIDUMBRE
Es frecuente encontrar documentos y
textos donde se trata al error y a la
incertidumbre como sinnimos. Sin
embargo, las directrices de la comunidad
metrolgica internacional expresadas
durante la ltima dcada en documentos
como el VIM, establecen una clara
diferencia entre ambos conceptos.
INCERTIDUMBRE
Mtodos para estimar la incertidumbre:
Estimacin experimental de contribuciones
individuales
Programas de ensayos de aptitud
Informacin de los proveedores p.e. certificados de
calibracin
Modelado a partir de principios tericos
Estimacin basada en el juicio
COMPONENTES
Componente de incertidumbre tipo A: Es la
incertidumbre obtenida exclusivamente por medios
estadsticos, la mejor estimacin es la desviacin
estndar.
Componente de incertidumbre tipo B: Es la
incertidumbre obtenida por medios diferentes a los
estadsticos, tales como resolucin del equipo,
certificados de calibracin, datos del fabricante,
tablas, pruebas anteriores, tipos de distribucin.
Esta incertidumbre tiene su origen en los errores
sistemticos presentes en la medicin .
LA INCERTIDUMBRE
COMO EVALUARLA
Proceso de estimacin de la incertidumbre:
Paso 1: Especificar la magnitud
Paso 2: Ecuacin de relacin
Paso 3: Identificar la fuentes de incertidumbre
Paso 3: Cuantificar y reducir los componentes
Paso 4: Calcular la incertidumbre combinada
Paso 5: Estimar el factor de cobertura
Al estimar la incertidumbre de la
medicin, se debe tomar en cuenta
todos los componentes de la
incertidumbre que sean
importantes en una situacin dada,
utilizando mtodos de anlisis
aceptados.
EL GRAN PROBLEMA
La incertidumbre de medicin, calificada
en ocasiones como un gran problema
verdaderamente no lo es y no existe
situacin real alguna donde lo sea,
simplemente que su calculo juzga por si
mismo cuanto conocemos del proceso de
medicin en los que nos desempeamos
da a da.
FACTORES DE INFLUENCIA EN
LA MEDICION
Objeto de la medicin
El procedimiento de medicin
Los instrumentos de medicin
El ambiente de medicin
El observador
El mtodo de calculo
Tambin encontramos la
magnitudes de influencia.
Definicin incompleta del
mensurando
Realizacin imperfecta del
mensurando
Muestreo
Conocimiento inadecuado de
lo efectos ambientales
Error de lectura del
instrumento
Valores inexactos de los
patrones
Valores inexactos de las
constantes y modelos
matemticos
Aproximaciones y
simplificaciones
Variacin de las observaciones
repetidas.
LA INCERTIDUMBRE ASOCIADA
Para un resultado de una medicin y, la
incertidumbre
estndar
combinada
denotada uc(y), es una desviacin
estndar estimada igual a la raz cuadrada
positiva de la varianza total obtenida por la
combinacin de todas las componentes de
la incertidumbre, siguiendo la metodologa
de
la
ley
de
propagacin
de
incertidumbres.
PASOS
Paso 1
Especificacin del mensurando
Establecer el modelo fsico, identificando
las variables de entrada Xi que permitan
establecer el modelo matemtico.
Paso 2
Identificacin de las fuentes de
incertidumbre
PASOS
Paso 3
Cuantificacin y reduccin
Asignar una funcin de distribucin a cada
fuente
Convertir la componente a componentes
estndar u(xi)
Estimar correlaciones
PASOS
Paso 4
Calcular la incertidumbre estndar
combinada uc(y). Matriz de presupuesto
Revisar y analizar las componentes.
Diagrama de Pareto.
Estimacin de la incertidumbre expandida.
Factor de cobertura.
u 2c ( y ) u i2 ( y )
i 1
u c ( y)
c
i 1
u ( xi )
2
u ( xi )
i 1 X i
uc ( y )
u ( xi )
i 1 X i
s( xi , x j )
s( xi ) s( x j )
f f
u ( xi ) u ( x j ) r ( Xi, Xj )
i , j 1 X i X j
N
i j
1 n
s( xi , x j )
( xik xi ) ( x jk x j )
n(n 1) k 1
ORRELACION +1 -1
En los casos en que la correlacin es igual a +1
o -1 el termino para la estimacin de la
incertidumbre se establece por la siguiente
ecuacin:
f
uc ( y )
u ( xi )
i 1 X i
N
ESTIMACION A PARTIR DE LA
INCERTIDUMBRE RELATIVA
Si el modelo matemtico se
productos de las magnitudes de
clculo (numrico) de la
combinada se facilita utilizando
relativas
N
compone de
entrada Xi , el
incertidumbre
incertidumbres
f ( X i ,.... X N ) K ( X i )
pi
i 1
uc ( y )
u ( xi )
( pi
xi
i 1
N
yobs mx pred b
u ( x pred )
n
sy
m
s xx ( yi y )
i 1
1 1 ( x pred y )
p n
s xx
n
sy
i 1
obsi
mx pred b
n2
DESCRIPCION
m = pendiente
p = nmero replicas para determinar x
n = nmero de datos para la
calibracin
sy = varianza residual
sxx= suma de cuadrado de los errores
INCETIDUMBRE EXPANDIDA
La incertidumbre estndar uc tiene un valor igual a la
desviacin estndar de la funcin de distribucin del
mensurando. El punto medio del intervalo es le mejor
estimado del mensurando contiene el valor verdadero con
una probabilidad p de 68% aproximadamente, bajo la
suposicin de una distribucin normal.
Para una probabilidad mayor de 68%, se obtiene
expandiendo este intervalo por un factor k, llamado factor de
cobertura. El resultado se denomina
incertidumbre
expandida U.
k = 1 corresponde a p = 68,27 %, k = 2 corresponde a p =
95,45% y k = 3 a p = 99,73 %.
GRADOS EFECTIVOS DE
LIBERTAD
De cierta manera el nmero de grados de
libertad asociado a una distribucin de una
magnitud (Xi o Y) puede considerarse una
medida de incertidumbre de la incertidumbre
de esa magnitud. Entre mayor sea la
estimacin de la incertidumbre ser ms
confiable.
El nmero efectivo de grados de libertad ef
del mensurando considera el nmero de
grados de libertad i de cada fuente de
incertidumbre.
GRADOS EFECTIVOS DE
LIBERTAD
La determinacin del nmero de grados de libertad implica el criterio del
metrlogo soportado por su experiencia, aun cuando sea subjetiva,
para determinar la incertidumbre relativa de la propia incertidumbre, y
calcular el nmero de grados de libertad para esa fuente especfica.
Si u(xi) es cero, es decir, el metrlogo est completamente seguro del
valor de u(xi) , el nmero de grados de libertad asociado a esa fuente
es infinito. Si el metrlogo considera que u(xi) tiene una incertidumbre
del 50%, el nmero de grados de libertad es de slo 2, y si la considera
del 20% el nmero de grados de libertad asciende a 12.
1 u ( xi )
1 u ( xi )
i 2 2
2 u ( xi ) 2 u ( xi )
2
GRADOS EFECTIVOS DE
LIBERTAD
DISTRIBUCION
GRADOS DE LIBERTAD
NORMAL
200
RECTANGULAR
50
TRIANGULAR
30
GRADOS EFECTIVOS DE
LIBERTAD
El nmero efectivo de grados de libertad
se calcula segn la ecuacin de WelchSatterthwaite.
ef
uc ( y )
n
ui ( y )
i
i 1
MATRIZ DE PRESUPUESTO
COMPONENTE
SMBOLO
FUENTE
VALOR
DISTRIBUCIN
DE LA
PROBABIL
IDAD
COEFICIENTE
DE
SENSIBIL
IDAD
INCERTIDUMBR
E
COMBIN
ADA
CUADRADO
INCERTI
DUMBRE
COMBIN
ADA
GRADOS
LIBERTA
D
EJERCICIOS
MUCHAS GRACIAS