Sunteți pe pagina 1din 29

1

ESTUDIOS INTERLABORATORIOS
Notas
Indice
1. PLANIFICACIN DE LOS ESTUDIOS INTERLABORATORIOS....................................1
2. ELECCIN DE LOS LABORATORIOS...........................................................................2
3. MATERIALES PARA LAS PRUEBAS..............................................................................4
3.1. Nmero de niveles de las pruebas............................................................................................................. 4
3.2. Nmero de replicados ................................................................................................................................ 4
3.3. Especmenes reservados........................................................................................................................... 4
3.4. Homogeneizacin de especmenes ........................................................................................................... 5
4. DISTRIBUCIN DE LOS ESPECMENES......................................................................5
4.1. Aleatorizacin de especmenes.................................................................................................................. 5
4.2. Expedicin .................................................................................................................................................. 5
5. INSTRUCCIONES, PROTOCOLO DEL EXPERIMENTO ...............................................5
5.1. Instrucciones del experimento.................................................................................................................... 5
5.2. Protocolo del experimento.......................................................................................................................... 6
6. PROCEDIMIENTO ESTNDAR PARA EL ANLISIS ESTADSTICO DE LOS
RESULTADOS DEL ESTUDIO............................................................................................6
6.1. Modelo estadstico bsico .......................................................................................................................... 6
6.2. Clculos estadsticos iniciales.................................................................................................................... 7
6.3. Tests de consistencia............................................................................................................................... 10
6.4. Expresin de la precisin de los resultados............................................................................................. 16
7. UNA APROXIMACIN ALTERNATIVA, EL ANLISIS ESTADSTICO DE YOUDEN...17
7.1. Anlisis de Youden................................................................................................................................... 17
7.2. Grfico de Youden.................................................................................................................................... 17
7.3. Anlisis de Youden: clculos.................................................................................................................... 19
8. APLICACIN DE LOS RESULTADOS DE LA PRUEBA DE PRECISIN....................23
8.1. Generalidades .......................................................................................................................................... 23
8.2. Comparacin de diferentes mtodos analticos ....................................................................................... 24
9. VALORACIN DE LAS PRESTACIONES DE LOS LABORATORIOS .........................26
9.1. Tipos de valoracin .................................................................................................................................. 27
9.2. Procedimientos estadsticos y criterio...................................................................................................... 27
10. BIBLIOGRAFA............................................................................................................28
1. Planificacin de los estudios interlaboratorios
Antes de empezar un estudio interlaboratorios, un grupo de trabajo (llamado panel en la norma ISO 5725)
se necesita con total responsabilidad para la planificacin de dicho estudio incluyendo costes, nmero de
laboratorios, materiales para las pruebas, etc. Este grupo de trabajo constara de expertos familiarizados
con los mtodos analticos y sus aplicaciones.
Se elegir un coordinador con la responsabilidad para la planificacin detallada, incluyendo invitacin,
preparacin de las muestras, hojas de respuestas, resultados, valoracin preliminar y contacto directo con
los laboratorios participantes.
Una persona con adecuada competencia en mtodos estadsticos y conocimiento de la materia ser
designado como estadstico. Esta persona ser la responsable para el diseo estadstico y anlisis de
experimentos.
2
2. Eleccin de los laboratorios
Segn la opinin del responsable a algunos de los laboratorios considerados cualificados se les ofrecera la
oportunidad de participar en el estudio. Un laboratorio cualificado tendra:
facilidades apropiadas del laboratorio y equipamiento de pruebas
operadores competentes
familiaridad con el mtodo
reputacin de hacer anlisis fiables, y
suficiente tiempo e inters para hacer bien las cosas
En lo concerniente a la eleccin de los laboratorios, los patrones presentan ligeramente diferentes
opiniones:
Los trminos anteriores proceden de ASTM E 691. Sin suficiente familiaridad con el mtodo analtico puede
usarse un proceso de familiarizacin incluyendo una prueba piloto. La importancia de este paso de
familiarizacin no debe ser sobreenfatizado... Muchos estudios interlaboratorio resultan esencialmente
intiles debido a la falta de familiarizacin.
La norma ISO 5725-1: 1994 establece que Los laboratorios participantes no consistiran exclusivamente de
aquellos que haya adquirido especial experiencia durante el proceso de estandarizacin del mtodo.
Ninguno resultar un laboratorio de referencia especializada en orden a demostrar la exactitud para la cual
el mtodo puede `restar en manos expertas.
Uno puede concluir de lo dicho que, en orden s minimizar riesgos de algn sesgo, es importante incluir todo
tipo de laboratorios que usen el mtodo de una forma regular o hayan adquirido suficiente experiencia por
un pre-prueba.
Desde el punto de vista estadstico, los laboratorios participantes en un estudio interlaboratorio para estimar
la precisin sern elegidos de forma aleatoria de entre todos los laboratorios que usen el mtodo de prueba.
El nmero de laboratorios participantes en un estudio interlaboratorios ser suficientemente grande para
que resulte un corte transversal de la poblacin de laboratorios cualificados. De este modo la prdida o
pobres prestaciones de uno pocos no ser fatal para el estudio.
En la prctica, la eleccin del nmero de laboratorios ser un compromiso entre la disponibilidad de
recursos y el deseo de reducir la incertidumbre de los estimados a un nivel satisfactorio. El nmero de
laboratorios y el nmero de resultados de prueba (replicados) de cada laboratorio a cada nivel de la prueba
son interdependientes. El factor de incertidumbre A, a un nivel de probabilidad del 95 %, puede expresarse
mediante las siguientes ecuaciones:
Para repetibilidad:
( )
1
1, 96
2 1
r
A
p n
=

Para la reproducibilidad:
( ) ( )( )
( )
2
2
4 2
1 1 1 1
1, 96
2 1
R
p n n p
A
n p p

(
+ +

=

donde: r y R representan respectivamente repetibilidad y reproducibilidad,;


p es el nmero de laboratorios
n es el nmero de resultados de prueba (replicados)
es la razn de la desviacin tpica de reproducibilidad a la desviacin tpica de repetibilidad.
La relacin entre el factor de incertidumbre y el nmero de laboratorios se ilustra en las figuras 1 y 2. Se
puede ver como un nmero grande de laboratorios participantes reduce siempre la incertidumbre de los
estimados. Sin embargo, a veces el nmero de laboratorios cualificados para algunos mtodos recin
desarrollados es muy limitado. Una forma de resolver este problema es incrementar el nmero de
replicados, si la proporcin de reproducibilidad a repetibilidad no es muy grande, por ejemplo, inferior a 2, es
habitual elegir el nmero de laboratorios entre 8 y 15. Si la precisin de un mtodo de prueba se basa en
resultados previos aceptables, desde 6 laboratorios. La incertidumbre de los estimados ser mencionada
claramente en el informe final de la precisin.
3
Figura 1. Relacin entre la incertidumbre de la desviacin tpica de repetibilidad
y el nmero de laboratorios
4
Figura 2. Relacin entre la incertidumbre de la desviacin tpica de reproducibilidad
y el nmero de laboratorios
3. Materiales para las pruebas
3.1. Nmero de niveles de las pruebas
Los materiales que utilizados en los estudios interlaboratorio debern ser representativos de aquellos para
los cuales se espera aplicar el mtodo analtico. Es de esperar que diferentes materiales con diferentes
niveles de propiedad, produzcan valores ms altos o ms bajos de esta propiedad. El nmero de niveles de
prueba que deban incluirse en los estudios interlaboratorios depender de los siguientes factores:
el rango de niveles en la clase de materiales para ser analizados y la adecuada relacin de la precisin
para cada nivel del rango;
el nmero de diferentes tipos de materiales a los que se aplicar el mtodo;
las dificultades y costos implicados en la obtencin, procesamiento, y distribucin de las muestras;
la dificultad o perodo de tiempo requerido para de ejecucin de las pruebas y los costos que suponga;
la necesidad legal o comercial de obtener una estimacin de la precisin completa y fiable; y
la incertidumbre de la informacin previa en algunos de los puntos anteriormente mencionados.
En casos normales, deberan incluirse en un estudio interlaboratorio al menos tres materiales diferentes
representando tres diferentes niveles. Si el propsito es determinar la precisin de un mtodo de prueba,
deberan incluirse cinco o ms niveles. Puede reducirse el nmero de niveles si ya se conoce que la
precisin es relativamente constante o proporcional para el nivel medio del rango de valores de inters, o si
se trata de una investigacin piloto de un mtodo analtico recin desarrollado. El anlisis de Youden es una
excepcin, ya que usa solamente materiales a dos niveles.
3.2. Nmero de replicados
El nmero de replicados es generalmente de tres o cuatro. Se pueden usar dos replicados en los siguientes
casos:
el material se espera que sea muy homogneo;
se conoce que la desviacin tpica de reproducibilidad es significativamente mayor que la desviacin
tpica de repetibilidad, por ejemplo el valor de es mayor que 2;
el nmero de laboratorios es 15 o ms.
Si el material se espera que sea muy heterogneo, pueden ser necesarios hasta 10 replicados segn el
nivel de la incertidumbre.
3.3. Especmenes reservados
Se debe preparar suficiente cantidad de material para cubrir el experimento y reservar por si se producen
roturas accidentales o errores en la obtencin de algunos resultados que requieran material
complementario. Dependiendo del tipo de material y el nmero de laboratorios participantes, la cantidad de
material a reservar sera del 10 al 50 % del que se use directamente en el experimento. El coordinador
5
deber tomar las correspondientes decisiones sobre la cantidad de especmenes complementarios,
consultando con el grupo de trabajo.
3.4. Homogeneizacin de especmenes
Cuando un material tiene que ser homogeneizado, se har de la manera mas apropiada para ese material.
Despus de la homogeneizacin, muestreo estadstico ser analizado respecto a su homogeneidad. Si esta
prueba conduce a un considerable retraso en el programa se puede usar una prueba alternativa para la
valoracin indirecta de la homogeneidad. Si la subdivisin o reduccin de la muestra es una parte de los
procedimientos de la prueba, deber hacerse constar claramente en las instrucciones.
Cuando las pruebas tengan que ser realizadas en especmenes slidos que no pueden ser
homogeneizadas (tales como clculos, tejidos, etc.) y cuando las pruebas no puedan repetirse en la misma
pieza, la heterogeneidad en el material de prueba formar un componente esencial de la precisin del
mtodo. En este caso es importante distribuir los especmenes a cada laboratorio con la propiedad o
heterogeneidad tan similares como sea posible.
Debido a la heterogeneidad de algunos materiales concretos, la variacin entre especmenes puede ser a
veces muy grande. Esto se deber tener en cuenta en la evaluacin de la precisin de las tcnicas de
medida.
4. Distribucin de los especmenes
4.1. Aleatorizacin de especmenes
Todos los grupos de especimenes sern etiquetados y aleatorizados antes de la distribucin. La
aleatorizacin se puede hacer mediante una tabla de nmeros aleatorios, lotera o numeracin aleatoria por
ordenador.
Para algunos estudios interlaboratorios puede ser importante los aspectos de confidencialidad de los
resultados. En tal caso se puede contratar una empresa externa para la aleatorizacin y codificacin.
4.2. Expedicin
Los especmenes sern adecuadamente envasados para prevenir daos por impacto o sobrepeso y para
proteger su estabilidad y caractersticas durante el transporte. Si la propiedad del material es muy sensible a
la temperatura, deber utilizarse un medio de locomocin con temperatura acondicionada.
En el envase deber constar clara y correctamente el nombre y direccin del receptor para asegurar la
pronta entrega. Si el envo se va hacer a un pas donde es necesaria una declaracin del usuario, el
coordinador preparar suficiente documentacin, por ejemplo, facturas pro forma, unidas al envase.
Preferiblemente, el coordinador enviar previamente una copia de la documentacin relevante para la
declaracin de usuario del receptor. En ocasiones, dificultades en la declaracin del usuario pueden
provocar considerables retrasos en la entrega, y por tanto en el experimento.
Despus el envo de los especmenes, el coordinador informar a los receptores (contacto personal con los
laboratorios participantes) del envo incluyendo fecha de envo, nombre del correo, forma y peso del
paquete, manipulacin de los especmenes a la llegada, etc. A vuelta de correo, los receptores le informarn
de la llegada y condiciones de los especmenes.
5. Instrucciones, protocolo del experimento
5.1. Instrucciones del experimento
Es de suma importancia para el coordinador escribir claramente las instrucciones del experimento
incluyendo preparacin, calibracin y anlisis, especialmente cuando:
hay varias opciones en el mtodo;
el mtodo se ha desarrollado recientemente y algunos de los participantes pueden no tener experiencia;
existe alguna duda en la versin actual del mtodo estndar; o
la prueba consiste en una modificacin del mtodo estndar.
En las instrucciones se especificar el nmero de dgitos significativos. Generalmente, el nmero de dgitos
significativos en un estudio interlaboratorio es, si posible, uno ms que requerido en el mtodo estndar.
6
puede ser de gran ayuda para los operadores el disponer de utilizar tablas, figuras o fotografas, cuando sea
apropiado, para tener presente el procedimiento.
5.2. Protocolo del experimento
Es prudente por parte del coordinador preparar hojas estndar de protocolo para recordar los datos e
informar los resultados. Las unidades de medida y los dgitos significativos requeridos deben ser
expresados en el protocolo. La direccin de contacto del coordinador constar en el protocolo para facilitar
al operador contactar con l cuando surja alguna duda durante la prueba. En el protocolo habr suficiente
espacio para que el operador pueda tomar nota durante el procedimiento. Estas notas constituirn una
informacin til para la interpretacin la inconsistencia en los resultados de la prueba.
6. Procedimiento estndar para el anlisis estadstico de los resultados del estudio
6.1. Modelo estadstico bsico
El modelo estadstico bsico dado en la norma ISO 5725 para la estimacin de la inexactitud (inveracidad e
imprecisin) de un mtodo es:
y m B e = + +
Donde y es el resultado de la prueba;
m es la media general;
B es la componente del sesgo del laboratorio bajo condiciones de repetibilidad;
e es el error aleatorio que ocurre en cada medida bajo condiciones de repetibilidad.
El trmino B se considera constante bajo condiciones de repetibilidad, pero difiere en valor bajo otras
condiciones. En general, B puede considerarse como la suma de ambos componentes sistemtico y
aleatorio incluyendo diferentes condiciones climticas, variaciones en el equipamiento e incluso diferencias
en las tcnicas en los cuales los operadores son entrenados en sitios diferentes. De este modo la varianza
de B se llama varianza interlaboratorio y se expresa como:
( )
2
var
L
B =
donde
2
L
es el verdadero valor de la varianza interlaboratorio e incluye las variabilidades entre
operadores y entre equipamientos;
e representa el error aleatorio que ocurre en cada resultado de la prueba.
La varianza de un laboratorio simple, bajo condiciones de repetibilidad, se llama varianza intralaboratorio y
se expresa como:
( )
2
var
w
e =
donde
2
w
es el valor verdadero de la varianza intralaboratorio.
Es de esperar que
2
w
tenga diferentes valores en diferentes laboratorios debido a diferencias tales como
las habilidades de los operadores, pero se asume que para un mtodo de anlisis adecuadamente
estandarizado tales diferencias entre laboratorios seran pequeas. De este modo se establecera un valor
comn de la varianza intralaboratorio para todos los laboratorios a travs de la media aritmtica de las
varianzas intralaboartorio. Este valor comn se llama varianza de repetibilidad y se designa como:
( )
2 2
var
r w
e = =
y se obtiene a partir de todos los laboratorios participantes en el experimento de la exactitud despus de
eliminar los extremos (outliers).
De acuerdo con lo expuesto, la varianza de repetibilidad se mide directamente como la varianza del trmino
e , pero la varianza de reproducibilidad depende de la suma de la varianza de repetibilidad y la varianza
interlaboratorio. Como medida de la imprecisin, se requieren dos cantidades: la desviacin tpica de
repetibilidad
r
y la desviacin tpica de reproducibilidad
2
R
s :
7
( )
2
var (1)
r w
e = =
y
2 2 2
(2)
R L r
= +
En estas ecuaciones representa el valor verdadero de la desviacin tpica poblacional. En la prctica,
estas desviaciones estndar no son conocidas debido a que se utilizan poblaciones limitadas. Deben
hacerse estimaciones de los valores de la imprecisin a partir de muestras relativamente pequeas de todos
los posibles laboratorios y dentro de estos laboratorios a partir de una pequea muestra de todos los
posibles resultados de la prueba. En la prctica, el smbolo es sustituido por s para denotar que es una
estimacin.
6.2. Clculos estadsticos iniciales
6.2.1. Datos originales
Los resultados originales informados por los diferentes laboratorios son recogidos en hojas de trabajo y
generalmente organizados de tal manera que cada columna contiene los datos obtenidos de todos los
laboratorios para un nivel de prueba del material, y cada fila contiene los datos de un laboratorio para todos
los niveles. Un ejemplo se muestra en la tabla 1.
Tabla 1. Ejemplo de hoja de trabajo para la coleccin de los datos originales.
6.2.2. Media de celda y desviacin tpica de celda
La media de celda y la desviacin tpica de cada nivel de prueba son definidas por las siguientes
ecuaciones:
8
( )
1
2
1
1
1
1
1
i
i
n
i i j
j
i
n
i i j i
j
y y
n
s y y
n
=
=
=
=

donde
i
y es la media de la celda en el laboratorio i ;
i
n es el nmero de resultados de prueba en el laboratorio i ;
i
s es la desviacin tpica de los resultados de prueba en el laboratorio i .
Los valores calculados de
i
y y
i
s sern expresados con un dgito significativo ms que los datos originales.
Estos valores calculados sern tambin tabulados de la misma forma que los datos originales. Algunos
ejemplos se muestran en las tablas 2 y 3.
Tabla 2. Ejemplo de hoja de trabajo para la coleccin de las celdas de medias
(calculadas a partir de los datos de la tabla 1)
9
Tabla 3 Ejemplo de hoja de trabajo para la coleccin de las celdas de las desviaciones tpicas
( calculadas a partir de los datos de la tabla 1)
6.2.3. Media general, repetibilidad y reproducibilidad
La media general m es el promedio de las medias de las celdas, y se expresa como:
1
1

p
i i
i
p
i
i
n y
m
n
=
=
=

donde p es el nmero de laboratorios.


De acuerdo con las ecuaciones (1) y (2), la estimacin de la desviacin tpica de repetibilidad es:
2
r w
s =
y la estimacin de la desviacin tpica de reproducibilidad es:
2 2
R L r
s s s = +
El valor de
2
w
s se calcula como:
( )
( )
2
1 2
1
1
1
p
i i
i
w p
i
i
n s
s
n
=
=

Es obvio que, si el nmero de resultados es uniforme a travs de todos los laboratorios participantes la
desviacin tpica de repetibilidad puede ser expresada sencillamente como:
2
1
p
i
i
r
s
s
p
=
=

El valor de
2
L
s se calcula como:
2 2
2 2
2
2
2

0

r r
m m
L
r
m
s s
s s
n n
s
s
s
n

>

10
donde
m
s es la desviacin tpica de las medias de las celdas:
( )
2
1 2
2
1
1
1

1
1
1

1
p
i i
i
m
p
i
p
i
i p
i
i
i
n y m
s
p n
n
n n
p
n
=
=
=
=

| |
|
|
=
|
|
\ .

Si el nmero de resultados es uniforme a travs de los laboratorios participantes,


2
m
s se puede simplificar:
( )
2
2
1
1

1
p
m i
i
s y m
p
=
=


De este modo la desviacin tpica de reproducibilidad sera:
2 2
1
R m r
n
s s s
n

= +
6.3. Tests de consistencia
Se pueden usar varias tcnicas para estudiar la consistencia de los resultados de las pruebas procedentes
de varios laboratorios. ASTM E 691 recomienda una tcnica grfica (los estadsticos k y h de Mandel),
mientras que la NORMA ISO 57 25 recomienda ambas la grfica (estadsticos k y h de Mandel) y la
numrica (tests de Cochran y tests de Grubbs)
6.3.1.Consistencia entre laboratorios: estadstico h
El estadstico de consistencia h es un indicador de cmo el promedio de los resultados de un laboratorio
particular compara con el promedio del resto de los laboratorios. Est definido por:
x
d
h
s
=
dnde: ( ) d x m = ;
2
1
1
p
i
x
i
d
s
p
=
=

;
i
d desvo del promedio de cada laboratorio i respecto al promedio global m;
x
s desviacin tpica de los promedio de todos los laboratorios;
p nmero de laboratorios participantes.
El valor crtico de h se determina de acuerdo a:
( )
( )
2
1
2
crtico
p t
h
p t p

=
+
dnde: t es la t de Student con 2 p grados de libertad, al nivel de significacin de 0,5 % a dos
colas.
11
6.3.2. Consistencia intra laboratorios, estadstico k
El estadstico de consistencia k es un indicador de cmo la variabilidad intra laboratorio de un laboratorio
particular (bajo condiciones de repetibilidad) compara con el resto de los laboratorios combinados. Est
definido por:
r
s
k
s
=
dnde:
( )
2
1
1
p
i
i
x x
s
n
=

;
2
1
p
i
i
r
s
s
p
=
=

;
2
i
s desviacin tpica de los resultados de cada laboratorio particular;
r
s desviacin tpica de repetibilidad;
n nmero de replicaciones.
6.3.2.1.Valor crtico de k
El valor crtico de k se determina de acuerdo a:
1
1
crtico
p
k
p
F
=

+
dnde F es el valor de la distribucin de Fisher-Snedecor con ( ) 1 n y ( )( ) 1 1 p n grados de
libertad al nivel de significacin de 0.5 %.
Los resultados aberrantes son eliminados utilizando los estadsticos de consistencia h y k conforme a la
norma ASTM E691.
h
estadstico de consistencia entre-laboratorios. Compara el promedio de las rplicas con el valor
asignado (promedio global). A mayor valor absoluto de h
( )
h , menor consistencia entre los
resultados de un laboratorio particular respecto al resto de los laboratorios.
k
estadstico de consistencia intralaboratorio. Compara la desviacin tpica de las rplicas con la
desviacin tpica combinada o de repetibilidad. Si 1 k = , la variabilidad de ese laboratorio es igual
a la del resto. Si 1 k > su variabilidad es mayor y si 1 k < su variabilidad es menor. Valores altos
de k representan variabilidad intralaboratorio, valores muy pequeos de k pueden indicar
escasa sensibilidad en las escalas de medicin u otros problemas asociados a las mediciones.
Los estadsticos k y h calculados de se comparan con sus respectivos valores crticos:
crtica
h y
crtica
k
Los resultados con desvos significativos se descartan y se vuelven a recalcular nuevamente los
estadsticos anteriores. El proceso anterior se repite hasta que no haya valores que excedan los valores
crticos, de esta forma se obtiene un grupo de resultados finales, estadsticamente consistente.
Una ventaja de los estadsticos de Mandel es que los resultados de las pruebas de consistencia se pueden
ilustrar grficamente como se muestran en las figuras 3 y 4
12
Figura 3. Ejemplo del grfico del estadstico k de Mandel
(calculado a partir de los datos de la tabla 1)
Figura 4. Ejemplo del grfico del estadstico h de Mandel
(calculado a partir de los datos de la tabla 1)
6.3.3. Tcnica numrica
En la norma ISO 5725-2 se recomienda el test de Cochran para examinar la consistencia intralaboratorio y
el test de Grubbs para examinar la consistencia interlaboratorio. El test de Grubbs tambin se puede usar
como test de consistencia de los resultados medidos en un laboratorio usando materiales idnticos.
El estadstico C de Cochran se define como:
2
2
1
mx
p
i
i
s
C
s
=
=

donde
mx
s es la desviacin tpica mayor del conjunto de las desviaciones tpicas determinadas.
El test de Cochran es un test de valores aberrantes de una cola porque examina solamente el valor ms alto
en una serie de desviaciones tpicas.
En el test de Grubbs, los datos a ser analizados deben ser ordenados en orden ascendente, que es, para
una serie de p valores { } 1, 2, ,
j
x j k = = , donde
1
x es el menor y
k
x el mayor. Para examinar la
significacin del valor mayor, el estadstico
k
G es:
k
k
x x
G
s

=
13
donde:
1
1
k
j
j
x x
k
=
=

( )
2
1
1
1
k
j
j
s x x
k
=
=


Para examinar el valor ms pequeo:
1
1
x x
G
s

=
Para examinar los dos valores mayores:
2
1,
1, 2
0
k k
k k
s
G
s

=
donde
( )
2
2
0
1
k
j
j
s x x
=
=

( )
2
2
2
1, 1,
1
k
k k j k k
j
s x x


=
=

2
1,
1
1
2
k
k k j
j
x x
k

=
=


De modo similar, para examinar los dos valores ms pequeos:
2
1, 2
1, 2 2
0
s
G
s
=
donde
( )
2
2
1, 2 1, 2
3
k
j
j
s x x
=
=

1, 2
3
1
2
k
j
j
x x
k
=
=


Cuando el test de Grubbs se aplica a las medias d las celdas (para ensayar la consistencia
interlaboratorios), x y = y k p = , mientras que cuando se aplica a los datos originales (para determinar la
consistencia de n resultados en un laboratorio), x y = y k n = .
Las tablas 4 y 5 contienen respectivamente los valores crticos para el test de Cochran y el test de Grubbs.
14
Tabla 4. Valores crticos para el test de C de Cochran.
p es el nmero de laboratorios; n es nmero de resultados de prueba por celda.
15
Tabla 5. Valores crticos para el test de Grubbs.
p es el nmero de laboratorios a un nivel dado
Normalmente, los valores crticos con un nivel de significacin 1% = y 5% = se usan como criterios
para valores aberrantes y extraos, respectivamente. En otras palabras,
si el test estadstico es mayor que el valor crtico del 1 %, el tem ensayado es llamado un estadstico
aberrante;
si el test estadstico es mayor que el valor crtico del 5 % pero menor que el valor crtico del 1 % se
llama un estadstico extrao;
si el test estadstico es menor o igual que le valor crtico del 5 %, el tem ensayado se acepta como
correcto.
Si como consecuencia de los tests de consistencia se encuentra un valor aberrante o extrao, el laboratorio
que produce ese valor aberrante o extrao deber ser consultado para posible error tcnico (por ejemplo,
error tipogrfico, muestra equivocada, calibracin impropia, un error en la ejecucin del experimento, etc.).
Si la explicacin del error tcnico es tal que hace imposible reemplazar el tem sospechoso, el aberrante
16
ser rechazado (descartado) del estudio al menos que haya una buena razn para mantenerlo, mientras
que un valor extrao puede ser retenido en el estudio.
Si varios valores extremos o aberrantes se encuentran con el estadstico k o con el test de Cochran a
diferentes niveles de prueba dentro de un laboratorio, esto puede ser una fuerte indicacin de que la
varianza intralaboratorio es excepcionalmente alta (debido a falta de familiarizacin para el mtodo analtico,
diferentes operadores, equipamiento impropio para las pruebas, pobre mantenimiento, o descuidada
ejecucin), y el total de los datos de este laboratorio ser rechazado.
Si varios valores extraos o aberrantes son encontrados con el estadstico h o el test de Grubbs a
diferentes niveles dentro de un laboratorio, esto puede ser una fuerte indicacin de que el sesgo del
laboratorio es excepcionalmente alto ( debido a un error sistemtico alto en calibracin, o errores de
ecuacin al computar los resultados). En este caso los datos pueden ser corregidos despus de rehacer la
calibracin o computacin. En los dems casos todos los datos de este laboratorio sern tambin
rechazados.
Despus de rechazar los aberrantes el test de consistencia puede ser repetido pero la aplicacin repetida
de los tests de consistencia debe ser usado con gran precaucin, porque este proceso repetido a veces
conduce a excesivos rechazos. Adems hay que tener en cuenta que un rechazo de mas de un 22,2 % (dos
de nueve) del nmero original de laboratorios sin una explicacin se considera excesivo y el estudio debe
mantener datos vlidos de al menos ocho laboratorios.
6.4. Expresin de la precisin de los resultados
Despus de rechazar los aberrantes los datos remanentes se usan para calcular la precisin final de los
resultados, incluyendo la media general, la desviacin tpica de repetibilidad y la desviacin tpica de
reproducibilidad. Otra informacin puede incluir el nmero de laboratorios vlidos (despus de rechazar los
laboratorios aberrantes), el cociente
R
r
s
s
, el lmite de repetibilidad 2, 8
r
s (valor por debajo del cual se
encuentra, con una probabilidad del 95 %, el valor absoluto de la diferencia entre dos resultados, obtenidos
bajo condiciones de repetibilidad), y el lmite de reproducibilidad 2, 8
R
s (valor por debajo del cual se
encuentra, con una probabilidad del 95 % el valor absoluto de la diferencia entre dos resultados, obtenidos
bajo condiciones de reproducibilidad). La informacin acerca del rechazo de los aberrantes puede tambin
ser incluida. Un ejemplo de los resultados de la precisin se da en la tabla 6.
nivel j
nivel 1 nivel 2 nivel 3 nivel 4 nivel 5 nivel 6
Nmero de laboratorios vlido p
11 9 11 11 11 11
Media general m 3,483 4,601 6,995 9,121 11,802 15,159
Varianza de repetibilidad
2
r
s 0,00675 0,0335 0,05587 0,13574 0,32228 0,25746
Varianza entre laboratorios
2
i
s 0,05959 0,01962 0,08876 0,15221 0,26336 0,37035
Varianza de reproducibilidad
2
R
s 0,066 0,053 0,145 0,288 0,586 0,628
Desviacin tpica de repetibilidad
r
s
0,082 0,183 0,236 0,368 0,568 0,507
Desviacin tpica de reproducibilidad
R
s
0,257 0,230 0,381 0,537 0,766 0,792
Repetibilidad
( )
cov
r
s 2,4 % 4,0 % 3,4 % 4,0 % 4,8 % 3,3 %
Reproducibilidad
( )
cov
R
s 7,4 % 5,0 % 5,4 % 5,9 % 6,5 % 5,2 %
r
R
s
s
=
3,13 1,26 1,61 1,46 1,35 1,56
Lmite de repetibilidad 2, 8
r
r s =
0,230 0,512 0,661 1,030 1,590 1,420
Lmite de repetibilidad 2, 8
R
R s =
0,72 0,64 1,07 1,50 2,14 2,22
17
nivel j
nivel 1 nivel 2 nivel 3 nivel 4 nivel 5 nivel 6
Nmero de datos extremos excluidos 0 2 0 0 0 0
Tipo de dato extremo
1
k , h
Laboratorios extremos (outliers) #4, #11
Nmero de desviados excluidos 0 0 0 0 0 0
Tipo de desviacin
Laboratorios desviados
Tabla 6. Ejemplo de la expresin de los resultados de la precisin (calculados a partir de los datos
listados en la tabla 1, despus de rechazar los aberrantes.
7. Una aproximacin alternativa, el anlisis estadstico de Youden
7.1. Anlisis de Youden
El anlisis de Youden est especialmente dirigido a comparaciones interlaboratorios. La ventaja del anlisis
de Youden es su habilidad para separar los errores aleatorios de los sistemticos utilizando un diseo
simple y con requerimientos de un mnimo esfuerzo analtico por parte de los participantes.
Para su implementacin se requieren dos materiales similares (muestras A y B) con pequeas diferencias
en la concentracin de las caractersticas (magnitudes) a determinar. Este requisito es necesario, ya que,
tanto los errores aleatorios como los sistemticos pueden depender tanto de la concentracin de la
caracterstica considerada, como de posibles interferencias de la matriz presente.
Para una caracterstica dada, cada laboratorio participante genera un resultado de X para el caso de la
muestra A y un resultado Y para el caso de la muestra B. Estos resultados permiten la construccin del
grfico de Youden a partir del cual se obtiene el diagnstico de aptitud motivo del ensayo.
7.2. Grfico de Youden
El grfico de Youden se prepara a partir de un eje X como abscisa con una escala adecuada para cubrir el
rango de los resultados de la caracterstica evaluada en el material A y un eje Y como ordenada, con escala
en las mismas unidades, para incluir el rango de los resultados de la misma caracterstica en el material B.
El par de resultados de cada laboratorio es as un punto del grfico. Habr una cantidad de puntos igual a la
de laboratorios participantes y un punto origen cuyas coordenadas son las medianas de X y de Y (valores
de consenso). Una vez representados los resultados, se dibuja una lnea mediana horizontal, paralela al eje
X. De esta forma habr puntos por encima de esta lnea y puntos por debajo. Una segunda lnea mediana
se dibuja paralela al eje de las Y que deja puntos a su izquierda y a su derecha. Completan el grfico una
lnea diagonal de 45 y un crculo con centro en el origen. En la figura 5 se muestran los componentes del
grfico y en la tabla 7 se describen los mismos.
Figura 5. Componentes del grfico de Youden.

1
k , conforme al test estadstico k de Mandel; h , conforme al test estadstico h de Mandel
18
Origen
Es el punto de coordenadas
( )
,
Me Me
x y , siendo
Me
x e
Me
y las medianas
respectivas de los resultados de X y de Y de todos los laboratorios
participantes. Se utiliza la mediana por ser menos vulnerable a la
presencia de resultados aberrantes
Ejes XY Coordenadas con escala adecuada para representar todos los resultados
de los laboratorios participantes
Lneas medianas Lneas paralelas a los ejes que pasan por el punto origen y dividen al
grfico en cuatro cuadrantes
Lnea de 45 Lnea diagonal a 45 que pasa por el origen bisectando los cuadrantes
inferior izquierdo y superior derecho
Resultados del laboratorio i
Punto de coordenadas
( )
,
i i
x y , siendo
i
x e
i
y resultados de las
concentraciones de la caracterstica determinada por el laboratorio i en
las muestras A y B respectivamente
Crculo lmite del 95 % Crculo con centro en el origen (valores de consenso) y radio igual a la
desviacin tpica multiplicada por un factor de confianza, de tal forma que
el crculo contendra al 95 % de los resultados si los errores sistemticos
fueran eliminados
Tabla 7. Descripcin de los componentes del grfico de Youden
En el caso hipottico de ausencia de errores sistemticos y si slo operaran errores aleatorios, los puntos
de los resultados se distribuiran alrededor del origen o valores de consenso ocupando regularmente los
cuatro cuadrantes, ya que los errores positivos y negativos son igualmente probables. Si por el contrario, en
el caso hipottico de ausencia de errores aleatorios y operando slo errores sistemticos, los puntos de
resultados se alinearan sobre la lnea de 45, ya que se espera que si un laboratorio tiene desvos positivos
o negativos en sus resultados, tendr desvos con similar magnitud y sentido en ambas muestras
analizadas. Operando ambos tipos de errores, se obtendra una combinacin de ambos casos extremos y
los resultados ocuparan un espacio elptico con la mayora de los puntos en los cuadrantes inferior
izquierdo y superior derecho.
Una simulacin por computadora ilustra los casos hipotticos planteados. Los grficos obtenidos se
muestran en las figuras 6 (a), (b) y (c) y se explican por s mismos.
Nota: Los datos utilizados en la construccin de las figuras 6 (a), (b) y (c) simulan un ensayo
interlaboratorios con 11 participantes. Los resultados informados por los laboratorios para los valores de X
y de Y correspondientes a las muestras A y B respectivamente son muestras aleatorias tomadas de sendas
poblaciones de distribucin normal de media 30 = y desviacin tpica 1 = para el caso de la muestra A
y 40 = y 1 = para el caso de la muestra B. Los errores sistemticos simulados van de 2.5 a +2.5 para
los laboratorios 1 a 11 respectivamente como se muestra en la tabla 8.
laboratorio nmero
1 2 3 4 5 6 7 8 9 10 11
error sistemtico 2,5 2,0 1,5 1,0 0,5 0,0 + 0,5 + 1,0 + 1,5 + 2,0 + 2,5
Tabla 8. Errores sistemticos simulados para los laboratorios participantes.
19

Figura 6. Grfico de Youden (Laboratorios 1 a 11, respectivamente). (a) errores aleatorios ( = 1),
errores sistemticos = 0. (b) errores aleatorios ( = 0), errores sistemticos 2,5 a +2,5. (c) errores
aleatorios ( = 1), errores sistemticos 2,5 a + 2,5.
Nota: Los datos generados y los clculos utilizados para la construccin de la figura 6(c) se muestran en el
apartado 7.3.3.
La distribucin de los puntos en el grfico de Youden ponen en evidencia posibles problemas, resultando
una excelente herramienta de diagnstico.
Puntos conformando una elipse angosta y alargada sealan problemas con el mtodo analtico utilizado
e indican la necesidad de su modificacin;
Puntos alejados de ambos ejes indican resultados errticos;
El punto cercano a un eje pero alejado del otro indican resultados bastante buenos en un material pero
bastante malos en el otro;
Puntos en el cuadrante inferior izquierdo y superior derecho pero alejados del origen reflejan una
tendencia de resultados altos o bajos en ambos materiales;
Puntos cercanos a la lnea de 45 pero alejados del origen indican errores sistemticos importantes.
Puntos alejados de la lnea de 45 indican errores aleatorios grandes y son evidencia clara de
desviacin importante con el mtodo de ensayo utilizado;
Puntos fuera del crculo de confianza (95 %) indican errores totales grandes;
Alta proporcin de puntos fuera del crculo de radio igual a 2, 448s y cercanos a la lnea de 45
indican presencia general de errores sistemticos.
7.3. Anlisis de Youden: clculos
En la figura 7 se representan nuevamente los resultados del laboratorio i ,
( )
,
i i
x y en un grfico de
Youden y los vectores involucrados en los clculos.
20
Figura 7. Errores aleatorios y sistemticos. Se representa los puntos: R, de coordenadas (x
i
,y
i
):
resultados informados por el laboratorio i; O, de coordenadas (x
Me
,y
Me
): resultados de las medianas
valores de consenso utilizado; P, de coordenadas (x
i
,y
i
): distancia de R a la lnea de 45.
Los vectores generados y sus ecuaciones de clculo resultan:
OR

Error total
( )
T
cometido por el laboratorio i . Es una medida de la desviacin entre los valores de
consenso y los resultados del laboratorio i ., con
( ) ( )
2 2
T i Me i Me
x x y y = + ;
OP

Componente sistemtico del error


( )
S
C , con
( ) ( )
2
i Me i Me
s
x x y y
C
+
= ;
PR

Componente aleatorio del error


( )
A
C , con
2 2
1 1
2 2
S S
A
Me Me
C C
C x y
x y
| | | |
| | = +
| |
+ +
\ . \ .
.
7.3.1. Ajuste de los componentes sistemtico y aleatorio calculados
Los componentes sistemtico y aleatorio calculados requieren ser proporcionados de tal forma que su suma
sea igual al mdulo del vector error total, de esta forma se obtienen los errores sistemtico y aleatorio
correspondientes:
Error sistemtico
S
S T
S A
C
C C
=
+
Error aleatorio
A
A T
S A
C
C C
=
+
De esta forma el valor absoluto del error sistemtico sumado al error aleatorio resulta igual al error total:
T S A
E = +
7.3.2. Desviacin tpica, crculo de confianza y puntuacin z
La desviacin tpica combinada, s se obtiene sumando el cuadrado de los errores aleatorios de todos los
laboratorios, dividiendo el resultado por el nmero de laboratorios menos 1 y extrayendo la raz cuadrada:
2
1
1
n
Ai
i
n

=
=

Para el clculo de radio r del crculo de confianza se utilizan los factores mostrados en la tabla 9.
21
% f % f
10 0,459 70 1,552
20 0,668 75 1,665
25 0,759 80 1,794
30 0,845 90 2,146
40 1,011 95 2,448
50 1,177 99 3,035
60 1,350
Tabla 9. Tabla de probabilidad para una distribucin normal circular. % = porcentaje de puntos
dentro del crculo; f = factor de multiplicacin de la desviacin tpica.
El radio del crculo que demarca un intervalo de confianza del 95 % ser:
( )
2 2
2, 448 r s
y x y
=
=
La puntuacin z es una medida internacionalmente aceptada de la desviacin de los resultados informados
por cada laboratorio, respecto al valor de consenso. Se expresa en unidades de desviacin tpica. Este
parmetro es conveniente por su clculo directo y fcil interpretacin. En este caso se define una
puntuacin z para cada resultado analtico como el cociente entre la desviacin respecto al valor asignado
( )
i Me
x x dividido por la desviacin tpica
z
s :
i Me
z
x x
z
s

=
La puntuacin utilizada se muestra en la tabla 10.
2 z satisfactorio
2 3 z < cuestionable
3 z > insatisfactorio
Tabla 10. Tabla de presentacin de resultados y clculos
En la tabla 12 se muestran los datos originales y los resultados en forma generalizada
laboratorio
nmero
muestra
A
muestra
B
T i

S i

Ai

2
Ai

1
1
x
1
y
1 T

1 S

1 A

2
1 A

2
2
x
2
y
2 T

2 S

2 A

2
2 A

... ... ... ... ... ... ...


n
n
x
n
y
T n

S n

An

2
An

mediana
Me
x
Me
y
2
1
1
n
Ai
i
desviacin tpica s
n
radio r f s

=
= =

= =

Tabla 11: Datos originales y clculos


22
7.3.3. Datos originales y clculos utilizados en la simulacin mostrada en la figura 6 (c)
laboratorio
nmero
muestra A
i
x
muestra B
i
y
error sistemtico
S i

error aleatorio
Ai

1 27,3 37,7 2,5 1


2 29,1 37,2 2 1
3 29,7 38,3 1,5 1
4 30,6 38,9 1,0 1
5 29,1 38,9 0,5 1
6 29,4 39,7 0 1
7 29,0 41,5 0,5 1
8 30,7 40,4 1,0 1
9 32,7 41,9 1,5 1
10 30,9 42,5 2,0 1
11 31,5 42,8 2,5 1
Tabla 12: Datos simulados a partir de poblaciones normales de medias 30 y 40 respectivamente y
desviaciones tpicas igual a 1. A = N(30,1) y B = N(40,1)
Los resultados obtenidos estn en lnea con los observados en el grfico de Youden y reflejan muy bien las
condiciones impuestas, resultando insatisfactorios aquellos laboratorios cuyos errores sistemticos son
relativamente altos respecto a los errores aleatorios.
lab
i
x
i
y
i
x
i
y
T

A
C
S
C
A

2
A

T
z
s

=
1 27,3 37,7 25,50 37,50 3,12 0,28 3,11 0,26 2,86 0,068 3,9
2 29,1 37,2 28,15 38,15 2,57 1,34 2,19 0,98 1,59 0,954 3,3
3 29,7 38,3 29,00 39,00 1,40 0,99 0,99 0,70 0,70 0,490 1,8
4 30,6 38,9 29,75 39,75 1,20 1,20 0,07 1,14 0,07 1,293 1,5
5 29,1 38,9 29,00 39,00 1,00 0,14 0,99 0,13 0,87 0,016 1,3
6 29,4 39,7 29,55 39,55 0,30 0,21 0,21 0,15 0,15 0,023 0,4
7 29,0 41,5 30,25 40,25 1,93 1,77 0,78 1,34 0,59 1,799 2,4
8 30,7 40,4 30,55 40,55 1,22 0,21 1,20 0,18 1,04 ,034 1,5
9 32,7 41,9 32,30 42,30 3,72 0,57 3,86 0,50 3,22 0,246 4,7
10 30,9 42,5 31,70 41,70 3,05 1,13 2,83 0,87 2,18 0,785 3,9
11 31,5 42,8 32,15 42,15 3,58 0,92 3,46 0,75 2,83 0,565 4,5
Mediana 29,7 39,7 suma 6,240
6, 240
0, 79
11 1
s = =

2, 448 0, 79 1, 936 r = =
Tabla 13. Anlisis de Youden y clculo de la puntuacin z
En la figura 8, reproduccin de la figura 6 (c), se representan los resultados mostrados en la tabla 13.
23
Figura 8: repeticin de la figura 6 (c).
Los resultados indican errores sistemticos importantes en los laboratorios 1, 2, 9, 10 y 11. Ntese que el
laboratorio 3, a pesar de habrsele impuesto los mismos errores que al laboratorio 9 cay dentro del crculo
de confianza del 95 %. Esto puede ocurrir tambin en la realidad y es propio de un anlisis estadstico de
este tipo. Los resultados de la puntuacin z se muestran en la tabla 14.
laboratorio nmero
z puntuacin z
1 3,9 insatisfactorio
2 3,3 insatisfactorio
3 1,8 satisfactorio
4 1,5 satisfactorio
5 1,3 satisfactorio
6 0,4 satisfactorio
7 2,4 satisfactorio
8 1,5 satisfactorio
9 4,7 insatisfactorio
10 3,9 insatisfactorio
11 4,5 insatisfactorio
Tabla 14. Puntuacin z
Los resultados obtenidos estn en lnea con los observados en el grfico de Youden y reflejan muy bien las
condiciones impuestas, resultando no satisfactorios aquellos laboratorios cuyos errores sistemticos son
relativamente altos respecto a los errores aleatorios.
8. Aplicacin de los resultados de la prueba de precisin
8.1. Generalidades
Los resultados de la prueba de precisin se usan generalmente para comparar diferentes mtodos
analticos y para asegurar las prestaciones de las pruebas de los laboratorios. Adems, los datos de la
precisin se usan tambin para el control de la calidad y garanta de la calidad. Por ejemplo, chequear la
aceptabilidad de los resultados de las pruebas o monitorizar la estabilidad de los resultados de las pruebas
dentro de un laboratorio. La aplicacin prctica de los datos de la precisin es descrita con detalle en la
norma ISO 5725-6. Aqu veremos algunos ejemplos de aplicacin comparando diferentes mtodos
analticos y asegurando las prestaciones de las pruebas de los laboratorios.
24
8.2. Comparacin de diferentes mtodos analticos
Por ejemplo, se trata de comparar tres mtodos analticos para la determinacin del contenido en un
determinado constituyente. Muestras de referencia conteniendo una cantidad conocida (0,071 % por masa
de muestra con una incertidumbre expandida de 0, 004% U = por masa de muestra, el factor de cobertura
2 k = ) fueron analizadas en diferentes laboratorios usando tres diferentes mtodos nominalmente mtodo
A, B y C, respectivamente. De ellos, B es un mtodo estandarizado, A es un mtodo alternativo modificado,
y C es una prueba simplificada apropiada para una determinacin rpida. Puesto que el mtodo B es un
mtodo estandarizado, fue utilizado como mtodo de referencia, con el que se compararon los otros dos
mtodos. Los resultados de la prueba de precisin se dan en la tabla 15.
mtodo A mtodo B
2
mtodo C
Nmero de laboratorios vlido p
6 7 11
Nmero de replicados n 2 2 2
Datos de la precisin
Media general m 0,0696 0,0649 0,0583
Varianza de repetibilidad
2
r
s 0,00000061 0,00001192 0,00000850
Varianza interlaboratorios
2
L
s 0,00000359 0,00003697 0,00006284
Varianza de reproducibilidad
2
R
s 0,00000420 0,00004888 0,00007134
Desviacin tpica de repetibilidad
r
s
0,00078 0,00345 0,00292
Desviacin tpica de reproducibilidad
R
s
0,00205 0,00699 0,00845
Tabla 15. Datos de la imprecisin a partir del ejemplo
8.2.1. Comparacin de la precisin intra-laboartorio
La siguiente ecuacin ser aplicable para la comparacin de la precisin intralaboratorio:
2
2
r x
r
r B
s
F
s
=
donde el subndice x representa los otros mtodos A C,
( )
( )
1 2
1 2
1 , , 3
2
, , 4
2
r lmite bajo
r lmite alto
F F f f
F F f f

| |
=
`
|
\ . )
| |
=
`
|
\ . )
donde { } F es el inverso de la distribucin F con
( )
1
1
x x
f p n = y
( )
2
1
B B
f p n = grados de
libertad a un nivel de significacin 0, 05 = , como se recomienda en la NORMA ISO 5725-6.
Si
r lmite bajo r r lmite alto
F F F no hay evidencia de que los mtodos tengan diferentes precisiones
intralaboratorio
Si
r r lmite bajo
F F < , hay evidencia de que el mtodo X tiene mejor precisin intralaboratorio que el
mtodo B

2
Mtodo estndar establecido.
25
Si
r r lmite alto
F F > , hay evidencia de que el mtodo x tiene peor precisin intralaboratorio que el
mtodo B
Los resultados calculados se presentan en la tabla 16.
mtodo A mtodo B
3
mtodo C
Grados de libertad
r
f
6 7 11
r
F
0,051 1 0,713
r lmite inferior
F
0,176 0,200 0,266
r lmite superior
F
5,119 4,995 4,709
Notas mejor similar
Tabla 16. Resultados de la comparacin de la precisin intralaboratorio.
8.2.2. Comparacin de la precisin total
La siguiente ecuacin se utiliza para la comparacin de la precisin total:
2 2
2 2
1
1
1
1
R x r x
x
R
R B r B
B
s s
n
F
s s
n
| |

|
|
\ .
=
| |

|
|
\ .
Los valores lmites del inverso de la distribucin F ,
R lmite inferior
F y
R lmite superior
F son similares a los de las
ecuaciones (3) y (4), respectivamente, pero con grados de libertad
1
1
x
f p = y
2
1
B
f p =
Si
R lmite inferior R r lmite superior
F F F , no hay evidencia de que los mtodos tengan diferentes
precisiones totales
Si
R R lmite inferior
F F < , hay evidencia de que el mtodo x tiene mejor precisin total que el mtodo B
Si
R R lmite superior
F F > , hay evidencia de que la precisin total del mtodo x es peor que la del mtodo
B.
Los resultados calculados se presentan en la tabla 17.
mtodo A mtodo B
4
mtodo C
Grados de libertad
R
f 5 6 10
R
F 0,091 1 1,563
R lmite inferior
F 0,143 0,172 0,2466
R lmite superior
F 5,988 4,820 5,461
Notas mejor similar
Tabla 17. Resultados de la comparacin de la precisin total.

3
Mtodo estndar establecido como referencia.
4
Mtodo estndar establecido como referencia.
26
8.2.3. Comparacin de veracidades
La siguiente ecuacin es aplicable para la comparacin de inveracidades
m =
donde es el verdadero valor, en este caso 0, 071% = por masa de muestra,
2 2
1
2 1
R x r x
x
crtica
x
s s
n
p

| |

|
|
\ .
=
Si
crtica
la diferencia entre la media general y el verdadero valor no es estadsticamente
significativa;
Si
crtica
> la diferencia entre la media general y el verdadero valor es estadsticamente significativa.
En tal caso:
Si
2
m
no hay evidencia de que el mtodo analtico es inaceptablemente sesgado;
Si
2
m
> hay evidencia de que el mtodo analtico es inaceptablemente sesgado.
Donde
2
m
es la diferencia mnima entre el valor esperado del mtodo analtico y el valor verdadero.
En este ejemplo se asume que 0, 004%
m
U = = por masa de muestra. La tabla 18 presenta una lista de
resultados.
mtodo A mtodo B
5
mtodo C
Diferencia absoluta 0,0014 0,0061 0,0127
Diferencia crtica
crtica

0,0007 0,0019 0,0015


Diferencia mnima
mnima

0,0040 0,0040 0,0040


Notas sesgo no significativo sesgo significativo sesgo significativo
Tabla 18. Resultados de la comparacin de veracidades.
8.2.4. Comentarios sobre los resultados de la comparacin
En las tablas 16, 17 y 18 se puede ver que el mtodo A tiene mejor precisin intralaboratorio y total que el
mtodo estndar establecido (mtodo B) y su media general est muy prxima al valor verdadero. De este
modo puede usarse como una alternativa al mtodo estndar.
De acuerdo con estos resultados, el mtodo C tiene precisiones similares a las del mtodo B. En la tabla 18
se puede ver, sin embargo, que ambos mtodos muestran un sesgo significativo (sobreestimacin de los
resultados del contenido en la sustancia analizada), especialmente el mtodo C. Despus de haber
estudiado las posibles causas, se hall que, en el mtodo B se utilizaba un filtrado en papel que pudiera
puede contener cantidades significativas de la sustancia, produciendo una sobreestimacin de su contenido.
Respecto al mtodo C, se hall que el procedimiento analtico implica estrictamente un error sistemtico.
Con un procedimiento analtico modificado, el mtodo C funciona bien como una prueba rpida.
9. Valoracin de las prestaciones de los laboratorios
Una de las importantes aplicaciones de los estudios interlaboratorios es valorar las prestaciones o
habilidades de los laboratorios, especialmente de los laboratorios acreditados.

5
Mtodo estndar establecido como referencia.
27
La valoracin de las prestaciones de un laboratorio trabaja en ambas vas. Hay una posibilidad para un
segundo (usuario) o tercera parte (por ejemplo, entidad de acreditacin) para valorar las prestaciones en
relacin con otros laboratorios. Es posible tambin comparar la incertidumbre del laboratorio con los
resultados de la participacin en las pruebas de intercomparacin. Un usuario necesita conocer la
incertidumbre en los resultados de las pruebas y tener esto en cuenta cuando hace un informe de la
tolerancia de un producto.
Los beneficios para los laboratorios participantes son obvios. La participacin en pruebas de
intercomparacin es una buena herramienta para mantener y mejorar la calidad en el laboratorio y tambin
para producir mejoramiento en el mtodo. El tipo de error puede en muchos casos ser deducido para un
cierto tipo de problemas en el laboratorio o en el mtodo.
9.1. Tipos de valoracin
Hay tres tipos de valoracin dependiendo de la existencia de materiales de referencia o de un laboratorio de
referencia:
Valoracin individual usando materiales de referencia. Cuando existen materiales de referencia en un
adecuado nmero de niveles, la valoracin puede hacerse con la participacin del laboratorio individual
solamente;
Valoracin individual por comparacin con un laboratorio de referencia. Cuando coexisten materiales de
referencia, el laboratorio ha de ser comparado con un laboratorio de muy buena calidad el cual es
ampliamente reconocido por su prestigio;
Valoracin continua de los laboratorios por su participacin en pruebas de intercomparacin. Este es el
caso para la valoracin anual o bianual de los laboratorios acreditados.
Para la valoracin individual los datos de la precisin deben ser conocidos previamente, por ejemplo, de
pruebas previas de intercomparacin, mientras que para la valoracin continua los datos de la precisin
pueden obtenerse de las mismas pruebas de intercomparacin si las pruebas se organizan de tal manera
que satisface los requerimientos para la determinacin de la precisin, o desde las pruebas de
intercomparacin si la escala de la prueba es limitada.
9.2. Procedimientos estadsticos y criterio
Los resultados de las pruebas de habilidad (o aptitud) necesitan a menudo ser transformadas en
ejecuciones estadsticas para ayudar a la interpretacin y para permitir la comparacin con objetivos
definidos. Dependiendo del tipo de valoracin, se pueden usar diferentes ejecuciones estadsticas.
Para la valoracin individual usando materiales de referencia, la ejecucin estadstica ser un error absoluto
. Segn la norma ISO 5725-6, el criterio de aceptacin es:
2 2
1
2 1
R r
y
n

| |
=
|
\ .
Para la valoracin individual por comparacin con un laboratorio de referencia, la ejecucin estadstica ser
una diferencia absoluta D. Segn la norma ISO 5725-6, el criterio de aceptacin es:
2 2
1 2
1
2 2 1
R r
D y y
n

| |
=
|
\ .
Para la valoracin continua por participacin en una prueba de intercomparacin, el estadstico mas
comnmente usado es la llamada puntuacin z ( z -scores):
2 2

1
1
i i
i
R r
x X y m
z
s
s s
n

= =
| |

|
\ .
donde
i
x es el resultado de la prueba del laboratorio i ;
X es la media del grupo; y
S es la desviacin tpica del grupo.
Debe researse que los datos de la precisin en la ecuacin anterior deben ser fiables, esto es, basada en
bastantes observaciones para permitir deteccin de aberrantes y tener bajo error estndar. Los aberrantes
28
significativos deben excluirse antes de hacer los clculos. De acuerdo con ASTME E 1301-95, los siguientes
criterios son apropiados:
Si 2 z la prestacin es satisfactoria;
Si 2 3 z , la prestacin es cuestionable;
Si 3 z > , la prestacin es insatisfactoria.
Un ejemplo de prestaciones estadsticas z -scores se muestran en la figura 8.
Figura 8. Ejemplo de prestaciones estadsticas z -scores (datos procedentes de una prueba de
intercomparacin nacional sueca para la resistencia a la helada del hormign).
10. Bibliografa
1. ISO. International Standard ISO 5725-4-1994. Accuracy (Trueness and precision) of measurement
methods and results Part 2: Basic method for the determination of repeatability and reproducibility of a
standard measurement method. Geneva, 1994.
2. ISO. International Standard ISO 5725-4-1994. Accuracy (trueness and precision) of measurement
methods and resultsPart 4: Basic methods for the determination of the trueness of a standard
measurement method, Sections 14, 6. Geneva, 1994
3. ISO. International Standard ISO 5725-4-1994. Accuracy (trueness and precision) of measurement
methods and resultsPart 4: Basic methods for the determination of the trueness of a standard
measurement method. Sections 13, 56. Geneva, 1994.
4. ISO/IEC Guide 43-1:1997 (E). Proficiency testing by interlaboratory comparisons: Part 1: Development
and operation of proficiency testing schemes.
5. Pocklington WD, Guidelines for the development of standard methods by collaborative study, 3rd Ed.,
London:Laboratory of the Government Chemist.1986.
6. ISO. International Standard ISO 5725-6-1994, Accuracy (trueness and precision) of measurement
methods and results. Geneva, 1994.
7. ISO Guide 35:1989 (E), Certification of reference materials general and statistical principles. Geneva,
1989.
8. ISO /IEC Guide 43-1: 1996. Proficiency testing by interlaboratory comparison. Geneva 1996.
9. ISO. International Standard ISO 5725-1986, Precision of test methods determination of repeatability
and reproducibility for a standard test method by interlaboratory tests. Geneva, 1986.
10. Collaborative international pesticides analytical council limited (CIPAC): Guidelines for CIPAC
collaborative study procedures for assessment of performance of analytical methods, 1989.
11. Guidelines for collaborative study procedures, J Ass Off Anal Chem 1989; 72:694704.
29
12. International Union of Pure and Applied Chemistry (IUPAC). Analytical, applied and clinical chemistry
divisions, Protocol for the design, conduct and interpretation of collaborative studies. Pure Appl Chem
1988;60:855964.
13. International Union of Pure and Applied Chemistry (IUPAC). Analytical, applied and clinical chemistry
divisions, Protocol for the design, conduct and interpretation of method-performance studies. Pure Appl
Chem1995; 67:33143.
14. Association of Analytical Communities (AOAC). Guidelines for collaborative study procedures to validate
characteristics of a method of analysis. 2005.
15. Centro Nacional del Medio Ambiente de la Universidad de Chile (CENMA). Red Nacional de Metrologa
de Chile (RNM). Materiales de referencia y comparaciones interlaboratorios. 2006
16. International Union of Pure and Applied Chemistry (IUPAC). Analytical, applied and clinical chemistry
divisions. Protocol for the design, conduct and interpretation of collaborative studies, Pure Appl Chem
1988;60:855964.
17. CPQ. COFILAB. Ley 7020/65. Ensayo de metodologa Interlaboratorios. EMI Coordinacin y Anlisis
Estadstico.
18. CPQ. COFILAB. Ley 7020/65. Evaluacin estadstica. Comparacin interlaboratorios Anlisis de
Youden.
19. SP Sveriges Provning och Forskningsinstitut SP Rapport 2000- 35. SP Swedish National Testing and
Research Institute SP Report 2000 35. Methodology of Inter-comparison test and statistical analysis of the
test results Nordtest project No. 1483 99.
20. National Institute of Public Health and the Environment. RIVM report n 219101005. Statistic and the
assessment of interlaboratories studies. Bilthoven. The Netherlands, 1996
21. ASTM E 691-99. Standard practice for conducting an interlaboratory study to determine the precision of
test method.
22. ASTM E 1301-95. Proficiency testing programs by interlaboratory comparisons.
22. Cofino WP, Wells DE. Design and evaluation of the QUASIMEME interlaboratory performance studies: a
test case for robust statistics. Mar Pollut Bull 1994;29:149-58
23. Hund E, Massart DL, Smeyers-Verbeke J. Interlaboratory studies in analytical chemistry. Ann Chim Acta
2000;423:145-65.
24. Lysiak-Pasttuszak E. Interlaboratory analytical performance studies: a way to estimate measurement
uncertainty. Oceanologia 2004;46(3):427-38.

S-ar putea să vă placă și