Sunteți pe pagina 1din 7

Simposio de Metrologa 2004

25 al 27 de Octubre

EL NMERO EFECTIVO DE GRADOS DE LIBERTAD


Enrique Villa Diharce
Centro de Investigacin en Matemticas, A. C.
Jalisco s/n, Mineral de Valenciana, Guanajuato, Gto. CP. 36240
Tel.: (473) 732 71 55 ext. 49562, Fax: (473) 732 57 49, Email: villadi@cimat.mx
Resumen: En el anlisis de datos de medicin, presentamos el resultado de un proceso de medicin,
mostrando el resultado de la medicin y su incertidumbre. En la mayora de los casos el mensurando no es
directamente medible, sino que depende de otras cantidades medibles, a travs de una funcin que
generalmente es no lineal. En este caso, la determinacin de la incertidumbre expandida de la estimacin del
mensurando, se obtiene haciendo uso de una estadstica, cuya distribucin se desconoce, pero se aproxima
por una distribucin t de Student, en la que el nmero de grados de libertad se obtiene, de acuerdo con la
recomendacin de la GUM, utilizando la aproximacin de Welch-Satterthwaite. A este nmero de grados de
libertad se le conoce como el nmero efectivo de grados de libertad. En este artculo comentamos el
concepto de grados de libertad y presentamos una derivacin de la expresin conocida para obtener el
nmero efectivo de grados de libertad.

1.

Un procedimiento recomendado por la GUM [1],


para estimar la incertidumbre expandida, consiste
en aproximar la distribucin de la estadstica T con
una distribucin t de Student con un nmero de
grados de libertad dado por la aproximacin de
Welch Satterthwaite. A este nmero de grados de
libertad se le denomina el nmero efectivo de
grados de libertad.

INTRODUCCIN

En el anlisis de datos de medicin, presentamos el


resultado de un proceso de medicin, mostrando el
resultado de la medicin y su incertidumbre. Esta
ltima puede darse en forma estndar o expandida.
La conveniencia de dar la versin expandida de la
incertidumbre, es que le asociamos una cobertura
explicita, lo cual facilita su interpretacin, ya sea en
el terreno del enfoque frecuentista, o en el subjetivo
(grado de creencia). La incertidumbre expandida
corresponde al rango de un intervalo de confianza
del mensurando. Para construir tal intervalo de
confianza, utilizamos una estadstica T, dada por el
cociente de una estadstica normal estndar entre
una estadstica que incluye a la incertidumbre
combinada de las variables de influencia del modelo
de medicin. Cuando la estadstica del denominador
tiene asociada una distribucin ji-cuadrada,
entonces el cociente tiene una distribucin t de
Student, con un nmero de grados de libertad igual
a los grados de libertad de la estadstica ji-cuadrada
del denominador.

En la seccin 2, se muestra el origen de los grados


de libertad asociados a una incertidumbre
expandida. En la seccin 3, presentamos el
desarrollo de la formula de Welch - Satterthwaite,
para calcular el nmero efectivo de grados de
libertad.
En la seccin 4 se comentan las restricciones que
tiene la aproximacin de Welch-Sattertwaite y se
comenta un procedimiento alternativo para la
determinacin de la incertidumbre expandida. En la
seccin 5, se dan las conclusiones del trabajo.
2.

Frecuentemente, la estadstica que involucra a la


incertidumbre combinada no tiene una distribucin
ji-cuadrada exacta, por lo tanto la estadstica T no
tiene una distribucin t de Student exacta. Esta
complicacin nos impide tener un intervalo de
confianza para el mensurando, con la cobertura
nominal deseada exacta.

LOS GRADOS DE LIBERTAD

En la mayora de los casos el mensurando no es


directamente medible, sino que depende de otras
cantidades medibles X 1 , X 2 ,..., X k , a travs de
una funcin f ( X 1 , X 2 ,..., X k ) . As la incertidumbre
de la medicin Y del mensurando, es el resultado
de combinar las incertidumbres de medicin de las
diferentes cantidades medidas X 1 , X 2 ,..., X k , con

Simposio de Metrologa 2004

25 al 27 de Octubre

libremente, ya que el trmino restante tiene un valor


determinado por estos n 1 trminos elegidos y el
promedio x . A este nmero de trminos
independientes se le conoce como el nmero de
grados de libertad. De aqu que podemos interpretar
el nmero de grados de libertad como la cantidad
de informacin til en la determinacin de la
estimacin. En cambio si las observaciones no son
independientes, tenemos informacin redundante
en las observaciones, por lo que la informacin til o
efectiva ser menor

diferentes pesos, que dependern de la importancia


que cada componente tiene en el modelo de
medicin Y = f ( X 1 , X 2 ,..., X k ) .
Una magnitud X que varia aleatoriamente tiene
asociados dos parmetros muy importantes: su
esperanza X = E ( X ) que nos indica el valor
alrededor de cual se tienen las observaciones de

X , y su varianza X2 que expresa la magnitud de


la variabilidad de las observaciones alrededor de su
valor esperado X .

Otra interpretacin del nmero de grados de


libertad, es el parmetro de la distribucin jicuadrada asociada al estimador de la varianza,
n observaciones
calculada
a
partir
de
independientes. En este caso sabemos que la
estadstica

Cuando se tienen n observaciones independientes


x1 , x2 ,..., xn de X , estimamos su esperanza como
el promedio x de las n observaciones,

x=

1 n
xi ,
n i =1

W=

mientras que la varianza se estima por

s X2 =

1
n
( xi x ) 2 .

i =1
n 1

La estadstica anterior interviene en la estadstica T


utilizada
para
determinar
la
incertidumbre
expandida en forma de intervalo de confianza,

X X
T=

estimacin x proviene de la variabilidad de x


alrededor de X , que cuantificamos por su

x2 = X2 / n ,

sx2 = s X2 / n .

y que estimamos como

Tambien

podemos

tomar

como

x = x2

un

x = ( x1 + x2

X X
. (2)
SX

sx2 , o sx , podemos

( x t( n 1,1 / 2 ) sx , x + t( n 1,1 / 2) sx ) ,

(3)

x es la estimacin del mensurando, sx es la


incertidumbre de la medicin, y t( n 1,1 / 2) el

donde

dado
de
la
estimacin
+ ... + xn ) / n , tenemos solo n 1

xi

2
X
2
X

expresarla en forma expandida, como un intervalo


de confianza del mensurando,

valor

observaciones

incertidumbre, ya sea como

Cuando la informacin que tenemos del


mensurando es un conjunto de n observaciones
independientes x1 , x2 ,..., xn , entonces tenemos que
para

Z
=
W
(n 1)

As, adems de expresar en forma numrica la

incertidumbre de medicin la desviacin estndar


de la media,

(1)

tiene una distribucin ji-cuadrada con n 1 grados


de libertad. Con este enfoque entonces, el nmero
efectivo de grados de libertad viene a ser el
parmetro asociado a la distribucin ji-cuadrada
asociada al estimador de la incertidumbre de la
medicin considerada.

Cuando tenemos un mensurando, del que tomamos


mediciones con un instrumento, ocurre que
observamos
diversos
valores
que
varian
aleatoriamente, de acuerdo a alguna distribucin.
Generalmente asociamos el valor del mensurando
con el valor esperado de la distribucin, de aqu que
estimar el valor del mensurando equivale a estimar
el valor esperado X , La incertidumbre de la

varianza

(n 1) S X2

coeficiente de confianza para la distribucin t de

que pueden tomar valores

Simposio de Metrologa 2004

25 al 27 de Octubre

Student con = n 1 grados de libertad. Este


intervalo tiene una cobertura nominal de
(1 )100% .
Cuando el mensurando de inters
de varias magnitudes de influencia

coeficiente de confianza y ef . el nmero de grados


de libertad efectivos, dado por

ef . =

Y es resultado
X 1 , X 2 ,..., X k ,

de acuerdo a un modelo de medicin dado por la


funcin Y = f ( X 1 , X 2 , ..., X k ) , entonces hay que

las variables de influencia y

T=

1 , 2 ,..., k

sus grados

y Y
=
Sy

y Y

2
Y
2
Y

Y2 :

Z
.
W

(6)

ef

Aqu, la estadstica Z tiene una distribucin Normal


estndar y la estadstica W = ef S y / y
2

Y = f ( X , X ,..., X ) ,
1

f
Y2 = i =1 X2 i .
xi

distribucin ji-cuadrada asociada a la incertidumbre

sY2 , que se obtiene como una

expandida

y = f ( x1 , x2 ,..., xk ) ,

combinacin
2
1

2
2

lineal

de

las

incertidumbres

2
k

s , s ,..., s , de las mediciones de las variables de

f
sY2 = i =1
s X2 i .

i ( x1 , x2 ,..., xk )
k

influencia.

La incertidumbre numrica est dada por

La expresin del nmero efectivo de grados de


libertad, se conoce como la aproximacin de WelchSatterthwaite, que describimos en la siguiente
seccin.

sY2 ,

mientras que la incertidumbre expandida est dada


por el intervalo de confianza

( y t( ef . ,1 / 2 ) s y , y + t( ef . ,1 / 2) s y ) ,

3.

(4)

y es el resultado de medicin, s y su
t( ef . ,1 / 2)

tiene

En este caso, el nmero efectivo de grados de


libertad ef viene a ser el parmetro de la

Estos valores son estimados por:

combinada,

aproximadamente una distribucin ji-cuadrada con


ef grados de libertad.

incertidumbre

Para entender el origen del nmero efectivo de


grados de libertad,
hay que considerar la
estadstica T, utilizada para obtener el intervalo de
confianza (4)

cuando las variables de influencia son no


correlacionadas, obtenemos las aproximaciones

donde

(5)

de libertad correspondientes.

La manera de atacar este problema consiste en


tomar una aproximacin de Taylor, para Y ,
alrededor de su valor esperado Y . De esta forma,

siendo s1 , s2 ,..., sk las incertidumbres estndar de

incertidumbre de Y . Hacer esto en forma exacta


puede ser un problema complicado, cuando la
funcin f es nolineal, y mas difcil todava, si
adems, las variables de influencia son
correlacionadas.

si4

i =1

convertir la informacin que tenemos sobre los


resultados de
medicin e incertidumbres de
X 1 , X 2 ,..., X k , en el resultado de medicin y la

para

s y4

es

APROXIMACIN DE WELCHSATTERTHWAITE

Sean

W1 ,W2 ,...,Wk ,

variables

aleatorias

independientes e idnticamente distribuidas como jicuadrada con r1 , r2 , ..., rk grados de libertad

el

Simposio de Metrologa 2004

25 al 27 de Octubre

Segn el metodo de momentos, para estimar el


parmetro , igualamos los dos primeros
momentos de las variables que tenemos en ambos
lados de la relacin de equivalencia anterior. De
esta forma obtenemos las ecuaciones

respectivamente. Es un hecho conocido [2] que la


suma W1 + W2 + ... + Wk se distribuye tambin como
ji-cuadrada

con

r = r1 + r2 + ... + rk

grados

de

libertad. Esta propiedad de herencia de distribucin


no se tiene cuando, en lugar de una suma,
consideramos
una
combinacin
lineal
a1W1 + a2W2 + ... + akWk de las variables aleatorias.

E (U ) =
V (U ) = E (U ) 2 [ E (U ) ] = 2 .
2

Cuando la incertidumbre combinada es una


combinacin lineal de incertidumbres, entonces la
informacin de cada una de ellas dentro del total,
tiene un efecto modulado por la constante que
multiplica al trmino correspondiente. Esta
combinacin no aditiva de la informacin
proporcionada por cada componente es lo que
tenemos en la aproximacin de WelchSatterthwaite.

De lo anterior obtenemos que

U
E ( ) = 1,

U
2
E ( ) 2 = 1.

La lgica en el desarrollo de la aproximacin,


consiste en suponer que la combinacin lineal
a1W1 + a2W2 + ... + akW , tiene aproximadamente

E ( i =1 aiWi ) = 1 , y
k

E ( i =1 aiWi ) 2 =
k

aiWi y

tienen la misma distribucin. Esto se expresa

como la relacin de equivalencia,

i =1

aiWi

(9)

1.

(10)

De la ecuacin (9) no podemos deducir el valor de


, solo obtenemos una restriccin para los
coeficientes de la combinacin lineal. Despejamos
de la ecuacin (10) y obtenemos

Suponemos entonces, que la combinacin lineal es


equivalente al cociente dado por una variable
aleatoria U distribuida ji-cuadrada, dividida entre
k

Sustituyendo estas esperanzas en (7) y (8),


obtenemos,

una distribucin ji-cuadrada con un nmero de


grados de libertad que debemos determinar. Para
esto, procedemos ajustando una distribucin jicuadrada a la combinacin lineal, y estimamos su
parmetro (grados de libertad) por el mtodo de
momentos.

i =1

(8)

Como la esperanza de una variable aleatoria


distribuida como ji-cuadrada es igual a sus grados
de libertad, y su varianza es dos veces sus grados
de libertad, entonces

lineal de las incertidumbres de las variables de


influencia. Si en lugar de una combinacin lineal,
fuese una suma de trminos no correlacionados,
entonces el nmero de grados de libertad asociado
a la incertidumbre combinada seria la suma de los
grados de libertad de las variables de influencia.

k
U
E ( i =1 aiWi ) 2 = E ( ) 2 .

incertidumbre combinada s y es una combinacin

, esto es, que

(7)

La complicacin en la determinacin del nmero


efectivo de grados de libertad, se debe a que la

sus grados de libertad

k
U
E ( i =1 aiWi ) = E ( ) ,

2
E ( i =1 aiWi ) 2 1
k

(11)

De esta ecuacin obtenemos un estimador para el


nmero de grados de libertad, sustituyendo en el
denominador la esperanza del cuadrado de la
combinacin lineal, por la combinacin lineal
cuadrtica nicamente. As tenemos,

Simposio de Metrologa 2004

25 al 27 de Octubre

2
( i =1 aiWi ) 2 1
k

Sustituyendo ahora, la expresin (13) de la varianza


de la combinacin lineal, en la expresin (12) de
tenemos

E ( k aiWi )
i =1
.
=
2
k a
i=1 i E (Wi )

Este estimador tiene el inconveniente de que nos


puede dar valores negativos, lo cual es inadmisible.
Esta expresin para no considera la restriccin
de los coeficientes de la combinacin lineal.
Enseguida consideramos una versin modificada de
este estimador, incluyendo la restriccin.
k
k
k
E ( i =1 aiWi ) 2 = V ( i =1 aiWi ) + E ( i =1 aiWi )

k
2
V ( i =1 aiWi )
k

= E ( i =1 aiWi )
+ 1 ,
2


k
E ( aiWi )

i =1

De esta expresin para los grados de libertad como


funcin de esperanzas de las variables aleatorias,
obtenemos su estimador , sustituyendo las
esperanzas por sus observaciones, esto es,

entonces

V ( i =1 aiWi )
k

E ( i =1 aiWi ) =
k

E ( k aiWi )
i =1

+ 1.

Sustituyendo esto en la expresin (11) para


resulta
k

(12)

distribuidas

2 i =1
k

ai2 [ E (Wi ) ]

Wi

(14)

Los trabajos originales sobre esta aproximacin


fueron desarrollados en forma independiente por
Welch [3,4,7] y Satterthwaite [5,6]. Este problema
es similar al problema de inferencia para una
diferencia de medias, cuando las varianzas son
desconocidas y diferentes. Este ltimo problema
conocido en la literatura estadstica como el
problema de Behrens-Fisher [8], ha generado una
polmica interesante, y ha atrado la atencin de un
gran nmero de estadsticos, y por lo tanto se han
propuesto varias soluciones desde diferentes
enfoques.

V ( i =1 aiWi ) = i =1 ai2V (Wi ) =


k

ai = (f / xi ) , y Wi = si2 .

Finalmente, considerando que W1 , W2 ,..., Wk son


variables aleatorias independientes
como ji-cuadradas, tenemos que

i =1

ai2

La expresin (14) obtenida para estimar los grados


de libertad coincide con la expresin conocida para
el nmero efectivo de grados de libertad, despus
de
hacer
las
siguientes
sustituciones:

2 E ( i =1 aiWi )
.
=
k
V ( i =1 aiWi )

Esta aproximacin obtenida en la dcada de los 40,


sigue an hoy siendo de gran utilidad, su uso se
sustituye algunas veces por procedimientos de
simulacin para la determinacin de incertidumbres
expandidas. Cabe hacer notar que el procedimiento
de simulacin de observaciones de las variables de
influencia, cuando stas estn correlacionadas no
es sencillo.

E ( i =1 aiWi ) = 1 ,

y considerando de (9) que

( i =1 aiWi ) 2

(13)

La ltima igualdad se debe a que


4.

V (Wi ) = 2 [ E (Wi ) ] / i .
2

RESTRICCIONES O LIMITACIONES

El desarrollo de la aproximacin de WelchSatterthwaite supone que las variables de influencia

Simposio de Metrologa 2004

25 al 27 de Octubre

Se ha mostrado el desarrollo de la aproximacin de


Welch-Satterthwite para obtener el nmero efectivo
de grados de libertad.
La estadstica de la incertidumbre combinada no
tiene una distribucin ji-cuadrada exacta, debido a
que en el numerador no tiene una suma de
cuadrados sino una combinacin lineal de
cuadrados.
Se han discutido limitaciones de esta aproximacin,
como son los supuestos de distribucin normal de
las variables de influencia, as como la no
correlacin entre ellas.
Adems se ha comentado que una alternativa que
se puede seguir al evaluar la incertidumbre de un
proceso de medicin, cuando las variables de
influencia son no-correlacionadas, es la tcnica de
Monte Carlo. Cuando se usa algn software para
simular observaciones de variables correlacionadas,
se recomienda conocer el procedimiento que dicho
software sigue para introducir la correlacin entre
las variables, para estar seguros de que la
correlacin que el software considera es la que
nosotros hemos determinado.

tienen distribucin normal y adems


son
nocorrelacionadas.
Estos
supuestos
con
frecuencia no se cumplen, ya que adems de la
distribucin normal, las distribuciones uniforme y
triangular intervienen como modelos de medicin de
las variables de influencia. Y adems, la correlacin
entre dichas variables
en algunos casos es
significativa.
Frecuentemente, el supuesto de no-correlacin no
se cumple en la practica metrolgica, ya que las
mediciones que se hacen de las diferentes variables
de influencia que intervienen en un proceso de
medicin, estn sujetas a un ambiente comn, lo
cual genera una cierta estructura de dependencia
entre dichas variables.
M Ballico [9] compara la formula de WelchSatterthwaite con otros procedimientos basados en
series de potencias utilizados para determinar la
incertidumbre expandida, y encuentra que la
formula sobreestima el nmero efectivo de grados
de libertad cuando una de las principales
componentes tiene pocos grados de libertad. Esto
genera una subestimacin del correspondiente
intervalo de confianza, lo cual es aun mas notorio
para altos niveles de confianza.

REFERENCIAS
[1] Guide to the Expression of Uncertainty in
Measurement,
Geneva,
International
Organization for standardization, 1993, ISBN
92-67-10188-9.
[2] Casella, G. and Berger, R. L., Statistical
Inference, Wadsworth & Brooks/Cole, Pacific
Grove, CA. 1990.
[3] Welch, B. L., The Specification of Rules for
Rejection too Variable a Product, with
Particular Reference to an Electric Lamp
Problem, Supplement to the Journal of the
Royal Statistical Society, 3(2), 1936, 29-48.
[4] Welch, B. L., The Significance of the Difference
Between two Means when the Population
Variances are Unequal, 29, 1938, 350-362.
Satterthwaite,F. E., Psychometrika, 1941, 6(5),
309-316.
[5] Satterthwaite,F. E., Psychometrika, 1941, 6(5),
309-316.
[6] Satterthwaite,F. E., An approximate distributin
of
estimates
of
variance
components,
Biometrics, Bull., 2(6), 1946, 110-114.
[7] Welch, B. L., The generalization of Students
problem when several different population
variances are involved, Biometrika 34, (1947),
28-35.
[8] Kendall, M. and Stuart, A., The Advanced
Theory of Statistics, , Vol. II: Inference and

Una alternativa que se ha elegido algunas veces


para la determinacin de la incertidumbre expandida
o intervalo de confianza, ha sido la tcnica de
simulacin [10], tambin conocida como Monte
Carlo. Cuando las variables de influencia que se
simulan son nocorrelacionadas, este procedimiento
es sencillo, aun cuando se tengan distribuciones
diferentes a la normal. En cambio, si las variables
son correlacionadas, el problema de simulacin en
forma exacta es muy complicado, ya que se
requiere conocer la distribucin conjunta de las
variables, lo cual no es fcil. Existe software como
por ejemplo, Cristal Ball [11] y Risk [12], que
simulan observaciones de variables aleatorias
correlacionadas, con cualquier conjunto de
distribuciones marginales, y con una relacin de
correlacin definida por el coeficiente de correlacin
por rangos, siguiendo el procedimiento de Iman y
Conover [13].
5.

CONCLUSIONES

En este artculo hemos comentado el concepto de


grados de libertad asociado a la determinacin de la
incertidumbre de medicin.

Simposio de Metrologa 2004

25 al 27 de Octubre

Relationship, 4th. Ed., Macmillan, New York,


NY., 1979.
[9] Ballico, M., Limitations of the WelchSatterthwaite aproximation for measurement
uncertainty calculations, Metrologia, 37, 2000,
61-64.
[10] Cox, M. G., Dainton, A. B., Forbes, A. B.,
Harris, P. M., Schwenke, P. M., Siebert, B. R.
L., and Woger, W., Use of Monte Carlo
Simulation for uncertainty evaluation in
metrology, in Ciarlini, P., Cox, M. G., Filipe, E,
Pavese, F, and Richter, D., editors, Advanced
Mathematical Tools in Metrology V. Series on
Advances in Mathematics for Applied Sciences,
Vol. 57, World Scientific, 2001, 93-104.
[11] Decisionengineering, Inc., Crystal Ball Version
4.0 User Manual.
[12] Winston, W. L., Simulation usiong @RISK,
Duxbury, Pacific Grove CA. 2001.
[13] Iman R. L. and Conover W. J., A DistributionFree Aproach to Inducing Rank Correlation
Among Input Variables, Communications in
Statistics - Simulation and Computation, 11(3),
1982, 331-334.

S-ar putea să vă placă și