Sunteți pe pagina 1din 38

Analyse de donn ees et exploitation de mesures

Jean-Fran cois ROCH Pr eparation ` a lagr egation de physique ENS Cachan January 3, 2005

Contenu
1 Mesurages et statistiques 1.1 Rappels sur la distribution normale de Gauss . . . . . . . 1.1.1 Int er et de la distribution normale de Gauss . . . . 1.1.2 Expression math ematique de la loi normale . . . . 1.1.3 Normalisation et fonction erreur . . . . . . . . . 1.2 Interpr etation statistique dune op eration de mesurage . . 1.2.1 Moyenne et incertitude dune mesure . . . . . . . . 1.2.2 Propagation des erreurs . . . . . . . . . . . . . . . 1.2.3 Erreurs al eatoires et erreurs syst ematiques dans un . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . mesurage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 3 5 5 7 7 8 9 11 11 11 13 14 15 16 18 19 21 21 21 21 22 23 24 25 25 25 26 27 27 28 29 30 31

2 Exploitation dune s erie de mesure 2.1 Estimateurs de la distribution de probabilit e associ ee ` a la mesure . . 2.1.1 Position du probl` eme et maximum de vraisemblance . . . . . 2.1.2 Estimateur de la moyenne . . . . . . . . . . . . . . . . . . . 2.1.3 Pr ecision sur la d etermination de lestimateur de la moyenne 2.1.4 Moyenne d echantillon et loi des grands nombres . . . . . . . 2.1.5 Estimateur de la variance de la distribution de probabilit e . 2.1.6 Pr ecision sur la d etermination de lestimateur de la variance 2.1.7 Cas dun petit nombre de mesures : fonction de Student . . . 2.2 Exemple concret danalyse dune s erie de mesures . . . . . . . . . . . 2.2.1 Position du probl` eme . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Premier niveau danalyse . . . . . . . . . . . . . . . . . . . . 2.2.3 Deuxi` eme niveau danalyse : etude statistique . . . . . . . . . 2.2.4 Comparaison avec la distribution gaussienne estim ee . . . . . 2.2.5 Vocabulaire de m etrologie : incertitudes de type A et de type 2.2.6 Budget dincertitude de la mesure . . . . . . . . . . . . . . . 3 Ajustement de courbes exp erimentales 3.1 Donn ees et moindres carr es . . . . . . . . . . . . . . . . . 3.1.1 Position du probl` eme . . . . . . . . . . . . . . . . . 3.1.2 Hypoth` ese de d epart . . . . . . . . . . . . . . . . . 3.2 Ajustement par une fonction ane . . . . . . . . . . . . . 3.2.1 Ajustement sans prendre en compte dincertitudes 3.2.2 Droite de r egression et coecient de corr elation . . 3.2.3 Incertitudes sur les param` etres de lajustement . . 3.3 Ajustement par une fonction polyn omiale . . . . . . . . . 3.4 Ajustement non-lin eaire . . . . . . . . . . . . . . . . . . . 1

. . . . . . . . . . . . . . . . . . . . . . . . . . B . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

2 4 Annexes 4.1 Annexe A : rappels el ementaires sur les lois de probabilit e . . . . . . 4.1.1 Loi de probabilit e et fonction caract eristique . . . . . . . . . . 4.1.2 Cas de la distribution normale . . . . . . . . . . . . . . . . . . 4.2 Quinconce de Galton ou la planche ` a clous . . . . . . . . . . . . . . 4.2.1 Description du dispositif . . . . . . . . . . . . . . . . . . . . . . 4.2.2 Mod elisation math ematique de la planche ` a clous . . . . . . 4.2.3 Composition de deux dispersions cons ecutives . . . . . . . . . . 4.3 Annexe C : variance d echantillon . . . . . . . . . . . . . . . . . . . . . 4.3.1 Annexe D : m ethode des moindres carr es et poids des mesures

CONTENU 33 33 33 33 34 34 35 36 36 37

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

1
1.1

Mesurages et statistiques
Rappels sur la distribution normale de Gauss
Int er et de la distribution normale de Gauss

1.1.1

Commen cons par nous int eresser ` a une fonction dune grande importance en physique : la distribution normale, egalement connue sous le nom de gaussienne 1 . Dapr` es le th eor` eme de la limite centrale, cette distribution correspond ` a la distribution limite associ ee ` a la mesure dune grandeur x sujette ` a de petites incertitudes al eatoires. En guise dintroduction, nous ne r esistons pas au plaisir de raconter une petite fable 2 . Lorsque lAllemagne eut perdu la guerre en 1945, la situation economique continua ` a se d et eriorer rapidement dans le pays. Toute la nourriture resta rationn ee, m eme le pain ; cette denr ee etait limit ee ` a 200 grammes par personnes et par jour. Les boulangers etaient par cons equent oblig es de se procurer des moules sp eciaux pour fabriquer des pains pesant exactement 200 grammes et ils en vendaient un par jour ` a chaque consommateur. Chaque matin, en se rendant ` a luniversit e, un vieux professeur de physique, Herr Pr. Dr. Herbert W., passait chez le boulanger pour prendre sa ration quotidienne. Un jour il lui dit : Vous etes un proteur, vous volez vos clients. Les moules dont vous vous servez sont de 5 pour cent plus petits quils ne devraient l etre pour faire des pains de 200 grammes, et la farine que vous economisez, vous la vendez au march e noir. Mais, Monsieur le Professeur, s ecria le boulanger, personne ne peut donner ` a tous ses pains exactement le m eme poids. Certains sont quelques pour cents plus l egers, dautres quelques pour cent plus lourds. Cest bien cela, r epliqua le professeur, depuis quelques mois, je p` ese chaque jour le pain que vous me vendez sur la balance de pr ecision de mon laboratoire. Son poids varie suivant la loi normale. Mais voici la courbe qui donne la r epartition des pains de divers poids (gure 1a), compar ee au poids de la ration. Vous voyez que certains pains ne p` esent que 185 grammes et que dautres p` esent 205 grammes mais que le poids moyen obtenu dans ces mesures est de 195 grammes au lieu de 200. Vous allez vous procurer des moules de taille correcte, ou je vous d enonce au service du ravitaillement. Je le ferai d` es demain, Monsieur le Professeur, dit le boulanger atter e, et soyez bien assur e que cette faute ne se renouvellera pas. Quelques mois plus tard, le professeur revint trouver le boulanger. Je viens de vous d enoncer au service du ravitaillement, dit-il. Vous navez pas chang e vos moules et vous continuez ` a voler vos clients. Mais, Monsieur le Professeur, sexclama le boulanger, vous ne pouvez pas maccuser de vol ! Vous ai-je jamais donn e des pains trop l egers ces derniers mois ? En eet, ils pesaient tous au moins 200 grammes. Mais ce nest pas parce que vous avez utilis e des moules plus grands ; vous avez tout simplement choisi pour moi les plus gros pains, et gard e les plus petits pour les autres clients. Vous ne pouvez pas le prouver, dit le boulanger avec arrogance.
La d ecouverte de limportance de cette loi est attribu ee aux pionniers du d eveloppement de la th eorie des probabilit es : dabord De Moivre (16671754), math ematicien dorigine fran caise protestant qui emigra en Angleterre en 1685 apr` es la r evocation de lEdit de Nantes et lexpulsion des Huguenots, puis le Marquis Pierre Simon de Laplace (17491827) et enn evidemment, le petit prince des math ematiques Karl Fiedrich Gauss (17771855). 2 Cette histoire est tir ee du merveilleux livre de G. Gamow et M. Stern, Jeux Math ematiques, Dunod (Paris, 1966), d edi e` a Th eodore Von Karman, qui aime bien les petits probl` emes. Il est indiqu e dans le livre que cette fable est rapport ee comme v eridique et se serait pass ee ` a Hambourg apr` es la guerre.
1

1 MESURAGES ET STATISTIQUES

Figure 1: Distribution du poids des pains achet es chez le boulanger par le Pr. Dr. Herbert W. Justement si, d eclara le professeur. Regardez la distribution statistique que jai obtenue en pesant vos pains au cours de ces derniers mois (gure 1b). Au lieu de la distribution normale d emontr ee par le grand math ematicien Karl Friedrich Gauss, vous avez une courbe qui correspond ` a des pains trop lourds ; elle sarr ete brusquement a ` gauche, et descend progressivement a droite. Jamais des ` ecarts statistiques autour de la moyenne ne pourraient conduire ` a une telle distribution, et il est clair que vous avez obtenu cette courbe articiellement en choisissant des pains qui pesaient plus que le poids minimum autoris e. Cette courbe est tout simplement le pied de la courbe de Gauss (gure 1a) : elle repr esente la m eme distribution que celle que javais obtenue en pesant mes pains avant notre pr ec edente conversation. Je suis certain que le service du rationnement me croira sur parole. Et, tournant les talons, le Pr. Dr. Herbert W. sortit de la boutique. On notera quen r ealit e, aucune mesure nest jamais distribu ee exactement suivant la loi gaussienne. Si on r ep` ete un grand nombre de fois la mesure dun param` etre et quon trace lhistogramme de ces mesures en fonction de la valeur trouv ee, la forme de lhistogramme tend vers une r epartition de Gauss lorsquon fait tendre le nombre de mesures vers linni. Pourquoi cela ? On dit parfois que les exp erimentateurs pensent quelle a et e prouv ee par les math ematiciens, puisque sa forme peut etre justi ee lorsque les conditions de Borel sont v eri ees, cest-` a-dire lorsquil existe des causes derreurs multiples dimportance comparable (cf. ` linverse, les math lexp erience du quinconce de Galton d ecrite dans lAnnexe ??). A ematiciens pensent quelle est un r esultat de lexp erience, puisquelle est obtenue dans la quasi-totalit e des cas o` u un exp erimentateur soigneux a pris le temps de regrouper un tr` es grand nombre de mesures ind ependantes et de poids egaux dune m eme grandeur. Si la distribution normale est eectivement obtenue pour un tr` es grand nombre dexp eriences, 3 certaines mesures eectu ees dans des r egimes de comptage nob eissent cependant plus ` a ce type de statistique lorsque le nombre de coups est tr` es faible. Il faut alors utiliser des proc edures danalyse de donn ees adapt ees ` a la situation consid er ee. On notera egalement quil existe dautres distributions de probabilit e, appel ees vols de L evy, qui s ecartent de mani` ere fondamentale de cette limite centrale puisquelles ne poss` edent ni valeur moyenne ni variance [?]. Alors que celles-ci ont longtemps et e consid er ees comme de simples curiosit es math ematiques, on a d ecouvert r ecemment quelles jouent un r ole crucial dans des domaines aussi vari es que la biologie, les march es nanciers, ou encore les embouteillages de la circulation automobile ! Elles se rencontrent egalement dans di erents ph enom` enes de physique dont l evolution temporelle est domin ee par loccurence d ev en ements rares, comme par exemple la diusion de particules dans les milieux tr` es fortement h et erog` enes ou le refroidissement datomes par laser.
On pensera par exemple au cas de la d etection de d esint egrations radioactives en physique nucl eaire ou bien celui dune mesure optique eectu ee pour un tr` es faible ux lumineux dans le r egime de comptage de photons.
3

1.1

Rappels sur la distribution normale de Gauss Expression math ematique de la loi normale

1.1.2

Lexpression math ematique de la loi normale, fonction de deux param` etres et (avec > 0), est : 1 2 2 G(x) = e(x) /(2 ) . (1) 2 Nous savons evidemment que G(x) a une forme de courbe en cloche, sym etrique par rapport ` a qui correspond ` a la valeur de x pour laquelle la courbe atteint son maximum. Le param` etre caract erise la largeur de la courbe, tandis que le facteur 2 assure la normalisation de la distribution de probabilit e dP = G(x)dx associ ee ` a cette fonction, cest-` a-dire : dP =
+

G(x)dx = 1 .

(2)

Les param` etres et peuvent etre interpr et es comme li es aux premiers moments de la distribution de probabilit e 4 donn ee par la loi normale G(x) : Le param` etre correspond ` a la valeur moyenne x de la variable x : = x =
+

xG(x)dx .

(3)

Cette quantit e porte egalement le nom desp erance math ematique 5 , not ee E[x]. Le param` etre correspond ` a l ecart-type ou ecart quadratique moyen de la variable x, egalement not e x et d eni comme : (x)2 = 2 = (x x )2 soit 2 = x2 x 2 . (4)

Le param` etre 2 est encore appel e variance V[x] de la loi de probabilit e. Plus est petit, plus il est probable que lon trouve une valeur de x proche de la moyenne. La quantit e constitue par cons equent une mesure de l ecart ` a la moyenne, et elle quantie les uctuations de la variable al eatoire x autour de la valeur moyenne . Cette propri et e appara t egalement si nous evaluons la largeur totale ` a mi-hauteur de la gaussienne : soit x1/2 2.355 . (5) x1/2 = 2 ln 2 (FWHM) De m eme, la hauteur de la gaussienne en x = est egale ` a 1/ e. Puisque 1/ e 0.607, l ecart-type peut etre consid er e de mani` ere approch ee comme la demi-largeur ` a mihauteur de la gaussienne. Nous dirons ainsi que la largeur dune distribution gaussienne est de lordre de son ecart-type . Normalisation et fonction erreur

1.1.3

En faisant les changements de variable z=


4

et

dz =

1 dx ,

On appelle moment dordre n dune distribution de probabilit e P (x) la valeur moyenne de xn , calcul ee selon + n x = x P (x)dx. Quelques rudiments de statistique sont rappel es dans lAnnexe ??. 5 Cette appellation tire son origine de lanalyse faite au XVII` eme si` ecle du probl` eme des partis, en lien avec lapplication des probabilit es aux jeux de hasard : quelle est la juste r epartition des enjeux lorsquune partie dun jeu de pur hasard est interrompue avant son terme. Des savants aussi illustres que Pascal, Fermat et Huygens se sont int eress es ` a ce probl` eme et ont montr e que la r epartition doit se faire selon les probabilit es de gagner des joueurs, calcul ees ` a partir de toutes les suites possibles de la partie. Chaque joueur recevra alors son esp erance de gain au moment de linterruption du jeu.
n

1 MESURAGES ET STATISTIQUES

la fonction gaussienne d enie pr ec edemment peut etre mise sous une forme normalis ee, avec une valeur moyenne nulle et un ecart-type egal ` a lunit e (gure 2a) : 1 2 y = ez /2 . 2 (6)

Cette expression donne en particulier la probabilit e F (a) = Pr(z a) quune mesure de la grandeur z soit plus petite que la valeur a : 1 F (a) = 2
a

eu

2 /2

du .

(7)

Cette int egrale, dont la variation en fonction de a est repr esent ee sur la gure 2a correspond ` a laire de la gaussienne situ ee ` a gauche de la limite z = a. Elle permet de d eterminer la probabilit e que z soit contenu dans tout intervalle b z a : Pr(b z a) = F (a) F (b) . (8)

Ainsi, nous pouvons calculer la probabilit e que le tirage de la variable al eatoire tombe ` a plus ou moins un ecart-type de la valeur moyenne : Pr(1 z 1) = F (1) F (1) = 0.8413 0.1587 = 0.6826 cest-` a-dire une probabilit e de 68 %. Quand on augmente la largeur de cet intervalle, cette probabilit e va tendre rapidement vers lunit e. Ainsi, la probabilit e quune mesure soit ` a 2 (resp. 3 ) est de 95.4 % (resp. 99.7 %). On d enit egalement la fonction erreur erf(z ) comme : 2 erf(z ) =
z 0

et dt

(9)

dont la variation est repr esent ee sur la gure 2b. Cette fonction, qui est int egr ee dans les logiciels de calcul ou de traitement de donn ees, permet de calculer ces m emes probabilit es, au moyen de lexpression : Pr(z a | gaussienne, , ) = 1 1 + erf 2 a 2 . (10)

Figure 2: (a) Trac e de la gaussienne normalis ee et de son aire F (z ), obtenue par simple int egration num erique.
(a) Trac e de la fonction erreurerf (z ), permettant de calculer au moyen de la formule (10) la probabilit e Pr(t ) que le r esultat dun tirage de la variable al eatoire se trouve dans un intervalle de t fois son ecart-type autour de la valeur moyenne .

1.2

Interpr etation statistique dune op eration de mesurage

1.2
1.2.1

Interpr etation statistique dune op eration de mesurage


Moyenne et incertitude dune mesure

Les rappels que nous venons deectuer vont nous permettre de mieux comprendre l ecriture du r esultat de la mesure dune grandeur donn ee x, sous la forme : x = xm x (11)

o` u xm est la meilleure estimation de la grandeur mesur ee x et x lincertitude sur la mesure. Ne craignons pas dinsister sur limportance de lestimation de lincertitude x. En son absence, il devient impossible de chercher ` a comparer entre eux des r esultats. Comment savoir, sans conna tre lincertitude, si une grandeur a evolu e, si tel proc ed e de mesure conduit au m eme r esultat que tel autre, si la di erence eventuellement observ ee entre les r esultats obtenus par des m ethodes ou des equipes di erentes est r eellement signicative ou bien si elle est uniquement due ` a des ph enom` enes al eatoires mal ma tris es ? Comment comparer le r esultat quon a obtenu a la valeur qui a ` et e publi ee dans un article scientique ? Comment le comparer ` a des valeurs de r ef erence sp eci ees par exemple dans une norme ou dans les objectifs dun contrat, et garantir ainsi la conformit e du produit ou du syst` eme r ealis e? Dans son rapport sur le concours 1998, le jury de l epreuve de montage ` a lagr egation de physique avait insist e sur le fait que trop de candidats ne savent pas comment aborder le probl` eme de la pr ecision des r esultats et l evaluation dune incertitude de mesure, repr esent ee par le terme x dans l equation (11). Il pr ecise en particulier que la critique des r esultats obtenus repose trop souvent sur un calcul dincertitude uniquement bas e sur lutilisation de di erentielles dont on a pris la valeur absolue. Malheureusement, cette m ethode, qui a et e longtemps enseign ee et utilis ee par les physiciens, nest pas appropri ee car le r esultat quelle fournit est ` a la fois optimiste et pessimiste : Il est pessimiste car il suppose que toutes les causes derreur agissent dans le m eme sens. Il sagit l` a dun cas particuli` erement d efavorable qui na dans la r ealit e que peu de chances de se produire. Il est optimiste car il sugg` ere que la valeur cherch ee ne peut pas etre ` a lext erieur de la barre dincertitude [xm x, xm + x] et que celle-ci repr esente par cons equent un domaine de valeurs qui contient ` a coup s ur la valeur exacte xexact de la grandeur mesur ee. La d enition de lincertitude sur la mesure est en r ealit e li ee ` a des consid erations dordre statistique 6 : lintervalle x doit etre pr esent e comme un domaine ` a lint erieur duquel la valeur xexact a de fortes chances d etre contenue. La dispersion des r esultats de mesure observ ee lorsquon r ep` ete lop eration de mesure dans des conditions apparemment identiques, justie ladoption dune description statistique du mesurage. Puisque la r ealisation dune mesure comporte n ecessairement une part dal eatoire, la grandeur physique x est alors caract eris ee, non plus par une valeur exacte, mais par la probabilit e de trouver telle ou telle valeur. Nous devons ainsi interpr eter le r esultat dune mesure de cette grandeur comme une valeur particuli` ere, issue du tirage au sort dune variable al eatoire X dans lensemble, en g en eral inni, des r esultats possibles. Ce tirage au sort de X est associ e` a une fonction de distribution de probabilit e Pr(X = x) de trouver la valeur x, pour laquelle nous ferons labus de la simple notation Pr(x). Nous pouvons maintenant interpr eter correctement les di erents termes dans l equation (11) :
Il faut ainsi se d ebarasser de certains a priori sur lutilisation des outils danalyse statistique, lesquels sont malheureusement souvent consid er es comme une simple description aust` ere et sans ame des faits economiques ou d emographiques. Les analyses des statisticiens sont egalement parfois per cues avec un m elange de scepticisme ou de m eance, ` a linstar de Mark Twain qui d eclarait quil existe trois formes de mensonges : lies damned lies and statistics. La statistique est en r ealit e une discipline importante, partie int egrante de tout processus de recherche elabor e` a partir dun ensemble de donn ees brutes.
6

1 MESURAGES ET STATISTIQUES La moyenne xm correspond ` a la valeur moyenne x , calcul ee avec la distribution de probabilit e Pr(x) : x = x Pr(x) dx ;

Lintervalle (ou la barre derreur) [xm x, xm + x] est d eni comme un intervalle de conance, associ e` a une probabilit e donn ee P de contenir la valeur vraie xexact de la grandeur mesur ee [?]. Cette probabilit e est appel ee niveau de conance et la valeur choisie en pratique est P = 0.95 = 95 % ou P = 0.99 = 99 % 7 . Supposons que les di erentes valeurs pouvant etre obtenues pour la mesure dune grandeur physique donn ee soient distribu ees selon une probabilit e gaussienne. Nous pouvons alors evaluer a partir du calcul eectu ` e pr ec edemment de la fonction erreur erf(z ) le risque encouru lorsquon donne pour la valeur de la grandeur un intervalle de conance, appel e encore intervalle de certitude ma tris ee. En limitant cet intervalle ` a (2 ) autour de la valeur estim ee, le risque de trouver une valeur au-del` a des bornes de lintervalle est inf erieur ` a 5 % 8. Les consid erations pr ec edentes montrent quil convient de faire, pour chaque mesurage, un inventaire pr ecis et rigoureux des causes derreur susceptibles de biaiser le r esultat. Il faut ensuite eectuer les corrections n ecessaires, evaluer lincertitude associ ee ` a chacune de celles-ci, puis composer ces termes avec la dispersion li ee ` a la non r ep etabilit e du proc ed e de mesure. On pourra alors exprimer le r esultat du mesurage sous la forme dun intervalle de conance, dont la valeur aura et e d etermin ee ` a partir de l ecart-type associ e au r esultat obtenu.

1.2.2

Propagation des erreurs

La composition quadratique des di erentes contributions ` a lincertitude de mesure, chacune exprim ee sous forme d ecart-type (m eme si lappr eciation de celui-ci ne r esulte pas dune multiplicit e de mesures), correspond alors mieux ` a la prise en compte simultan ee des causes derreur ind ependantes. Ainsi, lors de la d etermination dune r esistance R par voltm` etre et amp` erem` etre, il nest a priori pas justi e de corr eler les composantes de lincertitude associ ees ` a la mesure de la tension U et ` a celle de lintensit e I . Cette corr elation est implicite dans le calcul usuel par di erentielle logarithmique U I R = + R U I qui tend ` a quantier un hypoth etique intervalle maximal pour le r esultat. Pour exprimer l ecart-type R sur la mesure de la r esistance R, il est plus appropri e dutiliser la relation de propagation des erreurs R 2 U 2 I 2 = + . R U I Si cette expression a un sens math ematique bien d eni, on pourra se contenter dans la pratique de dire que lincertitude relative R/R est de lordre de : R R
7

U U

I I

Il est bon de savoir que lutilisation de ces m ethodes statistiques pour la donn ee des incertitudes se sont impos ees seulement au d ebut des ann ees 1990, avec linstallation des normes dassurance qualit e Iso 9000 dans le monde de lentreprise. Ces m ethodes avaient en r ealit e et e mises au point d` es le d ebut du XX` eme si` ecle et adopt ees par quelques industries, comme par exemple lagriculture et la fabrication textile de l et de tissu, dans le but de rationnaliser et am eliorer la production. 8 On notera limportance du choix du niveau de certitude, corr el e` a la d enition de lincertitude de la mesure. Si nous avions choisi de d enir lincertitude x ` a (1 ), un tiers des mesures eectu ees tomberait alors statistiquement en dehors de lintervalle [xm , xm + ]. Remarquons quen toute rigueur, le niveau de conance P = 95 % corrspond ` a (1.96 ).

1.2

Interpr etation statistique dune op eration de mesurage Erreurs al eatoires et erreurs syst ematiques dans un mesurage

1.2.3

Une premi` ere cause de variation des r esultats de mesure r eside dans les appr eciations du manipulateur lui-m eme. On ne refait jamais la mesure exactement dans les m emes conditions, parce que la lecture des instruments va changer dune mesure ` a la suivante : erreur de parallaxe dans le rep erage dun trait ou de lindication dune aiguille, eets de m enisque pour le niveau de liquide dans une pipette, fatigue au bout de longues heures de travail sur le dispositif exp erimental, etc. Il existe egalement bien dautres sources derreurs qui peuvent aectuer le r esultat brut dun mesurage. Voici tout dabord quelques exemples derreurs syst ematiques : La grandeur mesur ee peut etre parfois mal d enie. Il faut alors se demander quelles sont les conditions de validit e de la loi mod` ele pr evue, savoir si la grandeur mesur ee varie dans le temps ou dans lespace. La grandeur peut egalement avoir une dispersion intrins` eque. Cest par exemple le cas pour la mesure de l energie dun niveau instable dun noyau ou dun syst` eme atomique ou la mesure de la position dune particule microscopique lorsque celle-ci est sujette au mouvement brownien cr e e par son environnement. La grandeur etudi ee peut etre aect ee par le proc ed e de mesure lui-m eme, ce qui impose alors lusage de m ethodes d echantillonnage. Le mode op eratoire choisi peut egalement introduire des erreurs. Ainsi, une pes ee eectu ee dans lair doit prendre en compte une correction due ` a la pouss ee dArchim` ede ; une mesure de r esistance eectu ee ` a laide dun voltm` etre et dun amp` erem` etre est biais ee aussi bien dans les congurations courte ou longue d erivation, etc. Les capteurs et les instruments utilis es pour la mesure, et avec lesquels le syst` eme est mis en interaction, peuvent pr esenter des d efauts : temps de r eponse ni et bande passante limit ee, justesse et sensibilit e de linstrument de mesure utilis e 9 , r eponse non-lin eaire dun capteur, eet dhyst er esis... De nombreuses grandeurs qui caract erisent les conditions dambiance dans lesquelles la mesure est r ealis ee vont inuer sur le r esultat. Il sagit selon les cas de la temp erature, des conditions electriques ou magn etiques, de la pr esence ou non de lumi` ere parasite... De tels eets doivent etre recherch es puis quanti es, de mani` ere a ` pouvoir eventuellement introduire des corrections permettant de compenser les erreurs syst ematiques ainsi introduites. Les constructeurs fournissent en particulier des indications concernant la pr ecision de leurs appareils ou de leurs composants, sous la forme dune incertitude ` a attribuer aux mesures effectu ees. Il faut alors se reporter aux notices du constructeur pour conna tre le sens pr ecis... de la pr ecision indiqu ee, sachant que celle-ci est egalement donn ee suivant une norme industrielle. Ainsi, la norme Iso 9000 pr ecise aux fabricants comment ils doivent proc eder en pratique pour fournir les indications quantitatives sur les caract eristiques des produits quils commercialisent. Prenons ainsi lexemple dune r esistance donn ee avec une pr ecision de 1 %. Cette indication recouvre dabord un aspect d echantillonnage, puisque lindustriel va fabriquer des milliers ou des millions de produits, dont les r esistances vont varier n ecessairement un peu dun exemplaire ` a lautre. Il va egalement inclure un aspect de fonctionnement, puisque la r esistance va changer avec la temp erature du composant, qui est elle-m eme fonction de lintensit e du courant. En donnant R avec une incertitude de 1 %, le fabricant donne une limite ` a leet global de ces di erents facteurs, la valeur correspondant dans la norme ` a deux fois l ecart-type sur
On prendra soin de distinguer la sensibilit e, qui indique la variation de lindication de lappareil en fonction de la variation de la grandeur ` a mesurer, et la justesse de lappareil. Sil est mal calibr e, un dispositif de mesure peut etre sensible sans etre pour autant juste. Cest par exemple le cas dune mesure de temp erature eectu ee ` a laide dune thermistance, par comparaison avec une mesure de cette m eme grandeur eectu ee au moyen dune sonde etalon ` a r esistance de platine.
9

10 l echantillon de mesures.

1 MESURAGES ET STATISTIQUES

Lors des montages, il sagit souvent de comparer le r esultat de la mesure ` a ce quon appelle parfois abusivement la valeur th eorique et qui, la plupart du temps, est issue de valeurs nominales. Si celle-ci gure dans un recueil de donn ees comme dans le cas dune constante physique fondamentale ou de la longueur donde dune radiation, elle est eectivement bien connue. Dans ce cas, lincertitude sur la valeur tabul ee dans le recueil peut etre n eglig ee et il sut de v erier que cette valeur tombe ` a lint erieur de lintervalle de conance evalu e de fa con r ealiste pour la mesure. Dans dautres cas, la connaissance imparfaite des valeurs de r ef erence utilis ees, des courbes d etalonnage des instruments induit egalement des erreurs sur la valeur th eorique de comparaison. Il est alors n ecessaire de lui attribuer egalement une incertitude an de pouvoir parvenir ` a une comparaison pertinente entre le r esultat de la mesure et la valeur de r ef erence. Pour donner un exemple dune telle situation, consid erons ainsi la d etermination de la 2 = 1. fr equence de r esonance 0 dun circuit RLC s erie et la v erication de la formule LC0 La mesure directe de la fr equence de r esonance 0 doit etre eectu ee avec soin. Si la technique des courbes de Lissajous ` a loscilloscope est utilis ee, il faut se placer dans les meilleures conditions pour rep erer la situation dans laquelle lellipse est r eduite ` a un segment de droite. On doit donc veiller ` a faire les traces les plus nes possibles et ` a travailler avec des calibres qui correspondent ` a des valeurs maximales du gain. Si la fr equence 0 est mesur ee ` a laide dun fr equencem` etre de qualit e, la seule incertitude ` a prendre en compte est alors pratiquement celle du point e. Lincertitude sur le calcul de la fr equence 0 peut ensuite etre estim ee ` a laide des 2 = 1, il faut savoir quune formules habituelles. Si lon cherche ensuite ` a v erier la relation LC0 bobine r eelle peut etre assimil ee ` a une inductance L qui nest pas absolument constante lorsque la fr equence ` a laquelle elle est utilis ee varie. Ainsi, il est loin d etre acquis que le calcul de 0 ` a partir des valeurs de linductance L et de la capacit e C conduise ` a une pr ecision meilleure que celle dune mesure directe de 0 . Quitte ` a nous r ep eter, disons-le encore une fois : une valeur mesur ee nest pas une valeur certaine. La dispersion des r esultats est la signature de la variabilit e de la mesure, laquelle est un ph enom` ene objectif. De plus, il existe une certaine m econnaissance de la valeur pour chaque correction individuelle et par cons equent de la correction totale. Une fois prises en compte toutes les causes derreur, on appelle incertitude de mesure le param` etre associ e au r esultat qui caract erise la dispersion des valeurs num eriques. Nous retiendrons pour la suite : Une mesure sexprime toujours par la valeur mesur ee et son incertitude. On aura evidemment lhonn etet e de ne jamais evaluer lerreur sur une quantit e mesur ee en comparant la valeur trouv ee exp erimentalement ` a un quelconque chire d enich e dans un livre ou sur une page web !

11

2
2.1

Exploitation dune s erie de mesure


Estimateurs de la distribution de probabilit e associ ee ` a la mesure
Position du probl` eme et maximum de vraisemblance

2.1.1

La r ealisation dune mesure dune grandeur physique est sch ematis ee sur la gure 3. La r ep etition (` a lidentique, autant que faire se peut) du proc ed e de mesure direct conduit ` a associer ` a la grandeur mesur ee, appel ee mesurande, un ensemble de n valeurs num eriques, qui correspondent aux r esultats bruts des mesurages : {x1 , x2 , , xn }i=1n . Lensemble de ces valeurs constitue ce nous appellerons l echantillon de mesures.

environnement syst` eme physique appareil de mesure

grandeur x variable al eatoire X probabilit e Pr(X = x)

s erie de mesures

estimation
echantillon {x1 , x2 , , xn }

Figure 3: Mesure de la grandeur x, repr esent ee par une variable al eatoire X et associ ee ` a une distribution de probabilit e inconnue Pr(X = x). La gure montre la relation entre l echantillonnage, qui correspond ` a n tirages au
sort de la variable al eatoire X , et lestimation, proc edure dexploitation de l echantillon de mesure pour obtenir des informations sur la distribution de probabilit e Pr(x). Les param` etres de cette distribution sont estim es ` a partir dune statistique calcul ee sur la base de l echantillon des n valeurs de la variable al eatoire X .

12

EXPLOITATION DUNE SERIE DE MESURE

En pratique, on ne fait jamais assez de mesures pour conna tre la distribution limite associ ee ` a la mesure de la grandeur x, de sorte que les param` etres et qui interviennent dans lexpression de la distribution de probabilit e restent inconnus. Le probl` eme va donc se ramener a une exploitation optimale de l ` echantillon de mesures an dobtenir les valeurs estim ees des param` etres de la distribution de probabilit e Pr(x) associ ee ` a la mesure de la grandeur x. Cette estimation, dont nous attendons quelle soit dautant meilleure que le nombre n d el ements dans l echantillon est grand, nous permettra alors de d eterminer de mani` ere statistique le r esultat de mesures ult erieures de la grandeur x. An de bien faire ressortir la di erence entre param` etres de la distribution de probabilit e et grandeurs statistiques, nous utiliserons des symboles di erents. Ainsi, les caract eristiques de la distribution de probabilit e seront not ees par des lettres grecques tandis que les caract eristiques statistiques de l echantillon seront not ees par des lettres romaines. Il existe plusieurs m ethodes pour d eterminer les estimateurs des param` etres inconnus. Nous pouvons en particulier utiliser une m ethode destimation du maximum de vraisemblance qui fut introduite par R. A. Fisher (gure 4).

Figure 4: Sir Ronald Aylmer Fisher (18901962). Ce scientique anglais est reconnu comme un des fondateurs
de la statistique moderne. il fut en particulier un des premiers ` a introduire les m ethodes statistiques en agronomie, en partant de sch emas dexp eriences an de rechercher et de contr oler les sources de variations.

Pour appliquer cette m ethode, nous devons conna tre les distributions de probabilit e normalis ees des n variables xi qui forment notre ensemble de donn ees, Pr(xi | ) o` u correspond de mani` ere g en erique au param` etre ` a estimer duquel d epend la distribution de probabilit e. Nous pouvons alors consid erer le produit de ces fonctions pour lensemble des mesures eectu ees : L(x1 , x2 , , xn ; ) = Pr(x1 | ) Pr(x2 | ) Pr(xn | ) , (12)

que nous appellerons fonction de vraisemblance pour le param` etre . Le principe de vraisemblance maximale nous dit que pour lensemble dobservations, la valeur qui rend maximal L correspond au meilleur estimateur du param` etre : L(x1 , x2 , , xn ; ) = 0.
=

(13)

2.1

Estimateurs de la distribution de probabilit e associ ee ` a la mesure

13

Pour chercher cet estimateur, il est plus commode, et cependant equivalent du point de vue math ematique puisque le logarithmique est une fonction toujours croissante, de chercher le maximum de ln L. Supposons en particulier que lensemble des n donn ees {x1 xn } soit tir e dune distribution de probabilit e sous-jacente correspondant ` a une r epartition gaussienne de valeur moyenne et d ecart-type : Pr(xi | , ) = 1 1 exp 2 2 xi
2

(14)

En supposant que les n mesures sont ind ependantes, nous avons alors :
n

L = 2.1.2

i=1

Pr(xi | , )

et

W = ln L = nln 2

1 2

n i=1

xi

(15)

Estimateur de la moyenne

Pour d eterminer lestimateur de la valeur moyenne , nous pouvons ainsi calculer W = Cette expression est nulle pour :
n i=1 n i=1

xi . 2

(16)

xi = 0 2 1 n
n

soit : = m avec m =

xi .
i=1

(17)

Par cons equent, si un ensemble de mesures ob e t ` a une distribution de probabilit e gaussienne, la valeur la plus vraisemblable de la grandeur mesur ee x vis-` a-vis des valeurs mesur ees {xi }i=1n est simplement la moyenne arithm etique m de ces valeurs. Nous appellerons cette grandeur la moyenne d echantillon ou la moyenne exp erimentale. Pris dans le sens inverse, cest en r ealit e en partant de ce r esultat que Karl Friedrich Gauss, qui dirigeait lObservatoire de G ottingen, fut conduit ` a introduire la loi normale apr` es s etre 10 int eress e au probl` eme des erreurs dans les mesures astronomiques. . Son argumentation part du postulat intuitif de la moyenne : etant donn ees plusieurs valeurs observ ees dune quantit e inconnue, la valeur la plus probable de cette quantit e est la moyenne des valeurs observ ees. En supposant que les diverses observations sont repr esent ees par des variables al eatoires ind ependantes ayant une m eme distribution de probabilit e, on montre que la fonction correspondante est une loi normale. Remarquons que cette correspondance exacte entre la moyenne m de l echantillon de mesure et lestimateur du maximum de vraisemblance nest pas n ecessairement valable pour des distributions autres que la gaussienne. Consid erons par exemple le cas dune distribution rectangulaire 1 u x(1) et sur un intervalle (a, b). Lestimateur est egal ` a la valeur m ediane 2 x(1) + x(2) , o` x(2) sont respectivement la mesure la plus faible et la mesure la plus elev ee dans l echantillon. On constate que dans ce cas, lestimateur est di erent de la moyenne d echantillon m.
Ce r esultat fut publi e dans louvrage Theoria motus corporum clestium (1809). Gauss (1777-1855) fut un des derniers scientiques ` a utiliser le latin pour la diusion de ses travaux scientiques.
10

14 2.1.3

EXPLOITATION DUNE SERIE DE MESURE

Pr ecision sur la d etermination de lestimateur de la moyenne

Si nous reproduisons lensemble des n mesures dans des conditions identiques, la dispersion des r esultats conduira ` a des valeurs di erentes {x1 , , xn } dans l echantillon. La moyenne d echantillon m est par cons equent elle-m eme sujette ` a uctuations dune s erie de mesures a lautre. Dans lensemble dune innit ` e virtuelle d echantillons obtenus ind ependamment les uns des autres et dans des conditions identiques, on aura une moyenne (ou esp erance math ematique), une variance et une distribution. Cette distribution de probabilit e est la distribution d echantillonnage de la moyenne. Lesp erance E(m) et la variance Var(m) = (m )2 associ ees ` a la moyenne d echantillon m peuvent etre exprim ees en fonction des param` etres et . En eet, si {x1 , , xn } sont des copies ind ependantes dune grandeur x de moyenne et de variance , alors : E(m) = E soit : E(m) = . De m eme : (m )2 = Var(m) = Var soit : (m )2 = 1 n
n

1 n

xi
i=1

1 n

E(xi ) =
i=1

1 (n) n

(18)

(19)

xi
i=1

1 n2

Var(xi ) =
i=1

1 n 2 n2

(20)

2 n

et

m = . n

(21)

Une autre m ethode d evaluation des param` etres de la distribution d echantillonnage de la moyenne consiste ` a utiliser le principe du maximum de vraisemblance an de d eterminer l ecarttype associ e` a lestimateur , lorsque celui-ci est mesur e sur un grand nombre d echantillons. Il nest pas dicile de se convaincre que : 1 = ( )2 2W 2 (22)
=

En d erivant une deuxi` eme fois lexpression (16) par rapport au param` etre , nous obtenons ainsi 1 (m ) soit :
2

2W 2

=
= m i=1

1 2

(23)

m = . n

(24)

Cette derni` ere expression, que nous avons ainsi etablie de deux mani` eres di erentes, correspond ` a un r esultat que nous connaissons bien. Nous avons pu constater exp erimentalement que la valeur moyenne dun ensemble de n mesures tend ` a se stabiliser lorsque la taille n de l echantillon augmente. De mani` ere plus pr ecise, nous venons d etablir que l ecart-type sur la moyenne de n observations est plus petit que l ecart-type associ e` a une mesure unique , dans un rapport de 1/ n. Puisquune augmentation du nombre de points de mesure conduit ` a une meilleure localisation de la valeur moyenne, on pourrait alors penser quen partant dune mesure peu pr ecise, on puisse tr` es facilement augmenter la pr ecision de celle-ci gr ace ` a une simple r ep etition de la mesure. En eduire r ealit e, il nen est rien puisque le gain dans la pr ecision ne varie quen n. Ainsi, r

2.1

Estimateurs de la distribution de probabilit e associ ee ` a la mesure

15

lincertitude dun facteur 10 requiert deectuer 100 fois plus de mesures, et une am elioration dun facteur 1000 de cette m eme pr ecision obligerait ` a reproduire un million de fois la mesure. Il faut egalement etre conscient du fait que si un ensemble r ep et e de mesures permet eectivement de r eduire lerreur statistique, laugmentation du temps n ecessaire pour eectuer cette r ep etition des mesures n ecessite une tr` es grande stabilit e du dispositif ou de lappareil de mesure. En eet, si celui-ci d erive au cours du temps, la d eviation standard cesse d etre un bon indicateur de la 11 pr ecision de la mesure . 2.1.4 Moyenne d echantillon et loi des grands nombres

Nous avons suppos e que les mesures individuelles {x1 , , xN } de la grandeur x suivaient une distribution normale, centr ee sur et d ecart-type . Si le m eme appareil permet deectuer plusieurs d eterminations ind ependantes de la moyenne de N mesures, et que ces mesures ne sont pas aect ees par des erreurs syst ematiques, echantillon m suivra une distribution la moyenne d esultat est en r ealit e tout-` a-fait g en eral et normale centr ee sur et d ecart-type / N . Ce r est ind ependant de la forme initiale de la distribution de probabilit e, comme lindique la loi des grands nombres. An de comprendre pourquoi la forme initiale de la distribution de probabilit e Pr(x) associ ee ` une mesure individuelle de la grandeur x se trouve liss a ee pour aboutir ` a une loi gaussienne pour la moyenne d echantillon, commen cons par consid erer la distribution de probabilit e associ ee ` a la somme de deux tirages. Celle-ci va s ecrire : Pr(somme de deux tirages = x) = Pr(y )Pr(x y ) dy , (25)

et ainsi de suite pour la composition de plusieurs tirages. En dautres mots, la probabilit e dune somme est le produit de convolution des probabilit es individuelles. Pour continuer le calcul et simplier cette expression, introduisons la fonction caract eristique x (t) associ ee ` a la distribution de probabilit e normalis ee Pr(x) (cf. Annexe A) :
+

Pr(x) dx = 1

et

x (t) =

eitx Pr(x) dx

(26)

telle que : x (t) = = eitx 1 + it x t2 2 x + ... 2 (27)

` la condition quelle soit n-fois d A erivable, cette fonction x (t), qui porte egalement le nom de fonction g en eratrice des moments, permet de calculer les moments dordre 1 ` a n de la distribution de probabilit e. Remarquons que puisque Pr(x) est normalis ee, la fonction x (t) existe dans tous les cas mais ce nest pas forc ement le cas pour ses d eriv ees. On pensera ainsi ` a une distribution lorentzienne (ou de Cauchy), pour laquelle Pr(x) =
11

1 (1 + x2 )

et

x (t) = e|t| .

Ce probl` eme se pose en particulier lorsquon cherche ` a evaluer la stabilit e ` a long terme dun oscillateur ou dune horloge. Ainsi, depuis le d ebut des ann ees soixante et les travaux sur les horloges atomiques, de nombreuses etudes th eoriques et exp erimentales ont et e eectu ees pour caract eriser dune part les uctuations doscillation des r esonateurs, qui conduisent ` a une instabilit e en fr equence, et dautre part ` a ses instabilit es de fonctionnement au cours du temps. Nous renvoyons le lecteur int eress e par ce probl` eme ` a des r ef erences plus sp ecialis ees sur la m etrologie des temps et des fr equences (par exemple [?]).

16

EXPLOITATION DUNE SERIE DE MESURE

Ce type de distribution poss` ede ni valeur moyenne ni moments dordre sup erieur. De fa con equivalente, la fonction caract eristique qui lui est associ ee poss` ede une singularit e en t = 0 et ne permet donc pas de g en erer les moments de la distribution. Supposons maintenant que la distribution de probabilit e Pr(x) soit telle que x et x2 existent. Sans perdre de g en eralit e, nous pouvons egalement supposer que la moyenne est nulle et que la variance est egale ` a lunit e. Dans ce cas : x (t) = 1 Pour N 1 2 t + t2 o(t) 2 avec o(t) 0 pour t 0 . (28)

1, cette equation (28) conduit ` a la relation approch ee : [x (t)]n exp n t2 2 . (29)

En utilisant la relation de transform ee de Fourier : f (x) = 21 f (x) = nous obtenons ainsi : Pr(somme de n tirages = x) = 1 x2 exp 2N 2N . (31)
+ exp (itx) 2 1 exp 2x 2 2 + F (t) F (t) = exp (itx) f (x) dx 1 2 2 t F (t) = exp 2

(30)

Nous avons ainsi donn e une d emonstration 12 du th eor` eme de la limite centrale pour une somme de variables al eatoires ind ependantes. Nous en rappelons ici l enonc e. Soit XN = 1 N
N

xi
i=1

(32)

la moyenne dune somme de variables al eatoires ind ependantes, d ecrites toutes par la m eme loi de probabilit e Pr(x) pour laquelle la moyenne x et la variance 2 sont tous deux nis. Le th eor` eme de la limite centrale indique alors que : lim Pr(a XN b) = 1 2 N
b a

du exp

(u x )2 2 N
2

(33)

2.1.5

Estimateur de la variance de la distribution de probabilit e

Le r esultat d emontr e ci-dessus est remarquable car il nous dispense de conna tre la forme exacte de la distribution de probabilit e associ ee aux variables al eatoires initiales. Son application pose cependant deux probl` emes : Le r esultat d epend de la dimension N de la somme ; Pour lappliquer, il faut conna tre dune part la moyenne et dautre part la variance de la distribution de probabilit e initiale. Nous avons vu comment la donn ee dun echantillon de mesures {x1 , , xN } nous permettait destimer la moyenne x gr ace ` a la moyenne d echantillon m. Nous pouvons chercher de la m eme mani` ere quel est le meilleur estimateur de l ecart-type . Supposons ` a nouveau que
12

Les puristes auront certainement trouv e cette d emonstration insusamment rigoureuse..

2.1

Estimateurs de la distribution de probabilit e associ ee ` a la mesure

17

l echantillon de mesures soit issu dune distribution gaussienne sous-jacente. Pour d eterminer lestimateur , nous allons d eriver l equation (15) par rapport au param` etre :
N N W = + i=1

xi
N

xi 2

de sorte que : W =0 1 ( ) = N
2 i=1

( xi )2 .

(34)

Comme nous ne connaissons pas la valeur moyenne vraie , le r esultat de l equation (34) est cependant inutilisable ! En utilisant la moyenne d echantillon m, nous pouvons penser le remplacer par lestimateur : 1 N (m xi )2 . (35) S2 = N i=1 Nous devons cependant avoir une exigence dans le choix de lestimateur. Puisque la valeur de lestimateur peut uctuer dune r ealisation de l echantillon ` a lautre, une qualit e que nous devons imposer est que lensemble de toutes les estimations soit en moyenne egal ` a la valeur exacte du param` etre correspondant de la distribution de probabilit e. Ainsi, la relation E(m) = nous indique que la moyenne d echantillon m constitue bien un estimateur sans biais de la moyenne ` linverse, le choix de S 2 comme estimateur de la variance de la distribution de probabilit e. A 2 2 introduit un biais, puisque E(S ) nest pas exactement egal ` a 2 . On montre en eet (cf. Annexe ??) que : N 1 2 . E(S 2 ) = N Par cons equent, pour que lestimateur s2 de la variance 2 soit sans biais, il faut ajuster S 2 par le facteur (N 1)/N , soit : N 1 N S2 = N 1 N 1 N
N i=1

(m xi )2 .

Lestimateur sans biais de la variance 2 s ecrit ainsi : s2 = 1 N 1


N i=1

(m xi )2 .

(36)

La grandeur s d enie par l equation (36) est appel ee ecart-type d echantillon. Elle correspond ` a une caract erisation intrins` eque de la dispersion sur notre echantillon {x1 , , xN } de mesures. Insistons sur le fait quelle est de nature fondamentalement di erente de l ecart-type , puisque ce param` etre se r ef` ere au moment dordre deux de la loi de probabilit e associ ee ` a la mesure de la grandeur x. Notons que lapparition du facteur N 1 dans lexpression (36) est coh erente avec le fait quune seule mesure est insusante pour esp erer pouvoir estimer l ecart-type de la distribution de probabilit e associ ee ` a la mesure. Nous voyons ainsi appara tre la notion de degr es de libert e pour lobtention des estimateurs des moments de la distribution de probabilit e sous-jacente ` a la mesure : Lestimateur de la valeur moyenne est fond ee sur les N points de mesure, cest-` a-dire N degr es de libert e; Lestimateur de la variance 2 est obtenu avec seulement N 1 degr es de libert e, puisque nous avons d u dans un premier temps estimer la valeur moyenne de la distribution.

18

EXPLOITATION DUNE SERIE DE MESURE

Nous pouvons egalement remarquer que les deux expressions s2 = 1 N 1


N i=1

(m xi )2

et

( )2 =

1 N

N i=1

( xi )2

N et que la moyenne pr esentent aucune di erence notable pour N 1, puisque N 1 d echantillon m va converger vers pour cette limite des grands nombres. 2.1.6 Pr ecision sur la d etermination de lestimateur de la variance

Nous devons egalement etre conscients du fait que la valeur de l ecart-type d echantillon s, evalu ee selon lexpression (36) va uctuer dun echantillon de mesures {x1 , ; xN } ` a lautre. Pour evaluer l ecart-type associ e` a cette dispersion, nous pouvons partir de l equation (22), avec : 2W N 3 = 2 4 2
N i=1

( xi )2 =

N 2

13

2W 2

=
=

2N . ( )2

(37)

En rempla cant N par N 1, nous en d eduisons imm ediatement la variance V(s) associ ee ` a la d etermination de l ecart-type d echantillon s : V(s) = s2 2(N 1) (38)

Comme repr esent e sur la gure 5, ce r esultat montre que l ecart-type d echantillon s est connu avec une pr ecision relative s 1 . (39) s 2(N 1)

Si la forme de la d ependance par rapport ` a N ne nous etonne pas, nous voyons que pour N 10 mesures, lestimation s de l ecart-type de la distribution de probabilit e est eectu ee avec une incertitude de lordre de 25 %. Pour un echantillon de telle petite taille, il est par cons equent inutile de chercher ` a attribuer une valeur parfaitement d enie ` a l ecart-type d echantillon, tel quon peut le calculer a ` laide de la formule (36).

incertitude relative

s s

taille N de l echantillon
Figure 5: Pr ecision relative sur l ecart-type d echantillon s en fonction de la taille N de l echantillon consid er e.
Pour 5 ` a 6 mesures, cette pr ecision est de lordre de 30 % . Il est n ecessaire deectuer plus de 30 mesures pour que celle-ci devienne inf erieure ` a 20 %.

2.1

Estimateurs de la distribution de probabilit e associ ee ` a la mesure Cas dun petit nombre de mesures : fonction de Student

19

2.1.7

Nous venons d etablir que l ecart-type d echantillon s est un estimateur sans biais de l ecarttype de la distribution de probabilit e associ ee ` a la mesure. Cette approximation est dautant meilleure que le nombre N de points de mesure dans l echantillon est grand et d` es lors que N 20, il ny a plus de di erence signicative entre s et . Dans le cas dun echantillon de petite taille pour lequel N est par exemple inf erieur ` a 10, lanalyse est cependant plus compliqu ee. Supposons en eet que lune des valeurs xk dans lensemble des mesures {x1 , , xN } soit anormalement elev ee, sa valeur etant a priori relativement improbable compte tenu de la distribution de probabilit e. Une telle mesure anormale va alors fortement inuencer dune part la moyenne d echantillon m, prise comme estimateur de la mesure vraie xvraie , et dautre part la valeur de l ecart-type d echantillon s. Dans ces conditions, la probabilit e P0.95 que lintervalle de conance [m 2s, m + 2s] contienne la valeur xvraie sera inf erieure ` a 95 %. Il est par cons equent n ecessaire de revoir la proc edure dexploitation de l echantillon de mesures, en cherchant une distribution dont la forme soit eectivement li ee ` a la loi de Gauss mais qui soit cependant mieux adapt ee ` a la situation consid er ee dun echantillon de petite taille. Notre objectif consiste plus pr ecis ement ` a obtenir un intervalle de conance pour le r esultat de la mesure, en utilisant les valeurs m et s des estimateurs de la moyenne et de l ecart-type. Nous cherchons donc la quantit e e telle que : Pr(| m | e) = 1 soit : Pr |m |
s N

=1

avec

e =
s N

e
s N

Etant donn e que le num erateur m et le d enominateur distribution de probabilit e de la variable r eduite t= xm
s N

sont tous deux al eatoires, la

(40)

est celle dun ratio entre deux variables al eatoires. Cette distribution de probabilit e nest plus une fonction normale comme cela est le cas quand la variance 2 le d enominateur du ratio est un param` etre x e et connu. On montre que la variable r eduite t suit une distribution appel ee loi de Student ` a N 1 degr es de libert e et d enie par : fN 1 (t) = C 1+
t2 N 1
N 2

avec

C=

( N 2) 1 (N 1) ( N 2 )
13 .

(41)

o` u la fonction (x) est lint egrale dEuler de deuxi` eme esp` ece

Comme repr esent e sur la gure 6, cette fonction a une structure relativement simple. Pour N = 2, cest-` a-dire lexploitation de seulement deux points de mesure, la fonction de Student se confond avec une lorentzienne 1/ (1 + x2 ). Lorsque N devient tr` es grand, la distribution de 2 Student tend asymptotiquement vers une distribution de Gauss normalis ee 1/ 2 exp x 2 . Dans lhypoth` ese o` u toute erreur syst ematique a et e ecart ee et o` u les N mesures de l echantillon {x1 , , xN } sont tir ees dune distribution gaussienne plus vaste, lintervalle de conance de la
Cette fonction sp eciale constitue une g en eralisation de la fonction factorielle au cas dun argument non-entier, avec (N + 1) = N ! pour N entier.
13

20

EXPLOITATION DUNE SERIE DE MESURE

fonction de Student

N (Gauss) N =5

(a)

N = 2 (Lorentz)

(b)

variable r eduite t
Figure 6:
(a) Comparaison de la distribution t de Student pour di erentes valeurs du nombre N dans l echantillon de mesures. Lorsque N 1, ces courbes tendent asymptotiquement vers une distribution de Gauss. On notera que pour un echantillon contenant un nombre ni de valeurs, lutilisation de la distribution de Gauss conduit ` a sous- evaluer la probabilit e dobtenir des ecarts importants, qui seraient par exemple sup erieurs ` a 3 , par rapport ` a la valeur moyenne. (b) On doit ces lois ` a W. S. Gosset (19761937) qui etait ` a lorigine employ e par les c el` ebres brasseries Guinness an de mettre au point des techniques de contr ole de qualit e, lesquelles sont aujourdhui dune utilisation courante dans tout le monde industriel. Il publia ses travaux en 1908 sous le pseudonyme de Student, car la soci et e Guiness souhaitait pr eserver le secret sur les travaux dexploitation statistique, pensant quils etaient la cl e dun avantage industriel par rapport ` a des soci et es concurrentes !

grandeur x qui correspond ` a un niveau de conance donn e (par exemple 95 %) est alors de la forme : s s t ; + t N N

(42)

Cette expression fait intervenir le coecient de Student t . Ce coecient est obtenu par int egration de la distribution de Student pour un echantillon de taille N , correspondant ` a Nd = N 1 degr es de libert e. Si lon trouve dans tous les trait es de statistique des tableaux donnant les valeurs num eriques de ces coecients en fonction du niveau de conance et du nombre N de mesures, le logiciel Igor propose deux fonctions utiles qui sont directement li ees a ` ces distributions de Student :

StudentA(t,DegFree) donne laire de la distribution de Student correspondant ` a un nombre Nd =DegFree de degr es de libert e, comprise entre les valeurs -t et +t ; StudentT(Prob,DegFree) retourne la valeur de t qui correspond ` a une aire Prob endessous de la distribution de Student ` a Nd =DegFree degr es de libert e.

2.2

Exemple concret danalyse dune s erie de mesures

21

2.2
2.2.1

Exemple concret danalyse dune s erie de mesures


Position du probl` eme

Consid erons 10 mesures successives dune tension, eectu ees ` a laide dun m eme voltm` etre14 . N de la mesure Valeur lue (en V) 1 5.11 2 5.10 3 5.08 4 5.08 5 5.07 6 5.10 7 5.10 8 5.10 9 5.10 10 5.11

Si nous examinons les r esultats obtenus, dont les valeurs sont indiqu ees dans le tableau ci-dessus, nous constatons tout dabord quapparemment, aucune dentre elles ne s ecarte de mani` ere signicative des autres. Par cons equent, nous ne pouvons d eceler aucune erreur de manipulation dans la prise de ces donn ees. Quel est alors le r esultat de la mesure et comment lexprimer ? 2.2.2 Premier niveau danalyse

Il peut sembler logique de supposer que la vraie valeur de la tension se trouve comprise entre la valeur maximale Umax = 5.11 V et la valeur minimale Umin = 5.07 V de la s erie de mesure On trouvera parfois ecrit, ou arm e lors de la pr esentation dun montage, que l ecart entre ces deux valeurs conduit ` a une estimation de lerreur U , leur moyenne donnant une valeur probable de la grandeur mesur ee : Uprobable = Umax + Umax = 2 et U = Umax Umax , 2

ce qui revient ` a donner le r esultat de la mesure sous la forme U = (5.09 0.02) V. Cette analyse est evidemment simple et rapide. Nous esp erons cependant avoir convaincu le lecteur quelle est sans fondement, et que le r esultat ainsi enonc e na aucune valeur scientique. En particulier, si on venait ` a eectuer une nouvelle mesure de cette tension, rien ninterdirait dobtenir un r esultat dont la valeur soit situ ee nettement en dehors de lintervalle ecrit ci-dessus. M eme si ce type danalyse donne pratique des r esultats acceptables, il faut une fois pour toutes y renoncer et lui pr ef erer lexploitation statistique de la s erie de mesures. 2.2.3 Deuxi` eme niveau danalyse : etude statistique

Nous allons maintenant voir comment une analyse statistique de cet echantillon de mesures peut etre eectu ee simplement ` a laide du logiciel Igor. Apr` es avoir cr e e la wave tension contenant les dix valeurs mesur ees, nous allons tout dabord nous faire une id ee sur la r epartition de ces valeurs. Allons pour cela dans le menu Analysis Wave Stats..., ou tapons directement la commande correspondante WaveStats Tension dans la ligne de commande. Nous voyons alors simprimer dans la fen etre dhistoire les renseignements suivants : V npnts= 10; V numNaNs= 0; V numINFs= 0; V avg= 5.095; V sdev= 0.0135401; V rms= 5.09502; V adev= 0.011; V skew= -0.604267; V kurt= -1.22603; V minloc= 4; V min= 5.07; V maxloc= 0; V max= 5.11; Parmi ces di erentes variables dont on trouvera la signication dans la documentation du logiciel 15 , V avg et V sdev donnent respectivement la valeur moyenne d echantillon m = 5.095 et l ecart-type d echantillon s = 0.0135401.
Cet exemple est tir e du polycopi e de TP dAndr e Galais sur le traitement et lanalyse des donn ees. Igor Pro Version 4.0, Vol. II Users Guide et Vol. III Programming and Reference Manual (Wavemetrics, 2000).
15 14

22

EXPLOITATION DUNE SERIE DE MESURE

Nous allons ainsi pouvoir exprimer le r esultat de ces mesures sous la forme dun intervalle de conance, en prenant en compte les corrections de Student. Pour les N 1 = 9 degr es de libert e de l echantillon, la valeur de t correspondant ` a un niveau de conance de = 0.95 peut etre obtenue gr ace aux tables. Nous pouvons egalement utiliser ` a nouveau le logiciel Igor et sa fonction pr e-d enie StudentT : print StudentT(0.95,9) 2.26214 de sorte que : 0.0135401 s = 2.26214 = 0.009686 . t 10 N Nous avons maintenant tous les el ements pour exprimer le r esultat sous la forme : U = m U soit U = (5.095 0.010) V

Compte tenu de larrondi, cet intervalle correspond ` a un niveau de conance l eg` erement sup erieur a 95 % pour les 10 mesures eectu ` ees. Le r esultat pr ec edent peut egalement etre ecrit sous la forme U = 5.095(10) V . Cette convention de notation est en particulier utilis ee pour l ecriture des valeurs num eriques des constantes fondamentales, car elle conduit ` a une lecture plus agr eable lorsque la valeur num erique comporte un grand nombre de chires signicatifs. Remarquons que si nous navions pas tenu compte du facteur correctif introduit par la distribution de Student, nous nous serions content es de donner lincertitude sur la moyenne des 10 mesures pour un intervalle de probabilit e de 95 % comme s 2 N 0.0086 V .

Comme nous avons montr e pr ec edemment que l evaluation de lincertitude est eectu ee ` a environ 25 % pr` es, nous pouvons tout aussi bien lui donner une valeur comprise entre 0.0064 V et 0.0107 V. Lintervalle de conance d etermin e` a partir du coecient de Student recouvre ces valeurs et cest par cons equent celui que nous conserverons pour la suite. Enn, nous pouvons noter que le premier niveau danalyse, qui consiste ` a prendre les valeurs extr emes de la s erie de mesures comme bornes dun intervalle ctif qui contiendrait la vraie valeur conduit ` a une surestimation de lincertitude sur la mesure, nettement sup erieure ` a lincertitude eective s sur l ecart-type. 2.2.4 Comparaison avec la distribution gaussienne estim ee

Si cette analyse est rigoureuse et donne un r esultat nal quantitatif, on peut cependant lui reprocher de supposer implicitement que les mesures de la tension U sont distribu ees suivant une loi normale de Gauss. Nous pouvons par cons equent nous interroger sur la justesse de cette hypoth` ese, et chercher des crit` eres quantitatifs qui nous permettraient de la tester. Une premi` ere m ethode qualitative peut etre de simplement tracer lhistogramme des points de mesure en choisissant un pas 16 appropri e, par exemple Vbin = 0.01 V). Commen cons pour cela par cr eer une wave tension histo dans le logiciel Igor Pro, puis s electionnons r le menu Analysis > Histogram. Dans la fen etre qui appara t alors , pr ecisons r la wave de d epart (tension ), la wave de destination (tension histo ), le bin start (5), la largeur du pas (0.01) ainsi que le nombre de pas (20). La taille et l echelle de la wave (tension histo ) sont alors automatiquement calcul ees. Nous pouvons repr esenter la wave tension histo sous la
16

En anglais, bin.

2.2

Exemple concret danalyse dune s erie de mesures

23

forme dun histogramme, en s electionnant le mode Bars to next ` a la place de Line between points pour lachage de la courbe (gure 7). Nous pouvons ensuite superposer ` a cet histogramme la distribution de probabilit e d etermin ee ` partir de l a echantillon de mesures. La probabilit e dobtenir une valeur Ulue de la tension, avec le pas Vbin choisi, va alors s ecrire : Pr(Ulue ) = = 1 (Ulue m)2 Vbin exp 2s2 s 2 1 (Ulue (V) 5.095)2 0.01 . exp 2 (0.0135)2 0.0135 2 (43)

Lhistogramme des valeurs de l echantillon et la loi de Gauss correspondante N Pr(Ulue ), o` u le facteur N correspond au nombre total de points de mesure dans l echantillon, sont repr esent es sur la gure 7. Compte tenu de la faible statistique, l echantillon contenant seulement 10 mesures, il est evidemment dicile dexploiter cette simple repr esentation pour se convaincre ou non de la validit e de lhypoth` ese dune r epartition des mesures eectu ees selon la loi normale de Gauss. Le test du 2 , dont on trouvera la description dans tout ouvrage de statistique, permet de rendre ces consid erations plus quantitatives.

nombre d occurences

tension mesur ee (en volt)


Figure 7: Histogramme des mesures de la tension, trac e pour un pas d echantillonnage de 0.01 V, et
repr esentation en pointill e de la distribution de probabilit e associ ee. Cette courbe correspond ` a une gaussienne avec comme param` etres les valeurs des estimateurs m et s obtenus ` a partir de lexploitation de l echantillon de mesures. Les points () correspondent aux occurences pour chaque valeur de la tension obtenue dans l echantillon consid er e.

2.2.5

Vocabulaire de m etrologie : incertitudes de type A et de type B

Lincertitude U que nous venons d evaluer est celle sur la moyenne m des dix mesures. Elle ne correspond pas ` a celle qui aecte une mesure unique de la tension, laquelle est caract eris ee par l ecart-type dont s est un estimateur sans biais statistique. Ainsi, lintervalle de conance de 95 % pour une mesure unique de la tension U sera donn e comme [ m 2s ; m + 2s ], soit [5.081 V ; 5.109 V].

24

EXPLOITATION DUNE SERIE DE MESURE

Dans le langage des m etrologues, nous venons dutiliser une m ethode d evaluation de type A de lincertitude17 . Cette d enomination correspond par d enition ` a une technique d evaluation de lincertitude ` a partir dun proc ed e statistique qui prend en compte la dispersion des r esultats observ ee lorsquon r ep` ete ` a lidentique une mesure. Les m etrologues d enissent egalement les m ethodes d evaluation de type B, lesquelles correspondent a contrario aux techniques d evaluation de lincertitude qui ne sont pas fond ees sur une proc edure dexploitation statistique dun echantillon de mesures. L evaluation de ce type dincertitude sappuie en g en eral sur un jugement scientique elabor e ` a partir dune analyse physique de lexp erience. Il faut en particulier cerner la part dincertitude qui est due ` a chacune des corrections associ ees aux di erentes causes derreur ayant et e identi ees. On applique le m eme formalisme que pour les m ethodes de type A, ` a savoir evaluer lincertitude par une valeur Uk quon peut traiter comme un ecart-type. Cette valeur est d etermin ee ` a partir d el ements qui peuvent provenir dune bibliographie sur les mat eriaux et les capteurs utilis es dans lexp erience, de notices des constructeurs, d eventuels certicats d etalonnage, etc. mais egalement ` a partir des connaissances et du savoir-faire de lexp erimentateur. Pour obtenir ensuite lincertitude U (B) sur la correction totale, on applique la loi de composition des variances pour la somme de variables al eatoires ind ependantes. Dans lhypoth` ese o` u causes derreur et corrections ne sont pas corr el ees, celle-ci s ecrira : U (B)
2

=
k

(Uk )2 .

(44)

On peut egalement convenir de donner une incertitude globale en introduisant un facteur multiplicatif conventionnel 2, lequel correspond pour une loi normale de Gauss ` a la donn ee dun intervalle ` a risque derreur inf erieur ` a 5 %. Lincertitude compos ee Utot sur la mesure va tenir compte des incertitudes U (A) et U (B) evalu ees respectivement par les m ethodes de type A et B. Elle est obtenue par composition des variances : (Utot )2 = U (A)
2

+ U (B)

soit

(Utot )2 = t2

s2 + N

U (B)

(45)

Lincertitude nale sur le r esultat sera ensuite donn ee par la racine carr ee de cette variance. Cette expression montre egalement que lincertitude de type B aecte de la m eme mani` ere une mesure unique et la valeur moyenne dun echantillon de mesures. Contrairement ` a lincertitude de type A, ce type dincertitude ne peut etre r eduit par le moyennage dune s erie de mesures r ep et ees. Tout lart du physicien m etrologue sera alors de chercher ` a identier le mieux possible les di erentes causes derreur qui aectent la mesure quil r ealise. 2.2.6 Budget dincertitude de la mesure

Les m etrologues ont pour coutume de pr esenter les deux types de contributions sous la forme dun budget dincertitude. Nous allons illustrer ce concept ` a travers lexemple des dix mesures de la tension. Celles-ci ont et e eectu ees au moyen dun multim` etre num erique Tektronix dmm 912 dont nous disposons au laboratoire. Nous avons evalu e la dispersion associ ee ` a la r ep etabilit e des mesures, repr esent ee par une incertitude U (A) = 9.2 mV .
17 B. N. Taylor et C. E. Kuyatt, Guidelines for Evaluating and Expressing the Uncertainty of NIST Measurement Results, NIST Technical Note 1297 (1994). Ce document peut etre t el echarg e directement ` a ladresse web du nist.

25 Lincertitude de type B sera quant-` a elle due ` a l etalonnage du voltm` etre et ` a la limitation impos ee par la r esolution de lappareil num erique, soit : U (B) = 2 ( 0.2% VL + 1 UL ) o` u VL correspond ` a la valeur lue (5.10 V) et UL ` a une unit e du dernier chire exprimant la mesure. Le multim` etre ayant 2000 points et etant utilis e sur le calibre 10 V, UL correspond ` a 5 mV. On obtient ainsi un budget dincertitude quon peut repr esenter par le tableau ci-dessous : Composantes evalu ees par lanalyse statistique Exploitation de 10 mesures r ep et ees de la tension U (A) (incertitude de type A sur la moyenne des 10 mesures) Composantes evalu ees par dautres moyens Etalonnage du multim` etre (0.2 % de la valeur lue) R esolution du multim` etre (1 unit e de lecture) (B) U (incertitude de type B elargie ` a 2 ) Incertitude totale Utot = U (A)
2

en V 0. 009 7 en V 0. 010 2 0. 005 0 0. 030 4 en V 0. 032 1

+ U (B)

(valeur elargie a ` 2 )

` la lumi` A ere du budget dincertitude, nous avons montr e que la pr ecision de la mesure etait essentiellement x ee par la calibration du multim` etre... On se convaincra du fait quavec un peu dentra nement et lhabitude dun travail m ethodique, une telle analyse peut etre eectu ee tr` es rapidement.

Le r esultat nal de la mesure, qui prend en compte les deux types dincertitudes, sera ainsi donn e comme : U = (5.095 0.032) V .

3
3.1

Ajustement de courbes exp erimentales


Donn ees et moindres carr es
Position du probl` eme

3.1.1

Nous avons vu dans la partie pr ec edente comment il est possible dexploiter une s erie de mesures correspondant ` a la d etermination directe dune grandeur comme la tension, lintensit e, la position dun objet, etc. Dans son travail, le physicien exp erimentateur est tr` es souvent confront e` a un probl` eme de nature un peu di erente 18 . Lorsquon r ealise une exp erience, on est amen e` a mesurer une grandeur y en fonction dune autre grandeur x, soit quil sagisse d etablir une loi empirique, soit quil sagisse dutiliser une loi connue pour d eterminer une grandeur inconnue. Ainsi, on peut chercher ` a etablir la relation entre la pression et le volume dun gaz ` a temp erature constante, d eterminer comment varie le gain electronique dun amplicateur en fonction de la fr equence du signal dentr ee, etc. On peut egalement poss` eder une th eorie pr edisant la loi y (x) et chercher ` a d eterminer si cette th eorie est juste. Cest bien l` a lessence m eme dune mod elisation dexp erience, o` u on cherche a faire entrer les mesures dans le cadre th ` eorique et pr edictif dun mod` ele, et ` a valider les hypoth` eses physiques sur lesquelles il repose. En g en eral, la loi issue de la th eorie va egalement d ependre de param` etres dits ajustables, dont on ne conna t pas la valeur a priori et quon va tenter dajuster an dobtenir le meilleur accord possible avec les donn ees exp erimentales. On est ainsi amen e` a poser deux questions distinctes :
Cette partie est tr` es largement inspir ee du polycopi e de cours de Philippe Depondt Physique num erique (Licence Phytem, 2004), dont nous recommandons vivement la lecture.
18

26 (1) Est-ce que la th eorie marche ?

3 AJUSTEMENT DE COURBES EXPERIMENTALES

(2) Quelles sont les valeurs des param` etres ajustables, et les incertitudes associ ees ? Compte tenu de limportance de ce probl` eme, nul ne doutera de lint er et de regarder dun peu plus pr` es comment un logiciel comme Igor Pro peut etre utilis e pour r epondre ` a ces questions, et quels sont les algorithmes quil utilise. Nous pouvons egalement nous demander quelles sont les hypoth` eses sous-jacentes, et surtout quelles sont les eventuelles limites de ce type dexploitation. 3.1.2 Hypoth` ese de d epart

En pratique, lexp erimentateur rel` eve, pour N points de mesure {x1 , , xN }, les N valeurs {y1 , , yN } correspondantes. Supposons que lon dispose dune loi th eorique qui donne l evolution de la grandeur y en fonction de x. Les valeurs correspondantes, que nous noterons y sont suppos ees etre fonction de la variable x et dun certain nombre de param` etres {1 , , m }. Nous ecrirons par cons equent : y i = y (x | 1 , , m ) = y (x | {j }) (46)

e dune incertitude carNous supposerons par ailleurs que chaque r esultat mesure y i est aect act eris ee par un ecart-type i , comme repr esent e sur la gure 8

loi y (x) y

x1 x2
Figure 8:

x3

x4 x

Principe de lajustement dune loi th eorique y (x) ` a un ensemble de donn ees de mesure

{(x1 , y1 ), (x2 , y2 ), }. Pour chaque valeur xi , la mesure correspondante yi est eectu ee avec une incertitude yi . Cette pr ecision sur les mesures est repr esent ee par la barre derreur sur le graphique y (x).

Ce qui nous int eresse, ce sont les ecarts entre les yi mesur es et les valeurs y i calcul ees ` a laide de la loi th eorique pour les di erentes valeurs xi . On d enit ainsi la quantit e chi-deux comme : N 1 (xi | {1 , , m })]2 . (47) 2 (1 , , m ) = 2 [yi y i i=1

3.2

Ajustement par une fonction ane

27

Nous cherchons alors lensemble des param` etres {1 , , m } qui rendra le coecient 2 le plus petit possible. Cest pour cette raison que la m ethode porte le nom dajustement par moindres carr es puisque 2 est d eni comme la somme (pond er ee par lincertitude) des carr es des ecarts entre les mesures et les valeurs th eoriques calcul ees. Remarquons que nous aurions pu choisir autre chose que la somme des carr es des ecarts, par exemple la somme des valeurs absolues ou la borne sup erieure des carr es. La justication du choix que nous avons fait repose en fait sur lhypoth` ese que chaque mesure individuelle yi est tir ee dune distribution gaussienne sous-jacente dont la valeur moyenne est donn ee par la valeur vraie de yi , y (xi | {1 , , m }). Pour l ecart-type de cette loi de Gauss, nous prendrons naturellement l ecart-type i associ e` a lincertitude de mesure sur chacun des yi . La distribution de probabilit e correspondante va alors s ecrire Pr(yi | xi | {1 , , m }) = (xi | {1 , , m })]2 1 1 [yi y exp 2 2 i i 2 . (48)

Par analogie avec l equation (12), la fonction de vraisemblance va s ecrire


N

L(y1 yN | x1 xN | {j }) =

i=1

Pr(yi | xi | {1 , , m })

(49)

et nous cherchons les estimateurs { 1 , , m } qui rendent maximale cette fonction de vraisemblance, ou plut ot de mani` ere equivalente son logarithme W = ln L. Compte tenu de la d enition de L, celui-ci va s ecrire : N

W =

ln i 2

i=1

1 2

N i=1

[ y (xi | {1 , , m }) yi ]2 . 2 i

(50)

Puisque les valeurs des i sont x ees par la m ethode de mesure, les estimateurs { 1 , , m } vont correspondre aux valeurs des param` etres {1 , , m } qui rendent minimale la somme des carr es des ecarts 2 (1 , , m ) d enie par l equation (47).

3.2
3.2.1

Ajustement par une fonction ane


Ajustement sans prendre en compte dincertitudes

Consid erons pour commencer le cas le plus simple dune d ependance ane y = ax + b, o` u les deux param` etres ajustables sont les coecients a et b. Nous supposerons egalement que chaque mesure a le m eme poids statistique, de sorte que nous cherchons a et b tels que
N

2 (a, b) =
i=1

(axi + b yi )2

(51)

prenne une valeur minimale. Il faut pour cela que les d eriv ees de 2 par rapport aux deux param` etres a et b soient nulles :
a b

2 (a, b) 2 (a, b)

= =

N i=1 2xi (axi + b yi ) N i=1 2(axi + b yi )

= =

0 0

(52)

de sorte que les valeurs de a et b sont obtenues par la r esolution dun syst` eme lin eaire de deux equations ` a deux inconnues : a
N N 2 i=1 xi + b i=1 xi a N x + bN i=1 i

= =

N i=1 xi yi N i=1 yi

(53)

28

3 AJUSTEMENT DE COURBES EXPERIMENTALES

Notons que la derni` ere equation montre que la fonction obtenue par cet ajustement passe n ecessairement par le point dont les coordonn ees suivant x et y correspondent respectivement aux moyennes x et y des echantillons {x1 xN } et {y1 yN } : x = 1 N
N

xi
i=1

et

y =

1 N

yi .
i=1

(54)

Quelques lignes de calcul susent ensuite ` a d eterminer les valeurs de a et b : a =


N i=1 xi (yi N i=1 xi (xi

y) x)

et

b = y ax .

(55)

Lire dans un chier ou dans une m emoire les N valeurs de x et y , puis eectuer ces calculs pour obtenir la droite dajustement par moindres carr es est donc extr emement simple. On comprend pourquoi cette fonctionnalit e est disponible sur toutes les calculatrices scientiques, et quelle est egalement propos ee dans tous les tableurs. 3.2.2 Droite de r egression et coecient de corr elation

La droite obtenue par la proc edure dajustement par moindres carr es porte egalement le nom de droite de r egression. Ce nom provient des travaux eectu es au d ebut du XXe si` ecle par le g en eticien Francis Galton, dont on pourra lire une biographie sommaire dans lAnnexe B. ` parIl d ecouvrit en particulier un ph enom` ene quil qualia de r egression vers la moyenne. A tir de l etude de la taille des populations, il tenta dexpliquer pourquoi la taille des ls tend ` a r egresser vers la taille moyenne de la population, par comparaison avec la taille du p` ere. Ainsi, un p` ere de grande taille tend ` a avoir un ls de plus petite taille et vice versa. De mani` ere plus g en erale, lanalyse par r egression permet de sinterroger sur la relation qui peut exister e cause a eet entre deux variables x et y , en identiant cette relation et en mesurant cette importance. ` An de montrer comment la droite dajustement par moindres carr es permet de quantier la r egression entre une grandeur explicative x et une grandeur expliqu ee y (gure 9), introduisons les notations suivantes :
2 sx =

s2 y

= sxy =

1 N 1 N 1 N

2 N 1 i=1 (xi x) = N 2 N 1 i=1 (yi y ) = N N i=1 (xi x) (yi y )

N 2 2 i=1 xi x N 2 2 i=1 yi y N 1 = N i=1 xi yi

(56) xy

r egression de y en x yi erreur r egression y x


grandeurs.

xi

Figure 9: Droite de r egression de y en x, ayant pour but de quantier le degr e de corr elation entre ces deux

3.2

Ajustement par une fonction ane

29

Dapr` es l equation (55), la pente de la droite de r egression de y en fonction de x est donn ee par : sy sxy a = rxy avec rxy = . (57) sx sx sy La quantit e rxy est appel ee coecient de corr elation lin eaire. Nous pouvons egalement d enir une variance r esiduelle s2 par la relation R s2 R = soit s2 R 1 = N
N i=1

1 2 N

(58)

2 [yi (axi + b)]2 = s2 y 1 rxy

(59)

Cette grandeur correspond ` a la variance non expliqu ee par la droite de r egression de y en x. Dautre part, la variance sE expliqu ee par la droite de r egression est donn ee par : sE 1 = N
N i=1

(axi + b y )2 .

(60)

Un peu dalg` ebre permet d etablir la relation suivante :


2 2 2 sE = rxy s2 y = sy sR .

(61)

Ces r esultats permettent d etablir les propri et es les plus importantes du coecient de corr elation, a savoir : ` (a) Le coecient de corr elation rxy est une quantit e comprise entre 1 et +1 ; (b) Le coecient de corr elation en valeur absolue | rxy | en valeur absolue mesure, sur une echelle allant de 0 ` a 1, le degr e dalignement des points correspondant aux observations ; (c) Un coecient de corr elation rxy egal ` a 1 ou +1 indique un alignement parfait, soit une corr elation parfaite entre les deux grandeurs, tandis quun coecient de corr elation egal ` a 0 indique une absence corr elation ; (d) Le signe du coecient de corr elation indique si lalignement est de pente positive, correspondant ` a une corr elation positive, ou de pente n egative, correspondant ` a une corr elation n egative. 3.2.3 Incertitudes sur les param` etres de lajustement

Il y a evidemment une faiblesse criante dans ce que nous avons fait jusqu` a pr esent, puisque nulle part ne gure dincertitude sur cet ajustement. Plus pr ecis ement, nous aimerions conna tre lincertitude sur les param` etres a et b de la droite dajustement qui r esulte de l ecart-type sur les mesures de la grandeur y . Imaginons pour cela la r ealisation de nouvelles mesures de la grandeur y correspondant aux m emes N valeurs {x1 , , xN } de la grandeur x. Nous obtiendrions alors un nouvel echantillon de valeurs {y1 , , yN }, de sorte que lajustement par moindres a de nouvelles valeurs carr es des nouveaux couples de points {(x1 , y1 ), , (xN , yN )} conduirait ` a et b de la droite dajustement par moindres carr es. En supposant que chaque yi est tir e au sort ` a partir dune loi normale centr ee sur la valeur a xi avec un ecart-type (gure 10), les param` etres xi et yi sont reli es vraie yi correspondant ` par : yi = a xi + b (62)

30

3 AJUSTEMENT DE COURBES EXPERIMENTALES

droite de r egression y (x) y4 y3 y2 y1

Pr(y )

Figure 10: Mesures r ep et ees pour un ensemble x e de valeurs {x1 , x2 , , xN } de la grandeur x. Pour chaque
valeur xi , le r esultat yi de la mesure forme une distribution normale centr ee sur la valeur vraie y i . Les mesures etant suppos ees avoir le m eme poids statistique, chaque distribution gaussienne poss` ede le m eme ecart-type . Chaque nouvel ensemble de mesures {(x1 , y1 ), (x2 , y2 ), (xN , yN )} correspondra ` a une nouveau jeu de valeurs des param` etres a et b de la droite y = ax + b dajustement par moindres carr es. Lajustement vrai correspond quant-` a lui ` a la droite d equation y = ax + b, passant par les points {(x1 , y1 ), (x2 , y2 ) (xN , y N )}.

o` u a et b correspondent aux valeurs vraies des param` etres de lajustement par moindres carr es. Si nous ne sommes pas capables de conna tre ces valeurs puisque nous disposons dun seul ensemble de mesures, nous voulons pouvoir estimer les erreurs standard sur les valeurs de a et b donn ees par l equation (55) : (a)2 = (a a)2 et (b)2 = (b b)2 . (63)

` partir de la dispersion des valeurs de y par rapport ` A a celles estim ees par le mod` ele, nous montrerons en cours quil est possible de faire une estimation des incertitudes a et b.

3.3

Ajustement par une fonction polyn omiale

On peut g en eraliser facilement la d emarche pr ec edente au cas de lajustement des points de mesure par un polyn ome de degr ep:
p

P (x) = c0 + c1 x + c2 x2 + + cp xp =

cj xp .
j =0

(64)

Les coecients cj du polyn ome dajustement sont ` a nouveau d etermin es par la m ethode des moindres carr es, soit : 2 cj = cj i=1

N p k =0 2

ck xi k yi

=0.

(65)

3.4

Ajustement non-lin eaire

31

On peut se convaincre ais ement que le probl` eme va en fait se ramener ` a un syst` eme lin eaire de p equations ` a p inconnues correspondant aux coecients ck du polyn ome. On obtiendra par cons equent dans tous les cas une solution pour les param` etres de lajustement. Si une telle proc edure est commode an de par exemple pouvoir mod eliser une courbe d etalonnage dun capteur ou dun composant sans avoir besoin de conna tre un quelconque mod` ele physique, nous pouvons nous demander sil sagit de la m ethode g en erique dajustement. Poser la question revient evidemment ` a lui donner un d ebut de r eponse. Il sut de consid erer les equations de ce chapitre pour constater que cette m ethode donnera toujours un r esultat, aussi absurde quil puisse etre. La gure 11 montre ainsi un exemple dun ajustement de donn ees exp erimentales par une loi quadratique y = a + bx + cx2 , dont on peut douter de l` a-propos... Moralit e : ce nest pas parce quun programme dajustement par moindres carr es donne un r esultat que (1) le mod` ele est valid e et que (2) les param` etres donn es par le calcul algorithmique sont eectivement pertinents vis-` a-vis du probl` eme physique consid er e.

Figure 11: Un exemple dajustement. La gure (a) repr esente labondance relative dabeilles africanis ees
(axe horizontal) et dabeilles sans dard (axe vertical), et lajustement de ces donn ees par un polyn ome du second degr e. Cette courbe est tir ee dun article publi e en 1978 dans la revue prestigieuse Nature. La gure (b) propose un autre type dajustement...

3.4

Ajustement non-lin eaire

Ce qui rend lajustement de lois anes, et par extension de polyn omes, si simple, cest que la d ependance dun polyn ome par rapport aux param` etres qui le composent est lin eaire. Ainsi, la 2 2 fonction y = a + bx + cx est lin eaire en a, b et c, m eme si ce nest pas une fonction lin eaire de la variable x. Si la fonction dajustement ne d epend plus de fa con lin eaire des coecients de lajustement, le principe de la minimisation des moindres carr es peut continuer ` a etre appliqu e, tout au moins dans son principe. On utilise alors un algorithme dajustement non-lin eaire qui fonctionne selon la proc edure suivante. Imaginons quon cherche ` a trouver le fond dune vall ee ` partir dun point de d la nuit et dans le brouillard. A epart donn e, on suit naturellement la direction de plus grande pente pour descendre, et on continue ` a le faire jusqu` a aboutir ` a un minimu local. Bien evidemment, si on fait un pas de g eant, il se peut quon passe par-dessus ` linverse, plus on arrive vers le fond de la vall le fond de la vall ee. A ee et plus il est n ecessaire de faire des petits pas pour etre s ur de bien localiser le minimum. Dans la recherche du minimum

32

3 AJUSTEMENT DE COURBES EXPERIMENTALES

du 2 de lajustement, Igor utilise lalgorithme de LevenbergMarquardt 19 qui est une m ethode num erique astucieuse et ecace pour d enir la taille du pas au fur et ` a mesure quon se rapproche du minimum . Attention cependant ! Ce nest pas parce que cette m ethode est int egr ee dans le logiciel Igor Pro ou un autre, quelle est infaillible. Si le point de d epart de la recherche, cest-` a-dire 20 les valeurs propos ees initialement pour les param` etres de lajustement , est trop eloign e de la solution, le r esultat obtenu risque d etre absurde ou bien lalgorithme risque de ne jamais converger. Un autre danger est dutiliser un trop grand nombre de param` etres ajustables, chaque param` etre ajoutant une dimension ` a lespace de recherche. Dans ce cas, la signication physique du r esultat math ematique obtenu risque d etre assez discutable. Ind ependamment de lutilisation dun algorithme dajustement non-lin eaire, il existe au reste une premi` ere m ethode ecace pour tester, tout au moins de fa con semi-quantitative, la validit e dun mod` ele. Une bonne habitude est de tracer sur un m eme graphe la courbe th eorique et les r esultats exp erimentaux pour voir ` a lil si c a ressemble 21 ! On peut pousser un peu plus loin lanalyse en tra cant en parall` ele la courbe des ecarts entre fonction th eorique et points de mesure. Lajustement des valeurs des param` etres du t se fait alors par une proc edure essaierreur, qui converge plus ou moins rapidement... R esumons-nous pour conclure. Lorsquon ajuste un mod` ele th eorique ` a des donn ees exp erimentales, on est en pratique confront e` a deux types de dicult es: La recherche du minimum de 2 , sachant quil est parfois dicile de prouver que le minimum trouv e par le logiciel est bien le v eritable minimum de la fonction ; Le fait que davoir trouv e le minimum de 2 ne valide en aucun cas le mod` ele utilis e. Cest en fait le bon sens du physicien, et surtout son analyse critique, qui permet davoir conance dans lajustement. On doit consid erer les param` etres de lajustement comme des grandeurs physiques, voir si lordre de grandeur obtenu au moyen de lajustement est eectivement correct, v erier si une modication dun param` etre donn e entra ne bien une variation dans le sens quon observe exp erimentalement, etc. On pourra lire dans lAnnexe D ce que le physicien fran cais du d ebut du XXe si` ecle Henri Bouasse pensait, avec son outrance habituelle, de la m ethode dajustement par moindres carr es.

19 W. H. Press, S. A. Teukolsky, W. T. Vetterling et B. P. Flannery, Numerical Recipes in C: The Art of Scientic Computing, Cambridge University Press (2` eme edition, 1992). Le contenu de cet ouvrage de base sur les m ethodes num eriques peut etre consult e online, ` a ladresse http://www.library.cornell.edu/nr/bookcpdf.html. 20 Cest l` a une di erence fondamentale par rapport ` a lajustement dun polyn ome, o` u les valeurs des param` etres sont d etermin ees directement par la r esolution dun syst` eme lin eaire d equations. 21 Le logiciel Igor Pro ore cette possibilit e une fois la fonction de t d enie.

33

4
4.1

Annexes
Annexe A : rappels el ementaires sur les lois de probabilit e
Loi de probabilit e et fonction caract eristique

4.1.1

Consid erons une variable al eatoire X associ ee ` a une distribution de probabilit e Pr(X, x), telle que dPr = Pr(X, x)dx est la probabilit e el ementaire pour que le tirage de la variable X se fasse entre les valeurs x et x + dx. Nous ferons labus de langage traditionnel du physicien, qui consiste a confondre le nom de la variable al ` eatoire X avec celui de son echantillon x r eel. La fonction, maintenant not ee Pr(x), peut etre caract eris ee par la fonction caract eristique x (t), avec t r eel, d enie par : x (t) = eitx soit x (t) =
+

Pr(x)eitx dx .

(66)

En d eveloppant eitx en s erie enti` ere, on obtient : x (t) =

(it)n

n=0

xn n

(67)

de sorte que la connaissance de x (t) permet davoir directement les moments xn de la variable al eatoire, sans quil soit pour autant n ecessaire de disposer dune expression explicite de la fonction de distribution Pr(x). Nous pouvons egalement noter que :
dx (t) dt d2 x (t) dt2 dn x (t) dtn

(t = 0) = i x (t = 0) = x2 (t = 0) = in (68) xn

orant ainsi une mani` ere simple pour calculer les moments de la loi de probabilit e Pr(x) : xn = 4.1.2 1 in dn x (t) (t = 0) . dtn (69)

Cas de la distribution normale

Consid erons la distribution de probabilit e gaussienne centr ee sur = 0 et d ecart-type . La fonction caract eristique est alors donn ee par : x (t) =
+

eitx

2 x 1 e 22 dx 2

soit

x (t) = e

2 t 2 2

(70)

par le calcul habituel de la transform ee de Fourier dune fonction gaussienne. Par d eveloppement en s erie, on obtient alors : k t2k (1)k k x (t) = (71) 2 k k =0 On voit ainsi que tous les moments dordre impair sont nuls x tandis que ceux dordre pair valent : x
2p 2p+1

=0

= 2p C2p

avec

C2p =

(2p) . 2p p

34

ANNEXES

Gr ace ` a cette expression, on retrouve la variance de la distribution x 2 = 2 . On a de m eme x 4 = 3 4 de sorte que : x4 =3. x2 2 Cette derni` ere relation est souvent consid er ee comme la signature dune distribution gaussienne, lorsquon consid` ere une distribution de probabilit e Pr(x) qui est au d epart inconnue.

4.2
4.2.1

Quinconce de Galton ou la planche ` a clous


Description du dispositif

Une exp erience el ementaire permet de visualiser la limite gaussienne dun ph enom` ene al eatoire. Sur un plan inclin e, on plante en quinconce des clous de sorte quils soient r eguli` erement espac es, ` la base du plan inclin en les disposant sur des lignes horizontales parall` eles (gure 12). A e, se trouvent des compartiments identiques, s epar es par des cloisons qui prolongent les clous situ es ` a la base du quinconce. On place sur la ligne sup erieure une bille dont le diam` etre est sensiblement egal ` a la distance entre deux clous voisins. Depuis cette position initiale, la bille 1 , va descendre en passant ` a gauche ou ` a droite de chaque clou rencontr e avec la probabilit e 2 jusqu` a ce quelle tombe dans lun des compartiments ` a la base du quinconce. Lorsquon r ep` ete cette petite exp erience avec un grand nombre de billes, les billes accumul ees dans les di erents compartiments forment un histogramme dont lenveloppe se rapproche de plus en plus dune courbe en cloche. On trouvera sur le web 22 de tr` es nombreuses simulations de cette exp erience, dont le physicien naura pas manqu e de remarquer le lien avec le probl` eme de la marche au hasard ` a une dimension.

Figure 12: Exp erience du quinconce ou planche de Galton. On peut voir ce m eme dispoistif, r ealis e ` a
plus grande echelle, ` a la Cit e des Sciences de Paris.
22

Par exemple http://www-sop.inria.fr/mefisto/java/tutorial1/node11.html.

4.2

Quinconce de Galton ou la planche ` a clous

35

Pour la petite histoire, ce dispositif fut imagin e par Sir Francis Galton (18221911), qui v ecut ` a l epoque victorienne et fut lun des pionniers des etudes statistiques. Ce scientique, qui commen ca sa carri` ere par lexploration en 1844 du Nil blanc et du sud-ouest de lAfrique, aborda tout au long de sa vie de nombreux sujets, avec ` a chaque fois la volont e de quantier lobjet de ses etudes. S eduit par la th eorie de l evolution de son cousin Charles Darwin, il voulut justier la transmission des capacit es intellectuelles par lh er edit e an de permettre lam elioration de lesp` ece humaine. Son point de d epart etait le paradoxe suivant. Comment expliquer qu` a chaque g en eration, on observe une dispersion des tailles, alors qu` a celle des parents devra sajouter celle des enfants, et quen m eme temps la taille moyenne des individus dune population et la dispersion par rapport ` a cette moyenne restent ` a peu pr` es constantes quand les g en erations se succ` edent. Les concepts et m ethodes quil introduisit pour ses etudes, comme la corr elation et les analyses de r egression, sont devenus des outils de base de la statistique moderne. 4.2.2 Mod elisation math ematique de la planche ` a clous

On trouvera sur le web 23 de tr` es nombreuses simulations de cette exp erience, dont le physicien naura pas manqu e de remarquer le lien avec le probl` eme de la marche au hasard ` a une dimen1 , n), correspondant ` an sion. Ce dispositif illustre egalement la convergence de la binomiale B ( 2 tirages ind ependants dune pi` ece de monnaie non biais ee, vers une loi normale, montrant ainsi comment une succession de processus el ementaires, ind ependants les uns des autres, donne un eet nal dont lhistogramme de probabilit e tend vers une distribution normale. ` chaque choc de la Nous pouvons egalement justier ce r esultat de mani` ere el ementaire. A 1 a gauche (x = a) ou ` a droite (x = +a). bille contre un clou, elle a une probabilit e 2 daller ` Si nous notons x la variable al eatoire qui repr esente la position horizontale de la bille, sa fonction de distribution est : 1 x = +a 2 si 1 si x = a f (x) = 2 0 si x = +a a en choisissant de prendre la position du clou comme origine des axes. Par cons equent : E(x) V(x) = = 1 1 (a) + (+a) = 0 2 2 1 1 2 E([x E(x)] ) = (a 0)2 + (+a 0)2 = a2 . 2 2

Si nous nous int eressons maintenant ` a la position de la boule apr` es N chocs, son abscisse est une variable al eatoire
N

X=
i=1

xi

dont la fonction de distribution fN (x) est celle de la somme de N variables al eatoires identiques xi desp erance math ematique E(x) = 0 et de variance V(x) = a2 . Le th eor` eme de la limite centrale nous dit alors que cette fonction de distribution se comporte pour N 1 comme une loi normale : N 1 2 2 eX /2 fN (X ) avec 2 = V(xi ) = N a2 . 2 i=1 La r epartition que lon mat erialise en envoyant un grand nombre de billes qui vont venir saccumuler dans les di erentes colonnes a donc pour limite la fonction f (X ) =
23

1 2 2 eX /(2N a ) . N a 2

Par exemple http://www-sop.inria.fr/mefisto/java/tutorial1/node11.html.

36

ANNEXES

L` a encore, le lien avec la marche au hasard ` a une dimension est transparent. Le lecteur int eress e peut egalement samuser ` a retrouver ce m eme r esultat en consid erant les chemins parcourus par une bille et en evaluant les probabilit es que la bille, partant de X = 0 arrive ` a une position X donn ee. 4.2.3 Composition de deux dispersions cons ecutives

Le quinconce permit egalement ` a Galton de comprendre leet de la combinaison de deux dispersions successives. Les billes sont alors recueillies dans une premi` ere s erie de bacs, o` u elles dessinent une distribution normale d ecart-type . On rouvre ensuite les bacs s epar ement et on peut constater que dune part, chacun des bacs engendre une distribution normale, de m eme ecart-type et que dautre part, la r eunion de toutes ces petites distributions conduit ` a une grande distribution normale d ecart-type > . On v erie ainsi la propri et e de stabilit e des variables al eatoires gaussiennes : si lon compose deux variables gaussiennes stochastiquement ind ependantes, on obtient de nouveau une variable gaussienne. Pour d emontrer ce r esultat, consid erons deux variables gaussiennes x1 et x2 ind ependantes, caract eris ees par leurs valeurs moyennes 1 et 2 , ainsi que par leurs ecarts-types 1 et 2 . Posons X = x1 + x2 ; la fonction caract eristique de cette nouvelle variable al eatoire va alors s ecrire : X (t) = eitX = eit(x1 +x2 ) = eitx1 eitx2 de sorte que X (t) = x1 (t)x2 (t) = eit( x1
+ x2 )
( 2 + 2 )t 2 1 2 2

Nous voyons ainsi que X correspond ` a une variable al eatoire gaussienne avec comme param` etres : X = x 1 + x2 et
2 2 2 = 1 + 2 .

On notera que ce r esultat peut etre imm ediatement g en eralis e ` a la somme de plusieurs variables al eatoires gaussiennes.

4.3

Annexe C : variance d echantillon

Dans cette annexe, nous allons montrer que la variance d echantillon s2 , d enie par l equation (36), correspond ` a un param` etre qui, dans la limite dun grand nombre d echantillons de mesures {xi }, donne en moyenne la vraie variance 2 de la distribution de probabilit e Pr(x) associ ee ` a la mesure de la grandeur x. Calculons ainsi : s2 = = = 1 N 1 1 N 1 1 N 1
N i=1 N

(xi m)2 (xi + m)2


N N

i=1 N

i=1

(xi )2 2

i=1

(xi )(m ) +

i=1

(m )2

(72)

Nous reconnaissons sans dicult e le premier et le troisi` eme terme dans cette somme :
N i=1

(xi )2 = N 2

et

(m )2 =

2 . N

(73)

4.3

Annexe C : variance d echantillon

37

Nous devons calculer le deuxi` eme terme, que nous pouvons ecrire ` a partir de la d enition de la valeur moyenne d echantillon m :
N i=1

(xi )(m ) =

1 N

i=1 k =1

(xi )(xk .

Dans cette expression, la seule contribution non nulle correspond ` a i = k, do` u:


N i=1

(xi )(m ) =

1 N

N i=1

(xi )2 = 2

(74)

En reportant les expressions (73) et (74) dans l equation (72), nous obtenons nalement la 2 valeur moyenne de la variance d echantillon s : s2 = 4.3.1 1 N 1 N 2 2 2 + N 2 N soit s2 = 2 CQFD . (75)

Annexe D : m ethode des moindres carr es et poids des mesures

Dans lexploitation dune s erie de mesures, il est possible daecter chacun des points par un poids inversement proportionnel ` a la pr ecision de la mesure correspondante. Nous ne r esistons pas au plaisir de reproduire un extrait dun livre de Henri Bouasse 24 et nous laisserons au lecteur le soin de se forger sa propre opinion sur lemploi de telles pond erations dans lexploitation des r esultats exp erimentaux. Nous entrons ici dans le domaine du tripatouillage syst ematique et du bafouillage corr elatif. Ce que nous allons exposer est lart de faire rendre aux nombres bruts le r esultat quon d esire, pour l echer les bottes dun pontife, faire cadrer avec une th eorie absurde dont on est lauteur, ou tout simplement pour montrer quon est un imb ecile : il y a des gens qui pourraient se taire, mais qui nont de cesse quon les ait class es parmi les idiots. Le poids est un coecient dont on aecte le r esultat dun mesure ; il est cens e d eterminer sa pr ecision. Comme je ne veux pas avoir lair de d enigrer syst ematiquement, je cite lexemple suivant emprunt e ` a feu lastronome Hatt (membre de lInstitut, il va sans dire) : il est bien caract eristique de la sottise de certains savants. On a mesur e une m eme longueur successivement avec deux r` egles, lune en millim` etres, lautre en centim` etres, en estimant chaque fois la fraction de division. La premi` ere mesure, dix fois sup erieure en pr ecision a donn e 0.1853 m ; la deuxi` eme a donn e 0.186 m. En multipliant par 10 l equation de condition correspondant ` a la premi` ere mesure, on obtiendra deux seconds membres ayant la m eme pr ecision : 10 x = 1.853 m et x = 0.186 m

La r` egle des moindres carr es nous conduira ` a ecrire pour l equation normale : 101 x = 18.530 + 0.186 = 18.716 m soit x = 0.185307 m

Ce texte est-il assez b ete ! Quel cr etin, ayant mesur e avec le m` etre plus pr ecis, tiendra compte de la mesure avec lautre m` etre ? Quel cr etin encore plus g ateux simaginera obtenir une pr ecision meilleure parce quil aura joint ` a une mesure dune certaine pr ecision une mesure
H. Bouasse, Construction des instruments de mesure, p. 536, Delagrave (Paris, 1935). Les ouvrages de cet auteur sont connus pour la vigueur avec laquelle certaines th` eses sont d efendues, en particulier dans les pr efaces. Il ne faudrait cependant pas oublier que ce monumental trait e, constitu e de plus dune trentaine de volumes, regorge dexplications quon ne trouve nulle part ailleurs.
24

38

ANNEXES

evidemment moins pr ecise ? Quel abruti admettra quune mesure, estim ee dix fois plus pr ecise, doit etre aect ee, personne na jamais su pourquoi, du coecient 100 ? L` a-dessus vous direz que lexemple est sch ematique, quil ne faut pas attacher dimportance a une caricature ! Malheureusement, sous des oritures, chaque fois quun auteur met des poids, ` lop eration de di` ere en rien comme stupidit e de celle que suppose notre astronome hydrographe ! Lhomme intelligent raisonne ` a linverse. Quand une mesure vous semble mauvaise, laissezl` a de c ot e : il ny a pas de m ethode rationnelle pour utiliser lerreur. Cent mille mauvaises mesures nen font pas une bonne. Encore une fois, les exemples sont inniment nombreux des r esultats d eplorables que ces m ethodes de trompe-lil ont toujours donn es. En d enitive, mettre des poids, cest supposer quune op eration compte pour plusieurs ; on applique donc la m ethode ordinaire, en r ep etant plusieurs fois l equation de condition que fournit la mesure en question. Comme le poids est arbitraire, il ny a pas ` a discuter si lop eration de poids p doit etre consid er ee comme p, p2 ou pn op erations, larbitraire du choix de p pouvant evidemment se reporter sur le choix de n. Aussi bien on ne discute pas des sottises ; jen ai assez dit. Hatt parle du poids des observateurs. Il consent ` a ecrire : On appr ecie dune mani` ere plut ot vague le poids des observateurs. Quant aux instruments, on en d etermine lerreur moyenne par lensemble des r esultats ant erieurs. Javais pour coll` egue pendant de longues ann ees un homme dont les etrangers consid` erent les exp eriences commes bonnes, et qui cependant etait notre joie pour la fa con grotesque dont il exp erimentait. Ses pr eparateurs se chaient de lui ` a tel point quils faussaient syst ematiquement les exp eriences : jamais notre imb ecile ne sen est aper cu. Voil` a ` a quels r esultats dautres imb eciles mettront des poids ! (...) Lappareil ne vaut que par celui qui lemploie ; mais il est impossible de juger de lhabilet e de lobservateur sans recommencer ses exp eriences. Voil` a ce que dit le bon sens... et tout le reste nest que chaise ! Mettez des poids et des moindres carr es si c a vous amuse. Ca tient de la place, c a fait du papier noirci. Vous trouverez toujours dans les acad emies des gens, certes non pour vous lire, mais, sur des recommandations bien agenc ees, pour vous donner un prix, voire un fauteuil ! Vous ne demandez rien de plus ? Mettez des poids et des moindres carr es ! Et pour nir, voici la conclusion dHenri Bouasse, si on en doutait encore : Ma conclusion est tr` es simple. Vous voulez d eterminer un cercle : d eterminez-en trois points avec toute la pr ecision possible ; c a vaut beaucoup mieux que den d eterminer cent mille par-dessous la jambe. Quand vos trois points seront connus au mieux de vos appareils et de votre habilet e, faites passer le cercle. Si vous avez quatre points qui refusent de se placer sur le cercle a ` la pr ecision estim ee de vos appareils, menez un cercle a ` lil dans leur voisinage : tous les calculs que vous ajoueriez, perdraient votre temps sans aucun b en ece. Cest ainsi quop` erent les meilleurs physiciens : seuls les anes conservent lespoir de remplacer lhabilet e manuelle et les appareils bien etudi es par une manivelle math ematique. mais comme ils sont le nombre, ce nest pas demain quon cessera dappliquer la m ethode des moindres carr es.

S-ar putea să vă placă și