Documente Academic
Documente Profesional
Documente Cultură
$PQZSJHIUEJTDMBJNFS
-BGBDVMUJTBXFCTJUFUIBUDPMMFDUTNFEJDBMEPDVNFOUTXSJUUFOCZ"MHFSJBOBTTJTUBOUQSPGFTTPST
QSPGFTTPSTPSBOZPUIFSIFBMUIQSBDUJDBMTBOEUFBDIFSTGSPNUIFTBNFGJFME
4PNFBSUJDMFTBSFTVCKFDUUPUIFBVUIPShTDPQZSJHIUT
0VSUFBNEPFTOPUPXODPQZSJHIUTGPSUIFNPTUDPOUFOUXFQVCMJTI
-BGBDVMUUFBNUSJFTUPHFUBQFSNJTTJPOUPQVCMJTIBOZDPOUFOUIPXFWFS
XFBSFOPUBCMFUPCFJO
DPOUBDUXJUIBMMBVUIPST
*GZPVBSFUIFBVUIPSPSDPQZSJHIUTPXOFSPGBOZLJOEPGDPOUFOUPOPVSXFCTJUF
QMFBTFDPOUBDUVTPO
GBDBEN!HNBJMDPNUPTFUUMFUIFTJUVBUJPO
"MMVTFSTNVTULOPXUIBU-BGBDVMUUFBNDBOOPUCFSFTQPOTJCMFBOZXBZPGBOZWJPMBUJPOPGUIF
BVUIPSThDPQZSJHIUT
"OZMVDSBUJWFVTFXJUIPVUQFSNJTTJPOPGUIFDPQZSJHIUThPXOFSNBZFYQPTFUIFVTFSUPMFHBMGPMMPXVQ
Plus de cours sur: www.la-faculte.net merci pour votre visite
Biostatistique
Riad Benchoucha
Chapitre
1
Dans ce chapitre
1.1 Vocabulaire de base
1.2 Srie statistique
1.3 Reprsentations graphiques
Introduction ltude de la
statistique descriptive
La statistique descriptive est la branche des statistiques qui regroupe les nom-
breuses techniques utilises pour dcrire, cest--dire de rsumer ou reprsenter,
un ensemble relativement important de donnes.
Variable quantitative : si on peut mesurer cet aspect, cest--dire y faire des oprations, la variable
est dite de nature quantitative. Exemple : le poids
Si la variable quantitative ne prend que quelques valeurs, dites isoles, elle est discrte.
Exemple : le nombre denfants
Si la variable quantitative prend nimporte quelle valeur dun intervalle, elle est continue.
Exemple : le poids
Variable qualitative : si laspect ne se traduit pas par des nombres, ou nest pas mesurable, la
variable est de nature qualitative. Exemple : la couleur des yeux.
Mesures dans une chelle nominale, les modalits sont exprimables par des noms et ne
sont pas hirarchises.
Exemple : la couleur du pelage, les groupes sanguins, les diffrents nuclotides de lADN.
Mesures dans une chelle ordinale, les modalits traduisent le degr dun tat caractrisant
un individu sans que ce degr ne puisse tre dfini par un nombre qui rsulte dune mesure.
Les modalits sont alors hirarchises.
Exemple : le stade dune maladie.
Dans le cas dune variable discrte, les diffrentes modalits du caractre tudi seront notes x1 , x2 , x3
, , xi .
B. Variable continue :
Amplitude dune classe : lamplitude, ou lintervalle dune classe statistique borne est sa largeur. Lam-
plitude de la classe [a, b[ est b a. On parle aussi dtendue dune classe.
tendu dune srie statistique : ltendue dune srie statistique est la diffrence entre les deux valeurs
extrmes prises par un caractre quantitatif, on notera : E = xmax xmin .
Regroupement par classes En rgle gnrale, on choisit des classes de mme amplitude. Pour que
la distribution en frquence ait un sens, il faut que chaque classe comprenne un nombre suffisant de
valeurs (ni ).
1.2.2 Effectif
A. Effectif dune modalit ou dune classe
Leffectif dune modalit xi est gal au nombre dindividus qui prennent cette valeur, on le note ni .
Les diffrents effectifs seront nots n1 , n2 , n3 , . . . . . . , ni .
B. Effectif total
Leffectif total est gal au nombre dindividus de la population, on le note N. On a donc :
i
X
N = n1 + n2 + n3 + . . . . . . + ni = nk
k=1
1.2.3 Frquence
La frquence dune valeur est le rapport de leffectif de cette valeur sur leffectif total.
La frquence de la modalit xi , note fi , est donc gale :
ni
fi =
N
Remarque : si 0 (zro) est une modalit du caractre, il est dusage de dcaler lorigine.
C. Diagramme cumulatif
Le diagramme cumulatif est obtenu en reliant les btons cumuls par une ligne en escalier.
C. Courbe cumulative
La courbe cumulative est obtenue en reliant les points ayant pour abscisse la borne suprieur de la
classe et lordonne nic ou fi c . On joindra le premier point obtenu avec le point (a0 ; 0).
Remarque : une courbe cumulative bien trace ne comporte pas de cassures et a une forme en s
allong.
Remarque : les modalit tant non mesurables, on ne met pas de flche sur laxe des abscisses.
B. Diagramme circulaire
Le diagramme circulaire ou secteurs sert reprsenter en gnral un caractre qualitatif nominal.
Chaque secteur angulaire reprsentant une valeur ou modalit est proportionnel leffectif (ou frquence)
correspondant.
Remarque : on reprsente souvent les caractres qualitatifs nominaux par un diagramme bandes
car il est plus facile dessiner et permet une comparaison dans le temps de plusieurs sries.
Ni
1 2 3 4 5 6 7 8 9 10 Xi
Nic
1 2 3 4 5 6 Xi
Fic
1
1 2 3 4 5 6 7 8 9 10 Xi
FIGURE 1.3 En couleurs lhistogramme, en noir le
polygone des frquences. FIGURE 1.4 Courbe cumule.
Australie
Autres
Canada
UK
USA
Chapitre
2
Dans ce chapitre
2.1 Paramtres de position
2.2 Paramtres de dispersion
Lorsque lon est en face dune srie statistique comportant un grand nombre
de termes, il devient difficile danalyser directement lensemble des donnes.
Nous avons vu que la reprsentation graphique permettait dextraire une cer-
taine information. En complment de cette analyse qualitative, le statisticien
est amen simplifier la distribution observe par des caractristiques ou para-
mtres, significatives. Nous distinguerons deux types de caractristiques : celles
de la position et celles de dispersion.
Pour des donnes groupes en classes, on peut calculer une valeur approximative de la moyenne
en supposant que tous les individus dune classe se situent au centre de celle-ci. xi reprsente alors
le centre de la classe.
x+b=x
+b
Lorsquon multiplie chacune des valeurs du caractre par un mme rel a, la moyenne est multi-
plie par a (linarit de la moyenne arithmtique) :
ax=ax
La somme des carts la moyenne est nulle :
n
X
(xi x
) = 0
i=1
Remarque : On utilisera ces proprits lors dun changement de variable statistique (voir section
2.2.6 page 11).
A. Le mode
Le mode M o dune srie statistique est la valeur du caractre la plus frquente ou dominante dans
lchantillon.
Dans le cas dune variable continue, la classe modale correspond la classe de frquence maximale
dans la distribution des frquences. On peut identifier le mode comme la valeur mdiane de la classe
modale.
B. Quantile dordre
On appelle quantile dordre ( 2]0; 1[) le nombre not q tel quil y ait n des observations qui lui
sont inferieures dans une srie ordonne de taille n.
Interpolation linaire
Soit f une fonction dfinie sur R, [a; b] un intervalle de R et c un nombre rel .
Quand il nest pas possible de calculer limage de c par f , on utilise une interpolation linaire, cela
consiste remplacer f (c) par g(c) ou g est la fonction affine telle que g(a) = f (a) et g(b) = f (b).
On remplacera alors la courbe reprsentative de f sur [a; b] par la droite (AB). On dit que lon a
dtermin f (c) par interpolation linaire.
g(c)
f(c)
A
a c b
f (b) f (a)
f (c) ' f (a) + (c a)
b a
q l1 n F1
=
l2 l1 F2 F1
Avec :
l1 et l2 les xtrmits de la classe contenant q ;
F1 la frquence (ou effectif) cumule de la classe avant [l1 ; l2 ] ;
F2 la frquence (ou effectif) cumule de la classe [l1 ; l2 ].
F2
n
F1
l1 q l2
2.2.1 La variance
Soit un chantillon de n valeurs observes x1 , x2 , , xn dun caractre quantitatif X, x
sa moyenne
arithmtique. On dfinit la variance, note 2 ou var(x) comme la moyenne arithmtique des carrs des
carts la moyenne.
n
2 1X
= (xi )2
x
n
i=1
i i
2 1 X X
= nk (xk )2 ; N =
x nk
N
k=1 k=1
Pour des commodits de calcul, on utilisera la formule dveloppe suivante (thorme de KNIG) :
i i
2 1 X X
= (nk x2k ) 2 ; N =
x nk
N
k=1 k=1
Remarque : La variance et lcart-type sont des paramtres de dispersion absolue qui mesurent la
variation absolue des donnes indpendamment de lordre de grandeur des donnes.
Qi = Q3 Q1
Lintervalle interquartile limine le premier 25% et le dernier 25% soit la tte et la queue, des ob-
servations. On ne garde que les 50% au centre. Lintervalle interquartile est une bonne mesure de la
dispersion des donnes dune variable.
x=ay+b
On choisira :
a lamplitude de la classe ;
b le mode.
On crira y, on calculera y et y
2, respectivement la moyenne de la variance de y, puis on utilisera
ces formules :
x
= a
y+b
2
x = a2 y
2
Chapitre
3
Dans ce chapitre
3.1 Principe fondamental de lanalyse combinatoire
3.2 Arrangements
3.3 Permutations
3.4 Combinaisons
Lanalyse combinatoire
13
14 Lanalyse combinatoire
3.2 Arrangements
3.2.1 Arrangements sans rptition
En mathmatiques, lorsque nous choisissons p objets parmi n objets discernables et que lordre dans
lequel les objets sont slectionns revt une importance, nous pouvons les reprsenter par un k-uplet
dlments distincts et on en constitue une liste ordonne sans rptition possible, cest--dire dans
laquelle lordre des lments est pris en compte, si lon permute deux lments de la liste, on a une liste
diffrente, et un lment ne peut tre prsent quune seule fois.
n!
Apn = n(n 1)(n 2)...(n p + 1) =
(n p)!
Exemple : un examen, cinq candidats tirent les uns aprs les autres un sujet dans une urne conte-
nant des questions toutes diffrentes. Le premier tirage se fera sur un ensemble de 50 questions possibles.
chaque tirage suivant, la question qui vient dtre tire est enleve de lurne. Ainsi, en faisant passer
les cinq candidats, le tirage se fait dabord sur 50, puis sur 49, et ainsi de suite jusqu 46 qui reprsente
lensemble des questions restantes dans lurne pour le dernier tirage. Larrangement va consister addi-
tioner chaque modification possible de cet ensemble de dpart la nouvelle probabilit de piocher une
question donne. La solution pour cet exemple est donc un arrangement de 5 (p) 50 (n).
50!
A550 = 50(49)(48)(47)(46) = = 254 251 200
45!
np = np
Exemple : Dans lexemple prcdant, si on remettait la question tire de nouveau dans lurne
chaque tirage, ce serait un arrangement avec rptition de 5 (p) 50 (n), et la solution vaudrait :
5
50 = 505 = 312 500 000
3.3 Permutations
3.3.1 Permutations sans rptition
Une permutation de n objets distincts, correspond toute suite ordonne de ces n objets distincts ou
tout arrangement n n de ces objets.
3.4 Combinaisons 15
Pn = n!
Exemple : Pour trois objets, les permutations abc, bca, cab nen font quune, et de mme pour bac,
acb, cba puisquon peut choisir librement le premier objet.
3.4 Combinaisons
3.4.1 Combinaisons sans rptition
En mathmatiques, lorsque nous choisissons p objets parmi n objets distincts (discernables), num-
rots de 1 n et que lordre dans lequel les objets sont placs (ou numrs) na pas dimportance, nous
pouvons les reprsenter par un sous-ensemble k lments.
Un tel sous-ensemble k lments est appel une combinaison de p lments parmi n. Le nombre
de combinaisons que lon peut faire est not Cnp ou nk et vaut :
p n n!
Cn = =
k (n p)! p!
Voici pourquoi :
Il y a Apn manires de tirer p objets parmi les n en les ordonnants.
Une fois les p objets tirs, il y a Pp = p! manires de les ordonner.
Apn
Il y a donc manires de tirer p objets parmi n sans les ordonner.
p!
A. Proprits
Cnp = Cnn p
n p
Cnp+1 = Cnp
p+1
16 Lanalyse combinatoire
Chapitre
4
Dans ce chapitre
4.1 Vocabulaire de base
4.2 Lois de probabilits conditionnelles
Calcul de probalilits
17
18 Calcul de probalilits
4.1.3 Lintersection
Lvnement A\B (not parfois AB) est ralis ds que A et B sont raliss dans la mme exprience.
Dans un lancer de d, si lvnement A est obtenir un nombre pair et lvnement B obtenir un
multiple de 3 , lvnement est lvnement obtenir un nombre pair ET multiple de 3 , cest--dire
{6}.
vnement contraire : lvnement contraire de A, not A contient tous les lments de qui ne sont
pas dans A. Cest lvnement qui est ralis ds que A nest pas ralis.
vnements incompatibles : lorsque deux vnements ont une intersection vide, cest quil ne peuvent
pas tre raliss au cours dune mme exprience. On les appelle alors vnements incompatibles
ou mutuellement exclusifs.
B. Equiprobabilit
Si on estime que toutes les ventualits sont quiprobables, et si on note ||, le cardinal de , cest-
-dire le nombre dlments dans , chaque ventualit a une probabilit dapparition de :
1
P ({!1 }) = P ({!2 }) = ... = P ({!i }) =
||
Dans ce cas, et uniquement dans ce cas la probabilit de lvnement A est donne par la formule :
|A|
P (A) =
||
C. Proprits lmentaires
Des axiomes on dduit immdiatement les proprits suivantes :
Proprit 1 : p() = 1
Proprit 2 : p(;) = 0
Proprit 3 : p(A) = 1 p(A)
Proprit 4 : p(A [ B) = p(A) + p(B) p(A \ B)
Proprit 5 : p(A B) = p(A \ B) = p(A) p(A \ B)
Proprit 7 : p(A [ B [ C) = p(A) + p(B) + p(c) [p(A \ B) + p(A \ C) + p(B \ C) + p(A \ B \ C)]
Lois distributives
A [ (B \ C) = (A [ B) \ (A [ C)
A \ (B [ C) = (A \ B) [ (A \ C)
P (A \ B)
P (A/B) =
P (B)
En cas dquiprobabilit, nous aurons :
|A \ B|
P (A/B) =
|B|
20 Calcul de probalilits
B
A
A. Probabilit de lintersection
Pour deux vnements nous avons :
4.2.2 Indpendance
A. Indpendance de deux vnements
DFINITION
A est indpendant de B si P (A/B) = P (A)
A et B sont indpendants si et seulement si P (A/B) = P (A) et P (B/A) = P (B)
A et B sont indpendants si et seulement si P (A \ B) = P (A) P (B)
B. Indpendance mutuelle
DFINITION
Soit A1 , A2 , ..., An des vnements, ils sont dits mutuellement indpendants si et seulement
sils sont indpendants deux deux.
C. Formules de BAYES
Les formules de BAYES ont pour but dexprimer P (A/B) en fonction de P (B/A).
Soit Bi un systme complet dvnements.
Premire formule X
P (A) = P (A/Bi ) P (Bi )
i
Deuxime formule
P (A/Bi ) P (Bi )
P (Bi /A) = P
k P (A/Bk ) P (Bk )
21
3 Lanalyse combinatoire 13
3.1 Principe fondamental de lanalyse combinatoire . . . . . . . . . . . . . . . . . . . . . . 14
3.2 Arrangements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.2.1 Arrangements sans rptition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.2.2 Arrangements avec rptition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.3 Permutations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.3.1 Permutations sans rptition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.3.2 Permutations avec rptition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.3.3 Permutations circulaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.4 Combinaisons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.4.1 Combinaisons sans rptition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
A. Proprits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.4.2 Cominaisons avec rptition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4 Calcul de probalilits 17
4.1 Vocabulaire de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4.1.1 Oprations sur les venements . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4.1.2 Lunion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4.1.3 Lintersection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4.1.4 Probabilit sur un ensemble fini . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
A. Dfinition mathmatique . . . . . . . . . . . . . . . . . . . . . . . . . 18
B. Equiprobabilit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
C. Proprits lmentaires . . . . . . . . . . . . . . . . . . . . . . . . . . 19
D. Rappels utiles sur les oprations appliques aux ensembles . . . . . . . 19
4.2 Lois de probabilits conditionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4.2.1 Introduction et dfinitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
A. Probabilit de lintersection . . . . . . . . . . . . . . . . . . . . . . . . 20
4.2.2 Indpendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
A. Indpendance de deux vnements . . . . . . . . . . . . . . . . . . . . 20
B. Indpendance mutuelle . . . . . . . . . . . . . . . . . . . . . . . . . . 20
C. Formules de BAYES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20