Documente Academic
Documente Profesional
Documente Cultură
Jan-16
Fethi Derbeli
Agenda
Test dhypothse pour 01 Echantillon
Test pour la moyenne
Distribution Standard normale (Z) pour grande taille dchantillons
t-distribution pour une taille rduite dchantillons
Jan-16
Fethi Derbeli
Hypothesis Testing
Non Normal
Ho: s1 = s2 = s3 = ...
Ha: at least one is different
Minitab:
Stat - Anova Test for Equal Variances
For only two ss this is similar to an FTest: F=(S1)2 / (S2)2
If F calc > F table, then reject null.
(Use Chi-Squared for one sample)
Normality Test
Levenes Test
One
Ho: 1 = target
Sample
Ha: 1 target
Minitab:
Chi-Squared
Stat Basic Stats Display Descriptive
Statistics
Graphs: Graphical Summary
If s target falls with CI, then fail to
Two or More
Samples
Ho: 1 = 2 = 3 = ...
Ha: at leastone is different
Minitab:
Stat - Anova Test for Equal Variance
(For only two ss this is the same as an FTest: F=(S1)2 / (S2)2
If F calc > F table, then reject null.
Bartletts Test
reject Ho.
Ho: 1 = target
Ha: 1 target
1 Sample T Test
Minitab:
Stat - Basic Stats - 1 Sample-T
Stat Basic Stats Display Descriptive
Two
Statistics
Samples
Graphs: Graphical Summary
2 or More
Samples
Jan-16
Contingency
Table
Normal
Two or More
Samples
Ho: M1 = M target
Ha: M1 M target
1 Sample
Minitab:
Stat - Nonparametric - 1 Sample-Sign (OR)
Stat - Nonparametric - 1 Sample-Wilcoxon
(This is also used for paired comparisons:
Ho: M1 - M2 = 0)
M1 = Median of sample 1
M target = Target Median
Ho: M1 = M2 = M3 = ...
Ha: at least one is different
Minitab:
Stat - Nonparametric - Mann-Whitney (OR)
Stat - Nonparametric - Kruskal-Wallis (OR)
Stat - Nonparametric - Moods Median (OR)
Stat - Nonparametric - Friedmans
M1 = Median of sample 1, etc...
Two or More
Samples
One Way
Anova
CI, then
Ho: 1 = 2
2 Sample T Test
( Variances Equal)
Ha: 1 2
Minitab:
Stat - Basic Stats - 2-Sample T
(Compares Means using pooled Std Dev)
Assume equal variances
Ho: 1 = 2
2 Sample T Test
(Variances Not Equal)
Ha: 1 2
Minitab:
Stat - Basic Stats - 2-Sample T
(Compares Means using each sample Std Dev)
Fethi Derbeli
Ho: 1 = 2 = 3 = ...
Ha: at least one is different
Minitab:
Stat - Anova- One-way (or oneway unstacked)
Assumes Equal Variances
(Bartletts test must fail to
reject that variances are =.
Pertes
Ou
Limite infrieur de
Specifications
Jan-16
L = pertes financires
T = Valeur cible
k = Constante numrique
cible
x
Lmite superieur de
Specifications t
Fethi Derbeli
Tests-t
Objectifs de ce programme
Fethi Derbeli
x
s/ n
n = taille chantillon
s = Ecart typed deviation
= Moyenne cible
Cible
Jan-16
Fethi Derbeli
Observ
3.
4.
5.
6.
Problme
Pratique
Jan-16
Problme
Statistique
7.
8.
9.
Solution
Statistique
Fethi Derbeli
Solution
Practique
Tcrit-1
Tcal
Tcal
Tcrit-1 = T1-, n-1
Tcrit-2 = T, n-1
Fethi Derbeli
Tcrit
Utiliser la table
de distribution
1-cot
Tcal
Tcrit = T, n-1
Jan-16
Fethi Derbeli
Tcrit
Tcal
Tcrit = T1-, n-1
Fethi Derbeli
10
Exemple
fn: ballistic.mtw
Jan-16
Fethi Derbeli
11
Exemple (cont)
Step 8: Calculer le test statistic appropri:
Xbar = 226.95 et s = 8.63
tcalculated = {(226.95-230)/(8.63 5.5)} = |-1.94|
Step 9: Trouver la valeur critique de la distribution appropri
tcritical = t/2, 29df = 2.045; pour un deux cots
Puisque -1.94 < 2.045, on choue de rejeter Ho
parce que tcalculated < tcritical
Step 10: Il n y a pas de diffrence significative entre population et cible, alors, on
doit conclure que nous ralisons la valeur optimale.
Jan-16
Fethi Derbeli
12
Exemple (cont)
On utilisant Minitab pour Steps 8-10:
Stat > Basic Stats > 1 Sample T
Moyenne = 230
Options: Hypothse Alternative non gale
One-Sample T: Impulse totale
Test de mu = 230 vs mu not = 230
Variable
Total Impuls
Variable
Total Impuls
N
30
Mean
226.95
95.0% CI
(223.73, 230.18)
StDev
8.63
SE Mean
1.58
P
-1.93
0.063
Est ce que lanalyse confirme la solution manuelle? Interpreter la pvalue = 0.063 and the 95% CI pour mu.
Si on veut oprer 230nsec ou plus? Est ce que a change les
rsultats?
Jan-16
Fethi Derbeli
13
t /2 * s
Jan-16
Fethi Derbeli
14
Fethi Derbeli
15
(n 1)s 2
2
Fethi Derbeli
16
Fethi Derbeli
17
Jan-16
Fethi Derbeli
18
Exemple
fn: ballistic.mtw
Fethi Derbeli
19
Exemple (cont)
Step 6: On collecte alatoirement 30 pices de la production
Step 7: Mesurer et enregistrer les data
Step 8: Calculer le test statistique:
calc
48.6
2
2
(6.67)
Jan-16
Fethi Derbeli
20
Jan-16
Fethi Derbeli
21
210
220
230
Mean
StDev
Variance
Skewness
Kurtosis
N
240
Minimum
1st Quartile
Median
3rd Quartile
Maximum
0.260
0.688
226.953
8.630
74.4798
0.249783
-6.5E-01
30
211.500
220.325
226.150
232.950
244.500
222
223
224
225
226
227
228
229
230
231
230.176
scible = 6.67
Ne se situe pas
dans le CI 95%
pour sigma
Rejet hypothse
nulle
11.602
Jan-16
221.640
Fethi Derbeli
229.600
22
2
n /2, n-1 1
s
Cette quation demande un processus de slection
de la taille de lchantillon, la dtermination de la
valeur approprie de 2 et la vrification si
lgalit est rsolue.
Jan-16
Fethi Derbeli
23
Test 02 chantillons
Pourquoi on vrifie des paramtres de 02 populations?
Mthode Gnrale
StDev population1 vs. StDev population2
Manuellement: F-test
Minitab: Test galit des variances
Manuellement: 2 sample t
Minitab: 2 sample t
Options de lhypothse Alternative
Paired comparisons (blocking)
Class Exercises
Jan-16
Fethi Derbeli
24
Hypothesis Testing
Non Normal
Ho: s1 = s2 = s3 = ...
Ha: at least one is different
Minitab:
Stat - Anova Test for Equal Variances
For only two ss this is similar to an FTest: F=(S1)2 / (S2)2
If F calc > F table, then reject null.
(Use Chi-Squared for one sample)
Normality Test
Contingency
Table
Normal
Two or More
Samples
Levenes Test
Ho: M1 = M target
Ha: M1 M target
1 Sample
Minitab:
Stat - Nonparametric - 1 Sample-Sign (OR)
Stat - Nonparametric - 1 Sample-Wilcoxon
(This is also used for paired comparisons:
Ho: M1 - M2 = 0)
M1 = Median of sample 1
M target = Target Median
One
Ho: 1 = target
Sample
Ha: 1 target
Minitab:
Chi-Squared
Stat Basic Stats Display Descriptive
Statistics
Graphs: Graphical Summary
If s target falls with CI, then fail to
Two or More
Samples
Ho: 1 = 2 = 3 = ...
Ha: at leastone is different
Minitab:
Stat - Anova Test for Equal Variance
(For only two ss this is the same as an FTest: F=(S1)2 / (S2)2
If F calc > F table, then reject null.
Bartletts Test
reject Ho.
Ho: 1 = target
Ha: 1 target
1
Minitab:
Stat - Basic Stats - 1 Sample-T
Two or More
Samples
Sample T Test
Two
Samples
One Way
Anova
2 or More
Ho: M1 = M2 = M3 = ...
Samples
Ha: at least one is different
Minitab:
Stat - Nonparametric - Mann-Whitney (OR)
Stat - Nonparametric - Kruskal-Wallis (OR)
Stat - Nonparametric - Moods Median (OR)
Stat - Nonparametric - Friedmans
M1 = Median of sample 1, etc...
Jan-16
2 Sample T Test
Ho: 1 = 2
2 Sample T Test
(Variances Equal)
Ha: 1 2
Minitab:
Stat - Basic Stats - 2-Sample T
(Compares Means using pooled Std Dev)
Assume equal variances
Ho: 1 = 2
Ha: 1 2
Minitab:
Stat - Basic Stats - 2-Sample T
(Compares Means using each sample Std Dev)
Fethi Derbeli
Ho: 1 = 2 = 3 = ...
Ha: at least one is different
Minitab:
Stat - Anova- One-way (or oneway unstacked)
Assumes Equal Variances
(Bartletts test must fail to
reject that variances are =.
25
Machine A
Machine B
AAB
B BB B AA BB A B
AAAA
AAB
B BB B AA BB A B
AAAA
Fethi Derbeli
26
Fethi Derbeli
27
Jan-16
Fethi Derbeli
28
S1
a)
b)
c)
F-Distribution
S2
F(critical)
5% of total
area
Jan-16
Fethi Derbeli
29
F-Distribution
F(critical)
5% of total
area
Jan-16
Fethi Derbeli
30
Exemple
fn: 2samples.mtw
Normal Probability Plot
p-value = 0.595
.999
.99
Probability
.95
.80
.50
.20
.05
.01
.001
80
85
90
MachineA
erage: 84.24
Probability
.80
.50
.20
.05
.01
.001
80
85
90
MachineB
Jan-16
Fethi Derbeli
31
Exemple (cont)
Step 2: Vrifier lgalit des variances. Statuer lhypotheses
nul et alternatif.
Ho: MachineA = MachineB
Ha: MachineA MachineB
Step 3: Les variables alatoires du test de lgalit des
variances suivent une distribution-F
Step 4: On assume le niveau de risque (alpha) de 0.05
Step 5: La taille dchantillon est 10
Step 6: Collecter 10 chantillons alatoires pour chaque
machine
Step 7: Les data sont en fn: 2Samples.mtw.
Jan-16
Fethi Derbeli
32
Exemple (cont)
Step 8: Calculer les paramtres the random variable F
Descriptive Statistics: MachineA, MachineB
Variable
N
Mean
Median
TrMean
StDev
MachineA
10
84.240
84.500
84.125
2.902
MachineB
10
85.54
85.40
85.53
3.65
Fcalc = sB2 / sA2 = (3.65)2 / (2.902)2 = 1.5819
SE Mean
0.918
1.15
Jan-16
Fethi Derbeli
33
Factor Levels
MachineA
MachineB
2
F-Test
Test Statistic: 0.632
Levene's Test
Test Statistic: 0.775
P-Value
P-Value
: 0.505
: 0.390
MachineB
80
Jan-16
Minitab:
Stat > ANOVA > Test for Equal
Variances (stacked data)
Stat > Basic Statistics > 2
Variances (stacked OR unstacked
data)
85
90
Fethi Derbeli
34
MachineA
MachineB
95.0000
Sigma
Upper
2.90180
3.65033
5.84322
7.35049
N
10
10
Factor Levels
MachineA
MachineB
On choue de
rejeter Ho,
variances sont
egales.
Jan-16
Fethi Derbeli
35
x pop1 x pop2
tcalc
s
2
pooled
1 1
n1 n2
tcalc
Jan-16
Fethi Derbeli
x pop1 x pop2
s12 s22
n1 n2
36
Exemple
Step 1: Problme Pratique On a modifi une de deux machines. On veut
savoir sil y a une amlioration significative du rendement de la machine
modifie avant de la gnraliser sur les autres machines. Aprs avoir
collect des chantillons sur les rendements des 2 machines. On veut
dterminer sil y a une vraie diffrence entre les deux?
Rappel: Les data sont normales et les variances sont gales.
Step 2: Dterminer lhypothse nul and alternatif pour lamlioration des
rendements.
Ho: machineA = machineB
Ha: machineA < machineB
Step 3: Les variables alatoires pour le test des moyennes suivent la
distribution-t.
Step 4-7: Alpha est 0.05, taille des chantillons est de 10, Les chantillons
alatoires sont collects de chaque machine.
Jan-16
Fethi Derbeli
37
Exemple (cont)
Steps 8-9: test-t de 02 echantillons
Machine
A
B
N
10
10
Mean
84.24
85.54
StDev
2.90
3.65
SE Mean
0.92
1.2
Step 10: On doit statuer sur les cots des modifications damlioration des
rendements (bas sur 02 chantillons de donnes)
Jan-16
Fethi Derbeli
38
Chaque donnes est mesure 02 fois (01 pour chaque machine dans les
mmes conditions).
Blocking est utilis pour minimiser lexcs de variabilit caus par la
dpendance des chantillons. Rgle: Blocker ce qui tu peux, et chantilloner en
mode alatoire ce qui tu ne peut pas.
Jan-16
Fethi Derbeli
39
Exemple
Problem: Casco produit les alummes cigares et ses
composants pour les voitures utilisant 02 machines
dassemblages (appel Bodine 6 et Bodine 8). Les 02
machines produisent avec la mme cadance et le mme
rendement moyenne. Une modification est faite sur la
Bodine 6. Des Data sont collectes chaque heure durant
les 03 quipes. Est ce que la la modification a amliore
le rendement du Bodine 8?
Les data sont en fn: bodinepair.mtw
Quel est le variable de blockage dans le problme?
Que fait le blockage pour notre analyse?
Jan-16
Fethi Derbeli
40
fn: bodinepair.mtw
Jan-16
Fethi Derbeli
41
Exemple (cont)
Paired T-Test and CI: Bodine 6, Bodine 8
Paired T pour Bodine 6 - Bodine 8
N
Bodine 6 24
Bodine 8 24
Difference 24
Mean
StDev
0,963750 0,021832
0,955000 0,022067
0,008750 0,018954
SE Mean
0,004456
0,004504
0,003869
Fethi Derbeli
42
Jan-16
Fethi Derbeli
43
Les chantillons par paires contre des chantillons indpendants peuvent tre difficiles juger. La distinction est
nanmoins cruciale puisque des procdures statistiques diffrentes sont applicables dans chaque cas.
Par paires: en gnral dans le mme sujet.
Exemple: usure des pneus de deux marques sur la mme voiture en mme temps.
Indpendant: ncessite des chantillons indpendants prlevs au hasard.
Exemple: mesurer lusure de deux marques de pneus, une marque sur la voiture A et une autre marque
sur la voiture B.
Variances gales
Dans le cas du test-t deux chantillons, la fonction par dfaut de MINITAB est de ne pas supposer lgalit. En
gnral, si lgalit est suppose tort, on peut se tromper de beaucoup lorsquon estime la diffrence des moyennes.
Si lon suppose lingalit alors que les variances sont en fait gales, on obtient une approche lgrement
conservatrice et une faible partie de la prcision est perdue lors de lestimation.
Echantillonnage alatoire
En gnral, pour les tests-t, on suppose que nous collectons des donnes partir dchantillons au hasard dans une
distribution normale.
Mme si la distribution n est pas normale, la distribution t donne de bonnes approximations, tant que lchantillon
est prlev de faon alatoire .
Obtenir un chantillon qui ne soit pas alatoire est plus problmatique que les donnes non distribues normalement.
Jan-16
Fethi Derbeli
44
Rsum
Au cours de ce programme, nous avons abord lutilisation des vrifications dhypothses,
pour dtecter les diffrences des moyennes et des variances pour un ou deux chantillons.
T 1-Echantillon
But: Analyser la diffrence entre la moyenne obtenue et une valeur cible ou une
moyenne passe.
Caractristiques cls:
A utiliser lorsquil ny a quun seul chantillon pour tirer des
conclusions sur la moyenne de lchantillon.
T 2- Echantillons
But: Pour analyser la diffrence entre les moyennes obtenues de deux chantillons
indpendants.
Caractristiques cls : utiliser lorsquon a deux chantillons indpendants. Les
variances peuvent tre gales ou ingales.
Les donnes peuvent tre dans une seule colonne avec groupement variable ou dans
deux colonnes diffrentes.
T par paires
But: Analyser la diffrence entre les moyennes obtenues de deux chantillons lis.
Caractristiques cls :
Utilis avec les donnes par paires (souvent deux mesures du
mme sujet ou du mme objet test) lordre des observations est important. Chaque
observation doit tre dans la mme range que celle qui lui correspond.
Jan-16
Fethi Derbeli
45
Fethi Derbeli
46
Questions?
Jan-16
Fethi Derbeli
47