13 Test Hypothèse VC PDF

Vrification dhypothse:
Les donnes continues
Jan-16
Fethi Derbeli
Agenda
Test dhypothse pour 01 Echantillon
Test pour la moyenne
Distribution Standard normale (Z) pour grande taille dchantillons
t-distribution pour une taille rduite dchantillons
Test pour la variance (standard deviation)

Distribution Chi-carr
Test dhypothse pour 02 Echantillons

Test pour la variance
Test dgailit des variances
F-distribution
Test pour la moyenne

Egalit des variances
Ingalit des variances
Jan-16
Fethi Derbeli
Hypothesis Testing Roadmap
For all tests:

p > 0.05 Fail to Reject Ho (null)
p < 0.05 Reject Ho
Hypothesis Testing
Non Normal
Ho: s1 = s2 = s3 = ...
Ha: at least one is different
Minitab:
Stat - Anova Test for Equal Variances
For only two ss this is similar to an FTest: F=(S1)2 / (S2)2
If F calc > F table, then reject null.
(Use Chi-Squared for one sample)
Normality Test
Ho: Data is Normal

Ha: Data is NOT Normal
Minitab:
Stat - Basic Stat - Normality Test
Use Anderson-Darling
Levenes Test
One
Ho: 1 = target
Sample
Ha: 1 target
Minitab:
Chi-Squared
Stat Basic Stats Display Descriptive
Statistics
Graphs: Graphical Summary
If s target falls with CI, then fail to
Two or More
Samples
Ho: 1 = 2 = 3 = ...
Ha: at leastone is different
Minitab:
Stat - Anova Test for Equal Variance
(For only two ss this is the same as an FTest: F=(S1)2 / (S2)2
Bartletts Test
reject Ho.
Ho: 1 = target
Ha: 1 target
1 Sample T Test
Minitab:
Stat - Basic Stats - 1 Sample-T
Two
Statistics
Samples
2 or More
Samples
Jan-16
Contingency
Table
Normal
Two or More
Samples
Ho: M1 = M target
Ha: M1 M target
1 Sample
Minitab:
Stat - Nonparametric - 1 Sample-Sign (OR)
Stat - Nonparametric - 1 Sample-Wilcoxon
(This is also used for paired comparisons:
Ho: M1 - M2 = 0)
M1 = Median of sample 1
M target = Target Median
Ho: M1 = M2 = M3 = ...
Minitab:
Stat - Nonparametric - Mann-Whitney (OR)
Stat - Nonparametric - Kruskal-Wallis (OR)
Stat - Nonparametric - Moods Median (OR)
Stat - Nonparametric - Friedmans
M1 = Median of sample 1, etc...
Ho: Two factors are independent

Ha: Two factors are dependent
Minitab:
Stat -Tables - Chi-square Test
Attribute Data (2 factors only)
Continuous Data (one factor only)
If Xbar target falls with
Two or More
Samples
One Way
Anova
CI, then
fail to reject Ho.
Ho: 1 = 2
2 Sample T Test
( Variances Equal)
Ha: 1 2
Minitab:
Stat - Basic Stats - 2-Sample T
(Compares Means using pooled Std Dev)
Assume equal variances
Ho: 1 = 2
2 Sample T Test
(Variances Not Equal)
Ha: 1 2
Minitab:
(Compares Means using each sample Std Dev)
Fethi Derbeli
Ho: 1 = 2 = 3 = ...
Minitab:
Stat - Anova- One-way (or oneway unstacked)
Assumes Equal Variances
(Bartletts test must fail to
reject that variances are =.
La Function des pertes de Taguchi

L=k(x-T)2
Pertes
Ou
Toutes deviation du valeur

cible gnre des pertes
financires
Limite infrieur de
Specifications
Jan-16
L = pertes financires
T = Valeur cible
k = Constante numrique
cible
x
Lmite superieur de
Specifications t
Fethi Derbeli
Tests-t
Objectifs de ce programme
Tout au long de ce programme de formation, vous allez apprendre:

la mthode pour analyser la diffrence entre une moyenne dchantillon et une valeur
cible;
des mthodes pour analyser la diffrence entre les moyennes obtenues partir de deux
chantillons;
une mthode pour dterminer si des diffrences significatives de variance existent entre
deux chantillons ou davantage.
Nous aborderons lutilisation de graphiques, les intervalles de confiance, et les vrifications
dhypothse pour analyser les diffrences de moyennes obtenues partir dun ou plusieurs
chantillons. Nous envisagerons aussi une mthode pour analyser les diffrences possibles de
variance de deux chantillons ou plus.
Pralables: manipulation des donnes et analyse graphique, introduction aux statistiques par
dduction.
Prparation pour: les mthodes avec rgression, ANOVA, les Conceptions dExpriences
factorielles et la surface de rponse.
Jan-16
Fethi Derbeli
Moyenne Population vs. Moyenne cible

Pour tester la diffrence entre les valeurs des moyennes
demande des data variables et une distribution de
rfrence
La diffrence entre la moyenne des chantillons et la
cible est faite pour gnrer le test statistique. La formule
pour 1 Echantillon T Test est:
Tn 1
Where:
x
s/ n
n = taille chantillon
s = Ecart typed deviation
= Moyenne cible
Cible
Jan-16
Fethi Derbeli
Observ
Les tapes de la vrification d hypothse:

1. Caractriser le problme et dfinir les
objectifs
2.
3.
4.
5.
6.
Elaborer les hypothses

- Enoncer lhypothse nulle (Ho)
- Enoncer lhypothse alternative
(Ha).
Dcider du test statistique appropri
(distribution de probabilit suppose, Z, t,
2, F)
Indiquer le niveau Alpha (en gnral 5%)
Dfinir la taille de lchantillon
Dvelopper le plan dchantillonnage
Problme
Pratique
Jan-16
Problme
Statistique
7.
Effectuer la vrification et collecter les

donnes
8.
Calculer la statistique du test

(z, t, ou F) partir des donnes.
9.
Dterminer la probabilit que se

produise par hasard cette probabilit de
test calcule = valeur-P .
Si p-value < , rejeter Ho
Si p-value > , accepter Ho

10. Reproduire les rsultats et transposer la
conclusion statistique en une solution
pratique
Solution
Statistique
Fethi Derbeli
Solution
Practique
Ha: pop # Cible

Utiliser la
Tcrit-2 table de
distribution
2-cots
Tcrit-1
Tcal
Tcal
Tcrit-1 = T1-, n-1
Tcrit-2 = T, n-1
Rejet si Tcal < Tcrit-1 ou Tcal > Tcrit-2

Puisque T-distribution est symmetrique, on peut utiliser la
valeur absolue de Tcal et comparer seulement Tcrit-2, rejetant si
Tcal > Tcrit-2
Jan-16
Fethi Derbeli
Ha: pop > Cible
Tcrit
Utiliser la table
de distribution
1-cot
Tcal
Tcrit = T, n-1
Rejet si Tcal > Tcrit
Jan-16
Fethi Derbeli
Ha: pop < Cible

Utiliser la
table de
distribution
1-cots
Tcrit
Tcal
Tcrit = T1-, n-1
Rejet si Tcal < Tcrit

Puisque t-distribution est symmetrique on peut utiliser
la valeur absolue de Tcal et comparer T, n-1
Jan-16
Fethi Derbeli
10
Exemple
fn: ballistic.mtw
Step 1: Problme Pratique IL a t dtermin que les impulsions totales

optimale dun moteur aprs le temps dallumage (T0) 0.5 seconds aprs
lallumage est 230Nsec. Un chantillon de 30 allumages prises. Les data sont
prsents ballistics.mtw. On se basant sur des chantillons, est quon ralise la
la valeur optimale?
Step 2: Statuer lhypothse nulle et lhypothse alternative
Pour :
Ho: population = 230
Ha: population 230

Step 3: Le test statistique est une variable alatoire normalement distribue.
Puisque la taille des chantillons est petite ( 30), la distribution t est la
rfrence approprie.
Step 4: Le niveau de risque assum (alpha) est 0.05 pour un test deux cots.
Step 5: Taille dchantillon est 30.
Step 6: Dvelopper un plan dchantillonage.
Step 7: Collecter les data.
Jan-16
Fethi Derbeli
11
Exemple (cont)
Step 8: Calculer le test statistic appropri:
Xbar = 226.95 et s = 8.63
tcalculated = {(226.95-230)/(8.63 5.5)} = |-1.94|
Step 9: Trouver la valeur critique de la distribution appropri
tcritical = t/2, 29df = 2.045; pour un deux cots
Puisque -1.94 < 2.045, on choue de rejeter Ho
parce que tcalculated < tcritical
Step 10: Il n y a pas de diffrence significative entre population et cible, alors, on
doit conclure que nous ralisons la valeur optimale.
Jan-16
Fethi Derbeli
12
Exemple (cont)
On utilisant Minitab pour Steps 8-10:
Stat > Basic Stats > 1 Sample T
Moyenne = 230
Options: Hypothse Alternative non gale
One-Sample T: Impulse totale
Test de mu = 230 vs mu not = 230
Variable
Total Impuls
Variable
Total Impuls
N
30
Mean
226.95
95.0% CI
(223.73, 230.18)
StDev
8.63
SE Mean
1.58
P
-1.93
0.063
Est ce que lanalyse confirme la solution manuelle? Interpreter la pvalue = 0.063 and the 95% CI pour mu.
Si on veut oprer 230nsec ou plus? Est ce que a change les
rsultats?
Jan-16
Fethi Derbeli
13
Taille dchantillon 1-Sample T test

La formule prcdente:
t /2 * s
Choisir lintervalle de confiance (alpha = ?)

Choisir la diffrence minimum dtectable = - xbar
Estimer la variabilit = s
On peut aussi utiliser Minitab
Jan-16
Fethi Derbeli
14
Taille dchantillon utilisant Minitab

Minitab:
Stat > Power and Sample Size > 1-Sample t
Remplir nimporte deux
champs le troisime sera
calcul automatiquement
Differences: Dfinit en
fonction de lhypothse nul,
la difference mini quon veut
dtecter
Power Values: (1 - )
Sigma: Entrer le s historique
ou estim base sur
lexprience prcdente ou
processus similaire
1-Sample t Test
Testing mean = null (versus not = null)
Calculating power for mean = null + difference
Alpha = 0,05 Assumed standard deviation = 8,63
Sample Target
Difference Size Power Actual Power
3,05 65 0,8 0,801333
Jan-16
Fethi Derbeli
15
Tests de la Variance et l cart type

Rappelons la discussion de lintervalle de confiance
pour 2 et
Un chantillon statistique est une estimation dune paramtre
de la population
En prenant des chantillons de taille gale et on construisant
des histogrammes des variances des chantillons cre une
forme prdictible
Cette forme est appele chi-carr et dpend de la taille des
chantillons (n) et la valeur relle de la variance, 2 de la
population
La variable alatoire chi-carr est dfinit:

2
(n 1)s 2
2
Cette statistique est utilis pour dfinir le CI pour

variances et Ecarts typeand.
Jan-16
Fethi Derbeli
16
Population vs. cible

On a besoin dune distribution 2 et des data variables
Cette statistique peut tre utilise pour tester si la
variation dune population est significativement
diffrente dune valeur cible.
En dautre mots:
Y a t-il une diffrence significative entre population et
cible?
Cest le mme test statistique utilis pour des Data par
attribue mais avec des formules diffrentes :
2(calc) = (n 1)s2/ 2
Ou:
n = Taille de lchantillon
s2 = variance de lchantillon
2 = variance cible
Jan-16
Fethi Derbeli
17
Dterminer une Variance cible

Rappelons lquation:
Cp = (USL LSL) / 6s
Si nous sommes interresss de crer un processus six

sigma, Cp = 2.0.
On dvise les spcifications en 12 longueurs gaux
(chaque s gale une longueur)
Si notre objectif est diffrent de 6 process?
Si on veut avoir une Cp de 1.67?
Si notre s objectif pour un 4 process?
Jan-16
Fethi Derbeli
18
Exemple
fn: ballistic.mtw
Step 1: Problme pratique Le directeur veut savoir si la variabilit actuelle du

processus est au niveau six sigma.
Step 1a: Test de des data.
Stat > Basic Statistics > Normality Test
p = 0.688, data est normale
Step 2: Statuer lhypothse nulle et alternative.
On doit rsoudre lquation Cp pour s.
le USL du processus est 270, LSL est 190
Avec Cp de 2.0, s = 6.67
Pour :
Ho: population 6.67
Ha population > 6.67

Step 3: La distribution des chantillon est chi-carr
Step 4: On assume alpha est 0.05
Step 5: La taille de lchantillon est 30
Jan-16
Fethi Derbeli
19
Exemple (cont)
Step 6: On collecte alatoirement 30 pices de la production
Step 7: Mesurer et enregistrer les data
Step 8: Calculer le test statistique:
calc
(n 1)s 2 (30 1)(8.63)2
48.6
2
2
(6.67)
Step 9: Trouver la valeur critique du table (Breyfogle, p. 704)

2(critical) = 20.05, 29df = 42.56
Puisque 2(critical) < 2(calc), on rejete lhypothse nulle
Step 10: Il y a une diffrence significative entre population et cible; Le processus
nest capable un niveau qualit six sigma d des variation excessive
variation.
Jan-16
Fethi Derbeli
20
Exemple Utilisant Minitab

Minitab ne peut pas gnrer les tapes dun test 2
pour la variance
On peut calculer le CI pour la variance et vrifier
si la valeur cible se situe dans lintervalle
Lintervalle de confiance est gnr via :
Stat > Basic Statistics > Descriptive Statistics
Select Graphs
Graphical Summary
Choose confidence level: 95%
Jan-16
Fethi Derbeli
21
Minitab Resume Graphique

Descriptive Statistics
Variable: Total Impuls
Anderson-Darling Normality Test
A-Squared:
P-Value:
210
220
230
Mean
StDev
Variance
Skewness
Kurtosis
N
240
Minimum
1st Quartile
Median
3rd Quartile
Maximum
95% Confidence Interval for Mu
0.260
0.688
226.953
8.630
74.4798
0.249783
-6.5E-01
30
211.500
220.325
226.150
232.950
244.500
95% Confidence Interval for Mu

223.731
221
222
223
224
225
226
227
228
229
230
231
230.176
scible = 6.67
Ne se situe pas
dans le CI 95%
pour sigma
Rejet hypothse
nulle
95% Confidence Interval for Sigma

6.873
11.602
95% Confidence Interval for Median

95% Confidence Interval for Median
Jan-16
221.640
Fethi Derbeli
229.600
22
Taille dchantillon pour test 2

On fait une supposition pour dterminer la taille
approprie de lchatillon pour le test de variance
La formule des varaibles alatoires:
2
2
n /2, n-1 1
s
Cette quation demande un processus de slection
de la taille de lchantillon, la dtermination de la
valeur approprie de 2 et la vrification si
lgalit est rsolue.
Jan-16
Fethi Derbeli
23
Test 02 chantillons
Pourquoi on vrifie des paramtres de 02 populations?
Mthode Gnrale
StDev population1 vs. StDev population2
Manuellement: F-test
Minitab: Test galit des variances
Moyenne Population1 vs. Moyenne Poulation2
Manuellement: 2 sample t
Minitab: 2 sample t
Options de lhypothse Alternative
Paired comparisons (blocking)
Class Exercises
Jan-16
Fethi Derbeli
24
Hypothesis Testing Roadmap
For all tests:

p > 0.05 Fail to Reject Ho (null)
p < 0.05 Reject Ho
Hypothesis Testing
Non Normal
Ho: s1 = s2 = s3 = ...
Minitab:
Stat - Anova Test for Equal Variances
For only two ss this is similar to an FTest: F=(S1)2 / (S2)2
(Use Chi-Squared for one sample)
Normality Test
Ho: Data is Normal

Ha: Data is NOT Normal
Minitab:
Stat - Basic Stat - Normality Test
Use Anderson-Darling
Contingency
Table
Normal
Two or More
Samples
Levenes Test
Ho: M1 = M target
Ha: M1 M target
1 Sample
Minitab:
Stat - Nonparametric - 1 Sample-Sign (OR)
Stat - Nonparametric - 1 Sample-Wilcoxon
(This is also used for paired comparisons:
Ho: M1 - M2 = 0)
M1 = Median of sample 1
M target = Target Median
One
Ho: 1 = target
Sample
Ha: 1 target
Minitab:
Chi-Squared
Statistics
If s target falls with CI, then fail to
Two or More
Samples
Ho: 1 = 2 = 3 = ...
Ha: at leastone is different
Minitab:
Stat - Anova Test for Equal Variance
(For only two ss this is the same as an FTest: F=(S1)2 / (S2)2
Bartletts Test
reject Ho.
Ho: 1 = target
Ha: 1 target
1
Minitab:
Stat - Basic Stats - 1 Sample-T
Two or More
Samples
Sample T Test

Statistics
Two
Samples
One Way
Anova
If Xbar target falls with CI, then

fail to reject Ho.
2 or More
Ho: M1 = M2 = M3 = ...
Samples
Minitab:
Stat - Nonparametric - Mann-Whitney (OR)
Stat - Nonparametric - Kruskal-Wallis (OR)
Stat - Nonparametric - Moods Median (OR)
Stat - Nonparametric - Friedmans
M1 = Median of sample 1, etc...
Jan-16
Ho: Two factors are independent

Ha: Two factors are dependent
Minitab:
Stat -Tables - Chi-square Test
Attribute Data (2 factors only)
Continuous Data (one factor only)
2 Sample T Test
Ho: 1 = 2
2 Sample T Test
(Variances Equal)
Ha: 1 2
Minitab:
(Compares Means using pooled Std Dev)
Assume equal variances
Ho: 1 = 2
(Variances Not Equal)
Ha: 1 2
Minitab:
(Compares Means using each sample Std Dev)
Fethi Derbeli
Ho: 1 = 2 = 3 = ...
Minitab:
Stat - Anova- One-way (or oneway unstacked)
Assumes Equal Variances
(Bartletts test must fail to
reject that variances are =.
25
Pourquoi le Test dhypothse 02 chantillons?
Il y a plusieurs raisons de connaitre

sil ya une diffrenec significative
entre 02 populations.
Evaluer le potentiel qualit dun
nouveau fournisseur
Savoir si une modification a
gnre des amliorations des
performances
Quantifier la diffrences entre
deux machines
Savoir si une modification du
dsigne dun produit a apport
les amliorations attendues.
Machine A
Machine B
AAB
B BB B AA BB A B
AAAA
AAB
B BB B AA BB A B
AAAA
Y a t il ine diffrence significative entre A et B?

Jan-16
Fethi Derbeli
26
Les tapes de la vrification d hypothse:

1. statuer le problme pratique et dfinir les
objectifs de lamlioration
a) Vrifier la normalit
4. Indiquer le niveau Alpha (en gnral

5%)
5. Dfinir la taille de lchantillon
6. Dvelopper le plan dchantillonnage
2. Elaborer les hypothses
7. Effectuer la vrification et collecter les
1. - Enoncer lhypothse nulle
donnes
(Ho)
1. Enoncer lhypothse alternative (Ha). 8. Calculer la statistique du test
4. (z, t, ou F) partir des donnes.
For :
2. For :
3.
Ho: pop1= pop2
Ho: pop1 9.
Dterminer la probabilit que se
= pop2
produise par hasard cette probabilit de
(normal data)
Ho: M1 = M2
test calcule = valeur-P .
(nonnormal data)
4.
4. Si p-value < , rejeter Ho
5.
Ha: pop1 pop2
Ha: pop1
5. Si p-value > , accepter Ho
pop2
10. Reproduire les rsultats et transposer la
(normal data)
Ho: M1 M2
conclusion statistique en une solution
(nonnormal data)
pratique
3. Dcider du test statistique appropri
(distribution de probabilit suppose, Z, t,
2, F)
Jan-16
Fethi Derbeli
27
Population St. Dev.1 vs Population St. Dev. 2

Lorsque on compare les moyennes de deux populations, utilisant des data
variables on doit premirement vrifier sil y a une diffrence statistiques entre
les variances (test degalit des variances). Ce test est important puisquil
affecte la formule utilise dans le test des moyennes.
On a besoin aussi de savoir si la populations est normallement distribue (test
de normalit) pour dterminer le type de test de variance effectuer.
Les rsultats de test de normalit et le test de variance vont dterminer la
supposition adquate pour lanalyse de les tendances centrales de la
population (moyennes vs. medianes avec ou sans galit des variances)
Le test exige lutilisation du test statistique -F
Le test statistique-F peut tre utiliser pour comparer 02 ou plusieurs variances. (Le
test F est utilis pour 02 chantillons.) Ce test assume que les data sont
normallement distribues.
Test statistique du Levene est utilis pour comparer 2 ou plusieurs variances et il
est appropri pour les donnes continues mais peuvent tre non normallement
distributes.
Jan-16
Fethi Derbeli
28
Test dgalit des Variances

Ho: pop1= pop2
Ha: pop1 pop2
S1
a)
Calculer Fcalc sachant que Fcalc >1

Fcalc = s22 / s12 ou Fcalc = s12/s22
b)
Comparer Fcrit (pour = 0.05)
c)
Si Fcalc > Fcrit, on rejete Ho
F-Distribution
S2
F(critical)
5% of total
area
Jan-16
Fethi Derbeli
29
Cest quoi F(critique)?

Si on veut savoir la valeur critique, on peut lavoir partir du table F.
la valeur dpend de la valeur alpha, et le degr de libert des deux
facteurs (numrateur and dnominateur).
Quand la valeur F calcule dpasse la valeur F critique ( = 0.05), la
valeur p va tre plus petit que 0.05. implique que les deux variances
sont diffrentes (p is low H0 must go).
F-Distribution
F(critical)
5% of total
area
Jan-16
Fethi Derbeli
30
Exemple
p>0,05 on choue de rejeter Ho. Data est

normale
fn: 2samples.mtw
Normal Probability Plot
p-value = 0.595
.999
.99
Probability
.95
.80
.50
.20
.05
.01
.001
80
85
90
MachineA
erage: 84.24
Anderson-Darling Normality Test
Normal Probability Plot

p-value = 0.942
.999
.99
.95
Probability
Step 1: Problme Pratique On a modifi

une de deux machines. On veut savoir sil y
a une amlioration significative du
rendement de la machine modifie avant de
la gnraliser sur les autres machines. Aprs
avoir collect des chantillons sur les
rendements des 2 machines. On veut
dterminer sil y a une vraie diffrence entre
les deux?
Premirement on vrifie si les data sont
normalement distribues.
Stat > Basic Stats > Normality Test
Ho: Data est normale
Ha: Data ne sont pas normale
.80
.50
.20
.05
.01
.001
80
85
90
MachineB
Jan-16
Fethi Derbeli
31
Exemple (cont)
Step 2: Vrifier lgalit des variances. Statuer lhypotheses
nul et alternatif.
Ho: MachineA = MachineB
Ha: MachineA MachineB
Step 3: Les variables alatoires du test de lgalit des
variances suivent une distribution-F
Step 4: On assume le niveau de risque (alpha) de 0.05
Step 5: La taille dchantillon est 10
Step 6: Collecter 10 chantillons alatoires pour chaque
machine
Step 7: Les data sont en fn: 2Samples.mtw.
Jan-16
Fethi Derbeli
32
Exemple (cont)
Step 8: Calculer les paramtres the random variable F
Descriptive Statistics: MachineA, MachineB
Variable
N
Mean
Median
TrMean
StDev
MachineA
10
84.240
84.500
84.125
2.902
MachineB
10
85.54
85.40
85.53
3.65
Fcalc = sB2 / sA2 = (3.65)2 / (2.902)2 = 1.5819
SE Mean
0.918
1.15
Step 9: Determiner la valeur critique du table F

Fcrit = F.05,9,9 = 3.18
Step 10: Puisque 3.18 > 1.5819, on choue de rejeter Ho

Il ny a pas de diffrence significative entre s2machineA et
s2machineB, les variances sont supposes gaux.
Solution pratique: Eviter de modifier le rest des machines
Jan-16
Fethi Derbeli
33
Minitab: Test dgalit des Variances

Si la normalit est confirme on utilise le test statistique
de Bartlett (Minitab)
Si la distribution net pas normale, on utilise test
statistique de Levene (Minitab)
Test for Equal Variances
95% Confidence Intervals for Sigmas
Factor Levels
MachineA
MachineB
2
F-Test
Test Statistic: 0.632
Levene's Test
P-Value
P-Value
: 0.505
: 0.390
Ho: pop1 = pop2
Boxplots of Raw Data

MachineA
Ha: pop1 pop2
MachineB
80
Jan-16
Minitab:
Stat > ANOVA > Test for Equal
Variances (stacked data)
Stat > Basic Statistics > 2
Variances (stacked OR unstacked
data)
85
90
Fethi Derbeli
34
Minitab: Test dgalit des Variances

Session Window Output:
Test for Equal Variances
Level1
Level2
ConfLvl
MachineA
MachineB
95.0000
Bonferroni confidence intervals for standard deviations

Lower
1.89814
2.38776
Sigma
Upper
2.90180
3.65033
5.84322
7.35049
N
10
10
Factor Levels
MachineA
MachineB
F-Test (normal distribution)
On choue de
rejeter Ho,
variances sont
egales.

P-Value
: 0.505
Levene's Test (any continuous distribution)
P-Value
: 0.390
Jan-16
Fethi Derbeli
35
Moyenne Population-1 vs Moyenne Population-2
On a besoi dune t-distribution et data variables

On veut vrifier si les chantillons viennet de la mme ou de deux distinctes
populations.
Dautre mots:
Y a til une diffrence siginficative entre pop1 et pop2?
La pour le test des deux chantillons t test est:
Egalit des variances (degrees of freedom = n1 + n2 2):
x pop1 x pop2
tcalc
s
2
pooled
1 1

n1 n2
Ingalit des variances (degrees of freedom = n1 + n2 2):
tcalc
Jan-16
Fethi Derbeli
x pop1 x pop2
s12 s22

n1 n2
36
Exemple
Step 1: Problme Pratique On a modifi une de deux machines. On veut
savoir sil y a une amlioration significative du rendement de la machine
modifie avant de la gnraliser sur les autres machines. Aprs avoir
collect des chantillons sur les rendements des 2 machines. On veut
dterminer sil y a une vraie diffrence entre les deux?
Rappel: Les data sont normales et les variances sont gales.
Step 2: Dterminer lhypothse nul and alternatif pour lamlioration des
rendements.
Ho: machineA = machineB
Ha: machineA < machineB
Step 3: Les variables alatoires pour le test des moyennes suivent la
distribution-t.
Step 4-7: Alpha est 0.05, taille des chantillons est de 10, Les chantillons
alatoires sont collects de chaque machine.
Jan-16
Fethi Derbeli
37
Exemple (cont)
Steps 8-9: test-t de 02 echantillons
Stat > Basic Statistics > 2-sample t

Les data dans une colonne: Echantillons: Rendement, Machine
Assumer lgalit des variances
Options: Changer lhypothesis alternative
Machine
A
B
N
10
10
Mean
84.24
85.54
StDev
2.90
3.65
SE Mean
0.92
1.2
T-Test of difference = 0 (vs not =): T-Value = -0.88 P-Value = 0.390 DF = 18

T-Test of difference = 0 (vs <): T-Value = -0.88 P-Value = 0.195 DF = 18
T-Test of difference = 0 (vs >): T-Value = -0.88 P-Value = 0.805 DF = 18
Step 10: On doit statuer sur les cots des modifications damlioration des
rendements (bas sur 02 chantillons de donnes)
Jan-16
Fethi Derbeli
38
Test-t par Paire

Definition comparison par paire:
Dans plusieurs cas de problmes pour 02 chantillons alatoires qui ne sont pas
indpendents; au lieu que chaque observation dans une colonne, les chantillons
sont naturellemnt ou par dsgne sont par paire avec des observations dans
lautre. (Milton and Arnold, 1995, p. 353).
Chaque donnes est mesure 02 fois (01 pour chaque machine dans les
mmes conditions).
Blocking est utilis pour minimiser lexcs de variabilit caus par la
dpendance des chantillons. Rgle: Blocker ce qui tu peux, et chantilloner en
mode alatoire ce qui tu ne peut pas.
Jan-16
Fethi Derbeli
39
Exemple
Problem: Casco produit les alummes cigares et ses
composants pour les voitures utilisant 02 machines
dassemblages (appel Bodine 6 et Bodine 8). Les 02
machines produisent avec la mme cadance et le mme
rendement moyenne. Une modification est faite sur la
Bodine 6. Des Data sont collectes chaque heure durant
les 03 quipes. Est ce que la la modification a amliore
le rendement du Bodine 8?
Les data sont en fn: bodinepair.mtw
Quel est le variable de blockage dans le problme?
Que fait le blockage pour notre analyse?
Jan-16
Fethi Derbeli
40
Paired Comparisons Example (cont)

Step 1: Problme Practique Est ce que la modification de la
Bodine 6 amliore le rendement du Bodine 8
Test de Normalit: Bodine 6: p= 0.11
Test de Normalit: : Bodine 8: p= 0.93
fn: bodinepair.mtw
Step 2: Statuer lhypothses:

Ho: = 0 ( - delta or change)
Ha: 0
Steps 3-9: Determiner le test statistique, determiner la valeur
critique, et rejeter ou accepter lhypothse nul. (Utiliser
MINITAB).
Stat > Basic Stats > Paired t
Jan-16
Fethi Derbeli
41
Exemple (cont)
Paired T-Test and CI: Bodine 6, Bodine 8
Paired T pour Bodine 6 - Bodine 8
N
Bodine 6 24
Bodine 8 24
Difference 24
Mean
StDev
0,963750 0,021832
0,955000 0,022067
0,008750 0,018954
SE Mean
0,004456
0,004504
0,003869
95% CI for mean difference: (0,000747; 0,016753)

T-Test of mean difference = 0 (vs not = 0): T-Value = 2,26 P-Value = 0,033
Step 10: La modification sur Bodine 6 a amlior le

rendement par rapport Bodine 8. Bodine 6 a un
rendement significativement suprieur Bodine 8.
Jan-16
Fethi Derbeli
42
Exemple LAnalyse erronne

On va voir la mme analyse des donnes avec une mthode diffrente:
Stat > Basic Statistics > 2-sample-t
P-value for Bartletts test shows that variances are equal (p=0.959)
Two-sample T for Bodine 6 vs Bodine 8

N
Mean
StDev
SE Mean
Bodine 6
24
0.9637
0.0218
0.0045
Bodine 8
24
0.9550
0.0221
0.0045
Difference = mu Bodine 6 - mu Bodine 8
Estimate for difference: 0.00875
95% CI for difference: (-0.00401, 0.02151)
T-Test of difference = 0 (vs not =): T-Value = 1.38 P-Value = 0.174 DF = 45
Un test est significative, lautre nest pas. pourquoi?
Jan-16
Fethi Derbeli
43
Les tests-t, les tests-F et les chantillons alatoires

Considrations finales
Echantillons par paires contre chantillons indpendants
Les chantillons par paires contre des chantillons indpendants peuvent tre difficiles juger. La distinction est
nanmoins cruciale puisque des procdures statistiques diffrentes sont applicables dans chaque cas.
Par paires: en gnral dans le mme sujet.
Exemple: usure des pneus de deux marques sur la mme voiture en mme temps.
Indpendant: ncessite des chantillons indpendants prlevs au hasard.
Exemple: mesurer lusure de deux marques de pneus, une marque sur la voiture A et une autre marque
sur la voiture B.
Variances gales
Dans le cas du test-t deux chantillons, la fonction par dfaut de MINITAB est de ne pas supposer lgalit. En
gnral, si lgalit est suppose tort, on peut se tromper de beaucoup lorsquon estime la diffrence des moyennes.
Si lon suppose lingalit alors que les variances sont en fait gales, on obtient une approche lgrement
conservatrice et une faible partie de la prcision est perdue lors de lestimation.
Echantillonnage alatoire
En gnral, pour les tests-t, on suppose que nous collectons des donnes partir dchantillons au hasard dans une
distribution normale.
Mme si la distribution n est pas normale, la distribution t donne de bonnes approximations, tant que lchantillon
est prlev de faon alatoire .
Obtenir un chantillon qui ne soit pas alatoire est plus problmatique que les donnes non distribues normalement.
Jan-16
Fethi Derbeli
44
Rsum
Au cours de ce programme, nous avons abord lutilisation des vrifications dhypothses,
pour dtecter les diffrences des moyennes et des variances pour un ou deux chantillons.
T 1-Echantillon
But: Analyser la diffrence entre la moyenne obtenue et une valeur cible ou une
moyenne passe.
Caractristiques cls:
A utiliser lorsquil ny a quun seul chantillon pour tirer des
conclusions sur la moyenne de lchantillon.
T 2- Echantillons
But: Pour analyser la diffrence entre les moyennes obtenues de deux chantillons
indpendants.
Caractristiques cls : utiliser lorsquon a deux chantillons indpendants. Les
variances peuvent tre gales ou ingales.
Les donnes peuvent tre dans une seule colonne avec groupement variable ou dans
deux colonnes diffrentes.
T par paires
But: Analyser la diffrence entre les moyennes obtenues de deux chantillons lis.
Caractristiques cls :
Utilis avec les donnes par paires (souvent deux mesures du
mme sujet ou du mme objet test) lordre des observations est important. Chaque
observation doit tre dans la mme range que celle qui lui correspond.
Jan-16
Fethi Derbeli
45
Comparer les variances

Egalit de la variance
But: Analyser la diffrence entre les variances de deux
chantillons ou plus, indpendants les uns des autres.
Caractristiques cls: Souvent utilis pour voir si la condition
des variances gales ncessaires pour de nombreuses procdures
statistiques est remplie.
Les donnes doivent tre dans une colonne unique, avec la
variable du groupement dans une deuxime colonne. Peut tre
utilis avec des donnes normales (test de Bartlett, test-F) ou
non-normales (test de Levene).
Jan-16
Fethi Derbeli
46
Questions?
Jan-16
Fethi Derbeli
47

13 Test Hypothèse VC PDF

Încărcat de

Informații document

Titlu original

Drepturi de autor

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

13 Test Hypothèse VC PDF

Încărcat de

Drepturi de autor:

Vrification dhypothse:

Les donnes continues

Test pour la variance (standard deviation)

Test dhypothse pour 02 Echantillons

Test pour la moyenne

Hypothesis Testing Roadmap

For all tests:

Ho: Data is Normal

Ho: Two factors are independent

Attribute Data (2 factors only)

Continuous Data (one factor only)

If Xbar target falls with

fail to reject Ho.

La Function des pertes de Taguchi

Toutes deviation du valeur

Tout au long de ce programme de formation, vous allez apprendre:

Moyenne Population vs. Moyenne cible

Les tapes de la vrification d hypothse:

Elaborer les hypothses

Effectuer la vrification et collecter les

Calculer la statistique du test

Dterminer la probabilit que se

Si p-value < , rejeter Ho

Si p-value > , accepter Ho

Ha: pop # Cible

Rejet si Tcal < Tcrit-1 ou Tcal > Tcrit-2

Ha: pop > Cible

Rejet si Tcal > Tcrit

Ha: pop < Cible

Rejet si Tcal < Tcrit

Step 1: Problme Pratique IL a t dtermin que les impulsions totales

Ho: population = 230

Ha: population 230

Taille dchantillon 1-Sample T test

Choisir lintervalle de confiance (alpha = ?)

On peut aussi utiliser Minitab

Taille dchantillon utilisant Minitab

Tests de la Variance et l cart type

La variable alatoire chi-carr est dfinit:

Cette statistique est utilis pour dfinir le CI pour

Population vs. cible

Dterminer une Variance cible

Si nous sommes interresss de crer un processus six

Step 1: Problme pratique Le directeur veut savoir si la variabilit actuelle du

Ho: population 6.67

Ha population > 6.67

(n 1)s 2 (30 1)(8.63)2

Step 9: Trouver la valeur critique du table (Breyfogle, p. 704)

Exemple Utilisant Minitab

Minitab Resume Graphique

95% Confidence Interval for Mu

95% Confidence Interval for Mu

95% Confidence Interval for Sigma

95% Confidence Interval for Median

Taille dchantillon pour test 2

Moyenne Population1 vs. Moyenne Poulation2

Hypothesis Testing Roadmap

For all tests:

Ho: Data is Normal

Stat Basic Stats Display Descriptive

If Xbar target falls with CI, then

Ho: Two factors are independent

Attribute Data (2 factors only)

Continuous Data (one factor only)

(Variances Not Equal)

Pourquoi le Test dhypothse 02 chantillons?