Sunteți pe pagina 1din 47

Vrification dhypothse:

Les donnes continues

Jan-16

Fethi Derbeli

Agenda
Test dhypothse pour 01 Echantillon
Test pour la moyenne
Distribution Standard normale (Z) pour grande taille dchantillons
t-distribution pour une taille rduite dchantillons

Test pour la variance (standard deviation)


Distribution Chi-carr

Test dhypothse pour 02 Echantillons


Test pour la variance
Test dgailit des variances
F-distribution

Test pour la moyenne


Egalit des variances
Ingalit des variances

Jan-16

Fethi Derbeli

Hypothesis Testing Roadmap

For all tests:


p > 0.05 Fail to Reject Ho (null)
p < 0.05 Reject Ho

Hypothesis Testing

Non Normal
Ho: s1 = s2 = s3 = ...
Ha: at least one is different
Minitab:
Stat - Anova Test for Equal Variances
For only two ss this is similar to an FTest: F=(S1)2 / (S2)2
If F calc > F table, then reject null.
(Use Chi-Squared for one sample)

Normality Test

Ho: Data is Normal


Ha: Data is NOT Normal
Minitab:
Stat - Basic Stat - Normality Test
Use Anderson-Darling

Levenes Test

One
Ho: 1 = target
Sample
Ha: 1 target
Minitab:
Chi-Squared
Stat Basic Stats Display Descriptive
Statistics
Graphs: Graphical Summary
If s target falls with CI, then fail to

Two or More
Samples
Ho: 1 = 2 = 3 = ...
Ha: at leastone is different
Minitab:
Stat - Anova Test for Equal Variance
(For only two ss this is the same as an FTest: F=(S1)2 / (S2)2
If F calc > F table, then reject null.

Bartletts Test

reject Ho.

Ho: 1 = target
Ha: 1 target
1 Sample T Test
Minitab:
Stat - Basic Stats - 1 Sample-T
Stat Basic Stats Display Descriptive
Two
Statistics
Samples
Graphs: Graphical Summary

2 or More
Samples

Jan-16

Contingency
Table

Normal
Two or More
Samples

Ho: M1 = M target
Ha: M1 M target
1 Sample
Minitab:
Stat - Nonparametric - 1 Sample-Sign (OR)
Stat - Nonparametric - 1 Sample-Wilcoxon
(This is also used for paired comparisons:
Ho: M1 - M2 = 0)
M1 = Median of sample 1
M target = Target Median

Ho: M1 = M2 = M3 = ...
Ha: at least one is different
Minitab:
Stat - Nonparametric - Mann-Whitney (OR)
Stat - Nonparametric - Kruskal-Wallis (OR)
Stat - Nonparametric - Moods Median (OR)
Stat - Nonparametric - Friedmans
M1 = Median of sample 1, etc...

Ho: Two factors are independent


Ha: Two factors are dependent
Minitab:
Stat -Tables - Chi-square Test

Attribute Data (2 factors only)

Continuous Data (one factor only)

If Xbar target falls with

Two or More
Samples

One Way
Anova

CI, then

fail to reject Ho.

Ho: 1 = 2

2 Sample T Test
( Variances Equal)

Ha: 1 2
Minitab:
Stat - Basic Stats - 2-Sample T
(Compares Means using pooled Std Dev)
Assume equal variances

Ho: 1 = 2

2 Sample T Test
(Variances Not Equal)

Ha: 1 2
Minitab:
Stat - Basic Stats - 2-Sample T
(Compares Means using each sample Std Dev)

Fethi Derbeli

Ho: 1 = 2 = 3 = ...
Ha: at least one is different
Minitab:
Stat - Anova- One-way (or oneway unstacked)
Assumes Equal Variances
(Bartletts test must fail to
reject that variances are =.

La Function des pertes de Taguchi


L=k(x-T)2

Pertes

Ou

Toutes deviation du valeur


cible gnre des pertes
financires

Limite infrieur de
Specifications

Jan-16

L = pertes financires
T = Valeur cible
k = Constante numrique

cible

x
Lmite superieur de
Specifications t

Fethi Derbeli

Tests-t
Objectifs de ce programme

Tout au long de ce programme de formation, vous allez apprendre:


la mthode pour analyser la diffrence entre une moyenne dchantillon et une valeur
cible;
des mthodes pour analyser la diffrence entre les moyennes obtenues partir de deux
chantillons;
une mthode pour dterminer si des diffrences significatives de variance existent entre
deux chantillons ou davantage.
Nous aborderons lutilisation de graphiques, les intervalles de confiance, et les vrifications
dhypothse pour analyser les diffrences de moyennes obtenues partir dun ou plusieurs
chantillons. Nous envisagerons aussi une mthode pour analyser les diffrences possibles de
variance de deux chantillons ou plus.
Pralables: manipulation des donnes et analyse graphique, introduction aux statistiques par
dduction.
Prparation pour: les mthodes avec rgression, ANOVA, les Conceptions dExpriences
factorielles et la surface de rponse.
Jan-16

Fethi Derbeli

Moyenne Population vs. Moyenne cible


Pour tester la diffrence entre les valeurs des moyennes
demande des data variables et une distribution de
rfrence
La diffrence entre la moyenne des chantillons et la
cible est faite pour gnrer le test statistique. La formule
pour 1 Echantillon T Test est:
Tn 1
Where:

x
s/ n

n = taille chantillon
s = Ecart typed deviation
= Moyenne cible
Cible

Jan-16

Fethi Derbeli

Observ

Les tapes de la vrification d hypothse:


1. Caractriser le problme et dfinir les
objectifs
2.

3.

4.
5.
6.

Elaborer les hypothses


- Enoncer lhypothse nulle (Ho)
- Enoncer lhypothse alternative
(Ha).
Dcider du test statistique appropri
(distribution de probabilit suppose, Z, t,
2, F)
Indiquer le niveau Alpha (en gnral 5%)
Dfinir la taille de lchantillon
Dvelopper le plan dchantillonnage

Problme
Pratique
Jan-16

Problme
Statistique

7.

Effectuer la vrification et collecter les


donnes

8.

Calculer la statistique du test


(z, t, ou F) partir des donnes.

9.

Dterminer la probabilit que se


produise par hasard cette probabilit de
test calcule = valeur-P .

Si p-value < , rejeter Ho

Si p-value > , accepter Ho


10. Reproduire les rsultats et transposer la
conclusion statistique en une solution
pratique

Solution
Statistique
Fethi Derbeli

Solution
Practique

Ha: pop # Cible


Utiliser la
Tcrit-2 table de
distribution
2-cots

Tcrit-1

Tcal

Tcal
Tcrit-1 = T1-, n-1
Tcrit-2 = T, n-1

Rejet si Tcal < Tcrit-1 ou Tcal > Tcrit-2


Puisque T-distribution est symmetrique, on peut utiliser la
valeur absolue de Tcal et comparer seulement Tcrit-2, rejetant si
Tcal > Tcrit-2
Jan-16

Fethi Derbeli

Ha: pop > Cible

Tcrit

Utiliser la table
de distribution
1-cot

Tcal
Tcrit = T, n-1

Rejet si Tcal > Tcrit

Jan-16

Fethi Derbeli

Ha: pop < Cible


Utiliser la
table de
distribution
1-cots

Tcrit

Tcal
Tcrit = T1-, n-1

Rejet si Tcal < Tcrit


Puisque t-distribution est symmetrique on peut utiliser
la valeur absolue de Tcal et comparer T, n-1
Jan-16

Fethi Derbeli

10

Exemple
fn: ballistic.mtw

Step 1: Problme Pratique IL a t dtermin que les impulsions totales


optimale dun moteur aprs le temps dallumage (T0) 0.5 seconds aprs
lallumage est 230Nsec. Un chantillon de 30 allumages prises. Les data sont
prsents ballistics.mtw. On se basant sur des chantillons, est quon ralise la
la valeur optimale?
Step 2: Statuer lhypothse nulle et lhypothse alternative
Pour :

Ho: population = 230

Ha: population 230


Step 3: Le test statistique est une variable alatoire normalement distribue.
Puisque la taille des chantillons est petite ( 30), la distribution t est la
rfrence approprie.
Step 4: Le niveau de risque assum (alpha) est 0.05 pour un test deux cots.
Step 5: Taille dchantillon est 30.
Step 6: Dvelopper un plan dchantillonage.
Step 7: Collecter les data.

Jan-16

Fethi Derbeli

11

Exemple (cont)
Step 8: Calculer le test statistic appropri:
Xbar = 226.95 et s = 8.63
tcalculated = {(226.95-230)/(8.63 5.5)} = |-1.94|
Step 9: Trouver la valeur critique de la distribution appropri
tcritical = t/2, 29df = 2.045; pour un deux cots
Puisque -1.94 < 2.045, on choue de rejeter Ho
parce que tcalculated < tcritical
Step 10: Il n y a pas de diffrence significative entre population et cible, alors, on
doit conclure que nous ralisons la valeur optimale.

Jan-16

Fethi Derbeli

12

Exemple (cont)
On utilisant Minitab pour Steps 8-10:
Stat > Basic Stats > 1 Sample T
Moyenne = 230
Options: Hypothse Alternative non gale
One-Sample T: Impulse totale
Test de mu = 230 vs mu not = 230
Variable
Total Impuls
Variable
Total Impuls

N
30

Mean
226.95

95.0% CI
(223.73, 230.18)

StDev
8.63

SE Mean
1.58

P
-1.93

0.063

Est ce que lanalyse confirme la solution manuelle? Interpreter la pvalue = 0.063 and the 95% CI pour mu.
Si on veut oprer 230nsec ou plus? Est ce que a change les
rsultats?
Jan-16

Fethi Derbeli

13

Taille dchantillon 1-Sample T test


La formule prcdente:

t /2 * s

Choisir lintervalle de confiance (alpha = ?)


Choisir la diffrence minimum dtectable = - xbar
Estimer la variabilit = s

On peut aussi utiliser Minitab

Jan-16

Fethi Derbeli

14

Taille dchantillon utilisant Minitab


Minitab:
Stat > Power and Sample Size > 1-Sample t
Remplir nimporte deux
champs le troisime sera
calcul automatiquement
Differences: Dfinit en
fonction de lhypothse nul,
la difference mini quon veut
dtecter
Power Values: (1 - )
Sigma: Entrer le s historique
ou estim base sur
lexprience prcdente ou
processus similaire
1-Sample t Test
Testing mean = null (versus not = null)
Calculating power for mean = null + difference
Alpha = 0,05 Assumed standard deviation = 8,63
Sample Target
Difference Size Power Actual Power
3,05 65 0,8 0,801333
Jan-16

Fethi Derbeli

15

Tests de la Variance et l cart type


Rappelons la discussion de lintervalle de confiance
pour 2 et
Un chantillon statistique est une estimation dune paramtre
de la population
En prenant des chantillons de taille gale et on construisant
des histogrammes des variances des chantillons cre une
forme prdictible
Cette forme est appele chi-carr et dpend de la taille des
chantillons (n) et la valeur relle de la variance, 2 de la
population

La variable alatoire chi-carr est dfinit:


2

(n 1)s 2
2

Cette statistique est utilis pour dfinir le CI pour


variances et Ecarts typeand.
Jan-16

Fethi Derbeli

16

Population vs. cible


On a besoin dune distribution 2 et des data variables
Cette statistique peut tre utilise pour tester si la
variation dune population est significativement
diffrente dune valeur cible.
En dautre mots:
Y a t-il une diffrence significative entre population et
cible?
Cest le mme test statistique utilis pour des Data par
attribue mais avec des formules diffrentes :
2(calc) = (n 1)s2/ 2
Ou:
n = Taille de lchantillon
s2 = variance de lchantillon
2 = variance cible
Jan-16

Fethi Derbeli

17

Dterminer une Variance cible


Rappelons lquation:
Cp = (USL LSL) / 6s

Si nous sommes interresss de crer un processus six


sigma, Cp = 2.0.
On dvise les spcifications en 12 longueurs gaux
(chaque s gale une longueur)
Si notre objectif est diffrent de 6 process?
Si on veut avoir une Cp de 1.67?
Si notre s objectif pour un 4 process?

Jan-16

Fethi Derbeli

18

Exemple
fn: ballistic.mtw

Step 1: Problme pratique Le directeur veut savoir si la variabilit actuelle du


processus est au niveau six sigma.
Step 1a: Test de des data.
Stat > Basic Statistics > Normality Test
p = 0.688, data est normale
Step 2: Statuer lhypothse nulle et alternative.
On doit rsoudre lquation Cp pour s.
le USL du processus est 270, LSL est 190
Avec Cp de 2.0, s = 6.67
Pour :

Ho: population 6.67

Ha population > 6.67


Step 3: La distribution des chantillon est chi-carr
Step 4: On assume alpha est 0.05
Step 5: La taille de lchantillon est 30
Jan-16

Fethi Derbeli

19

Exemple (cont)
Step 6: On collecte alatoirement 30 pices de la production
Step 7: Mesurer et enregistrer les data
Step 8: Calculer le test statistique:

calc

(n 1)s 2 (30 1)(8.63)2

48.6
2
2

(6.67)

Step 9: Trouver la valeur critique du table (Breyfogle, p. 704)


2(critical) = 20.05, 29df = 42.56
Puisque 2(critical) < 2(calc), on rejete lhypothse nulle
Step 10: Il y a une diffrence significative entre population et cible; Le processus
nest capable un niveau qualit six sigma d des variation excessive
variation.

Jan-16

Fethi Derbeli

20

Exemple Utilisant Minitab


Minitab ne peut pas gnrer les tapes dun test 2
pour la variance
On peut calculer le CI pour la variance et vrifier
si la valeur cible se situe dans lintervalle
Lintervalle de confiance est gnr via :
Stat > Basic Statistics > Descriptive Statistics
Select Graphs
Graphical Summary
Choose confidence level: 95%

Jan-16

Fethi Derbeli

21

Minitab Resume Graphique


Descriptive Statistics
Variable: Total Impuls
Anderson-Darling Normality Test
A-Squared:
P-Value:

210

220

230

Mean
StDev
Variance
Skewness
Kurtosis
N

240

Minimum
1st Quartile
Median
3rd Quartile
Maximum

95% Confidence Interval for Mu

0.260
0.688
226.953
8.630
74.4798
0.249783
-6.5E-01
30
211.500
220.325
226.150
232.950
244.500

95% Confidence Interval for Mu


223.731
221

222

223

224

225

226

227

228

229

230

231

230.176

scible = 6.67
Ne se situe pas
dans le CI 95%
pour sigma
Rejet hypothse
nulle

95% Confidence Interval for Sigma


6.873

11.602

95% Confidence Interval for Median


95% Confidence Interval for Median

Jan-16

221.640

Fethi Derbeli

229.600

22

Taille dchantillon pour test 2


On fait une supposition pour dterminer la taille
approprie de lchatillon pour le test de variance
La formule des varaibles alatoires:
2

2
n /2, n-1 1
s
Cette quation demande un processus de slection
de la taille de lchantillon, la dtermination de la
valeur approprie de 2 et la vrification si
lgalit est rsolue.
Jan-16

Fethi Derbeli

23

Test 02 chantillons
Pourquoi on vrifie des paramtres de 02 populations?
Mthode Gnrale
StDev population1 vs. StDev population2
Manuellement: F-test
Minitab: Test galit des variances

Moyenne Population1 vs. Moyenne Poulation2

Manuellement: 2 sample t
Minitab: 2 sample t
Options de lhypothse Alternative
Paired comparisons (blocking)

Class Exercises

Jan-16

Fethi Derbeli

24

Hypothesis Testing Roadmap

For all tests:


p > 0.05 Fail to Reject Ho (null)
p < 0.05 Reject Ho

Hypothesis Testing

Non Normal
Ho: s1 = s2 = s3 = ...
Ha: at least one is different
Minitab:
Stat - Anova Test for Equal Variances
For only two ss this is similar to an FTest: F=(S1)2 / (S2)2
If F calc > F table, then reject null.
(Use Chi-Squared for one sample)

Normality Test

Ho: Data is Normal


Ha: Data is NOT Normal
Minitab:
Stat - Basic Stat - Normality Test
Use Anderson-Darling

Contingency
Table

Normal
Two or More
Samples

Levenes Test

Ho: M1 = M target
Ha: M1 M target
1 Sample
Minitab:
Stat - Nonparametric - 1 Sample-Sign (OR)
Stat - Nonparametric - 1 Sample-Wilcoxon
(This is also used for paired comparisons:
Ho: M1 - M2 = 0)
M1 = Median of sample 1
M target = Target Median

One
Ho: 1 = target
Sample
Ha: 1 target
Minitab:
Chi-Squared
Stat Basic Stats Display Descriptive
Statistics
Graphs: Graphical Summary
If s target falls with CI, then fail to

Two or More
Samples
Ho: 1 = 2 = 3 = ...
Ha: at leastone is different
Minitab:
Stat - Anova Test for Equal Variance
(For only two ss this is the same as an FTest: F=(S1)2 / (S2)2
If F calc > F table, then reject null.

Bartletts Test

reject Ho.
Ho: 1 = target
Ha: 1 target
1
Minitab:
Stat - Basic Stats - 1 Sample-T

Two or More
Samples

Sample T Test

Stat Basic Stats Display Descriptive


Statistics
Graphs: Graphical Summary

Two
Samples

One Way
Anova

If Xbar target falls with CI, then


fail to reject Ho.

2 or More

Ho: M1 = M2 = M3 = ...
Samples
Ha: at least one is different
Minitab:
Stat - Nonparametric - Mann-Whitney (OR)
Stat - Nonparametric - Kruskal-Wallis (OR)
Stat - Nonparametric - Moods Median (OR)
Stat - Nonparametric - Friedmans
M1 = Median of sample 1, etc...

Jan-16

Ho: Two factors are independent


Ha: Two factors are dependent
Minitab:
Stat -Tables - Chi-square Test

Attribute Data (2 factors only)

Continuous Data (one factor only)

2 Sample T Test
Ho: 1 = 2

2 Sample T Test
(Variances Equal)

Ha: 1 2
Minitab:
Stat - Basic Stats - 2-Sample T
(Compares Means using pooled Std Dev)
Assume equal variances

Ho: 1 = 2

(Variances Not Equal)

Ha: 1 2
Minitab:
Stat - Basic Stats - 2-Sample T
(Compares Means using each sample Std Dev)

Fethi Derbeli

Ho: 1 = 2 = 3 = ...
Ha: at least one is different
Minitab:
Stat - Anova- One-way (or oneway unstacked)
Assumes Equal Variances
(Bartletts test must fail to
reject that variances are =.

25

Pourquoi le Test dhypothse 02 chantillons?

Il y a plusieurs raisons de connaitre


sil ya une diffrenec significative
entre 02 populations.
Evaluer le potentiel qualit dun
nouveau fournisseur
Savoir si une modification a
gnre des amliorations des
performances
Quantifier la diffrences entre
deux machines
Savoir si une modification du
dsigne dun produit a apport
les amliorations attendues.

Machine A

Machine B

AAB

B BB B AA BB A B
AAAA

AAB

B BB B AA BB A B
AAAA

Y a t il ine diffrence significative entre A et B?


Jan-16

Fethi Derbeli

26

Les tapes de la vrification d hypothse:


1. statuer le problme pratique et dfinir les
objectifs de lamlioration
a) Vrifier la normalit

4. Indiquer le niveau Alpha (en gnral


5%)
5. Dfinir la taille de lchantillon
6. Dvelopper le plan dchantillonnage
2. Elaborer les hypothses
7. Effectuer la vrification et collecter les
1. - Enoncer lhypothse nulle
donnes
(Ho)
1. Enoncer lhypothse alternative (Ha). 8. Calculer la statistique du test
4. (z, t, ou F) partir des donnes.
For :
2. For :
3.
Ho: pop1= pop2
Ho: pop1 9.
Dterminer la probabilit que se
= pop2
produise par hasard cette probabilit de
(normal data)
Ho: M1 = M2
test calcule = valeur-P .
(nonnormal data)
4.
4. Si p-value < , rejeter Ho
5.
Ha: pop1 pop2
Ha: pop1
5. Si p-value > , accepter Ho
pop2
10. Reproduire les rsultats et transposer la
(normal data)
Ho: M1 M2
conclusion statistique en une solution
(nonnormal data)
pratique
3. Dcider du test statistique appropri
(distribution de probabilit suppose, Z, t,
2, F)
Jan-16

Fethi Derbeli

27

Population St. Dev.1 vs Population St. Dev. 2


Lorsque on compare les moyennes de deux populations, utilisant des data
variables on doit premirement vrifier sil y a une diffrence statistiques entre
les variances (test degalit des variances). Ce test est important puisquil
affecte la formule utilise dans le test des moyennes.
On a besoin aussi de savoir si la populations est normallement distribue (test
de normalit) pour dterminer le type de test de variance effectuer.
Les rsultats de test de normalit et le test de variance vont dterminer la
supposition adquate pour lanalyse de les tendances centrales de la
population (moyennes vs. medianes avec ou sans galit des variances)
Le test exige lutilisation du test statistique -F
Le test statistique-F peut tre utiliser pour comparer 02 ou plusieurs variances. (Le
test F est utilis pour 02 chantillons.) Ce test assume que les data sont
normallement distribues.
Test statistique du Levene est utilis pour comparer 2 ou plusieurs variances et il
est appropri pour les donnes continues mais peuvent tre non normallement
distributes.

Jan-16

Fethi Derbeli

28

Test dgalit des Variances


Ho: pop1= pop2
Ha: pop1 pop2

S1

a)

Calculer Fcalc sachant que Fcalc >1


Fcalc = s22 / s12 ou Fcalc = s12/s22

b)

Comparer Fcrit (pour = 0.05)

c)

Si Fcalc > Fcrit, on rejete Ho

F-Distribution

S2
F(critical)
5% of total
area

Jan-16

Fethi Derbeli

29

Cest quoi F(critique)?


Si on veut savoir la valeur critique, on peut lavoir partir du table F.
la valeur dpend de la valeur alpha, et le degr de libert des deux
facteurs (numrateur and dnominateur).
Quand la valeur F calcule dpasse la valeur F critique ( = 0.05), la
valeur p va tre plus petit que 0.05. implique que les deux variances
sont diffrentes (p is low H0 must go).

F-Distribution
F(critical)
5% of total
area

Jan-16

Fethi Derbeli

30

Exemple

p>0,05 on choue de rejeter Ho. Data est


normale

fn: 2samples.mtw
Normal Probability Plot
p-value = 0.595

.999
.99

Probability

.95
.80
.50
.20
.05
.01
.001
80

85

90

MachineA
erage: 84.24

Anderson-Darling Normality Test

Normal Probability Plot


p-value = 0.942
.999
.99
.95

Probability

Step 1: Problme Pratique On a modifi


une de deux machines. On veut savoir sil y
a une amlioration significative du
rendement de la machine modifie avant de
la gnraliser sur les autres machines. Aprs
avoir collect des chantillons sur les
rendements des 2 machines. On veut
dterminer sil y a une vraie diffrence entre
les deux?
Premirement on vrifie si les data sont
normalement distribues.
Stat > Basic Stats > Normality Test
Ho: Data est normale
Ha: Data ne sont pas normale

.80
.50
.20
.05
.01
.001
80

85

90

MachineB

Jan-16

Fethi Derbeli

31

Exemple (cont)
Step 2: Vrifier lgalit des variances. Statuer lhypotheses
nul et alternatif.
Ho: MachineA = MachineB
Ha: MachineA MachineB
Step 3: Les variables alatoires du test de lgalit des
variances suivent une distribution-F
Step 4: On assume le niveau de risque (alpha) de 0.05
Step 5: La taille dchantillon est 10
Step 6: Collecter 10 chantillons alatoires pour chaque
machine
Step 7: Les data sont en fn: 2Samples.mtw.
Jan-16

Fethi Derbeli

32

Exemple (cont)
Step 8: Calculer les paramtres the random variable F
Descriptive Statistics: MachineA, MachineB
Variable
N
Mean
Median
TrMean
StDev
MachineA
10
84.240
84.500
84.125
2.902
MachineB
10
85.54
85.40
85.53
3.65
Fcalc = sB2 / sA2 = (3.65)2 / (2.902)2 = 1.5819

SE Mean
0.918
1.15

Step 9: Determiner la valeur critique du table F


Fcrit = F.05,9,9 = 3.18

Step 10: Puisque 3.18 > 1.5819, on choue de rejeter Ho


Il ny a pas de diffrence significative entre s2machineA et
s2machineB, les variances sont supposes gaux.
Solution pratique: Eviter de modifier le rest des machines

Jan-16

Fethi Derbeli

33

Minitab: Test dgalit des Variances


Si la normalit est confirme on utilise le test statistique
de Bartlett (Minitab)
Si la distribution net pas normale, on utilise test
statistique de Levene (Minitab)
Test for Equal Variances
95% Confidence Intervals for Sigmas

Factor Levels

MachineA
MachineB
2

F-Test
Test Statistic: 0.632

Levene's Test
Test Statistic: 0.775

P-Value

P-Value

: 0.505

: 0.390

Ho: pop1 = pop2

Boxplots of Raw Data


MachineA

Ha: pop1 pop2

MachineB

80

Jan-16

Minitab:
Stat > ANOVA > Test for Equal
Variances (stacked data)
Stat > Basic Statistics > 2
Variances (stacked OR unstacked
data)

85

90

Fethi Derbeli

34

Minitab: Test dgalit des Variances


Session Window Output:
Test for Equal Variances
Level1
Level2
ConfLvl

MachineA
MachineB
95.0000

Bonferroni confidence intervals for standard deviations


Lower
1.89814
2.38776

Sigma

Upper

2.90180
3.65033

5.84322
7.35049

N
10
10

Factor Levels
MachineA
MachineB

F-Test (normal distribution)

On choue de
rejeter Ho,
variances sont
egales.

Test Statistic: 0.632


P-Value
: 0.505
Levene's Test (any continuous distribution)
Test Statistic: 0.775
P-Value
: 0.390

Jan-16

Fethi Derbeli

35

Moyenne Population-1 vs Moyenne Population-2

On a besoi dune t-distribution et data variables


On veut vrifier si les chantillons viennet de la mme ou de deux distinctes
populations.
Dautre mots:
Y a til une diffrence siginficative entre pop1 et pop2?
La pour le test des deux chantillons t test est:
Egalit des variances (degrees of freedom = n1 + n2 2):

x pop1 x pop2

tcalc
s

2
pooled

1 1

n1 n2

Ingalit des variances (degrees of freedom = n1 + n2 2):

tcalc

Jan-16

Fethi Derbeli

x pop1 x pop2
s12 s22

n1 n2
36

Exemple
Step 1: Problme Pratique On a modifi une de deux machines. On veut
savoir sil y a une amlioration significative du rendement de la machine
modifie avant de la gnraliser sur les autres machines. Aprs avoir
collect des chantillons sur les rendements des 2 machines. On veut
dterminer sil y a une vraie diffrence entre les deux?
Rappel: Les data sont normales et les variances sont gales.
Step 2: Dterminer lhypothse nul and alternatif pour lamlioration des
rendements.
Ho: machineA = machineB
Ha: machineA < machineB
Step 3: Les variables alatoires pour le test des moyennes suivent la
distribution-t.
Step 4-7: Alpha est 0.05, taille des chantillons est de 10, Les chantillons
alatoires sont collects de chaque machine.

Jan-16

Fethi Derbeli

37

Exemple (cont)
Steps 8-9: test-t de 02 echantillons

Stat > Basic Statistics > 2-sample t


Les data dans une colonne: Echantillons: Rendement, Machine
Assumer lgalit des variances
Options: Changer lhypothesis alternative

Machine
A
B

N
10
10

Mean
84.24
85.54

StDev
2.90
3.65

SE Mean
0.92
1.2

T-Test of difference = 0 (vs not =): T-Value = -0.88 P-Value = 0.390 DF = 18


T-Test of difference = 0 (vs <): T-Value = -0.88 P-Value = 0.195 DF = 18
T-Test of difference = 0 (vs >): T-Value = -0.88 P-Value = 0.805 DF = 18

Step 10: On doit statuer sur les cots des modifications damlioration des
rendements (bas sur 02 chantillons de donnes)

Jan-16

Fethi Derbeli

38

Test-t par Paire


Definition comparison par paire:
Dans plusieurs cas de problmes pour 02 chantillons alatoires qui ne sont pas
indpendents; au lieu que chaque observation dans une colonne, les chantillons
sont naturellemnt ou par dsgne sont par paire avec des observations dans
lautre. (Milton and Arnold, 1995, p. 353).

Chaque donnes est mesure 02 fois (01 pour chaque machine dans les
mmes conditions).
Blocking est utilis pour minimiser lexcs de variabilit caus par la
dpendance des chantillons. Rgle: Blocker ce qui tu peux, et chantilloner en
mode alatoire ce qui tu ne peut pas.

Jan-16

Fethi Derbeli

39

Exemple
Problem: Casco produit les alummes cigares et ses
composants pour les voitures utilisant 02 machines
dassemblages (appel Bodine 6 et Bodine 8). Les 02
machines produisent avec la mme cadance et le mme
rendement moyenne. Une modification est faite sur la
Bodine 6. Des Data sont collectes chaque heure durant
les 03 quipes. Est ce que la la modification a amliore
le rendement du Bodine 8?
Les data sont en fn: bodinepair.mtw
Quel est le variable de blockage dans le problme?
Que fait le blockage pour notre analyse?
Jan-16

Fethi Derbeli

40

Paired Comparisons Example (cont)


Step 1: Problme Practique Est ce que la modification de la
Bodine 6 amliore le rendement du Bodine 8
Test de Normalit: Bodine 6: p= 0.11
Test de Normalit: : Bodine 8: p= 0.93

fn: bodinepair.mtw

Step 2: Statuer lhypothses:


Ho: = 0 ( - delta or change)
Ha: 0
Steps 3-9: Determiner le test statistique, determiner la valeur
critique, et rejeter ou accepter lhypothse nul. (Utiliser
MINITAB).
Stat > Basic Stats > Paired t

Jan-16

Fethi Derbeli

41

Exemple (cont)
Paired T-Test and CI: Bodine 6, Bodine 8
Paired T pour Bodine 6 - Bodine 8
N
Bodine 6 24
Bodine 8 24
Difference 24

Mean
StDev
0,963750 0,021832
0,955000 0,022067
0,008750 0,018954

SE Mean
0,004456
0,004504
0,003869

95% CI for mean difference: (0,000747; 0,016753)


T-Test of mean difference = 0 (vs not = 0): T-Value = 2,26 P-Value = 0,033

Step 10: La modification sur Bodine 6 a amlior le


rendement par rapport Bodine 8. Bodine 6 a un
rendement significativement suprieur Bodine 8.
Jan-16

Fethi Derbeli

42

Exemple LAnalyse erronne


On va voir la mme analyse des donnes avec une mthode diffrente:
Stat > Basic Statistics > 2-sample-t
P-value for Bartletts test shows that variances are equal (p=0.959)

Two-sample T for Bodine 6 vs Bodine 8


N
Mean
StDev
SE Mean
Bodine 6
24
0.9637
0.0218
0.0045
Bodine 8
24
0.9550
0.0221
0.0045
Difference = mu Bodine 6 - mu Bodine 8
Estimate for difference: 0.00875
95% CI for difference: (-0.00401, 0.02151)
T-Test of difference = 0 (vs not =): T-Value = 1.38 P-Value = 0.174 DF = 45

Un test est significative, lautre nest pas. pourquoi?

Jan-16

Fethi Derbeli

43

Les tests-t, les tests-F et les chantillons alatoires


Considrations finales
Echantillons par paires contre chantillons indpendants

Les chantillons par paires contre des chantillons indpendants peuvent tre difficiles juger. La distinction est
nanmoins cruciale puisque des procdures statistiques diffrentes sont applicables dans chaque cas.
Par paires: en gnral dans le mme sujet.
Exemple: usure des pneus de deux marques sur la mme voiture en mme temps.
Indpendant: ncessite des chantillons indpendants prlevs au hasard.
Exemple: mesurer lusure de deux marques de pneus, une marque sur la voiture A et une autre marque
sur la voiture B.

Variances gales

Dans le cas du test-t deux chantillons, la fonction par dfaut de MINITAB est de ne pas supposer lgalit. En
gnral, si lgalit est suppose tort, on peut se tromper de beaucoup lorsquon estime la diffrence des moyennes.

Si lon suppose lingalit alors que les variances sont en fait gales, on obtient une approche lgrement
conservatrice et une faible partie de la prcision est perdue lors de lestimation.

Echantillonnage alatoire

En gnral, pour les tests-t, on suppose que nous collectons des donnes partir dchantillons au hasard dans une
distribution normale.

Mme si la distribution n est pas normale, la distribution t donne de bonnes approximations, tant que lchantillon
est prlev de faon alatoire .

Obtenir un chantillon qui ne soit pas alatoire est plus problmatique que les donnes non distribues normalement.

Jan-16

Fethi Derbeli

44

Rsum
Au cours de ce programme, nous avons abord lutilisation des vrifications dhypothses,
pour dtecter les diffrences des moyennes et des variances pour un ou deux chantillons.
T 1-Echantillon
But: Analyser la diffrence entre la moyenne obtenue et une valeur cible ou une
moyenne passe.
Caractristiques cls:
A utiliser lorsquil ny a quun seul chantillon pour tirer des
conclusions sur la moyenne de lchantillon.
T 2- Echantillons
But: Pour analyser la diffrence entre les moyennes obtenues de deux chantillons
indpendants.
Caractristiques cls : utiliser lorsquon a deux chantillons indpendants. Les
variances peuvent tre gales ou ingales.
Les donnes peuvent tre dans une seule colonne avec groupement variable ou dans
deux colonnes diffrentes.
T par paires
But: Analyser la diffrence entre les moyennes obtenues de deux chantillons lis.
Caractristiques cls :
Utilis avec les donnes par paires (souvent deux mesures du
mme sujet ou du mme objet test) lordre des observations est important. Chaque
observation doit tre dans la mme range que celle qui lui correspond.
Jan-16

Fethi Derbeli

45

Comparer les variances


Egalit de la variance
But: Analyser la diffrence entre les variances de deux
chantillons ou plus, indpendants les uns des autres.
Caractristiques cls: Souvent utilis pour voir si la condition
des variances gales ncessaires pour de nombreuses procdures
statistiques est remplie.
Les donnes doivent tre dans une colonne unique, avec la
variable du groupement dans une deuxime colonne. Peut tre
utilis avec des donnes normales (test de Bartlett, test-F) ou
non-normales (test de Levene).
Jan-16

Fethi Derbeli

46

Questions?

Jan-16

Fethi Derbeli

47

S-ar putea să vă placă și