Sunteți pe pagina 1din 4

Anexa 3.

Reflecţii asupra experimentelor statistice

Experimentele statistice au la bază analiza dispersională, denumită şi ANOVA – ANalysis Of


VAriance, metodă pusă la punct de către R.A. Fisher23. Componenta economică a procedeelor de
experimentare constă în faptul că permite identificarea efectelor semnificative cu un efort
experimental minim.
Analiza dispersională permite testarea semnificaţiei relaţiei între două sau mai multe tipuri de
clasificări, determinând importanţa factorilor respectivi asupra relaţiilor. La baza analizei
dispersionale se află segregarea dispersiei totale a unei serii de date în dispersiile componente, care
pot fi atribuite diferiţilor factori implicaţi. Varianţa care poate fi atribuită unui factor este împărţită la
varianţa estimată a eşantionului, aceasta fiind o dispersie normală, dată de efectul variaţiilor de
eşantionare asupra datelor din eşantion. Dacă în acest raport, numit raportul Fisher (F), varianţa
atribuită unui factor este mai mare decât varianţa estimată a eşantionului, şi anume într-o mărime
superioară celei la care ne-am aştepta ca să provină numai din variaţiile de eşantionare, atunci i se
recunoaşte acestui factor calitatea de a exercita o influenţă asupra datelor din eşantion.
Semnificaţia mărimii cu care variaţia unui factor depăşeşte variaţia estimată a eşantionului se
determină interpolând valoarea raportului F în tabelul distribuţiilor de probabilitate, stabilind astfel
dacă valoarea calculată depăşeşte sau nu valoarea corespunzătoare a lui F, la nivelul de semnificaţie
α = 0,05 şi pentru fiecare mărime a gradelor de libertate24. Valoarea lui F arată probabilitatea aleasă
după care o valoare de F ori mai mare decât cea dată este aşteptată să apară ca urmare a variaţiilor de
eşantionare întâmplătoare.
Cel mai mare avantaj al analizei dispersionale este dat de capacitatea acesteia de a localiza
sursa diferenţelor semnificative la grupările combinate, întocmite după două, trei sau mai multe
caracteristici.
Experimentele factoriale reprezintă procedee de reducere a numărului de încercări, de grăbire
a obţinerii “răspunsului”, deci solicită un volum mai redus de informaţii. Acest tip de experimente,
deşi se pot reduce cu uşurinţă la modelele de analiză dispersională, beneficiază de o reprezentare
matematică diferită.
În cazul general, dacă se iau în considerare doi factori “a” şi “b”, fiecare având “I” şi “J”
niveluri şi dacă există (IxJ) condiţii experimentale corespunzătoare tuturor combinaţiilor posibile ale
nivelurilor celor doi factori, experimentul rezultat poartă denumirea de experiment factorial de tipul
(IxJ).
Modelul matematic general al unui astfel de model este acela al unui model bifactorial cu
interacţiuni şi repetiţii, adică dacă xijk este valoarea măsurată a repetării “k” la nivelul “i” al factorului
“a” şi la nivelul “j” al factorului “b”, atunci: x ijk = µ + α ia + α bj + α ijab + ρ k + ε ijk , i = 1, I , j = 1, J ,
k = 1, r şi ε ijk ∈ N( x;0, σ 2 ) sunt independente.
Ipotezele statistice supuse verificării sunt: Ha: toţi α ia = 0 , …, Hr: toţi ρ k = 0 .
Construirea statisticii F se bazează pe partiţionarea convenabilă a sumei:
∑∑(x ) ( ) ( ) ( )
I J I J r I J r 2

= r∑∑ xij. − x... + IJ∑ x..r − x... + ∑∑∑ xijk − xij. − x..k − x...
2 2 2
−x
ijk
i=1 j=1 i=1 j=1 =1 i=1 j=1 k=1
1 442443 1 44 42444 3 1k4 42443 1 444442444443
(IJr−1) gradedelibertate (IJ −1) gradedelibertate (r −1) gradedelibertate (IJ −1)(r −1) gradedelibertate
Se mai poate scrie:

23
Matematician angajat în anul 1920 la staţiunea agricolă experimentală Rothamsted, pentru a sprijini activitatea de
prelucrare şi interpretare a unui vast material de observaţie acumulat pe parcursul mai multor ani de experienţe
agrotehnice. Doar în câţiva ani de lucru a pus la punct o serie de principii şi metode, nu doar de interpretare a rezultatelor,
ci metodologii de programare, dirijare a experimentelor şi de interpretare statistică a rezultatelor.
24
Se lucrează cu două serii de grade de libertate, datorită faptului că se iau în considerare raporturile pentru două dispersii
independente, date de atributele de pe rândurile/coloanele tabelului de contingenţă şi fiecăreia dintre ele îi corespunde un
număr diferit de grade de libertate.
( ) ( ) ( ) ( )
I J I J I J 2

r∑∑ xij. − x... = rJ∑ xi.. − x... + rI∑ x. j. − x... + r∑∑ xij. − xi.. − x. j. + x...
2 2 2

i=1 j=1 i=1 j=1 i=1 j=1

În acest fel, în membrul drept s-au obţinut suma pătratelor pentru factorul “A”, suma
pătratelor pentru factorul “B” şi suma pătratelor pentru interacţiunea dintre cei doi factori.
Experimentele multifactoriale implică satisfacerea tuturor combinaţiilor posibile ale
nivelurilor factorilor. Creşterea numărului de factori, dar mai ales creşterea numărului de niveluri şi
repetiţii se reflectă multiplicativ în numărul condiţiilor experimentale. Acesta este motivul pentru care
experimentele sunt proiectate astfel încât fiecare factor este ţinut la numai două niveluri distincte. Alt
motiv este dat de faptul că în cazul acestor tipuri de experimente, există formule de calcul simplificate
care ajută substanţial la desfăşurarea analizei cantitative.
Într-un experiment de tipul 2n (n factori cu două niveluri), cele două niveluri ale fiecărui
factor sunt notate “0” şi “1”. Experimentul 23, pe baza căruia am măsurat la SC Verde SA modul în
care sunt influenţate emisiile de CO ale centralelor de utilităţi CUT1 şi CUT2, de tipul combustibilului
folosit, tipul centralei şi perioada în care s-a făcut observaţia (în timpul orelor de program la secţiile
productive sau în afara orelor de program la secţiile productive) verifică trei factori, notaţi cu A, B şi
C, fiecare dintre ei având valori diferite, fiind la niveluri diferite. Modelul matematic este următorul:
x ijkl = µ + α iA + α Bj + α Ck + α ijAB + α ikAC + α BC
jk + α ijk
ABC
+ ρ l + ε ijkl i = j = k = 0,1 l = 1, r
Se observă că modelul poate fi descris complet dacă se cunoaşte numai câte un singur
parametru, adică: µ, α 0A , α 0B , α C0 , α 00
AB
, α 00
AC
, α 00
BC
, α 000
ABC
. Condiţiile experimentale se codifică pentru
facilitarea desfăşurării calculelor. Codificarea constă în reprezentarea fiecărei condiţii experimentale
prin produsul literelor corespunzătoare factorilor respectivi şi care sunt consideraţi a fi luaţi la nivelul
superior – 1. Într-un experiment 23 notaţia “ab” scrisă cu litere minuscule înseamnă că se reprezintă
condiţia experimentală corespunzătoare factorilor “A” şi “B” consideraţi fiecare la nivelul său
superior. Absenţa literei “c” corespunzătoare factorului “C” înseamnă că acesta este considerat la
nivel inferior. Ordinea standard a condiţiilor experimentale astfel codificate este următoarea25:

Tabelul A3.1. Codificarea pentru experimentul 23


Nivelurile factorilor
Condiţia experimentală
a b c
0 0 0 0
a 1 0 0
b 0 1 0
ab 1 1 0
c 0 0 1
ac 1 0 1
bc 0 1 1
abc 1 1 1

Efectele factorilor se prezintă după cum urmează:


9 efectul direct al factorului A: α$ i = y i.. − y ...
9 efectul direct al factorului B: β$ = y − y
j . j. ...

9 efectul direct al factorului C: γ$ t = y ..t − y ...


în care:
1
y ... = ∑ ∑ ∑ y ijt reprezintă media generală a tuturor observaţiilor;
abk i j t
1
y i.. = ∑ y ijt reprezintă media observaţiilor după factorul A;
bk i

25
Tövissi L., Vodă V., “Metode statistice. Aplicaţii în producţie”, Editura Ştiinţifică şi Enciclopedică, Bucureşti, 1982.
1
y .j. = ∑ y ijt reprezintă media observaţiilor după factorul B;
ak j
1
y ..t =
ab t
∑ y ijt reprezintă media observaţiilor după factorul C.
Interacţiunile dintre factori sunt următoarele:
9 între factorii A şi B: ρ$ ij = y ij. − y i.. − y .j. + y ...
9 între factorii A şi C: ρ$ it = y i.t − y i.. − y ..t + y ...
9 între factorii B şi C: ρ$ kt = y .jt − y .j.. − y ..t + y ...
9 între factorii A, B, C, interacţiunea se identifică cu influenţa factorilor aleatori neluaţi în
considerare, reprezentată prin eroarea reziduală (deoarece experimentul este fără repetiţie - deci cu o
singură observaţie în fiecare celulă); eroarea este dată de relaţia:
ρ ijt = y ijt − y ij. − y i.t − y . jt + y i.. + y . j. + y ..t + y ...
În relaţiile anterioare s-au folosit notaţiile:
1
y ij. = ∑ y ijt reprezintă media după factorii A şi B;
k i, j
1
y i.t = ∑ y ijt reprezintă media după factorii A şi C;
b i ,t
1
y .jt = ∑ y ijt reprezintă media după factorii B şi C.
a j,t
Pentru obţinerea datelor necesare calculului analizei dispersionale este necesară stabilirea
sumelor pătratelor abaterilor pe factori şi pe combinări de factori, astfel:
2 2
1 ⎛ ⎞ 1 ⎛ ⎞
9 pentru factorul A: SPA = bk ∑ α$ = ∑ ⎜ ∑ y ijt ⎟ − ⎜ ∑ y ijt ⎟
2

i i bk i ⎝ jt ⎠ abk ⎝ ijt ⎠
2 2
2 1 ⎛ ⎞ 1 ⎛ ⎞
9 pentru factorul B: SPB = ak ∑ β$ = ∑ ⎜ ∑ y ijt ⎟ − ⎜ ∑ y ijt ⎟
j j
ak j ⎝ it ⎠ abk ⎝ ijt ⎠
2 2
1 ⎛ ⎞ 1 ⎛ ⎞
9 pentru factorul C: SPC = ab∑ γ$ = ∑ ⎜ ∑ y ijt ⎟ − ⎜ ∑ y ijt ⎟
2

t t ab t ⎝ ij ⎠ abk ⎝ ijt ⎠
9 pentru interacţiunea factorilor A, B:
2 2 2 2
1 ⎛ ⎞ 1 ⎛ ⎞ 1 ⎛ ⎞ 1 ⎛ ⎞
SPAB = k∑ρ$ = ∑⎜ ∑yijt ⎟ − ∑⎜ ∑yijt ⎟ − ∑⎜ ∑yijt ⎟ + ⎜ ∑yijt ⎟
2

ij ij
k ij ⎝ t ⎠ bk i ⎝ jt ⎠ ak j ⎝ it ⎠ abk ⎝ ijt ⎠
9 pentru interacţiunea factorilor A, C:
2 2 2 2
1 ⎛ ⎞ 1 ⎛ ⎞ 1 ⎛ ⎞ 1 ⎛ ⎞
SPAC = b∑ρ$ = ∑⎜ ∑yijt ⎟ − ∑⎜ ∑yijt ⎟ − ∑⎜ ∑yijt ⎟ + ⎜ ∑yijt ⎟
2

it it b it ⎝ j ⎠ bk i ⎝ jt ⎠ ab t ⎝ ij ⎠ abk ⎝ ijt ⎠
9 pentru interacţiunea factorilor B, C:
2 2 2 2
1 ⎛ ⎞ 1 ⎛ ⎞ 1 ⎛ ⎞ 1 ⎛ ⎞
SPBC = a∑ρ$ = ∑ ⎜ ∑ y ijt ⎟ − ∑ ⎜ ∑ y ijt ⎟ − ∑ ⎜ ∑ y ijt ⎟ + ⎜ ∑ y ijt ⎟
2

jt jt
a jt ⎝ i ⎠ ak j ⎝ it ⎠ ab t ⎝ ij ⎠ abk ⎝ ijt ⎠
9 suma pătratelor pentru împrăştierea totală:
2
1 ⎛ ⎞
SPT = ∑ y ijt − y ( ) = ∑y − ⎜ ∑ y ijt ⎟
2 2
ijt
ijt ijt abk ⎝ ijt ⎠
9 suma pătratelor abaterilor pentru eroarea reziduală:
SPE = abk ∑ ρ$ ,
2
care se mai exprimă şi printr-o formă echivalentă:
ijt ijt

SPE = SPT − (SPA + SPB + SPC + SPAB + SPAC + SPBC)