Sunteți pe pagina 1din 21

3.

Complexitatea modelelor

3.1 Complexitatea în sens Halstead a modelelor

Complexitatea în sens Halstead pentru un model M, este dată de


relaţia:
C1 ( M ) = n1 log 2 n1 + n2 log 2 n2 ,
unde:
n1 - numărul de operanzi (variabile şi coeficienţi);
n 2 - numărul de operatori.
Modelul liniar, definit prin ecuaţia:
y = a 0 + a1 x1 + a 2 x 2 + ... + a n x n
,
conţine:
a 0 , a1 ,..., a n
• - coeficienţii estimaţi ai modelului, în număr de
nc , n c = n + 1 ;
x1 , x 2 ,..., x n , y
• - variabilele exogene ale modelului şi variabila
rezultativă, în total în număr de nv , nv = n + 1 ;
• * - operatorii de înmulţire a coeficienţilor cu variabilele exogene, în
număr de
ncv , ncv = n ;
• + - operatorii care leagă variabilele exogene formând membrul drept
n n = n;
al ecuaţiei modelului liniar, în număr de t , t
• = - operatorul de atribuire. na = 1 .

Efectuând înlocuirile, se obţin:


n1 = ne + nv ,
n2 = ncv + nt + na .
În cazul modelului liniar de mai sus, dat prin ecuaţia:
y = a 0 + a1 x1 + a 2 x 2 + ... + a n x n
,
se obţin:
n1 = 2(n + 1)
n2 = n + 1 .
Rezultă că nivelul complexităţii în sens Halstead a modelului
economic de regresie liniară este:
C = 2(n + 1) log 2 [2(n + 1)] + (n + 1) log(n + 1) .
După efectuarea calculelor elementare se obţine:
C = (n + 1)[2 log 2 2 + 2 log 2 (n + 1) + log 2 (n + 1)] ,
C = (n + 1)[2 + 3 log 2 (n + 1)] .
Pentru ecuaţia
y = a 0 + a1 x1 , rezultă n = 1 şi complexitatea în sens Halstead a
modelului este
C = 2[2 + 3 log 2 2] = 10
Pentru modelul
y = a 0 + a1 x1 + a 2 x 2 + a 3 x3 , cu n = 3 , complexitatea în sens
Halstead a acestui model este:
C = 4[2 + 3 log 2 2 2 ] = 4(2 + 6) = 32

3.2 Complexitatea Halstead cu operatori ponderaţi

Modelul general al complexităţii în sens Halstead este:


m m n n
C 2 = (∑ f i pi ) log 2 (∑ f i pi ) + (∑ h j q j ) log 2 (∑ h j q j ) , unde
i =1 i =1 j =1 j =1
m - numărul de operanzi;
f i - frecvenţa de apariţie a operandului i ;
pi - ponderea asociată operandului în construcţia;
n - numărul de operatori;
hj
- frecvenţa de apariţie a operatorului j ;
qj
- ponderea asociată operatorului j ; în exemplul considerat,
ponderea s-a construit pornind de la prioritatea operatorilor.
Dacă se consideră priorităţile operatorilor PO1 , PO2 ,..., POn , cu
PO1 < PO2 < ... < POn , indicând că operaţia asociată priorităţii POi se
P
execută înaintea celei asociate ponderii i +1 , se procedează la construirea
unui nou sistem de ponderi care asociază coeficienţi de importanţă în ordine
descrescătoare în raport cu priorităţile. Dacă se consideră, de exemplu,
tabelul 3.1 de priorităţi:
Priorităţile operatorilor
Tabel 3.1
Operatorul Prioritatea
() α 1
*,/ 2
+,- 3
= 4
În evaluarea complexităţii în sens Halstead, frecvenţele de apariţie
ale operatorilor se înlocuiesc cu ponderile asociate,
tabelul 3.2.
Ponderile operatorilor
Tabel 3.2
Operator Pondere pi
() α 4
*,/ 3
+,- 2
= 1
Astfel, modelul:
y = ax 2 + bz 2 + c ,are frevcenţele de apariţie şi ponderile
corespunzătoare date în tabelul 3.3.
Frecvenţe şi ponderi ale componentelor
Tabel 3.3
Frecvenţa Ponderea
Componenta fi * pi
fi pi
a 1 1 1
b 1 1 1
c 1 1 1
2 2 1 2
Frecvenţa Ponderea
Componenta fi * pi
fi pi
nc 5
y 1 1 1
x 1 1 1
z 1 1 1
nv 3
n1 = nv + nc 8
= 1 1 1
+ 2 2 4
* 2 3 6
() α 2 4 8
n2 19

C = 8 log 2 8 + 19 log 2 19 = 104.71


În timp ce modelul:
y = ax + bz + c ,
are datele în tabelul 3.4.
Frecvenţe şi ponderi ale componentelor
Tabel 3.4
Componenta Frecvenţa Ponderea fi * pi
fi pi
a 1 1 1
b 1 1 1
c 1 1 1
nc 3
y 1 1 1
x 1 1 1
z 1 1 1
nv 3
n1 = nv + nc 6
= 1 1 1
+ 2 2 4
* 2 3 6
n2 11
C 2 = 6 log 2 6 + 11log 2 11 = 69.48
C 2 > C1
Pentru modelele:
M 1 : y = ax + b
M 2 : y = ax b
C1 = 4 log 2 4 + 3 log 2 3 = 12.75
C 2 = 4 log 2 4 + 6 log 2 6 = 33.21
Se obţine C 2 > C1 , ceea ce arată că modelul este senzitiv la
diferenţierea operatorilor.

3.3 Complexitatea modelelor neliniare

În cazul modelului neliniar


y = A ⋅ Bα ⋅ C β .

- operanzii sunt: y, A, B, C , α , β , rezultând n1 = 6 ;


α β
- operatorii sunt: =,*, () ,*, () , rezultând n2 = 5 .
α β
S-au notat cu () , () , ridicările la o putere, iar operatorul de
înmulţire, a fost scris explicit de două ori pentru că de două ori apare în
ecuaţie.
Complexitatea în sens Halstead a acestui model neliniar este:
C = 6 log 2 6 + 5 log 2 5 = 27.12 .
Trebuie impus un mod unitar de calcul al complexităţii, pentru a nu
se produce confuzii. De exemplu, în cazul modelului:
y = ( Ax + Bt )(au 2 + bz 3 + cw 4 ) + d ,
înainte de a se calcula complexitatea, trebuie obţinută forma
prelucrată exinsă prin efectuarea calculelor algebrice:
y = A ⋅ x ⋅ u 2 + A ⋅ x ⋅ b ⋅ z3 + A ⋅ x ⋅ c ⋅ w 4 + B ⋅ t ⋅ a ⋅ u 2 + B ⋅ t ⋅ b ⋅ z3 +
+ B⋅ t ⋅c⋅ w4 + d

Frecvenţele de apariţie ale elementelor ce apar în ecuaţia modelului


în forma extinsă sunt în tabelul 3.5.
Frecvenţele de apariţie din modelul extins
Tabel 3.5
Componenta Frecvenţa
A 3
B 3
a 2
b 2
c 2
d 1
2 2
3 2
4 2
19
Total coeficienţi nc
y 1
u 2
z 2
w 2
x 3
t 3
13
Total variabile nv

n1 = nv + nc = 33

Operatori şi frecvenţe
Tabelul 3.6
Operator Frecventa
* 18
+ 6
() α 6
= 1
31
Total n 2
Complexitatea în sens Halstead a modelului este:
C = 32 log 2 32 + 31log 31 = 313.58
Rafinarea modelului economic conduce la scăderea complexităţii în
sens Halstead. Dacă un model liniar are în forma iniţială n variabile
exogene şi respectiv complexitatea
C n = (n + 1)[2 + 3 log 2 (n + 1)] ,
prin scăderea numărului de variabile exogene la n − k , k < n , se obţine o
complexitate:
C n − k = (n − k + 1)[2 + 3 log 2 (n − k + 1)] , diferenţa de complexitate:
∆ = C n − C n − k = 2[(n + 1) − (n − k + 1)] + 3(n + 1) log 2 (n + 1) −
.
− 3(n − k + 1) log 2 ( n − k + 1)
Efectuând calculele se obţine:
n +1
∆ = 2( k − 1) + log 2 . Deoarece un model rafinat are între
n − k +1
2 şi n variabile,
2 ≤ n − k + 1 < n , ceea ce conduce la inegalitatea
n +1 n +1
2(k − 1) + 3(n + 1) log 2 > ∆ > 2(k − 1) + 3(n + 1) log 2 .
2 2
n +1
Deoarece 2(k − 1) + 3(n + 1) log 2 > 0 , rezultă ∆ > 0 în cazul în care se
2
obţine o reducere a complexităţii.
În cazul în care prin rafinare se trece de la un model neliniar la un
model liniar, de asemenea, scade complexitatea modelului.
Fie modelul neliniar:
M 1 : y = a x 2 + b z 2 + c xy + d
1 1 1 1 1
iar prin liniarizare se obţine:
M2: y = a x + b z + c .
2 2 2 2
Frecvenţele de apariţie ale operanzilor şi operatorilor celor două
modele sunt date în tabelul 3.7.

Frecvenţe operanzi şi operatori pentru două modele


Tabel 3.7
Componenta
Frecvenţa în modelul M 1 Frecvenţa în modelul M 2
a 1 1
b 1 1
c 1 1
d 1 -
nc 4 3
Componenta
Frecvenţa în modelul M 1 Frecvenţa în modelul M 2
y 1 1
x 2 1
z 2 1
nv 5 3
n1 = nc + nv 10 6
+ 3 2
= 1 1
* 4 2
() α 2 -
n2 10 5

C1 = 10 log 2 10 + 10 log 2 10 = 66.43


C 2 = 6 log 2 6 + 5 log 2 5 = 27.11
C1 > C 2 .
Este important să se analizeze complexitatea relativă a modelului în
raport cu o complexitate maxim posibilă care se obţine prin agregarea
operanzilor şi operatorilor.
Se calculează complexitatea relativă, C r , prin relaţia:
n1 log 2 n1 + n2 log 2 n2
Cr =
(n1 + n2 ) log 2 (n1 + n2 )
De exemplu, pentru modelul y = ax + b , cu 4 operanzi şi 3 operatori,
C = 4 log 2 4 + 3 log 2 3 , C t = 7 log 2 7 , rezultă:
C
Cr = = 0.649 .
Ct
Pentru modelul:
y = ax b
se observă că acesta conţine operanzii y , a, x, b , cu n1 = 4 şi operatorii
=,*, ()α , n2 = 3 şi are deci acceiaşi complexitate calculată cu indicatorul
precedent, deşi modelele nu au aceeaşi operatori iar operanzii au funcţiuni
diferite.

Pentru ecuaţia polinomială de gradul n , prin:


y = a 0 + a1 x + a 2 x 2 + a 3 x 3 + ... + a n x n ,
se identifică:
a 0 , a1 ,..., a n - coeficienţii care trebuie estimaţi în număr de n + 1 ;
coeficienţii putere 1,2,...,n - în număr de n ; în total, nc = 2n + 1 ; x, y -
variabilele modelului; nv = 2 ;
= - un operator de atribuire cu frecvenţa f1 = 1 ;
+ - operator de însumare cu frecvenţa f 2 = n ;
() α - operatorul de ridicare la putere cu frecvenţa f = n − 1 .
3

Rezultă:
n1 = nc + nv = 2n + 3
n 2 = f 1 + f 2 + f 3 = 2n
Complexitatea C în sens Halstead pentru modelul economic de
regresie polinomială este dată de relaţia:
C = (2n + 3) log 2 (2n + 3) + (2n) log 2 (2n)
Având în vedere faptul că evaluarea unei funcţii are prioritatea cea
mai mare, ponderea asociată evaluării unei funcţii este p5 , cu p5 = 5 . Dacă
se menţin priorităţile operatorilor, tabelul 3.8.

Priorităţi ale operatorilor


Tabel 3.8
= p1 = 1
+,- p2 = 2
*,/ p3 = 3
() α p4 = 4
f (.) p5 = 5

pentru evaluarea complexităţii modelului,


y = a+b+c
mai întâi, modelul se scrie sub forma
y = SQRT (a + b + c )
după care se construiesc liniile tabelului 3.9 în vederea calculului
complexităţii ponderate a acestuia.
Date pentru complexitatea ponderată
Tabelul 3.9
Componenta Frecvenţa Ponderea Frecvenţa X Ponderea
y 1 1 1
a 1 1 1
b 1 1 1
c 1 1 1
n1 4
= 1 1 1
+ 2 2 4
f (.) 1 5 5
n2 10

C = 4 log 2 4 + 10 log 2 10 = 41.21

Pentru modelul:
y = sin( ax + bz + c ) + cos( ax + bz + c )
se înregistrază datele în tabelul 3.10.

Date pentru complexitatea ponderată


Tabelul 3.10
Componenta Frecvenţa Ponderea Frecvenţa X Ponderea
a 2 1 2
b 2 1 2
c 2 1 2
x 2 1 2
y 1 1 1
z 2 1 2
n1 11
= 1 1 1
+ 5 2 10
* 4 3 12
f (.) 2 5 10
n2 33

Complexitatea în sens Halstead este:


C = 11log 2 11 + 33 log 2 33
Pentru modelele din tabelul 3.11, ultimele două coloane conţin
complexitatea Halstead şi complexitatea cu luarea în considerare a
ponderilor.

Complexităţile unor modele neliniare


Tabel 3.11
Nr. Denumire Complexitate Complexitate
Forma analitică
crt. model Halstead ponderată
1. funcţia y = ax α + bx + c 35.16 78.25
parabolică 1
2. funcţia y = a + bx 19.60 44.82
parabolică 1
3. funcţia y = 3 a + bx 19.60 44.82
parabolică 3
4. funcţia 27.11 64.91
y = a + bx 3
parabolică 4
5. parabola lui 43.65 104.71
y = 3 ax α + bx + c
Neile
6. funcţia putere y = ax b 12.75 32

7. funcţia y = e ax +b 19.60 54.62


exponenţială 1
8. funcţia y = ae bx 19.60 49.66
exponenţială 2
9. funcţia y = ab x 12.75 32
exponenţială 3
10. funcţia y = e ax ⋅ x b 27.11 74.11
exponenţială 4
11. funcţia ln y = a + b ln x 19.60 72
logaritmică 1
12. funcţia y = a ln x 9.50 33.28
logaritmică 2
13. funcţia y = a + b ln x 16 46.05
semilogaritmică
14. funcţia log- b 16 46.05
inversă ln y = a +
x
Nr. Denumire Complexitate Complexitate
Forma analitică
crt. model Halstead ponderată
15. funcţia log-log- b 35.16 100.23
inversă ln y = a + + c ln x
x
16. funcţia inversă b 12.75 23.50
y =a+
x
17. funcţia Prais a−
b 19.60 44.82
y=e x

18. funcţia de x 43.65 99.05


ordinul 3 y=
(ax + bx + c)
2

19. funcţia 1 19.60 40.13


hiperbolică 1 y=
(a + bx)
20. funcţia b 19.60 35.60
hiperbolică 2 y =a+
(c + x )
21. funcţia kx 19.60 40.13
Tornqvist 1 y=
( x + a)
22. funcţia k ( x + a) 31.01 74.11
Tornqvist 2 y=
( x + b)
23. funcţia bx( x − c) 39.30 94.71
Tornqvist 3 y=
( x + a)
24. funcţia Johnson k−
a 27.11 58.52
(b+ x )
y=e
25. funcţia log- y = a (ln x) α + b ln x + c 43.65 135.74
parabolică
26. funcţia logistică k 48 116.23
y=
(1 + be − ax )
27. funcţia logistică k2 57.05 144.62
pătratică y=
(1 + be − ax ) 2
28. funcţia Cobb- y = Ax1α x 2β e γx3 52.52 144.62
Douglas 1
29. funcţia Cobb- y = Ax1α x 2β 27.11 74.11
Douglas 2
30. funcţia CES 1 117.30 300.43
(
y = A dx1− ρ + (1 − d ) x 2− ρ
Nr. Denumire Complexitate Complexitate
Forma analitică
crt. model Halstead ponderată
31. funcţia CES 2 86.15 244.18
(
y = A dx1− ρ + (1 − d ) x 2− ρ

32. funcţia CES 3 112.10 302.18


(
y = A dx1− ρ + (1 − d ) x 2− ρ

33. funcţia CES 3 81.32 219.33


(
y = A dx1− ρ + (1 − d ) x 2− ρ

34. Funcţia Allen 76.23 174.10


y = 2hx1 x 2 − ax12 − bx 22

35. Funcţia Sato x12 x 22 71.27 191.63


y=
(ax13 + bx 23 )

Se observă diferenţe semnificative între complexităţile Halstead şi


complexităţile cu priorităţi.

3.4 Complexitatea modelelor cu ecuaţii simultane

Complexităţii modelelor cu ecuaţii simultane i se asociază o serie


de indicatori, cu luarea în considerare a unui set de ipoteze de lucru.
Se consideră modelul liniar cu ecuaţii simultane:
n
y j = a 0 j + ∑ aij xi , j = 1,2,..., m
i =1 .
Se construieşte o matrice Bm ,n +1 , în care
⎧1, aij ≠ 0
bij = ⎨
⎩0, altfel
k
Se notează j numărul elementelor nenule ale ecuaţiei j din model,
n
k j = ∑ bij , j = 1,2,..., m
i =1
j
Complexitatea ecuaţiei j , notată C1 este dată de relaţia:
n1j = k j + d j + 1
1

n2j = (k j − 1) + (d j − 1) + 1
C1j = n1j log 2 n1j + n2j log 2 n2j
.
Dacă modelul economic este privit ca un conglomerat de ecuaţii,
T
complexitatea totală C1 este dată de relaţia
m
C1T = ∑ C1j
.
j =1

Pentru o ecuaţie se identifică:


• o singură apariţie a operatorului de atribuire =;
• k j -1 apariţii ale operatorului de adunare;
• d j -1 apariţii ale operatorului de înmulţire;
• k j coeficienţi ai modelului;
• d j variabile exogene utilizate în ecuaţia j ;
• o singură variabilă endogenă;
unde:
n
d j = ∑ cij
c ij = 1
i =1 , , dacă în ecuaţia i figurează variabila j sau 0, în
caz contrar.
Se consideră următorul model cu ecuaţii simultane:
y1 = a 0 + a1 x1
y 2 = b0 + b1 x1 + b2 x 2
Matricea B corespunzătoare modelului este:
1 1 0
1 1 1
Se calculează:
k1 = 2 , d1 = 1
k2 = 3 , d 2 = 2
rezultând:
n11 = 4 , n12 = 2
n12 = 6 , n 22 = 4 .

Complexităţile celor două ecuaţii vor fi:


C11 = 2 log 2 2 + 4 log 2 4 = 10
C12 = 6 log 2 6 + 4 log 2 4 = 23.50
În acelaşi mod se construiesc tabele cu operatori, variabile,
frecvenţe, ponderi pentru modelele cu argument întârziat, după care se
calculează complexitatea folosind relaţia generalizată a complexităţii în sens
Halstead.

3.5 Inegalităţile de complexitate

În cazul în care modelul economic cu ecuaţii simultane este privit ca


un întreg datorită independenţelor generate de variabilele comune, se obţine
ecuaţia complexităţii:
m m m m
C T 2 = (∑ n1j ) log 2 (∑ n1j ) + (∑ n2j ) log 2 (∑ n2j ) .
j =1 j =1 j =1 j =1

Complexitatea, văzută ca diversitate, C 3 , este dată de relaţia


m m
C3T = [∑ (n1j + n2j )] log 2 [∑ (n1j + n2j )] .
j =1 j =1

Rezultă că între cele trei modele de complexitate există relaţia:


C1T < C 2T < C 3T .
Se consideră modelul:
y1 = a11 x1 + a12 x 2 + + a14 x 4 + a10
y 2 = a 21 x1 + + a 23 x3 + + a 25 x5
m = 2; n = 4

Matricea D
Termen liber
Coef x1 Coef x 2 Coef 3 Coef x 4
x
Coef
x5
Ec.1 1 1 0 1 0 1
Ec.2 1 0 1 0 1 0

n11 = 8 , n12 = 7
n12 = 7 , n 22 = 6

C1T = (8 log 2 8 + 7 log 2 7) + (7 log 2 7 + 6 log 2 6) = 78.81


C 2T = (8 + 7) log 2 15 + (7 + 6) log 2 13 = 106.7

C 3T = 28 log 2 (15 + 13) = 134.6


C1T < C 2T < C 3T
3.6 Ortogonalitatea modelelor

Se consideră o bază de modele în care sunt deja stocate modelele


M 1 , M 2 ,..., M n . Se pune problema adăugării unui nou model, M n +1 . Acest
lucru se efectuează dacă şi numai dacă modelul M n +1 este diferit de
modelele deja existente.
Modelele cu structură identică sunt modelele care au acelaşi
număr de variabile, acelaşi număr de ecuaţii, acelaşi număr de operatori, iar
prin dezvoltarea scrierii poloneze inverse, poziţiile operanzilor şi
operatorilor sunt aceleaşi.
Modelele:
M1 : y = a ⋅ x + b ⋅ z + c
M 2 : w = d ⋅u + h ⋅v + g ,
sunt cu structură identică.
Şi modelele:
M 3 : y = ax + be t
M 4 : u = ce w + dw ,
sunt identice din punct de vedere structural, adunarea fiind comutativă.
Pentru a vedea dacă două modele sunt identice, se procedează, mai
întâi, la calculul complexităţii neponderate.
C ( M 1 ) = 6 log 2 6 + 5 log 2 5 = 27.11
C ( M 2 ) = 6 log 2 6 + 5 log 2 5 = 27.11
C ( M 3 ) = 6 log 2 6 + 5 log 2 5 = 27.11
C ( M 4 ) = 6 log 2 6 + 5 log 2 5 = 27.11

La o primă analiză, rezultă că modelele au complexităţi neponderate


identice.
Pentru modelele M 1 şi M 2 , complexităţile ponderate sunt date de
relaţia:
C ( M 1 ) = 6 ⋅ log 2 6 + 11 ⋅ log 2 11 = 53.56
C ( M 2 ) = 6 ⋅ log 2 6 + 11 ⋅ log 2 11 = 53.56
ceea ce arată că modelele M 1 şi M 2 au un grad de asemănare foarte ridicat,
mai mult, din punct de vedere structural sunt identice:
C ( M 3 ) = 6 ⋅ log 2 6 + 13 ⋅ log 2 13 = 63.61
C ( M 4 ) = 6 ⋅ log 2 6 + 13 ⋅ log 2 13 = 63.61
Modelele M 3 şi M 4 sunt identice din punct de vedere structural şi
diferite de M 1 şi M 2 .
Modelele incluse sunt acelea care în scrierea poloneză inversă apar
sub formă de subşiruri ale unor şiruri.
Pentru modelele,
M 5 : y = ax + bz + c
M 6 : y = a ⋅ x + b ⋅ z + d ⋅u + c
se observă că M 6 se deduce din M 5 la care se adaugă termenul d ⋅ u .
Înseamnă că modelul M 5 este inclus în modelul M 6 . Complexităţile sunt:
C ( M 5 ) = 6 ⋅ log 2 6 + 5 ⋅ log 2 5 = 27.11
C ( M 6 ) = 8 ⋅ log 2 8 + 6 ⋅ log 2 6 = 39.5 .
Raportul de asemănare, A , este dat de relaţia:
K
A = , unde:
N
• N este numărul maxim de componente;
• M este numărul de componente identice.
Pentru modelele M 5 şi M 6 , N = max{11,14} = 14 , unde valorile din
paranteze reprezintă numărul de variabile şi de operatori. Elementele
comune se reunesc într-o mulţime:
{ y, =, a,⋅( produs ), x,+ ( adunare ), b,⋅( produs ), z ,+, c} al cărei cardinal este 11.
11
A= = 0,78 .
14
Complexităţile ponderate sunt:
C ( M 5 ) = 6 ⋅ log 2 6 + 11 ⋅ log 2 11 = 53.56
C ( M 6 ) = 8 ⋅ log 2 8 + 19 ⋅ log 2 19 = 104.71 .
Dacă modelul liniar M k este inclus în modelul M j , unde:
n
M k : y = a 0 + ∑ ai xi
k =1
n n+ r
M j : y = a 0 + ∑ ai xi + ∑a x i i ,
k =1 i = n +1
complexităţile calculate sunt:
C ( M k ) = (n + 2) ⋅ log 2 (n + 2) + (2n) ⋅ log 2 (2n)
C ( M j ) = ( n + r + 2) ⋅ log 2 (n + r + 2) + 2( n + r ) ⋅ log 2 2( n + r )
Modelele ortogonale sunt acelea în care operanzii şi operatorii sunt
diferiţi, fără a lua în considerare operatorul de atribuire:
M 7 : y = a ⋅ bt
M 8 : y = cx + dz + h

Operatorii modelului M 7 sunt constituiţi în şirul: * şi (), iar


operatorii modelului M 8 alcătuiesc şirul: *,+,*,+. Este evident că şirurile
sunt total diferite.
Operanzii din modelul M 7 se constituie în şirul: y, a, b, t, pe când
cei din modeleul M 8 se regăsesc în: z, c, x, d, z, h. Şirurile sunt, de
asemenea, diferite.
Gradul de ortogonalitate se obţine din relaţia:
O ( M k , M j ) = 1 − A( M k , M j ) .

Dacă indicatorul O ( M k , M j ) = 1 , rezultă că modelele sunt


ortogonale.
În cazul în care în baza de modele ce conţine
modelele M 1 , M 2 ,..., M n şi se doreşte adăugarea modelului M n +1 , dacă
O( M i , M n +1 ) = 1, ∀i = 1,2,.., n , modelul M n +1 este într-adevăr un model
nou şi prin includerea lui în baza de modele, aceasta sporeşte din punct de
vedere calitativ.
Modelele de aceeaşi clasă sunt acelea care nu diferă din punct de
vedere structural.

Modelele:
M 8 : y = ax + bz + cw + d
M 9 : y = ax + d
sunt modele liniare, provin din aceeaşi clasă pentru că includ în alcătuirea
lor:
• coeficienţi;
• variabile;
• operatori de adunare;
• operatori de înmulţire;
• termeni de acelaşi grad egal cu 1.
Se calculează complexitatea:
C = n1 log 2 n1 + n 2 log 2 n 2 + n3 log 2 n3 ,
unde:
• n1 este numărul de termeni diferiţi;
• n 2 este numărul de operanzi diferiţi;
• n3 numărul de grade diferite.
C ( M 8 ) = 2 log 2 2 + 3 log 2 3 + 2 log 2 2 = 8.75
C ( M 9 ) = 2 log 2 2 + 3 log 2 3 + 2 log 2 2 = 8.75

Modelele:
M 10 : y = ax12 + bx 22 + cx 32 + d + ex1 + fx 2 + gx 3
M 11 :
y = ax + bx 22 + cx 32 + dx 42 + ex 52 + gx 62 + hx 72 + i + jx1 + kx 2 + lx 3 ,
2
1

sunt definite prin:


• coeficienţii modelului M 10 : a, b, c, d , e, f , g .
• coeficienţii modelului M 11 : a, b, c, d , e, g , h, i, j , k , l .
• variabilele modelului M 10 : y, x1 , x 2 , x3 .
• variabilele modelului M 11 : y, x1 , x 2 , x3 , x 4 , x5 , x6 , x7 .
• operatorii diferiţi ai modelului M 10 : =,+, () 2 ,* .
• operatorii diferiţi ai modelului M 11 model are: =,+,*, () 2 .
• gradele termenilor modelelor M 10 şi M 11 : 0,1,2 .
Se calculează complexităţile modelelor de mai sus:
C ( M 10 ) = 3 log 2 3 + 4 log 2 4 + 3 log 2 3 = 17.5
C ( M 11 ) = 3 log 2 3 + 4 log 2 4 + 3 log 2 3 = 17.5 .
Rezultă că M 10 şi M 11 aparţin aceleiaşi clase.

Modelele asemenea sunt acelea care conţin structuri dominante


comune. Modelele:

M 12 : y = ax1 + bx 2 x 3 + ce x4 + dx 5 ⋅ log( x 6 ) + g
şi
x2
M 13 : y = ax12 + b + ce x4 + dx 5 ⋅ log( x 6 ) + g
x3
au în structura lor termenii comuni reuniţi în subexpresia
ce x4 + dx 5 ⋅ log( x 6 ) + g . Complexităţile neponderate ale celor două modele
sunt:
C ( M 12 ) = 12 log 2 12 + 12 log 2 12 = 86.03
C ( M 13 ) = 13 log 2 13 + 13 log 2 13 = 96.21
Complexitatea subexpresiei comune este:
C (comun) = 6 log 2 6 + 7 log 2 7 = 35.16 .

Ponderea complexităţi subexpresiei comune în totalul complexităţii


lui M 12 este:
6 log 2 6 + 7 log 2 7
ρ12 = = 0.4
12 log 2 12 + 12 log 2 12

şi ponderea complexităţi subexpresiei comune în totalul complexităţii lui


M 13 este:
6 log 2 6 + 7 log 2 7
ρ13 = = 0.36 .
13 log 2 13 + 13 log 2 13
Dacă ρ ∈ [0,0.82] , se concluzionează că modelele au în comun
elemente nesemnificative.
Dacă ρ ∈ [0.82,0.92] , se concluzionează că modelele au în comun
elemente semnificative.
Dacă ρ ∈ [0.92,1) ,modelele au un grad foarte ridicat de asemănare.
Pentru ρ i = 1 , un anumit model, M i este inclus în alt model, M j , cu
ρ j > 0 . Dacă ρ i = ρ j = 1 , modelele sunt identice.
În general, ponderea complexităţii subexpresiei comune a două
modele M i şi M j se calculează astfel:
C (M i ∩ M j ) C (M i ∩ M j )
ρi = , ρj =
C (M i ) C (M j )

În concluzie, bazele de modele includ:


• modele ortogonale;
• modele generative pentru o clasă,
de exemplu:
n n
y = a 0 + ∑ a i x i , y = a 0 + ∑ a i x12 ,
i =1 i =1
modele cu subexpresii comune cu pondere limitată;
• modele cu un nivel de includere sub o limită impusă.
Limitele sunt impuse atunci când se configurează baza de modele,
pentru a se gestiona riguros varietăţile de modele. Unele dintre rezultate au
fost publicate în [POPAM04].

S-ar putea să vă placă și