Sunteți pe pagina 1din 19

 Metode de identificare şi validare

. Variante de bază ale MCMMP

Cum pot fi relaxate condiţiile restrictive din cadrul Teoremei fundamentale fără a
afecta consistenţa estimaţiilor?
Condiţia a. (determinismul matricii regresorilor) este adesea înlocuită prin E [n]v[m]  0
condiţia ca perturbaţia şi vectorul regresorilor să nu fie corelate.  n, m N

• Se poate arăta (deşi este mai complicat), că noua condiţie nu


conduce la pierderea consistenţei.
• Condiţia este sugerată de expresia ideală aparametrilor adevăraţi.
θ   E{φ[n]φT [n]}
1
 E{φ[n] y[n]}  E{φ[n]v[n]}
 1 N  
1
1 N 

θ  E φ[ n]φ [ n] 
1
 T
 E φ[n] y[n]   Nlim   φ[ n ]φT
[ n ]   N   
 lim φ[ n] y[ n] 
   N n 1     N n 1 

 θˆ N
• Mai mult, datorită timpului mort intrinsec al procesului, în anumite cazuri este posibilă
verificarea condiţiei de necorelare chiar şi în cazul identificării în buclă închisă.
Condiţia b. (inversabilitatea matricii de covarianţă) este indispensabilă
pentru buna definire a estimaţiei vectorului parametrilor necunoscuţi.
 Aceasta nu este o
1
1 N  1 N  condiţie restrictivă.
θˆ N  R N1rN    [ n]T [ n]    [ n] y[ n] 
 N n 1   N n 1 
 Metode de identificare şi validare
. Variante de bază ale MCMMP

Condiţia c. (perturbaţia este un zgomot alb) se verifică rareori în practică.


Pentru relaxarea ei, există două abordări.

Cazul zgomotelor colorate, Cazul zgmotelor albe


Erori sistematice de măsură 
de medie nulă de medie nenulă
Estimatorul Markov  Cazuri frecvent Centrarea datelor pe medie
întîlnite în aplicaţii.

Cazul zgomotelor colorate, de medie nulă. Estimatorul Markov.


matrice de auto-covarianţă nu neapărat diagonală, dar
E{VVT }  Λ  0
simetrică şi strict pozitiv definită
Deoarece media zgomotului continuă să fie nulă,
atît nedevierea cît şi consistenţa estimaţiilor  Se pierde eficienţa estimaţiei.
   
1 1
oferite de MCMMP se conservă. Exerciţiu ˆ
P(θ)  Φ Φ ΦT ΛΦ ΦT Φ
T

Cum se poate remedia acest efect?


Estimatorul CMMP se poate înlocui cu estimatorul Markov, care se
construieşte plecînd de la descompunerea Cholesky a matricii .
Λ  CT C  0

CT  Y  Φθ  V CT Y  CT Φθ  CT V Y  Φθ  V


Transformare echivalentă a ecuaţiei procesului Y Φ V
 Metode de identificare şi validare
. Variante de bază ale MCMMP

Cazul zgomotelor colorate, de medie nulă. Estimatorul Markov. (final )

Aşadar Y  Φθ  V Este alb noul zgomot? DA

CT Y CT Φ CT V E{VVT }  E{CT VVT C1}  CT E{VVT }C1  CT ΛC1
 CT CT CC1  I N
Estimaţia Markov  Şi are chiar

  ΦT Y   ΦT Λ 1Φ  ΦT Λ 1Y
1 1 dispersie unitară.
θ  ΦT Φ

 Cea mai eficientă din clasa .


ΦT  Λ 1  Φ  ΦT ΛΦ  ΦT  Φ  0
1
P(θ)  P(θˆ )
   
1
Exerciţiu P(θ)  ΦT Λ1Φ
Markov CMMP

Este acest estimator implementabil?


În general, nu, din două motive:
 Matricea de auto-covarianţă a zgomotului colorat nu este cunoscută.
Chiar dacă matricea de auto-covarianţă a zgomotului colorat ar fi estimată în prealabil,
dimensiunea acesteia este egală cu a orizontului de măsură, astfel că inversarea este o
operaţie consumatoare de timp.
În cazul zgomotelor colorate de medie nulă, se utilizează tot MCMMP,
chiar dacă nu este cea mai eficientă.
 Metode de identificare şi validare
. Variante de bază ale MCMMP

Cazul zgomotelor albe, de medie nenulă. Centrarea datelor pe medie.

E{v[ n]}  v  0  Consistenţa şi nedevierea estimaţiei se pierd. Exerciţiu


Cum se poate remedia acest efect?
eroare sistematică de măsură
(necunoscută)
Există două strategii.
Exerciţiu
în acest curs

Centrarea datelor pe medie Metoda Celor Mai Mici Pătrate cu


(staţionarizarea datelor) Parametri Extinşi (MCMMPPE)

• Se pleacă de la observaţia că zgomotul staţionarizat are medie nulă.

E v[ n]  v  v  0
def
v  v  E{v[ n]}  v  v

• De notat că zgomotul staţionarizat nu mai este alb, ci colorat.


Exerciţiu E{v[n]v[m]}  E  v[n]  v  v[m]  v    0 [n  m] 
2 2
v  n, m N

• Conform cazului anterior, zgomotele colorate nu produc


pierderea consistenţei, dacă au media nulă. parametru necunoscut
y[n]  φT [n]θ  v[n]  n N y[ n]  φT [ n]θ  v  v[ n] suplimentar
 n N
Transformare echivalentă a ecuaţiei procesului
 Metode de identificare şi validare
. Variante de bază ale MCMMP

Cazul zgomotelor albe, de medie nenulă. Centrarea datelor pe medie. (final)


Aşadar y[ n]  φ [ n]θ  v  v[ n]
T
 n N

• Se poate aplica operatorul de mediere statistică: E{y[n]}  E{φT [n]}θ  E{v[n]} y  φ θ  v


T

• Ecuaţia mediilor se scade din cea a procesului: T ecuaţia mediilor


  θ  v[n]

y φ v
y[ n]  y  φT [ n]  φ
T

 Medii ale datelor măsurate.


y[ n] φT [ n] y[n]  φT [n]θ  v[n]  n N
 Date staţionarizate
(centrate pe medie). Zgomotul noii ecuaţii de proces are medie nulă, dar este colorat.

1 Se poate folosi fie Estimatorul Markov,


 N   N   θ 
θ N    [ n] [ n]    [ n] y[ n] 
T def
fie Estimatorul CMMP. 
θ  
 n 1   n 1  e
 v 

 
1 N Exerciţiu

2
N 
2
y[ n ]  φT
[ n ]θ
 N n 1
N
• Să se dezvolte MCMMPPE plecînd de la exprimarea ecuaţiei
procesului cu ajutorul vectorului extins de parametri.
• Se poate arăta că estimaţiile oferite de
T
medii v N
 y N
 φ N θ N Eroarea
temporale sistematică MCMMPPE sunt aceleaşi ca în cazul
estimate estimată. staţionarizării datelor.
 Metode de identificare şi validare
. Variante de bază ale MCMMP

Analiza estimaţiei oferite de MCMMP pentru modelele ARX  Cele mai folosite în Automatică.

P (*) A (q1 ) y[n]  B (q1 )u[n]  v[n] y[n]  φT [n]θ  v[n]


 n N  n N
polinoame cu parametri adevăraţi,
avînd gradele na, respectiv nb n  na  nb
DN  {(u[n], y[n])}n1, N  T def
date măsurate  [ n]    y[ n  1]  y[ n  2]  y[ n  na ] u[ n  1] u[ n  2] u[ n  nb] 
 T def  vectorul regresorilor
θ   a1 a2 ana b1 b2 bnb   vectorul parametrilor necunoscuţi
 Aceşti vectori au cîte două componente.
 1 N   1 N
   1 N  
  y[ n  i ] y [ n  j ]   N y[ n  i ]u[ n  j ]  i1,na     y [ n  i ] y[ n ]  
  N n 1  i , j1,na  n 1     N n 1  i1, na 
j1, nb
RN   ryN [i  j ]  ru , y [i  j ]
N
 r   ry [i ]
N

 1 N  1 N
  N
1  
 N 
N
  u [ n  i ] y [ n  j ]  i1,nb u [ n  i ]u [ n  j ]      u[ n  j ] y[ n] 
  N n 1   n 1  i , j1,nb    n 1
N  j1,nb 
  r N [i  j ]
j1, na
r [i  j ]
N   N 
y ,u u ry ,u [ j ]
 Matricea nu este neapărat simetrică.
• În cadrul matricii RN , indicele i parcurge liniile, iar indicele j parcurge coloanele.
• Pentru a evalua elementele matricii şi ale vectorului se apelează la
convenţia prelungirii cu zeroruri a secvenţelor de date măsurate.
 Metode de identificare şi validare
. Variante de bază ale MCMMP

Analiza estimaţiei oferite de MCMMP pentru modelele ARX (continuare)


1
  r N [i  j ]   r [i  j ] i1,na 
N
   r N [i ] 
y  i , j1,na u, y
j1, nb    y   
θˆ N  R N1rN  
i 1, na
  N 
   ryN,u [i  j ] i1,nb  ru [i  j ]
N   
  y ,u  j1,nb 
r [ j ]
  i , j1, nb 
 
 j1, na

    y[n]  φT [n]R N1rN  Dacă perturbaţia este un zgomot alb de


N N
1 2 1
ˆ 2N  y[ n]  φ [ n]θˆ N
2
T

N n 1 N n 1 medie nulă şi dispersie necunoascută.
 Vectorul regresorilor nu este perfect determinist. Nu poate fi aplicată Teorema fundamentală a
 Mai mult, estimaţia vectorului parametrilor MCMMP pentru a testa consistenţa estimaţiilor.
necunoscuţi este deviată.

Cum poate fi testată consistenţa în cazul acestui model?

Prin relaxarea condiţiei a. din ipoteza Teoremei 4.2.

  r [i  j ]   ru , y [i  j ] i1,na 
 y  i , j1,na
j1, nb 
  r [i ] 
lim R N     E{φ[ n]φT [ n]} lim r    y  i1,na   E{φ[ n] y[ n]}
N     r [i  j ] i1,nb  ru [i  j ]  N 
N
  r [ j ] 
  y ,u 
j1, na
i , j1, nb    y ,u  j1,nb 
 
IE
 Metode de identificare şi validare
. Variante de bază ale MCMMP

Analiza estimaţiei oferite de MCMMP pentru modelele ARX (continuare)


θ   E{φ[n]φT [n]}
1
 E{φ[n] y[n]}  E{φ[n]v[n]}
lim R N lim rN O condiţie suficientă de consistenţă
N  N 

lim θˆ N  θ   E{φ[ n]φT [ n]}


1

N 
 E{φ[ n]v[ n]} E v[n] y[n  i]  0
 i 1, na
E φ[n]v[n]  0
• Mai precis, se poate demonstra rezultatul de mai jos. E v[ n] u[ n  j ]  0
Propoziţia 4.3  j 1, nb
Pentru modelul ARX, următoarele 3 ipoteze se consideră verificate:
a. semnalul de intrare are ordin de persistenţă suficient de mare, astfel încît matricea RN
să fie inversabilă pentru toate dimensiunile orizontului de măsură suficient de mari;
b. perturbaţia v aparţine clasei za(0,2) (cu dispersia necunoscută  2);
c. semnalul de intrare (comandă sau referinţă) este necorelat cu perturbaţia
( E u[ n]v[ m]  0 ,  n, m Z ).
Atunci estimaţiile oferite de MCMMP sunt consistente.

• Se observă că numai una dintre cele două condiţii suficiente  Ieşirea de la momente anterioare
de consistenţă este precizată în cadrul propoziţiei. este necorelată cu zgomotul de la
• Intrarea ar trebui generată artificial, departe de sursa de momentul curent datorită timpului
perturbaţii care afectează ieşirea procesului, cu ordin de mort intrinsec al procesului.
persistenţă cît mai mare.
 Metode de identificare şi validare
. Metoda Variabilelor Instrumentale (MVI)
• Condiţia ca perturbaţia să fie un zgomot alb rămîne restrictivă.
• Dacă nu se doreşte impunerea veunei condiţii asupra perturbaţiilor, atunci se operează o
modificare asupra estimaţiilor oferite de MCMMP.
Estimaţia oferită de Aceasta este o definiţie.
Metoda Variabilelor Instrumentale (MVI)
1
• Nu s-a utilizat nici un raţionament
def
 1 N
  1 N
 pentru deducerea ei.
θˆ N  R N rN    ζ[ n]  [ n]    ζ[ n] y[ n] 
1 T
• Definiţia este corectă numai dacă
 N n 1   N n 1  matricea RN este inversabilă.

vectorul variabilelor instrumentale ζ[ n]  R n


 Ales liber de către utilizator, astfel
încît definiţia să fie corectă.
Această proprietate trebuie studiată în manieră riguroasă.
Dar consistenţa?
Se pot deduce mai întîi condiţiile generale de consistenţă.
ζ[ n]  y[n]  φT [n]θ  v[n]
det  E{ζ[ n]φT [ n]}  0
E

θ  E ζ[n]φT [n]   E ζ[n] y[n]  E ζ[n]v[n]
1

E{ζ[ n]v[ n]}  0


IE  n N
 Instrumentele trebuie să fie
θ  lim θˆ N   E{ζ[ n]φT [ n]}  E{ζ[ n]v[ n]}
 1

N  necorelate cu perturbaţiile.
 Metode de identificare şi validare
. Metoda Variabilelor Instrumentale
A (q1 ) y[n]  B (q1 )u[n]  v[n]
Analiza estimaţiei oferite de MVI pentru modelele ARX P ((
**))  n N
y[n]  φT [n]θ  v[n]
 n N
 T def
Cum se poate construi vectorul variabilelor  [ n]    y[ n  1]  y[ n  2]  y[ n  na ] u[ n  1] u[ n  2] u[ n  nb] 
 T def
instrumentale în cazul modelelor ARX? θ   a1 a2 ana b1 b2 bnb 

Pentru a realiza necorelarea cu perturbaţiile, se încearcă utilizarea


n  na  nb
doar a intrării (nu şi a ieşirii).
def
ζ[ n]   u[ n  1] u[ n  2] u[ n  na  nb]
T
nefiltrat

3 tipuri de vectori
ai instrumentelor parţial filtrat
def T
ζ[ n]  u f [ n  1] u f [ n  2] u f [ n  na ] | u[ n  1] u[ n  2] u[ n  nb] ;
 Pe poziţia componentei AR.
def T
ζ[ n]  u[ n  1] u[ n  2] u[ n  na ] | u f [ n  1] u f [ n  2] u f [ n  nb] ;
 Pe poziţia componentei X.
(total) filtrat
def
ζ[ n]  u f [ n  1] u f [ n  2] u f [ n  na  nb]
T
Semnalul D( q1 )
def
u f [ n]  1
u[ n]
filtrat C(q )
C( q1 )  1 Bˆ ( q 1 )  n N
;
def
Exemple u f [ n]   u[ n  nk ] estimate cu
D(q1 )  qnd Aˆ ( q 1 ) 
 n N MCMMP
polinoame
 Metode de identificare şi validare
. Metoda Variabilelor Instrumentale

Analiza estimaţiei oferite de MVI pentru modelele ARX (continuare)


def
ζ[ n]  u[ n  1] u[ n  2] u[ n  na  nb]
T
(nefiltrat)

  1 N  1 N
   1 N  
    u[ n  i ] y[ n  j ] N u [ n  i ]u [ n  j ]  i1,na     u[ n  i ] y[ n] 
def 
 N n 1  i , j1,na  n 1   def 
 N n 1  i1, na 
j1, nb
RN    ry ,u [i  j ]
N
ru [i  j ]
N  r  N
ry ,u [i ] 
 1 N  1 N   N  1 N  
    u[ n  na  i ] y[ n  j ] N  u [ n  na  i ]u [ n  j ]      u[ n  na  j ] y[ n] 
  N n 1  i1,nb  n 1  i , j1,nb    N n 1  j1,nb 
  r N [ na  i  j ]
j1, na
ruN [na  i  j ]   
y ,u ryN,u [ na  j ]

1
   r N [i  j ]  r [i  j ] i1,na
N 
  y ,u  i , j1,na u
   r N [i ] 
  y ,u  i1,na
j1, nb
θˆ N  R N1rN    
   r N [ na  i  j ] i1,nb  ruN [ na  i  j ]    r N [ na  j ] 
  y ,u 
j1, na
i , j1, nb    y ,u  j1,nb 
 

    y[n]  φ 
N N
1 2 1
ˆ 2N  y[ n]  φ [ n]θˆ N 1 2
T
 T
[ n]R r
 Dacă perturbaţia este un zgomot alb de
N N
N N
n 1 n 1 medie nulă şi dispersie necunoascută.

Condiţiile det  E{ζ[ n]φT [ n]} 0


• Datorită formei vectorului instrumentelor, a doua
condiţie este automat verificată dacă intrarea este
generale de 
 n N produsă departe de sursa perturbaţiilor.
consistenţă E{ζ[ n]v[ n]}  0
 Nu este necesar ca zgomotul să fie alb.
 Metode de identificare şi validare
. Metoda Variabilelor Instrumentale

Analiza estimaţiei oferite de MVI pentru modelele ARX (continuare)

Este bine definită estimaţia oferită de MVI?


Pentru anumite semnale de intrare, da.

Teorema 4.4 (Teorema fundamentală a MVI pentru modelele ARX)


Pentru modelul ARX[na,nb], următoarele 3 ipoteze se consideră verificate:
 
a. modelul este parsimonios: ( A , B )  1
(polinoamele adevărate sunt coprime) ;
b. semnalul de stimul u aparţine clasei za(0,  u2 )
(adică este un zgomot alb de medie nulă şi dispersie cunoscută).
c. perturbaţia v nu este corelată cu semnalul de stimul: E{u[ n]v[ m]}  0 ,  n, m N .
Dacă se alege un vector al instrumentelor de tip nefiltrat, atunci estimaţia oferită de MVI
pentru vectorul parametrilor adevăraţi ai modelului este bine definită şi consistentă.

• Acest rezultat arată că modelele de tip ARX pot fi identificate cu succes şi în cazul cînd
perturbaţiile nu pot fi caracterizate statistic.
• Condiţia de neautocorelare a perturbaţiilor se transferă acum intrării, care poate fi controlată.
• În practică, intrarea de tip zgomot alb nu poate fi generată, dar semnalele care
o aproximează (SPAB, SPA) sunt frecvent utilizate în conjuncţie cu MVI, fără
a pierde buna definire a estimaţiei aferente.
 Metode de identificare şi validare
. Metoda Variabilelor Instrumentale

Analiza estimaţiei oferite de MVI pentru modelele ARX (continuare)


Cît de eficientă este estimaţia oferită de MVI?

Pentru testarea eficienţei, este necesară evaluarea Aceasta se realizează în demonstraţia


matricii de auto-covarianţă a erorii de estimare. rezultatului care urmează.

Teorema 4.5 (Eficienţa estimaţiei oferite de MVI pentru modelele ARX)


Se consideră că modelul ARX[na,nb] verifică următoarele ipoteze:
 
a. modelul este parsimonios: ( A , B )  1 (polinoamele adevărate sunt coprime);
b. intrarea u este un semnal de stimul cu ordin de persistenţă suficient de mare (cel puţin
na+nb) astfel încît estimaţiile oferite de MVI cu vectori ai instrumentelor construiţi
folosind numai acest semnal să fie corect definite;
c. perturbaţia v aparţine clasei za(0,2) (adică este un zgomot alb de medie nulă şi
dispersie necunoscută  2), nefiind corelată cu semnalul de stimul:
E{u[n]v[m]}  0 ,  n, m N .
d. perturbaţia v este independentă statistic de semnalul de stimul.
Atunci cea mai eficientă estimaţie (corect definită) oferită de MVI se obţine pentru
următorul vector al instrumentelor, parţial filtrat:
def T
ζ[ n]  u f [ n  1] u f [ n  2] u f [ n  na ] | u[ n  1] u[ n  2] u[ n  nb] ,
def
B ( q1 )
unde: u f [ n]    1 u[ n] .
A (q )
 n N
 Metode de identificare şi validare
. Metoda Variabilelor Instrumentale

Analiza estimaţiei oferite de MVI pentru modelele ARX (continuare)


O estimaţie cu eficienţă satisfăcătoare se obţine def
Bˆ ( q 1 )
Teorema 4.5 u f [ n]   u[ n]
folosind un filtru determinat prin MCMMP. Aˆ ( q 1 )  n N
 Cele două polinoame se pot estima şi folosind MVI
cu un vector al instrumentelor nefiltrat.
• În cadrul Teoremei 4.5, se revine la ipoteza perturbaţiilor de tip zgomot alb, de aceea valoarea sa este
destul de limitată.
• Cu toate acestea, dacă se verifică ipotezele Teoremei 4.5, se poate arăta că estimaţiile oferite de
MCMMP şi MVI sunt la fel de eficiente.
• În cazul zgomotelor colorate:
 Estimaţiile oferite de MCMMP sunt mai lent convergente (mai puţin eficiente)
decît cele oferite de MVI.
 Deoarece Estimatorul Markov este neimplementabil.
 Estimaţiile oferite de MVI pot să nu fie consistente către valorile adevărate ale parametrilor.
 Deoarece procesul nu poate fi stimulat cu un zgomot alb.

• În aplicaţiile unde este necesară identificarea unui model de tip ARX:


 Atît estimaţiile oferite de MCMMP cît şi cele oferite de MVI sunt implementabile.
 Asigurarea condiţiilor de consistenţă nu este uşor de realizat, deoarece se bazează pe
neautocorelarea fie a perturbaţiilor, fie a intrărilor.
• În general, MCMMP este utilizată cînd procesul nu poate fi stimulat cu un SPA(B),
altfel se recurge la MVI.
 Metode de identificare şi validare
. Exerciţii rezolvate
Exerciţiul 5.3
Deduceţi expresiile estimaţiilor oferite de MVI pentru un model ARX[1,1]
şi un vector al instrumentelor de tip nefiltrat.
Studiaţi consistenţa lor şi precizaţi un set de condiţii suficiente
pentru verificarea acestei proprietăţi.
Determinaţi condiţiile generale de consistenţă în cazul în care nici
intrarea nici zgomotul nu sunt neapărat albe.
Soluţie
 Metode de identificare şi validare
. Exerciţii rezolvate
Soluţie (Exerciţiul 5.3)
 Metode de identificare şi validare
. Exerciţii rezolvate
Soluţie (Exerciţiul 5.3)
 Metode de identificare şi validare
. Exerciţii rezolvate
Soluţie (Exerciţiul 5.3)
 Metode de identificare şi validare
. Exerciţii rezolvate
Soluţie (Exerciţiul 5.3)

S-ar putea să vă placă și