Sunteți pe pagina 1din 2

1.

Recunoasterea probelor

1.1 Introducere

Introducerea în prezent a instrumentelor analitice moderne permit producerea de cantități mari de


informații (variabile sau caracteristici) pentru un număr mare de probe , care pot fi analizate în timp
relativ scurt. Acest lucru duce la disponibilitatea unor matrici de date multivariate care necesită
utilizarea unor proceduri matematice și statistice, în scopul de a extrage eficient datele care ne sunt utile
.

Tehnicile pentru recunoașterea tehnicilor supravegheate utilizează informațiile despre clasa membrilor
de mostre la un anumit tip de grup (clasă sau categorie) pentru a clasifică noi probe necunoscute într-
una din clasele cunoscute bazate pe modelul său de măsurători .

Procedurile de recunoaștere a modelelor supravegheate utilizează o metodă comună ,o strategie,


indiferent de algoritmul aplicat, care constă în următoarele etape :

• Selectarea unei metode, a unei calibrări și a unui set de teste, care constau în obiecte de
membru de clasă cunoscute pentru care variabilele sunt măsurate. Setul de calibrare este utilizat pentru
optimizarea parametrilor caracteristici pentru fiecare multivariat de tehnică.

• Selecție variabilă. Aceste variabile care conțîn informații pentru clasificarea vizată sunt păstrate,
în timp ce aceste variabile codează zgomotul și / sau fără nici o putere de discriminare este eliminat.

• Construirea unui model folosind setul de antrenament. Un mathematic model este derivat între
un anumit număr de variabile măsurat pe eșantioanele care constituie setul de antrenament și
categoriile lor cunoscute.

• Validarea modelului utilizând un set independent de probe,pentru a evalua fiabilitatea


clasificării realizate.

Au existat mai multe tipuri de metode de recunoaștere a modelului aplicate în știința alimentelor, dar
ele diferă esențial de felul în care acestea obțîn clasificarea . Sunt două tipuri de metode de obicei
distinse într-o primă abordare: cele concentrate privind discriminarea între clase, cum ar fi discriminarea
liniară analiză (LDA), k-vecinii cel mai apropiat (kNN), clasificarea și arbori de regresie (CART), analiză
discriminatorie parțială minimă (PLS-DA) și rețelele neuronale artificiale (ANN); și aceleaorientate spre
cursuri de modelare, cum ar fi soft independentmodelarea analogiei de clasă (SIMCA) și inegal
dispersateclase (UNEQ).

Tehnicile de discriminare sunt folosite pentru a construi modele bazate pe toate categoriile implicate în
discriminare, întrucât metodele disjuncte de modelare a claselor creează o separare model pentru
fiecare categorie. Unul dintre dezavantajele discriminării metodelor este că eșantioanele sunt
întotdeauna clasificate într-una din categoriile respective, chiar dacă nu aparțîn niciuneia dintre ele.
Metodele de modelare a claselor iau în considerare acele obiecte care se potrivesc modelului pentru o
categorie că parte a modelului și clasificat că non-membri cei care nu. Cu toate acestea, în ceea ce
privește clasificarea abilități, examinările empirice recente arată că SIMCA nu este la fel de puternic că și
înainte; CAIMAN, CART și variantele de analiză discriminantă sunt mai bune .

Tehnicile de recunoaștere a modelelor supravegheate pot fi de asemenea grupate că parametrice /


non-parametrice , deterministe /probabilistic sau liniar / neliniar. Tehnici parametrice cum ar fi LDA,
PLS-DA, SIMCA și UNEQ .Statistici în metodele non-parametrice cum ar fi kNN și CART nu se bazează pe
distribuție ,ipoteza, ceea ce face estimarea probabilităților de clasificare corectă mai dificilă.La linia
liniară / neliniară, clasificarea se bazează pe natură funcțiilor discriminante, linear / non-linear,
respectiv, folosit pentru a discrimina printre clase.

1.2 Proceduri preliminare

Se presupune că datele analitice sunt obținute prin validare ,metode analitice în ceea ce privește
precizia, sensibilitatea, specificitate, incertitudine, robustețe și trasabilitate. În plus, datele utilizate
pentru formare ar trebui să fie suficient de mari pentru a le acoperi variația posibilă cunoscută în
domeniul problemei.

Supravegherea recunoașterii modelului necesită un set de antrenament cu obiecte de categorii


cunoscute pentru a obține un model pentru identificarea probelor necunoscute. Prin urmare, este
obligatoriu să stabiliți mai întâi dacă măsurătorile chimice sunt de fapt bune,suficient pentru a se
încadra în clasele predeterminate, deoarece tehnicile de recunoaștere nu pot compensa modelele slab
proiectate ,experimente sau date experimentale inadecvate . Această sarcină poate să fie dificilă
datorită faptului că tehnicile analitice modern sunt capabile să genereze atât de multe date că
informațiile esențiale nu pot fi evidente. Analiză datelor exploratorii (EDA) (și recunoașterea modelului
nesupravegheat) este utilizat în mod obișnuit pentru simplificare și să obțînă o mai bună cunoaștere a
seturilor de date. Provocarea este să eliminați redundanța și zgomotul, păstrând în același timp
semnificația informației.

Exemplu de test EDA printr-o nouă tehnică pe bază de microparticule pentru proteina C

Tehnicile noi de testare au fost aplicate la un test nou dezvoltat pe bază de microparticule pentru
proteina C reactivă (CRP). Prin utilizarea a două microparticule cu dimensiuni diferite