Sunteți pe pagina 1din 134

Academia de Studii Economice

Prof. univ. dr. Gheorghe RUXANDA

ANALIZA
MULTIDIMENSIONALA A
DATELOR

Bucureºti
2009
Tema 1. Probleme ale m|sur|rii Õi cuantific|rii economico-sociale

1.1 Necesitatea Õi rolul analizei datelor


Cunoa Õterea Õtiin Ûific | din orice domeniu de activitate uman | presupune, indiferent de natura Õi specificul obiectivelor
concrete urm |rite, o complex | Õi riguroas | analiz | cantitativ | a fenomenelor Õi proceselor care fac obiectul cercet|rii. Este
vizibil pentru oricine, Õi din ce în ce mai mult, c | în epoca modern | aproape orice individ angrenat într-o activitate uman | se
ocup |, într-un fel sau altul, în mod direct sau indirect, cu date Õi informa Ûii, cu colectarea, prelucrarea Õi interpretarea acestora.
Desf |Õurarea oric |rei activit|Ûi umane implic | o produc Ûie continu | de date sau informa Ûii, care se acumuleaz | în timp Õi
care pot fi folosite pentru cunoa Õterea structural| Õi evolutiv | a fenomenelor la care se refer | aceste informa Ûii, în scopul
fundament |rii corecte Õi eficiente a deciziilor care trebuie luate. M ai mult decât atât, desf |Õurarea activit|Ûilor umane nici m |car
nu poate fi conceput| în zilele noastre f|r | un consum continuu, din ce în ce mai mare, de informa Ûie. Din acest punct de vedere,
se poate spune c | informa Ûia a devenit unul dintre factorii de produc Ûie importan Ûi Õi activi, un factor de progres Õi civiliza Ûie.
Totdeauna, mulÛimile de date con Ûin, într-un mod amalgamat Õi invizibil, atât aspecte semnificative, cât Õi aspecte
nesemnificative, ale manifest |rii fenomenelor. Deoarece cunoa Õterea Õtiin Ûific | vizeaz | în mod exclusiv aspectele infor-
ma Ûionale semnificative, apare necesitatea utiliz |rii unor metode Õi tehnici specifice analizei datelor, cu ajutorul c |rora informa-
Ûia semnificativ | s | poate fi detectat|, separat| de informa Ûia nesemnificativ | Õi exprimat | sub o form | clar | Õi interpretabil|.
Metodele Õi tehnicile de analiz | a datelor sunt cele mai adecvate instrumente utilizabile pentru identificarea unor structuri
cauzale, pentru decelarea unor tendin Ûe Õi configura Ûii specifice pe mulÛimea datelor analizate Õi ob Ûinerea unor reprezent|ri
simplificate ale informa Ûiilor de mare complexitate.
Utilitatea Õi eficien Ûa utiliz |rii metodelor Õi tehnicilor de analiz | a datelor sunt maxime în situa Ûiile în care informa Ûiile
supuse studiului sunt în cantit |Ûi foarte mari. Din acest punct de vedere, domeniul economic poate fi considerat ca fiind un
domeniu privilegiat. În cea mai mare parte a lor, metodele Õi tehnicile de analiz | a datelor au natur | multidimernsional|, astfel
încât, comparativ cu metodele Õi tehnicile de analiz | statistic | descriptiv |, ele permit Õi investigarea leg |turilor Õi
interdependen Ûelor eviden Ûiate la nivelul mulÛimilor de date.
Materia prim | utilizat| în orice activitate de analiz | a datelor este reprezentat| de o colec Ûie sau mulÛime de date sau
informa Ûii cantitative, referitoare la st |rile sau evolu Ûiile unei mulÛimi de fenomene. Aceste date pot fi ob Ûinute fie pe cale
observa Ûional|, fie pe cale experimental|.
Din punct de vedere al analizei datelor, orice mulÛime de informa Ûii supus | studiului este privit| ca fiind o reprezentare
codificat|, într-o form | mai mult sau mai pu Ûin implicit |, a unor aspecte informa Ûionale referitoare la niveluri Õi varia Ûii ale unor
fenomene, evolu Ûii Õi tendin Ûe relevante, leg |turi Õi influen Ûe semnificative, ierarhii Õi configura Ûii structurale specifice.
Datele supuse unui proces de analiz | nu eviden Ûiaz |,în mod direct Õi explicit, prin ele însele, informa Ûia util | Õi semni-
ficativ |. De regul|, datele con Ûin informa Ûia util| Õi semnificativ | sub o form | mascat|, ascuns |, amestecat| într-un mod
nediferen Ûiat Õi f|r | o logic | aparent|, cu informa Ûia nesemnificativ |, rezultat| din influen Ûe accidentale Õi marginale. În acest
sens, se poate spune c | la nivelul datelor primare supuse analizei, informa Ûia semnificativ | se g |se Õte sub o form | diluat| Õi
disipat| într-o mulÛime informa Ûional| complex |, neordonat| Õi nestructurat| dup | vreun criteriu logic existent aprioric.
Rolul analizei datelor este acela de a prelucra Õi filtra informa Ûiile con Ûinute în datele supuse studiului, cu scopul de a capta
sau de a extrage esen Ûa informa Ûional| con Ûinut| în aceste date Õi de a eviden Ûia aceast| esen Û| informa Ûional| într-o form | de
reprezentare inteligibil|, sugestiv |, simplificat| Õi sintetizatoare. Atingerea acestui scop presupune realizarea unei succesiuni
de transform |ri efectuate asupra datelor primare Õi implic | utilizarea unor metode Õi tehnici specifice. Aceste transform |ri au
scopul de a maximiza relevan Ûa Õi interpretabilitatea datelor Õi presupun, printre altele, eliminarea informa Ûiilor redundante
sau lipsite de semnifica Ûie Õi generalitate, care au natur | accidental| sau marginal|. Din acest punct de vedere, procesul de
analiz | a datelor apare ca fiind un proces specific de transformare informa Ûional|, proces care are ca intr |ri datele primare, iar
ca ie Õiri informa Ûii sintetizatoare.
Având în vedere modul în care se efectueaz |, precum Õi natura instrumentelor pe care le folose Õte, analiza datelor este, prin
excelen Û|, o analiz | de tip multidimensional, reprezentând, în compara Ûie cu analiza simpl|, unidimensional|, o schimbare de
natur | calitativ |. Analiza statistic | descriptiv | permite reprezentarea unor colec Ûii foarte mari de date într-o manier | sugestiv |
Õi asimilabil|, simplificat| Õi schematizant |. Spre deosebire de aceasta, analiza multidimensional| constituie o generalizare
natural| a logicii Õi informa Ûiilor referitoare la mai multe variabile sau dimensiuni.
Activit|Ûile de manipulare a datelor Õi informa Ûiilor, de prelucrare Õi interpretare corect| Õi eficient | a acestora, presupun
existen Ûa unui cadru conceptual adecvat Õi utilizarea unor metode Õi instrumente specifice. Atât cadrul conceptual necesar, cât
Õi metodele Õi tehnicile utilizabile în prelucrarea, analiza Õi interpretarea datelor Õi informa Ûiilor, sunt subsumate de obiectul unei
discipline Õtiin Ûifice numit| analiza datelor.

1.2 Specificitatea domeniului economico-social Õi modalit|Ûi de abordare


De Õi metodele Õi tehnicile de analiz | a datelor sunt utilizate în majoritatea domeniilor activit|Ûii umane, putem afirma c |
analiza datelor are cea mai larg | utilizare în domeniul economico-social, iar eficien Ûa utiliz |rii ei în acest domeniu are o eficien Ûa
extrem de ridicat|. A Õa cum cum o s | ar|t|m în continuare, activitatea de cunoa Õtere Õtiin Ûific | din domeniul economico-social
este caracterizat| de anumite accente specifice, în compara Ûie cu alte domenii ale cunoa Õterii umane. În virtutea acestor elemente
de specificitate, domeniul economico-social pare a fi cel mai potrivit domeniu pentru utilizarea metodelor Õi tehnicilor de analiz |

1
multidimensional| a datelor.
Dintre toate elementele de specificitate a domeniului economico-social, dou | consider |m a fi mai importante Õi mai
relevante din punct de vedere al utiliz |rii analizei datelor: complexitatea ridicat| a fenomenelor economico-sociale Õi natura
cantitativ | a acestor fenomene. Împreun | cu multe alte caracteristici specifice, aceste dou | caracteristici fundamentale impun
modalit|Ûi specifice de abordare pentru cunoa Õterea Õtiin Ûific | din domeniul economico-social.
Necesitatea de a sintetiza Õi de a simplifica în procesul de cunoa Õtere a realit|Ûii, este impus | atât de faptul c | datele
utilizabile într-o analiz | mascheaz |, ascund, anumite aspecte, ci Õi de faptul c | realitatea analizat| este caracterizat| de o
complexitate foarte ridicat|, care nu poate fi cuprins | Õi în Ûeleas| numai pe baza intuiÛiei.
În activitatea de analiz | cantitativ |, pe care se bazeaz | în mod direct cunoa Õterea Õtiin Ûific | din cele mai multe domenii de
activitate, sunt implicate trei categorii esen Ûiale de elemente: teorii Õi principii teoretice generale Õi specifice domeniului
investigat, informa Ûii cantitative Õi calitative referitoare la fenomenele supuse studiului, metode Õi tehnici de cuantificare,
evaluare, estimare Õi testare a m |rimilor specifice Õi a rela Ûiilor existente la nivelul realit|Ûii investigate.
Teoriile Õi principiile teoretice care stau la baza oric |rei analize cantitative sunt reprezentate de mulÛimea cuno Õtiin Ûelor
Õtiin Ûifice acumulate în decursul timpului, de realiz |rile ob Ûinute pe plan Õtiin Ûific, atât la nivelul general al cunoa Õterii umane,
cât Õi la nivelul cunoa Õterii în domeniul abordat.
Inform a Ûiile cantitative Õi calitative referitoare la fenomenele Õi procesele studiate exprim | o mulÛime de st |ri Õi evolu Ûii
concrete din realitatea investigat| Õi sunt rezultatul unui laborios proces de observare, m |surare Õi evaluare, proces în care
intervin o serie de norme, principii, metodologii Õi instrumente specifice procesului de m |surare. Informa Ûiile ob Ûinute din
realitatea investigat|, în urma unor procese de observare Õi de m |surare, sunt cunoscute sub numele de date. Datele reprezint|
materialul brut, empiric, care st | la baza tuturor deciziilor din orice domeniu de activitate, iar de calitatea acestora depinde, în
mod direct, calitatea respectivelor decizii.
Metodele Õi tehnicile reprezint| un set de reguli, principii Õi proceduri de analiz|, prelucrare Õi interpretare a datelor.În
analiza datelor, metodele Õi tehnicile se refer | la cuantificare, evaluare, estimare Õi testare, Õi sunt reprezentate de o mulÛime
extins | Õi variat| de proceduri Õi instrumente statistico-matematice. Aceste proceduri sunt aplicate, sub o form | sau alta,
informa Ûiilor cantitative Õi calitative, datelor de intrare, în scopul deducerii anumitor rezultate Õi concluzii. De calitatea
metodelor Õi tehnicilor utilizate într-o activitate de analiz | Õi de eficien Ûa utiliz |rii lor depind, în mod direct Õi într-o propor Ûie
foarte mare, atât semnifica Ûia Õi validitatea concluziilor ob Ûinute, cât Õi calitatea rezultatelor ob Ûinute.
Combinarea, la nivelul analizei cantitative, a celor trei categorii de elemente men Ûionate anterior, conduce la ob Ûinerea unor
rezultate Õi concluzii, care contribuie la adâncirea procesului de cunoa Õtere a realit|Ûii studiate Õi care se pot concretiza sub mai
multe forme:
• ob Ûinerea de informa Ûii relevante suplimentare privind starea, evolu Ûia Õi conexiunile componentelor realit|Ûii investigate;
• relevarea unor noi principii Õi legit|Ûi care guverneaz | miÕcarea fenomenelor Õi proceselor din aceast | realitate;
• formularea unor concluzii cu privire la existen Ûa unor leg |turi Õi specificit|Ûi ce caracterizeaz | realitatea studiat|;
• validarea unor ipoteze formulate cu privire la popula Ûiile reprezentate de fenomenele Õi procesele studiate;
• identificarea unor tipologii Õi structuri specifice pe mulÛimea de fenomene Õi procese analizate;
• estimarea unor efecte Õi influen Ûe caracteristice interdependen Ûelor dintre fenomene Õi procese;
• deducerea unor modele statistico-matematice, care s| descrie comportamentul fenomenelor Õi proceselor;
• efectuarea de predic Ûii cu privire la evolu Ûia fenomenelor Õi proceselor;
• efectuarea de simul|ri privind evolu Ûia fenomenelor Õi a interdepende Ûelor manifestate între acestea.
Fenomenele economico-sociale Õi miÕcarea acestora în timp Õi spa Ûiu, adic | procesele, au o caracteristic | ce le face s | se
deosebeasc | în mod esen Ûial, fundamental, de fenomene Õi procese specifice altor domenii de activitate. Aceast | caracteristic |
este dat| de faptul c | manifestarea la nivel observabil a acestor fenomene Õi a miÕc |rii lor, este extrem de complex | Õi îmbrac |
o deosebit de mare varietate de forme, fiecare fenomen sau proces economico-social existând sub form | multiplicat| pe o scar|
foarte m are. Proprietatea de multiplicitate la o scar | foarte mare, pe care o au existen Ûa Õi manifestarea fenomenelor economice
Õi sociale, este cunoscut| în literatura domeniului sub numele de caracter de mas | al fenom enelor econom ico-sociale.
Formele sub care se manifest | fenomenele economice Õi sociale apar, de regul|, ca o amalgamare de aspecte esen Ûiale Õi
neesen Ûiale, legate direct sau indirect de con Ûinutul fenomenului, de ceea ce este esen Ûial Õi stabil în comportamentul acestuia,
fiind caracterizate în timp, cel pu Ûin la suprafa Û|, de un grad relativ ridicat de instabilitate. Partea consistent |, semnificativ | Õi
stabil| a unui fenomen economico-social este, de obicei, ascuns | de aceast | multitudine de manifest |ri, astfel încât cunoa Õterea
acesteia nu se poate face decât rareori prin observare direct|, fiind necesar, de cele mai multe ori, un demers logic extrem de
complex, în cadrul c |ruia se urm |re Õte eliminarea a ceea ce este accidental, conjunctural, neesen Ûial Õi nesemnificativ în
manifestarea fenomenului, re Ûinându-se ceea ce este trainic, cu caracter de regularitate, esen Ûial Õi semnificativ.
O alt| caracteristic | a fenomenelor economico-sociale este cea legat| de multitudinea Õi eterogenitatea acestor fenomene,
de dimensiunile la care are loc desf |Õurarea acestora, de numeroasele leg |turi func Ûionale existente între acestea Õi de multiplele
interdependen Ûe Õi condiÛion |ri dintre fenomenele economico-sociale Õi fenomenele specifice altor domenii. Gradul ridicat de
interconectare a elementelor Õi multitudinea factorilor de influen Û|, implica Ûi în manifestarea rela Ûiilor de cauzalitate, reprezint|
caracteristici definitorii pentru majoritatea fenomenelor Õi proceselor de natur | socio-economic |.
Amploarea complexit|Ûii din domeniul economico-social rezult| Õi din faptul c | natura Õi intensitatea rela Ûiilor de interde-
penden Û| cunosc o m are variabilitate în tim p Õi spa Ûiu, c | sensul rela Ûiilor de cauzalitate este reversibil, chiar contradictoriu,
Õi c |, din cauza gradului ridicat de interconectare, manifestarea cauzalit|Ûii are loc, în multe situa Ûii, sub forma unor "reac Ûii
în lan Û". Specificitatea domeniului economico-social Õi caracteristicile care îl fac s | se diferen Ûieze fundamental de celelalte
domenii de activitate, impun ca procesul de cunoa Õtere în acest domeniu, investigarea Õtiin Ûific | a fenomenelor Õi proceselor
de natur | economico-social| s | poarte o amprent| specific |, particular |.
Caracterul complex al manifest |rii fenomenelor economice Õi sociale face ca activitatea de cunoa Õtere în acest domeniu
s | fie puternic condiÛionat| atât de m odalitatea concret| de abordare a obiectului studiat, cât Õi de natura Õi puterea metodelor,
tehnicilor Õi instrumentelor de investigare utilizate.
Faptul c | fenomenele economice Õi sociale se caracterizeaz | printr-un grad de complexitate foarte ridicat face ca activitatea

2
de investigare a comportamentului acestora s | fie deosebit de dificil| Õi rezultatele acesteia s | aib | un grad ridicat de relativitate
din punct de vedere al semnifica Ûiei Õi exactit|Ûii. În aceste condiÛii, succesul investiga Ûiilor socio-economice, valabilitatea Õi
stabilitatea concluziilor rezultate din analizele efectuate, depind în mod direct de compatibilitatea dintre natura instrumentelor
de investigare folosite Õi specificul fenomenelor investigate.
Alegerea modalit|Ûilor de abordare Õi a celor mai potrivite metode Õi tehnici de analiz | sau predic Ûie reprezint| condiÛia
de baz | pentru ob Ûinerea unor rezultate satisf|c |toare în activitatea de cunoa Õtere a fenomenelor din domeniul economico-social.
În ceea ce prive Õte modalit|Ûile de abordare, cele mai des utilizate în analiza datelor sunt: abordarea sistemic |, abordarea
statistic | Õi abordarea bazat| pe modelarea matematic | Õi informatic |.

1.2.1 Abordarea sistemic|


O principal | modalitate de abordare, esen Ûial| pentru orice proces de investigare Õtiin Ûific |, impus | cu necesitate mai ales
în cazurile în care domeniul vizat este caracterizat de un grad ridicat de complexitate, este cea cunoscut| sub numele de
abordare sistem ic |.
Atât în sens teoretic, cât Õi în sens practic, abordarea sistemic | se deta Õeaz | ca metod | general|, universal | utilizat | în
investigarea Õtiin Ûific |, indiferent de domeniul concret al investig |rii Õtiin Ûifice. În cazul particular al analizei datelor, abordarea
sistemic | are o importan Û| special|, atât în faza de analiz | propriu-zis |, cât Õi în faza de interpretare sa rezultatelor.

1.2.2 Abordarea statistic|


Caracterul de mas | pe care îl au fenomenele economice Õi sociale determin | ca manifestarea acestora, în timp Õi spa Ûiu,
s | intre sub inciden Ûa unui principiu universal de regularitate Õi stabilitate, specific fenomenelor cu frecven Û| foarte mare de
existen Û| Õi apariÛie, principiu sintetizat sub forma uneia din cele mai importante legi din domeniul cunoa Õterii umane: legea
num erelor mari.
Regularitatea Õi stabilitatea comportamentului fenomenelor economice Õi sociale sunt asigurate, în virtutea acestui
principiu, de tendin Ûa de com pensare a influen Ûelor cu sensuri contrarii, pozitive Õi negative, exercitate de factorii neesen Ûiali,
nesemnificativi Õi accidentali implica Ûi în determinarea rela Ûiilor de cauzalitate dintre fenomenele socio-economice.
O consecin Û| direct| Õi imediat| a acestui principiu const | în faptul c | investigarea comportamentului fenomenelor econo-
mice Õi sociale Õi formularea de concluzii sintetizatoare cu privire la amploarea sau sensul evolu Ûiei acestor fenomene sunt cu
mult mai u Õor de realizat Õi caracterizate de un grad mult mai ridicat de semnifica Ûie Õi exactitate în cazul în care sunt supuse
studiului colectivit |Ûi mari de fenomene comparativ cu situa Ûia în care studiul vizeaz | fenomene individuale, izolate.
Necesitatea de a fructifica în procesul cunoa Õterii fenomenelor Õi proceselor economice sau sociale facilit|Ûile ce rezult|
din faptul c | acestea au caracter de mas |, impune ca în întreaga activitate de analiz | a datelor din domeniul economico-social
s | prevaleze m odalitatea de abordare statistic | Õi folosirea metodelor Õi tehnicilor oferite de teoria probabilit|Ûilor Õi statistica
m atem atic |.
Modalitatea de abordare statistic | este impus | ca modalitate de investigare a fenomenelor de natur | socio-economic | Õi
de faptul c | manifestarea acestora este caracterizat| de un grad ridicat de incertitudine Õi im previzibilitate.
Elementele vizate în mod direct în cadrul investiga Ûiilor Õtiin Ûifice bazate pe utilizarea metodelor Õi tehnicilor proprii
analizei datelor, sunt reprezentate de fenomenele cu natur | stohastic |, adic | de fenomenele al c |ror comportament are caracter
aleatoriu, dar care manifest | o anumit| regularitate mai mult sau mai pu Ûin evident |.
DefiniÛie: Fenom enul stohastic este acel fenomen observabil, ale c |rui manifest |ri particulare sunt incerte, dar care
eviden Ûiaz | o anumit| regularitate a formelor de manifestare, o anumit| leg |tur | între aceste forme de manifestare.
Necesitatea utiliz |rii în procesul de investigare a fenomenelor economice Õi sociale a modalit|Ûii de abordare statistic | este
determinat| Õi de caracterul de relativitate, par Ûialitate Õi inexactitate al inform a Ûiei din acest domeniu.
Imposibilitatea de a ob Ûine informa Ûii cu caracter exhaustiv despre desf |Õurarea fenomenelor economice Õi sociale impune
ca activitatea de cunoa Õtere a ansamblului acestei desf|Õur |ri s| se bazeze pe informa Ûii cu caracter par Ûial, ob Ûinute pe baz |
de sondaj. Extinderea concluziilor rezultate din analiza informa Ûiilor ob Ûinute prin sondaj la nivelul întregului ansamblu de
fenomene investigate de sondaj se bazeaz | pe metodele Õi tehnicile inferen Ûei statistice.
Una din cerin Ûele de baz | impuse de modalitatea de abordare statistic | oric |rui demers Õtiin Ûific ce are ca obiect
investigarea comportamentului unor fenomene Õi procese economice sau sociale poate fi exprimat | prin necesitatea de a studia
variabilele ce descriu acest comportament, în interdependen Ûa Õi sim ultaneitatea lor.
Analiza izolat| a comportamentului fiec |rei variabile este incompatibil| cu modalitatea de abordare sistemic | Õi duce la
o pierdere important | de informa Ûie semnificativ | în cazul în care variabilele sunt interdependente. Mai mult decât atât,
concluziile par Ûiale desprinse în urma unei astfel de analize nu pot fi generalizate Õi nu au valabilitate la nivelul compor-
tamentului "legat" al variabilelor, influen Ûa interac Ûiunii dintre acestea fiind, de cele mai multe ori, covâr Õitoare.
De regul|, analiza comportamentului individual al unui fenomen, în sensul s|u unidimensional, face obiectul analizei
statistice descriptive. Analiza statistic | descriptiv | permite reprezentarea unor colec Ûii foarte mari de date într-o manier |
sugestiv | Õi asimilabil|, simplificat| Õi schematizant |.
Considerând o mulÛime de variabile aleatoare ce descriu un anumit fenomen economic sau social, vom ob Ûine rezultate total
diferite dac | vom studia, de exemplu, repartiÛia fiec |reia dintre ele izolat, separat de celelalte, comparativ cu situa Ûia în care
în studiu ar fi vizat| reparti Ûia comun |, legat| a acestor variabile. Studiul comportamentului simultan, interdependent, al unei
mulÛimi de variabile presupune metode Õi tehnici de complexitate Õi rafinament mult mai ridicate decât studiul comportamentului
izolat al acestora Õi face obiectul unei discipline aparte, Õi anume analiza statistic | multidim ensional| sau m ultivariat|.

1.2.3 Abordarea bazat| pe modelarea matematic| Õi informatic|


A Õa cum am ar |tat anterior, complexitatea ridicat| ce caracterizeaz | domeniul economico-social Õi celelalte elemente de
specificitate ale fenomenelor apar Ûinând acestuia, determin | ca orice demers Õtiin Ûific întreprins în scopul adâncirii cunoa Õterii

3
în acest domeniu s | presupun |, cu necesitate, utilizarea unor metode Õi tehnici de lucru corespunz |toare.
Din rândul instrumentelor de investigare Õtiin Ûific |, a c |ror utilitate în contracararea dificult|Ûilor ridicate de gradul sporit
de complexitate al domeniului studiat este de neînlocuit Õi a c |ror utilizare înso Ûe Õte ast|zi demersul Õtiin Ûific din aproape oricare
domeniu al cunoa Õterii umane, se deta Õeaz | m odelarea matem atic | Õi tehnica de calcul.
Ca unul dintre cele mai utile Õi eficiente instrumente de cunoa Õtere a realit|Ûii, m odelarea matem atic | reprezint| procesul
de descriere a comportamentului unor fenomene din natur | Õi societate sub o form | sintetic |, logic | Õi formalizat| matematic.
Descrierea sub o form | matematic | a comportamentului fenomenelor Õi proceselor din cele mai diverse domenii de activitate
a devenit ast |zi dorin Ûa Õi, de cele mai multe ori, scopul oric |rui cercet|tor, indiferent de domeniul în care acesta activeaz |.
Surprinderea interdependen Ûelor, a legit|Ûilor Õi func Ûionalit|Ûilor ce caracterizeaz | fenomenele sau procesele din lumea
ce ne înconjoar |, sub forma sintetic | a unui model matematic, este, probabil, cea mai relevant | m |sur | a nivelului la care a ajuns
gradul de cunoa Õtere uman |.
Din punct de vedere informa Ûional, modelul matematic, în forma sa final|, poate fi privit ca un "concentrat informa Ûional",
având atât calitatea de acumulator al informa Ûiei receptate din segmentul de realitate economic | sau social| pe care îl descrie,
cât Õi de generator de informa Ûie nou |, inexistent | în momentul construirii lui.

1.3 M|surarea Õi cuantificarea în domeniul economico-social


Posibilitatea efectu |rii analizelor sau predic Ûiilor din domeniul economico-social este strict condiÛionat| de existen Ûa unei
baze informa Ûionale care s| cuprind | informa Ûiile necesare cu privire la nivelul, structura sau evolu Ûia în timp a fenomenelor
Õi proceselor supuse investig |rii, sau cu privire la condiÛion |rile cauzale ale acestor fenomene Õi procese.
Ob Ûinerea informa Ûiilor necesare pentru activitatea de analiz | a datelor este, de regul|, rezultatul unor procese de observare
Õi m |surare a fenomenelor Õi proceselor supuse studiului Õi presupune existen Ûa unor instrumente adecvate.
Informa Ûiile referitoare la un anumit fenomen supus studiului, informa Ûii necesare analizei comportamentului respectivului
fenomen, reprezint| rezultatul unui proces de m |surare. Acest proces reprezint|, de fapt, o ac Ûiune de atribuire de valori
numerice pentru caracteristicile respectivului fenomen.
DefiniÛie: Prin proces de m |surare se în Ûelege totalitatea activit|Ûilor de atribuire a unor valori numerice pentru
caracteristicile fenomenului analizat.
În cea mai mare parte a lor, informa Ûiile necesare efectu |rii analizelor sau predic Ûiilor din domeniul economico-social
trebuie s | aib | natur | cantitativ |, s | reprezinte exprim area sub form | num eric | a caracteristicilor specifice fenomenelor
analizate. Aceast | condiÛie presupune, în mod implicit, necesitatea existen Ûei unor unit|Ûi de m |sur |, prin intermediul c |rora
diferitele caracteristici ale fenomenelor economice sau sociale s | poat | fi exprimate, a unor instrum ente adecvate pentru
m |surarea caracteristicilor fenomenelor Õi a unor m odalit|Ûi de exprim are numeric |.
Din nefericire îns |, atât unit|Ûile de m |sur |, cât Õi instrumentele utilizate pentru exprimarea sub o form | cantitativ | a
caracteristicilor fenomenelor economice Õi sociale, sunt caracterizate de inexactitate Õi instabilitate, iar utilizarea acestora este
generatoarea unei multitudini de erori cu natur | extrem de variat|.
Exprimarea sub o form | numeric | a caracteristicilor fenomenelor Õi proceselor economice sau sociale presupune un proces
de observare a formelor individuale prin intermediul c |rora se manifest | acestea Õi de înregistrare a valorilor pe care le iau
aceste caracteristici în momentul observ |rii.
Odat| cu activitatea de înregistrare a m |rimilor caracteristicilor fenomenelor Õi proceselor economico-sociale, adic | a
valorilor luate de variabilele supuse studiului, are loc Õi un proces implicit de m |surare, de cuantificare, proces ce presupune
folosirea unor unit|Ûi de m |sur | specifice Õi instrumente de lucru adecvate. De regul|, informa Ûia rezultat| în urma acestui proces
este o informa Ûie brut|, primar |, care este cunoscut| sub numele de dat|.
Cele mai dificile probleme cu care este confruntat| investigarea fenomenelor economice sau sociale, de-a lungul întregului
Õir de procese de culegere, prelucrare Õi interpretare a informa Ûiilor referitoare la aceste fenomene, apar tocmai în cadrul
procesului de observare Õi înregistrare, de m |surare Õi cuantificare a caracteristicilor fenomenelor. În general, putem spune c |
m |surarea Õi cuantificarea din domeniul socio-economic au ca obiective principale:
• stabilirea nivelului sau volumului fenomenelor economice Õi sociale;
• eviden Ûierea alc |tuirii lor structurale;
• caracterizarea evolu Ûiei lor în timp sau spa Ûiu;
• exprimarea leg |turilor acestora cu alte fenomene sau procese.
Din punct de vedere conceptual, toate aspectele fenomenelor sau proceselor care fac obiectul m |sur |rii Õi cuantific |rii sunt
reunite sub termenul generic de caracteristici ale acestor fenomene sau procese.
În activitatea de m |surare Õi cuantificare din domeniul economico-social apar o serie de dificult|Ûi, determinate de
specificitatea acestui domeniu, cum ar fi: problema unit|Ûilor de m |sur |, par Ûialitatea informa Ûiilor, problema erorilor, problema
imposibilit|Ûii m |sur |rii directe etc.
1.3.1 Unit|Ûile de m|sur|
O problem | dificil| Õi complex | care apare în mod frecvent în procesul de m |surare din domeniul economico-social, este
cea dat| de faptul c | unit|Ûile de m |sur | utilizate pentru exprimarea sub form | numeric | a caracteristicilor unui anumit fenomen
nu sunt stabile. Cu o problem | de acest fel este confruntat|, în special, activitatea de m |surare Õi cuantificare din domeniul
economic.
Spre deosebire de cele mai multe domenii ale Õtiin Ûei, în domeniul economic, unit|Ûile de m |sur | cunosc modific |ri sub-
stan Ûiale în timp, modific |ri ce confer | rezultatelor m |sur |torilor un puternic caracter de instabilitate. De cele mai multe ori,
varia Ûia unit|Ûilor de m |sur | este indus | chiar de modific |ri, de un anumit tip, ale fenomenelor Õi proceselor studiate, ale
fenomenelor cu care acestea sunt, direct sau indirect, legate sau chiar a unor fenomene independente de fenomenele studiate.

4
1.3.2 ParÛialitatea informaÛiilor
O alt| problem | ce ridic | o serie de dificult|Ûi în m |surarea Õi cuantificarea din domeniul economico-social, este cea legat|
de par Ûialitatea informa Ûiilor disponibile pentru activit|Ûile de analiz | a datelor.
Complexitatea fenomenelor economice Õi sociale, multitudinea a formelor de manifestare în timp Õi spa Ûiu a acestora, fac
ca ob Ûinerea de informa Ûii printr-o observare complet| a desf |Õur |rii acestor fenomene s | fie de cele mai multe ori imposibil|.
În aceste condiÛii, modalitatea cea mai comod |, dar Õi cea mai eficient |, de ob Ûinere a informa Ûiilor necesare efectu |rii analizelor
sau realiz |rii predic Ûiilor este cea a observ |rii selective a manifest |rii fenomenelor.
Aceast | modalitate de investigare se bazeaz | pe faptul c |, în anumite condiÛii, cunoa Õterea caracteristicilor întregii popula Ûii
poate fi ob Ûinut| prin studierea direct| numai a unui anumit num |r de unit|Ûi ce intr | în componen Ûa acesteia, num |r care este
mult mai redus în compara Ûie cu volumul total al popula Ûiei. Alegerea unit|Ûilor ce vor fi efectiv supuse procesului de m |surare
Õi înregistrare se face dup | criterii Õi reguli foarte precise, fundamentate riguros din punct de vedere statistico-matematic.
Valorile pe care le iau caracteristicile unit|Ûilor studiate prin intermediul acestui procedeu alc |tuiesc a Õa-numitul e Õantion de
observa Ûii.
Investigarea fenomenelor Õi proceselor economice sau sociale pe baza informa Ûiilor provenite din observ |ri selective Õi
concluziile rezultate în urma acestei investig |ri sunt puternic influen Ûate de gradul în care informa Ûiile ce alc |tuiesc e Õantionul
sunt reprezentative la nivelul întregii popula Ûii de la care au fost ob Ûinute. De regul|, gradul de reprezentativitate al unui e Õantion
este invers propor Ûional cu gradul de eterogenitate a popula Ûiei Õi direct propor Ûional cu num |rul de unit|Ûi incluse în e Õantion.
În condiÛiile în care informa Ûiile ob Ûinute de la unit|Ûile selectate în e Õantion nu reproduc într-o m |sur | acceptabil| compor-
tamentul fenomenului la nivelul întregii popula Ûii, rezultatele analizelor efectuate vor fi incorecte, iar concluziile formulate pe
baza acestora vor fi eronate. De aceea, în toate cazurile în care baza informa Ûional| utilizat| în procesele de analiz | a datelor
este ob Ûinut| pe calea observ |rii selective, este necesar | o laborioas | activitate de verificare a semnifica Ûiei rezultatelor Õi de
validare a concluziilor desprinse pe baza acestor rezultate.
Implica Ûiile negative ale caracterului de par Ûialitate a informa Ûiilor din domeniul economico-social asupra valabilit|Ûii
concluziilor formulate în urma prelucr |rii acestor informa Ûii, pot fi mult diminuate, dac | organizarea cercet|rii selective este
f|cut | Ûinând cont de o serie de principii de baz | ale teoriei selec Ûiei, dac | în procesul de prelucrare a informa Ûiilor sunt utilizate
metodele Õi tehnicile statistico-matematice cele mai potrivite Õi dac | în extinderea rezultatelor nu sunt înc |lcate o serie de
principii statistice elementare.
Respectarea cu stricte Ûe a cerin Ûelor de acest tip poate conduce la ob Ûinerea unor rezultate cu adev |rat excep Ûionale, chiar
atunci când cantitatea de informa Ûie disponibil| este neglijabil| în raport cu dimensiunea Õi propor Ûiile fenomenului studiat.

1.3.3 Erorile
Impactul numeroaselor imperfec Ûiuni legate de m |surarea Õi cuantificarea din domeniul economico-social este concretizat,
din punct de vedere al proceselor de analiz | a datelor, în manifestarea unor distorsiuni Õi inexactit|Ûi informa Ûionale.
În mai toate cazurile, informa Ûiile disponibile pentru efectuarea unor analize sau prognoze sunt afectate de erori. Faptul
c | informa Ûiile disponibile sunt puternic afectate de erori, ale c |ror surse sunt numeroase, variate Õi dificil de controlat, impune
utilizarea unor modalit|Ûi specifice de abordare Õi a unor instrumente de lucru corespunz |toare.
Erorile ce înso Ûesc observa Ûiile rezultate din m |surarea Õi cuantificarea fenomenelor Õi proceselor economice sau sociale
pot fi grupate în dou | mari categorii: erori cu caracter sistematic Õi erori cu caracter accidental, aleator.
Erorile cu caracter sistematic
Sunt erorile care afecteaz | în mod substan Ûial, semnificativ, natura Õi semnifica Ûia informa Ûiilor Õi care pot determina
denaturarea drastic | a rezultatelor ob Ûinute Õi formularea unor concluzii fundamental eronate.
Sursele erorilor cu caracter sistematic sunt numeroase Õi extrem de variate: gradul redus de reprezentativitate a
informa Ûiilor ob Ûinute pe baz | de e Õantionare, imperfec Ûiunile metodologice specifice calculului unor indicatori economici,
raport|rile incorecte determinate de interesele de natur | fiscal| ale agen Ûilor economici, falsific |rile informa Ûionale la nivel
guvernamental etc.
DefiniÛie: Eroarea cu caracter sistematic poate fi definit| ca reprezentând diferen Ûa dintre valoarea adev |rat| a unei
m |rimi la nivel de popula Ûie Õi valoarea ob Ûinut| pentru aceast| m |rime în urma m |sur |rii tuturor unit|Ûilor elementare
ale popula Ûiei.
Problema cea mai dificil | legat | de impactul negativ al erorilor cu caracter sistematic este aceea c |, spre deosebire de
erorile cu caracter întâmpl|tor, în cazul acestor erori nu se manifest | tendin Ûa de compensare, astfel încât distorsionarea
informa Ûiei determinat| de aceste erori are loc numai într-un sens.
În cazul erorilor de natur | sistematic |, influen Ûa negativ | a acestora nu mai poate fi estompat | de caracterul de mas | al
fenomenelor economico-sociale, care în cazul altor tipuri de erori poate conduce la compensarea efectelor erorilor.
Erorile cu caracter accidental
Sunt erorile a c |ror influen Û| asupra semnifica Ûiei informa Ûiilor este neglijabil|; distorsiunile provocate de acest tip de erori
la nivelul datelor ce descriu comportamentul fenomenelor economice sau sociale sunt, de regul|, de sens opus, astfel încât în
numeroase situa Ûii are loc o compensare a influen Ûelor acestora.
DefiniÛie: Eroarea cu caracter accidental, aleator poate fi definit| ca reprezentând diferen Ûa dintre valoarea unei
m |rimi calculate pe baza unit|Ûilor apar Ûinând unui e Õantion Õi valoarea aceleia Õi m |rimi calculat| pe baza tuturor
unit|Ûilor popula Ûiei.
Faptul c | erorile de acest tip sunt distribuite dup | legea de probabilitate normal| ofer | posibilitatea abord |rii statistice a
influen Ûelor cu caracter distorsionant pe care le pot avea acestea asupra datelor.
Pe de alt| parte, în virtutea legii numerelor mari, are loc un efect de compensare a erorilor de tip accidental, impactul
negativ al acestora asupra calit|Ûii informa Ûiilor utilizate în analiz | devenind neglijabil.

5
În principal, sursele erorilor cu caracter accidental, întâmpl|tor, Ûin de o serie de factori cum ar fi: imperfec Ûiunile instru-
mentelor de m |surare, deficien Ûe în înregistrarea valorilor caracteristicilor urm |rite, efectuarea inexact | a unor calcule etc.
O însemn |tate cu adev |rat excep Ûional| pentru procesele de m |surare Õi cuantificare în care intervin erori cu caracter
întâmpl|tor, o are faptul c | erorile de acest tip sunt distribuite dup | legea normal|, de medie nul|.
Aceast | proprietate este deosebit de util| atât pentru m |surarea impactului pe care erorile îl au asupra informa Ûiilor ob Ûinute
în urma proceselor de m |surare, de cuantificare Õi de analiz | a datelor, cât Õi pentru dezvoltarea unor proceduri specifice care
au ca scop minimizarea influen Ûei erorilor asupra rezultatelor ob Ûinute în analiza datelor.
Formarea valorii unei m |sur |tori individuale, sub influenÛa erorilor sistematice Õi accidentale, poate fi descris | cu ajutorul
rela Ûiei urm |toare:

Efectuarea analizelor de date în condiÛiile existen Ûei Õi manifest |rii erorilor de tip accidental, determin | necesitatea utiliz |rii
unor metode Õi tehnici adecvate, de natur | statistico-matematic |.

1.3.4 M|surarea indirect|


În numeroase situa Ûii din investigarea Õtiin Ûific |, este imposibil| m |surarea direct| a unor fenomene sau procese specifice
domeniului economico-social. Situa Ûiile de acest fel sunt întâlnite în cazul existen Ûei factorilor laten Ûi sau ascun Õi, care au
caracter neobservabil Õi care, în mod implicit, nu pot fi supu Õi unui proces direct de m |surare.
Factorii laten Ûi sunt expresia manifest |rii unor fenomene de maxim | generalitate, cu semnifica Ûie Õi consisten Û| foarte
importante, caracterizate printr-o mare stabilitate a manifest |rilor lor. Ei reprezint | agreg |ri ale manifest |rilor unei multitudini
complexe de fenomene cu natur | particular |. Datorit | semnifica Ûiei Õi importan Ûei prin care factorii laten Ûi se deta Õeaz | de
fenomenele care reprezint| forme particulare de manifestare ale acestora, în numeroase investiga Ûii Õtiin Ûifice scopurile urm |rite
sunt direct Õi strâns legate într-o m |sur | mult mai mare de existen Ûa factorilor laten Ûi, în compara Ûie cu manifest |rile particulare
ale acestora. De Õi au caracter neobservabil, factorii laten Ûi se manifest | totdeauna în mod indirect, prin intermediul unor forme
particulare de manifestare, forme care pot avea caracter observabil Õi care pot fi supuse unui proces de m |surare.
În analiza datelor, se consider | c | formele particulare prin care se manifest | factorii laten Ûi reprezint| indicatori ai factorilor
laten Ûi. În acest fel, informa Ûiile disponibile cu privire la ace Õti indicatori pot fi folosite pentru a deduce informa Ûii cantitative
Õi calitative despre factorii laten Ûi.
Problema m |sur |rii indirecte, prin intermediul unor indicatori specifici, a factorilor cu natur | latent |, apare în mod frecvent
în cazul investig |rii unor caracteristici psihosociale, în cercet|rile legate de cuantificarea nivelului de dezvoltare economic |,
nivelului de dezvoltare social| sau nivelului progresului tehnic, în construirea unor indicatori agrega Ûi etc. În aceste cazuri, se
apeleaz | la proceduri speciale de estimare, la metode Õi tehnici de m |surare indirect| sau la metode de analiz| multi-
dimensional|, cum ar fi: analiza componentelor principale, analiza factorial| sau analiza coresponden Ûelor.

1.4. Definirea analizei datelor


Analiza datelor are ca obiectiv fundamental extragerea informa Ûiei relevante, semnificative, care este con Ûinut| în date,
în informa Ûia primar |. Aceast | informa Ûie este utilizat|, în continuare, pentru rezolvarea unor probleme specifice ale analizei
datelor: testare, estimare, interpretare, predic Ûii etc.
Conceptul de analiz | a datelor este un concept extrem de cuprinz |tor Õi dificil de definit din punct de vedere al sferei de
cuprindere, iar metodele Õi tehnicile utilizate în analiza datelor variaz | de la cele mai simple modalit|Ûi de prezentare grafic |
a datelor Õi calcul al unor indicatori statistici specifici, pân | la cele mai sofisticate metode de analiz | multidimensional|.
DefiniÛie: Activitatea de analiz| a datelor poate fi definit| ca reprezentând o succesiune de opera Ûii de prelucrare Õi
interpretare, opera Ûii efectuate asupra unor informa Ûii primare referitoare la fenomene Õi procese din realitatea econo-
mico-social| Õi bazate pe o mare varietate de metode Õi tehnici specifice, în scopul adâncirii cunoa Õterii comportamentului
acestor fenomene Õi procese Õi al formul|rii unor concluzii cu privire la specificitatea manifest |rii lor.
În figura urm |toare, este eviden Ûiat| o reprezentare simplificat| a procesului general de analiz | cantitativ |, a modului în
care intervin cele trei elemente men Ûionate anterior Õi a principalelor faze ale acestui proces.

Figura 1.1: Reprezentarea simplificat| a unui proces general de analiz | cantitativ |

6
Privit într-un mod foarte general, procesul de analiz | a datelor poate fi prezentat ca o succesiune de opera Ûii sintetizate sub
forma urm |toarelor activit|Ûi:
• form ularea ipotezelor cu privire la comportamentul fenomenului ce constituie obiectul studiului;
• organizarea experim entelor necesare m |sur|rii caracteristicilor fenomenului studiat;
• culegerea datelor privind comportamentul fenomenului ;
• analiza Õi interpretarea datelor disponibile;
• form ularea concluziilor, efectuarea predic Ûiilor Õi luarea deciziilor.
Scopul urm |rit în cele mai multe probleme de analiz | a datelor este legat de crearea condiÛiilor informa Ûionale necesare
pentru efectuarea de predic Ûii cu privire la comportamentul fenomenelor investigate.
De Õi între activitatea de analiz | a datelor Õi activitatea de predic Ûie exist| numeroase deosebiri, legate în primul rând de
natura celor dou | activit|Ûi, totu Õi, între cele dou | genuri de activit|Ûi exist| o important | suprapunere. Aceast | suprapunere
este determinat| de existen Ûa unor modalit|Ûi comune de abordare, de utilizarea unor concepte teoretice identice Õi de folosirea
aceleia Õi game de instrumente de lucru.
Cu toate c | obiectivele intermediare urm |rite în activitatea de predic Ûie sunt similare celor urm |rite în analiza datelor,
totu Õi, scopul final al oric |rei activit|Ûi de predic Ûie este legat în mod direct de prefigurarea evolu Ûiei viitoare a fenomenelor Õi
proceselor economice sau sociale, a modific |rilor structurale ce pot fi înregistrate în viitor de aceste fenomene Õi procese.
Atingerea acestui scop este îns | condiÛionat| de desf |Õurarea unei laborioase activit|Ûi de analiz | a datelor cu privire la
realitatea fenomenului care face obiectul predic Ûiei, activitate care, de regul|, precede procesul de predic Ûie propriu-zis.
Con Ûinutul activit|Ûii de analiz | a datelor din domeniul economico-social este strâns legat de natura claselor de probleme
supuse rezolv |rii. În func Ûie de aceast | natur |, analiza datelor poate presupune o anumit| succedare de activit|Ûi specifice,
utilizarea unei anumite game de metode Õi tehnici de lucru, urm |rirea anumitor obiective.
În rândul categoriilor de probleme a c |ror rezolvare conduce la efectuarea unui proces de analiz | a datelor men Ûion |m:
• identificarea legit|Ûilor ce guverneaz | miÕcarea fenomenelor Õi proceselor economice sau sociale, a principalelor
tendin Ûe Õi regularit |Ûi specifice evolu Ûiei acestora;
• identificarea principalilor factori sub a c |ror influen Û| se formeaz | comportamentul unor fenomene Õi procese;
• stabilirea sensului Õi intensit|Ûii leg |turilor cauzale manifestate între diferite fenomene Õi procese;
• determinarea gradului în care o mulÛime de factori de influen Û| contribuie la formarea unui anumit efect;
• verificarea unor ipoteze cu privire la existen Ûa unor leg |turi de tip cauzal, la posibilitatea ca anumite caracteristici
ale unor fenomene s | înregistreze anumite valori specifice etc;
• ierarhizarea factorilor ce determin | un anumit efect în func Ûie de importan Ûa Õi semnifica Ûia influen Ûei acestora;
• stabilirea modului în care comportamentul fenomenelor este afectat de anumite decizii sau m |suri de politic |
economic | Õi social|;
• identificarea principalelor posibilit |Ûi prin intermediul c |rora comportamentul fenomenelor s| poat | fi influen Ûat într-
un sens dorit;
• determinarea sensurilor în care comportamentul unui anumit fenomen poate evolua, a st|rilor posibile în care acesta
se poate afla în spa Ûiu Õi timp sau efectuarea de predic Ûii privind st|rile Õi evolu Ûia acestui fenomen.
În func Ûie de specificul fiec |reia din aceste clase de probleme, activitatea de analiz | a datelor se poate concretiza printr-un
anumit gen de opera Ûii de modelare statistico-matematic | Õi prelucrare informa Ûional| vizând:
• simplificarea Õi sintetizarea rela Ûiilor de cauzalitate;
• m |surarea interdependen Ûelor, cuantificarea influen Ûelor Õi verificarea semnifica Ûiei acestora;
• descrierea statistico-matematic | a comportamentului fenomenelor;
• efectuarea de predic Ûii;
• m |surarea gradului de omogenitate sau eterogenitate pentru anumite categorii de fenomene;
• clasificarea Õi ierarhizarea fenomenelor.
Fiecare din aceste tipuri de opera Ûii presupune utilizarea unor instrumente de lucru corespunz |toare, eficiente în raport cu
specificul problemei considerate. Dintre principalele metode Õi tehnici proprii analizei multidimensionale a datelor Õi utilizate
pentru rezolvarea problemelor enumerate anterior men Ûion |m: analiza componentelor principale, analiza factorial|, analiza
coresponden Ûelor, tehnicile de scalare multidimensional|, metodele Õi tehnicile de estimare, analiza corela Ûiilor canonice,
analiza varian Ûei, analiza regresiei liniare Õi neliniare, metodele Õi tehnicile de recunoa Õtere a formelor.

1.5 Clasificarea metodelor de analiz| a datelor


În general, în analiza de date, obiectul studiului este reprezentat de c |tre o mulÛime de date structurat| sub forma unui
anumit num |r de variabile Õi a unui anumit num |r de observa Ûii. Aceast | structur | informa Ûional| este reprezentat| prin
intermediul unei entit|Ûi cunoscute sub numele de matrice de observa Ûii.
În func Ûie de natura variabilelor analizate Õi de informa Ûiile existente aprioric cu privire la natura leg |turilor cauz |-efect
în care sunt implicate variabilele, metodele de analiz | a datelor pot fi grupate în dou | mari categorii: metode de analiz| a
dependen Ûei Õi metode de analiz| a interdependen Ûei.
Metodele de analiz| a dependen Ûei sunt metode statistice utilizate în cazul în care variabilele considerate în cadrul unei
analize pot fi grupate în dou | submulÛimi Õi au ca scop testarea prezen Ûei sau absen Ûei unor interdependen Ûe între cele dou |
submulÛimi de variabile.
În situa Ûia în care exist| informa Ûiile necesare, astfel încât, variabilelor dintr-un set li se poate atribui semnifica Ûia de
variabile dependente, iar variabilelor din cel|lalt set li se poate atribui semnifica Ûia de variabile independente, metodele de
analiz | a dependen Ûei au ca scop de a determina dac | Õi cum variabilele independente influen Ûeaz| variabilele dependente, atât
în manier | individual|, cât Õi în manier | comun |, simultan |.
De regul|, dându-se o mulÛime de date reprezentate de observa Ûiile efectuate asupra unor variabile, cu ajutorul metodelor
statistice se poate verifica doar dac | exist| leg |turi, interdependen Ûe între variabile, putându-se, eventual, determina sensul

7
leg |turilor (directe sau inverse) sau chiar m |sura intensitatea acestor leg |turi. Ceea ce nu se poate stabili cu ajutorul metodelor
Õi tehnicilor statistice este natura, sensul rela Ûiilor de cauzalitate, respectiv, care sunt variabilele dependente Õi care sunt
variabilele independente ce determin | evolu Ûia, miÕcarea celor dependente. Pentru a stabili cu exactitate rela Ûia cauz|-efect este
nevoie de informa Ûii suplimentare, apriorice, exogene în raport cu metodele Õi tehnicile statistice utilizate.
Exist| un anumit context al analizei datelor, în cadrul c |ruia delimitarea variabilelor dependente de variabilele independente
este foarte clar |, neechivoc |. Acest context este întâlnit în cadrul experimentelor controlate, când, în urma stabilirii unor
combina Ûii de nivele ale variabilelor independente, sunt m |surate nivelele înregistrate pentru variabilele dependente, ca urmare
a influen Ûei exercitate de fiecare combina Ûie de nivele ale variabilelor dependente.
În multe situa Ûii, analiza datelor este efectuat| pe mulÛimi de variabile pentru care nu exist| nici interesul Õi nici posibilitatea
conceptual| de a separa din mulÛimea variabilelor analizate o submulÛime care s | reprezinte variabilele dependente Õi o alt|
submulÛime care s | reprezinte variabile independente. În aceste situa Ûii, sunt utilizate metode de analiz | specifice, cunoscute
sub numele de metode de analiz| a interdependen Ûei.
Metodele de analiz| a interdependen Ûei sunt metodele statistice utilizate în cazul în care nu exist| posibilitatea de a
identifica în mulÛimea variabilelor analizate variabile dependente Õi variabile independente Õi care au scopul de a stabili din ce
cauz| Õi în ce m |sur | variabilele analizate sunt legate între ele. Utilizarea acestor metode are o mare varietate de scopuri, dintre
care, printre cele mai importante, amintim: m |surarea gradului de interdependen Û|, identificarea variabilelor cu semnifica Ûie
relevant|, identificarea unor categorii sau clase de variabile.

1.5.1 Metode de analiz| a dependenÛei


Metodele de analiz | a dependen Ûei pot fi clasificate în func Ûie de mai multe criterii, dintre care cele mai importante sunt
urm |toarele:
• num |rul de variabile dependente: o singur | variabil| dependent| sau mai multe variabile dependente;
• num |rul de variabile independente: o singur | variabil| independent| sau mai multe variabile independente;
• tipul scalei pe care sunt m |surate variabilele dependente: scal| non-metric | sau scal| metric |;
• tipul scalei pe care sunt m |surate variabilele independente: scal| non-metric | sau scal| metric |;
Metodele de analiz | a dependen Ûei pot fi clasificate în func Ûie de num |rul de variabile dependente Õi de num |rul de
variabile independente în dou | grupe:
• metode unidimensionale de analiz| a dependen Ûei;
• metode multidimensionale de analiz| a dependen Ûei.
În categoria metodelor unidimensionale se încadreaz | analiza regresiei simple, analiza discriminantului, procedurile unidi-
mensionale de verificare a unor ipoteze etc.
Metodele de analiz | multidimensional| a dependen Ûei se împart, în func Ûie de num |rul variabilelor dependente, în dou |
categorii:
• metode de analiz| multidimensional| cu o singur | variabil| dependent|;
• metode de analiz| multidimensional| cu mai multe variabile dependente.
În rândul metodelor de analiz | multidimensional| cu o singur | variabil| dependent | pot fi men Ûionate: analiza regresiei
multiple, analiza discriminantului, analiza varian Ûei etc.
Ca metode de analiz | multidimensional| cu mai multe variabile dependente putem men Ûiona: analiza corela Ûiilor canonice,
analiza multidimensional| a varian Ûei etc. O clasificare sintetic | a metodelor de analiz | a dependen Ûei, în func Ûie de criteriile
de mai sus, este prezentat| în tabelul urm |tor.

Clasificarea metodelor de analiz | a dependen Ûei


Num |r Num |r variabile dependente
variabile
independente O variabil| Mai multe variabile

Scal| non-metric| Scal| metric| Scal| non-metric| Scal| metric|

Scal| non- • Analiza discrimi- • testul t • Analiza multigrup a • Analiza multidi-


metric | nantului (discret|) discriminantului mensional| a varianÛei
O variabil| (discret|) (MANOVA)

Scal| • Analiza • Regresie • Analiza multigrup a • Analiza corelaÛiilor


metric | discriminantului simpl| discriminantului canonice
• Regresie logistic|

Scal| non- • Analiza discrimi- • Analiza • Analiza multigrup a • Analiza multidi-


Mai multe metric | nantului (discret|) ANOVA discriminantului mensional| a varianÛei
variabile • Analiza simultan| (discret|) (MANOVA)
(MONANOVA)

Scal| •Analiza • Regresie • Analiza multigrup a • Analiza corelaÛiilor


metric | discriminantului multipl| discriminantului canonice
• Regresie logistic|

1.5.2 Metode de analiz| a interdependenÛei


Analiza interdependen Ûei are ca scop s | identifice Õi s| eviden Ûieze situa Ûiile în care variabilele sunt corelate între ele Õi s|
explice modul în care are loc corelarea variabilelor supuse analizei. În func Ûie de num |rul de variabile analizate, metodele de

8
analiz | a interdependen Ûei se împart în dou | categorii:
• metode de analiz| a interdependen Ûei dintre dou | variabile;
• metode de analiz| a interdependen Ûei dintre mai multe variabile.
În cadrul metodelor de analiz | a interdependen Ûei dintre dou | variabile putem men Ûiona: analiza corela Ûiei simple, analiza
bazat| pe tabele de contingen Û| etc.
Dintre metodele de analiz| a interdependen Ûei dintre mai multe variabile putem men Ûiona: analiza componentelor principale,
analiza factorial|, analiza coresponden Ûelor, analiza cluster etc. În tabelul urm |tor este prezentat| sintetic clasificarea metodelor
Õi tehnicilor de analiz | a interdependen Ûei.

Clasificarea metodelor de analiz | a interdependen Ûelor


Num |r Tipul scalei
variabile
Scal| non-metric | Scal| metric |

Dou | variabile • Tabele de contingenÛ| • Analiza corelaÛiei simple


(bidimensionale)
• Modele log-liniare

Mai multe • Analiza corespondenÛelor • Analiza componentelor


variabile • Modele log-liniare principale
• Tabele de contingenÛ| • Analiza factorial|
(multidimensionale)

1.6 Analiza preliminar| a datelor


Una din cele mai importante etape ale procesului de analiz | a datelor din domeniul economico-social este cea a analizei
prelim inare, cunoscut| Õi sub numele de analiz| exploratorie a datelor. Analiza preliminar | este o activitate anterioar |,
preg |titoare, a analizei propriu-zise a datelor, care are ca scop iniÛializarea procesului de analiz |. În cadrul acestei etape, infor-
ma Ûiile primare disponibile sunt supuse unui proces de prelucrare în cadrul c |ruia are loc o filtrare a informa Ûiilor din punct de
vedere al semnifica Ûiei Õi utilit|Ûii pe care le au acestea în raport cu scopurile urm |rite. Activitatea de analiz | preliminar | a
datelor presupune utilizarea unei game variate de metode Õi tehnici statistico-matematice în scopul ob Ûinerii unei sugestive
caracteriz |ri statistice a acestor informa Ûii.
Preponderent| ca utilizare în faza de analiz | preliminar | a datelor Õi cu o utilitate de necontestat pentru activitatea Õtiin Ûific |
din aceast | etap |, este analiza grafic |. Utilizarea tehnicilor de analiz | grafic | în faza preliminar | a analizei datelor vizeaz |,
în principal, urm |toarele categorii de probleme:
• identificarea principalelor tendin Ûe manifestate la nivelul observa Ûiilor disponibile;
• depistarea principalelor leg |turi existente între variabilele supuse analizei;
• detectarea valorilor extreme, izolate, a c |ror apari Ûie în mulÛimea datelor analizate nu se justific | din punct de
vedere statistic.
Exist| în prezent numeroase instrumente software, cu ajutorul c |rora pot fi efectuate, într-o manier | comod | Õi eficient |,
cele mai complexe reprezent |ri grafice.

1.7 Suportul software în analiza datelor


ApariÛia calculatoarelor bazate pe microprocesoare Õi larga accesibilitate a acestora din punct de vedere al pre Ûului Õi
software-ului aplicativ au f|cut ca, în prezent, s | nu existe domeniu de cercetare în care calculatorul electronic s | nu fie instru-
mentul cel mai frecvent folosit pentru rezolvarea celor mai diverse probleme. Prelucrarea unui volum uria Õ de informa Ûii, pe
baza unor algoritmi de o complexitate deosebit| Õi în condiÛii de precizie ridicat|, nu se poate realiza decât cu ajutorul calcula-
torului electronic, chiar a unui calculator electronic performant.
În domeniul analizei datelor, exist| zeci Õi zeci de produse software, de dat| mai mult sau mai pu Ûin recent|. O inventariere,
pe care nu o putem pretinde a fi exhaustiv |, dar care poate fi considerat| ca fiind minimal |, pe care am f|cut-o în anul 2005,
cu privire la instrumentele software existente în lume la acest moment, ne-a condus la identificarea a peste 100 de astfel de
instrumente software specializate. Num |rul lor este cu atât mai semnificativ cu cât aceste produse software sunt de notorietate
mondial|, având o larg | utilizare în domeniul analizei datelor.
Printre cele mai noi Õi mai performante instrumente software existente în prezent, destinate, total sau par Ûial, activit|Ûilor
de analiz | a datelor, putem men Ûiona:
• SPSS 10.0, SPSS Inc., Chicago, IL, USA, 1999;
• STATISTICA 6.0, StatSoft Inc., Tulsa, OK, USA,2001;
• S-PLUS 2000, MathSoft Inc., Seattle, W ashington, USA, 1999;
• SAS 8.2, SAS Institute Inc., Cary, NC, USA, 2001;
• SYSTAT 9.0, SPSS Inc., Chicago, IL, USA, 1999;
• MATHEMATICA 4.0, W olfram Research, Champaign, IL, USA,1999;
• EVIEWS 3.0, Quantitative Micro Software, Irvine, CA, USA, 2000.
În afar | de existen Ûa unei mari variet|Ûi de instrumente software destinate analizei datelor, în prezent se poate identifica
o tendin Û| de dezvoltare exploziv | a preocup |rilor din acest domeniu, tendin Û| determinat| de necesit|Ûile informa Ûionale tot
mai mari Õi mai rafinate ale indivizilor Õi entit|Ûilor economice Õi sociale.

9
Tema 2. Concepte Õi operaÛii specifice econometriei Õi analizei datelor

2.1 Concepte fundamentale ale analizei datelor


Teoria Õi practica analizei datelor se bazeaz | pe o serie de concepte fundamentale, a c |ror definire este deosebit de
important | pentru în Ûelegerea demersului Õtiin Ûific presupus de acest tip de analiz |, pentru definirea Õi în Ûelegerea procedurilor
Õi instrumentelor specifice ale acestei discipline, pentru desf|Õurarea eficient| a organiz |rii Õi proiect|rii activit|tilor de analiz |
Õi pentru interpretarea rezultatelor ob Ûinute din analiz |.
Conceptele utilizate în analiza datelor Õi definirea riguroas | a acestora prezint| importan Û| nu numai pentru a facilita
definirea Õi în Ûelegerea procedurilor, metodelor Õi tehnicilor de analiz | a datelor, ci Õi pentru asigurarea unei modalit|Ûi coerente
Õi sugestive de interpretare Õi prezentare a concluziilor rezultate din analiz |. Pe lâng | conceptele proprii, specifice, în analiza
datelor sunt utilizate numeroase concepte care Ûin de domenii înrudite cu analiza datelor, cum ar fi: teoria probabilit|Ûilor Õi
statistica, econometria, teoria economic |, informatica etc. Din acest motiv, mulÛimea conceptelor cu care se opereaz | în
domeniul analizei datelor este extrem de cuprinz |toare Õi extrem de variat|.

2.1.1 Data
Conceptul cel mai important Õi cel mai frecvent întâlnit în analiza datelor, care, de fapt, intr | Õi în alc |tuirea numelui acestui
tip de activitate Õtiin Ûific |, este reprezentat de dat|. Importan Ûa acestui concept pentru domeniul analizei datelor este, cu
adev |rat, covâr Õitoare, deoarece el este cel care define Õte atât intr |rile oric |rui proces de analiz | a datelor, materia prim | supus |
prelucr|rii, cât Õi, într-un sens general, ie Õirile sale, rezultatele Õi concluziile ob Ûinute.
Datele pot fi privite ca reprezentând semnale Õi mesaje provenite din realitatea înconjur |toare, pe baza c |rora receptorul
îÕi poate forma o anumit| imagine despre respectiva realitate, poate ob Ûine un anumit grad de cunoa Õtere a acelei realit|Ûi.
Imaginea format| este cu atât mai fidel| în raport cu realitatea, cu cât cantitatea semnalelor Õi mesajelor este mai mare, respectiv,
cu cât acestea sunt mai pu Ûin afectate de perturba Ûii Õi de distorsiuni. De regul |, datele nu sunt recep Ûionate în mod pasiv de
beneficiarul lor, f|r | nici un efort din partea acestuia. Aproape f|r | excep Ûie, ob Ûinerea datelor necesare pentru orice activitate
de analiz | constituie un proces costisitor Õi laborios.
În analiza datelor, datele reprezint| expresia cantitativ | sau calitativ | a unor fapte reale, care sunt manifest |ri ale
fenomenelor Õi proceselor investigate. Eterogenitatea fenomenelor Õi a manifest |rii concrete a acestora face ca datele referitoare
la ele s | fie extrem de variate.
DefiniÛie: Datele reprezint| expresii cantitative Õi calitative ale unor fenomene Õi procese din realitatea înconjur |toare.

Datele pot s| difere în func Ûie de mai mulÛi factori: de sursa care le-a generat, de tipul Õi de natura lor. Indiferent de
varietatea lor, datele pot fi grupate în trei categorii fundamentale: date cantitative, date calitative Õi date mixte. Toate cele trei
tipuri de date pot fi, îns |, exprimate sub form | cantitativ |.

2.1.2 PopulaÛia Õi eÕantionul


Unul din conceptele fundamentale ale analizei datelor, de care este legat | definirea multora dintre conceptele uzuale ale
acestei discipline este cel de popula Ûie statistic |.
În raport cu acest concept fundamental sunt definite majoritatea celorlalte concepte utilizate în analiza datelor: e Õantion,
caracteristici, variabile, observa Ûii, parametri, grade de libertate.
DefiniÛie: Popula Ûia sau colectivitatea general| este reprezentat| de mulÛimea tuturor m |sur |torilor efective sau
conceptuale care prezint| interes pentru cercet|tor sau experimentator.
În general, se poate spune c | popula Ûia statistic | reprezint|, obiectul de studiu global al analizei datelor. Aceasta deoarece
majoritatea tehnicilor Õi instrumentelor de analiz | a datelor au ca scop deducerea unor legit|Ûi care guverneaz | popula Ûia
statistic |, ob Ûinerea unor estima Ûii pentru o serie de m |rimi specifice aceleia Õi popula Ûii statistice, efectuarea de predic Ûii
referitoare la structurarea pe tipologii sau la evolu Ûia popula Ûiei statistice.
De Õi popula Ûia reprezint| obiectul investiga Ûiei Õtiin Ûifice, totu Õi, analiza datelor vizeaz | în mod direct, aproape exclusiv,
observa Ûiile de la nivelul e Õantionului.
Popula Ûia statistic | poate fi definit| ca reprezentând totalitatea observa Ûiilor posibile dintr-un studiu. Generic, o unitate
component | a unei popula Ûii statistice se nume Õte unitate elementar |, element, individ, subiect, obiect, profil, form |, articol
sau caz. Ca exemple de unit|Ûi elementare ale unei popula Ûii statistice putem men Ûiona: cump |r |torul, firma, locuitorul unei Û|ri
sau al unui ora Õ, produsul, familia etc.
În func Ûie de num |rul, finit sau infinit, al elementelor din care este alc |tuit | o popula Ûie statistic |, aceasta poate fi de dou |
tipuri: popula Ûie finit| Õi popula Ûie infinit|.
Teoretic, într-o problem | de analiz | a datelor pot fi studiate, fie toate observa Ûiile posibile, adic | întreaga popula Ûie, fie
o parte, mai mare sau mai mic | a acestora, numit| e Õantion.
DefiniÛie: E Õantionul reprezint| o submulÛime de m |sur |tori selectate dintr-o popula Ûie, o submulÛime a popula Ûiei
statistice supus | investiga Ûiei Õtiin Ûifice.
E Õantionul are o importan Û| fundamental| în analiza datelor deoarece acesta, Õi nu popula Ûia total|, reprezint|, de fapt, baza
informa Ûional| utilizat| în procesele de analiz | a datelor. Informa Ûiile primare manipulate în activitatea de analiz | a datelor sunt

10
de fapt rezultatele m |sur |torilor efectuate la nivel de e Õantion.
O modalitate de vizualizare a rela Ûiei, a raportului în care se g |se Õte e Õantionul fa Û| de popula Ûia statistic | este prezentat|
în figura urm |toare.

Figura 2.1: Ilustrarea rela Ûiei dintre e Õantion Õi popula Ûie


O foarte mare importan Û| principial| pentru analizele cantitative bazate pe studiul e Õantioanelor, o are postulatul statistic
în conformitate cu care un e Õantion exprim | informa Ûional într-o oarecare m |sur | popula Ûia din care a fost extras, propriet|Ûile
Õi structura popula Ûiei fiind cu atât mai fidel exprimate de e Õantion cu cât volumul acestuia este mai mare.

2.1.3 Caracteristici Õi variabile


Din punct de vedere al informa Ûiei statistice, o popula Ûie statistic | prezint| interes nu în raport cu unit|Ûile, ca atare, din
care este alc |tuit | popula Ûia, ci în raport cu tr |s |turile, propriet|Ûile acestor unit|Ûi.
Propriet|Ûile unit|Ûilor elementare apar Ûinând unei popula Ûii statistice sunt numite în analiza datelor caracteristici sau
atribute. Fiecare unitate elementar | a popula Ûiei investigate poate avea o singur | caracteristic | sau mai multe caracteristici. În
cel de-al doilea caz, în studierea popula Ûiei statistice apare necesitatea abord |rii multidimensionale, necesitatea utiliz |rii unor
instrumente Õi tehnici de analiz | specifice caracterului multidimensional.
În func Ûie de natura lor, caracteristicile unit |Ûilor unei popula Ûii pot fi de dou | tipuri: caracteristici calitative Õi
caracteristici cantitative.
Caracteristicile sau atributele unit|Ûilor elementare ce alc |tuiesc o anumit| popula Ûie sunt elemente ale unei realit|Ûi date,
de natur | empiric |. De regul|, în activitatea Õtiin Ûific | nu se opereaz | cu elementele realit|Ûii ca atare, ci cu sim boluri care sunt
reprezent|ri abstracte ale realit|Ûii.
M |surarea caracteristicilor unit|Ûilor unei popula Ûii este echivalent | cu atribuirea de simboluri, numerice sau nenumerice,
acelor caracteristici. În general, simbolurile care pot s| ia o varietate de valori se numesc variabile.
În cadrul demersurilor Õtiin Ûifice care au ca scop investigarea fenomenelor Õi proceselor economice sau sociale,
caracteristicile unit|Ûilor unei popula Ûii sunt reflectate prin intermediul conceptului de variabile, tocmai pentru a sugera natura
schimb |toare a acestora, variabilitatea lor în timp Õi spa Ûiu. Variabila este, poate, cel mai important concept vehiculat în cadrul
oric |rui proces de analiz | a datelor, în raport cu care se define Õte întreaga succesiune de opera Ûii de prelucrare specifice acestui
proces.
Informa Ûiile care sunt elemente de intrare în procesele de analiz | a datelor, reprezint|, aproape f|r | excep Ûie, m |sur |tori
asupra unor caracteristici, m |sur |tori care definesc valori ale variabilelor ce simbolizeaz | caracteristicile popula Ûiei analizate.
DefiniÛie: Variabila reprezint| o abstractizare a mulÛimii de valori posibile pe care le poate înregistra o caracteristic |
a unui anumit fenomen.
Varietatea fenomenelor economico-sociale Õi modalit|Ûile diferite de exprimare a caracteristicilor acestora fac ca variabilele
prin intermediul c |rora sunt descrise aceste caracteristici s| aib | natur | diferit|. Ca Õi caracteristicile popula Ûiilor, dup | natura
pe care o au, variabilele pot fi de dou | tipuri: variabile calitative Õi variabile cantitative.
În analiza datelor apare necesitatea trat|rii diferen Ûiate a datelor de tip calitativ Õi cantitativ deoarece exist| diferen Ûe subs-
tan Ûiale între aceste tipuri de date atât din punct de vedere al modalit|Ûilor de abordare Õi interpretare, cât Õi din punct de vedere
al metodelor Õi tehnicilor utilizate în analiz |. Din aceste motive, se face o deosebire net| între variabilele de tip calitativ Õi
variabilele de tip cantitativ.
DefiniÛie: Variabilele calitative sunt variabile ce difer | prin tip, se refer | la propriet|Ûi nenumerice ale unit|Ûilor
elementare apar Ûinând unei popula Ûii Õi nu pot fi exprimate numeric.
În cazul în care, în mod conven Ûional, valorile lor sunt codificate prin numere, aceast| exprimare nu este relevant|
numeric. Variabile calitative sunt: sexul, op Ûiunea cump |r |torului, op Ûiunea aleg |torului, profesia, starea civil | etc.
DefiniÛie: Variabilele cantitative sunt variabile care difer | prin m |rime, se refer| la propriet|Ûi numerice ale unit|Ûilor
elementare dintr-o popula Ûie Õi sunt exprimate în unit|Ûi numerice: de lungime, de greutate, valorice etc.
Variabile cantitative sunt: pre Ûul unui produs, cheltuielile lunare ale unei familii, salariul mediu lunar, venitul na Ûional,
volumul fizic al produc Ûiei etc.
În func Ûie de natura valorilor pe care le iau, variabilele se împart în dou | categorii: variabile de tip discret Õi variabile de
tip continuu.
DefiniÛie: Variabilele de tip discret sunt variabile care pot lua o mulÛime limitat|, finit| de valori Õi care se mai numesc
Õi variabile categoriale.
Valorile luate de variabilele discrete se numesc alternative, categorii, variante sau m odalit|Ûi. De regul|, variabilele

11
calitative sunt variabile de tip discret. Variabile de tip discret pot fi îns | Õi unele variabile cantitative.
DefiniÛie: Variabilele de tip continuu sunt variabile care pot lua valori apar Ûinând unui interval continuu.
Practic, mulÛimea valorilor posibile ale variabilelor de tip continuu este o mulÛime infinit |. De regul|, variabilele calitative
nu sunt variabile de tip continuu.

2.1.4 ObservaÛii
Strâns legat de conceptul de variabil|, este un alt concept, la fel de important Õi frecvent utilizat în analiza datelor, Õi anume,
conceptul de observa Ûie.
DefiniÛie: Observa Ûia este reprezentat| de valoarea sau setul de valori înregistrate pentru o anumit| unitate elementar |
a popula Ûiei, la una sau mai multe caracteristici ale acesteia.
De fapt, observa Ûiile sunt valori pe care le iau variabilele supuse analizei, valori care sunt rezultate din m |sur |torile
efectuate asupra caracteristicilor unit|Ûilor apar Ûinând popula Ûiei investigate.
Observa Ûia reprezint| în procesul de analiz | a datelor unitatea elementar | de informa Ûie utilizat| în procesele de prelucrare,
mulÛimea observa Ûiilor constituind baza informa Ûional| a analizei datelor. Practic, mulÛimea de observa Ûii supuse procesului
de analiz | este echivalent | cu e Õantionul, care, la rândul s |u, nu este altceva decât tot o mulÛime de observa Ûii.
De cele mai multe ori, prin observa Ûie se în Ûelege chiar entitatea elementar | care intr | în alc |tuirea popula Ûiei analizate Õi
de la care se ob Ûin informa Ûii. În acest sens, observa Ûia este sinonim | cu cazul, obiectul, individul, subiectul, articolul.

2.2 Tipuri de date primare


În func Ûie de modul în care sunt ob Ûinute, datele primare pot fi clasificate în mai multe categorii. Vom prezenta, în
continuare, dou | dintre clasific |rile cele mai importante ale datelor primare: clasificarea în func Ûie de natura contextului în care
acestea sunt ob Ûinute Õi clasificarea în func Ûie de modul de ob Ûinere a acestora.

2.2.1 Date experimentale Õi date non-experimentale


Din punct de vedere al naturii contextului în care datele sunt ob Ûinute, al modului în care investigatorul controleaz | sau
nu, în procesul ob Ûinerii datelor, popula Ûia supus | studiului, datele pot fi grupate în dou | categorii:
• date experim entale;
• date non-experim entale sau date observa Ûionale.
Diferen Ûele dintre datele experimentale Õi non-experimentale Ûin nu numai de natura contextului în care ele sunt ob Ûinute,
ci Õi de modul în care ele sunt utilizate în analiza datelor, de metodele, instrumentele Õi procedurile utilizate pentru prelucrarea
acestora.

2.2.1.1 Date experimentale


Datele experimentale sunt datele ob Ûinute prin organizarea unor experimente de tip controlat, desf |Õurate în condiÛii clare
Õi prestabilite. Contextul ob Ûinerii datelor de tip experimental este restric Ûionat, prin impunerea unor reguli specifice.
În general, organizarea unui experiment controlat presupune, în primul rând, izolarea fenomenelor Õi proceselor studiate,
precum Õi eliminarea, în cât mai mare m |sur |, a influen Ûelor externe, care nu prezint | interes pentru analiz |. O alt| etap |
important | a experimentului controlat este aceea a stabilirii factorilor Õi cauzelor importante, cu semnifica Ûie, care îÕi exercit|
influen Ûa asupra m |rimilor exogene, precum Õi a alegerii nivelelor la care influen Ûa acestora va fi urm |rit |. Cea de-a treia etap |
a procesului de ob Ûinere a datelor experimentale const | în desf|Õurarea experimentului propriu-zis, etap | în care sunt “doza Ûi”,
în condiÛii specifice, factorii de influen Û|. În aceast | etap |, se fixeaz | nivele concrete pentru fiecare din factorii de influen Û|,
se creaz| condiÛiile necesare pentru exercitarea influen Ûelor factorilor Õi se m |soar | efectul influen Ûei factorilor asupra m |rimii
sau m |rimilor de ie Õire.
Datele ob Ûinute în urma unui astfel de proces, adic | datele experimentale, sunt reprezentate de dou | categorii de informa Ûii:
valorile fixate pentru nivelurile factorilor de influen Û| Õi valorile rezultate pentru variabila sau variabilele dependente, în urma
exercit|rii acestor influen Ûe.
DefiniÛie: Datele experim entale reprezint| informa Ûii ob Ûinute prin organizarea unor experimente controlate, în care
influen Ûele factorilor asupra efectului sunt controlate în mod direct, prin fixarea unor combina Ûii precise de influen Ûe.
Datele experimentale sunt caracteristice doar unor domenii de cercetare, Õi anume acelor domenii în care pot fi organizate
experimente specifice, necesare ob Ûinerii acestor date. Experimentarea este posibil| doar în anumite domenii ale cunoa Õterii,
cum ar fi, de exemplu, domeniul Õtiin Ûelor naturale: fizic |, chimie, biologie etc.
Într-o alt| modalitate de exprimare, se poate spune c | datele experimentale sunt date de laborator, prin “laborator”
în Ûelegând aici o serie de condiÛii speciale, care se refer | atât la o serie de restric Ûii Õi instrumente specifice de m |surare, cât la
modalitatea de desf |Õurare a unor procese cauzale specifice.
Spre deosebire de aceste domenii, în domeniul economico-social experimentarea este fie total imposibil|, fie posibil|, dar
numai foarte rar Õi în condiÛii foarte restrictive Õi costisitoare.

2.2.1.2 Date non-experimentale


Datele non-experimentale, care se mai numesc Õi date observa Ûionale, sunt datele ob Ûinute prin “observarea” fenomenelor
Õi proceselor în miÕcarea lor natural|, liber |, f|r | impunerea unor restric Ûii, f|r | a se exercita un control de un anumit fel asupra
fenomenelor Õi proceselor investigate.

12
DefiniÛie: Datele non-experim entale reprezint| informa Ûii ob Ûinute prin observarea liber | a miÕc |rii fenomenelor Õi
proceselor studiate, f|r | interven Ûia direct| a investigatorului asupra condiÛiilor în care se desf |Õoar | acest | miÕcare.
Ob Ûinerea datelor de tip non-experimental reprezint| rezultatul observ |rii pasive, constat|rii. Interven Ûia observatorului,
a celui care face m |sur |torile, este de tip ex-post, are loc dup | ce desf |Õurarea fenomenelor Õi proceselor reale a avut loc.
Datele de tip non-experimental sunt datele specifice domeniului economico-social, domeniu în care organizarea de
experimente este fie dificil|, fie imposibil|. Mai mult decât atât, complexitatea influen Ûelor din domeniul economico-social,
multitudinea interac Ûiunilor din acest domeniu, determin | o relevan Û| foarte sc |zut | pentru eventualele date de natur |
experimental|.

2.2.2 Date de tip profil, serii de timp Õi date panel


Din punct de vedere cronologic, observarea unei popula Ûii de fenomene sau procese, în scopul ob Ûinerii informa Ûiilor
necesare, poate avea loc sub dou | forme diferite: static Õi dinamic. Din acest punct de vedere, datele primare pot s | constituie
fie o imagine de tip static a popula Ûiei, în care aceste date s | reprezinte informa Ûii legate de starea unit|Ûilor popula Ûiei la un
moment dat, fie o imagine de tip dinamic, evolutiv, în care datele s| reprezinte informa Ûii legate de evolu Ûia în timp a unei sau
unor unit|Ûi ale popula Ûiei.
Având în vedere aceste dou | modalit|Ûi de a observa unit|Ûile unei popula Ûii, datele primare pot fi grupate în trei categorii:
• date de tip profil;
• date de tip serii de tim p;
• date de tip panel;
Ca Õi în cazul datelor experimentale, analiza datelor diferen Ûiaz | semnificativ modalit|Ûile de abordare, în raport cu fiecare
din aceste categorii de date. Din acest motiv, consider |m c | este necesar | o scurt| prezentare a acestor trei tipuri de date.

2.2.2.1 Date de tip profil


Datele de tip profil reprezint| rezultate ale unor m |sur |tori efectuate, la un moment dat, asupra uneia sau mai multor
caracteristici, de-a lungul unit|Ûilor popula Ûiei, adic | pe mulÛimea unit|Ûilor sau obiectelor care sunt supuse studiului.
Datele de tip profil se mai numesc date de tip secven Û| sau date de tip sec Ûiune Õi reprezit| “t|ieturi informa Ûionale”
efectuate într-o anumit| popula Ûie la un moment dat, “t|ieturi” care sunt de tip transversal, în raport cu axa timpului.
DefiniÛie: Datele de tip profil reprezint| informa Ûii ob Ûinute prin m |sur |tori de natur | static |, efectuate asupra
caracteristicilor unor unit|Ûi ale unei popula Ûii, la acela Õi moment de timp.
O observa Ûie în contextul datelor de tip profil este reprezentat| de valoarea sau de valorile unei singure entit|Ûi, ale unei
singure unit|Ûi din popula Ûie. Num |rul de observa Ûii coincide, în cazul datelor de tip profil, cu num |rul de unit|Ûi observate Õi
înregistrate. D atele de tip profil nu încorporeaz | în semnifica Ûia pe care acestea o poart|, influen Ûa timpului asupra form |rii
caracteristicilor la nivelul popula Ûiei Õi sensul scurgerii timpului, nici în mod explicit Õi nici în mod implicit.
Ca exemple de date de tip profil, putem men Ûiona: datele referitoare la salariul individual dintr-o lun | al lucr|torilor unei
firme; datele referitoare la popula Ûia medie a statelor lumii într-un anumit an; datele referitoare la rata infla Ûiei înregistrat| de
Û|rile lumii într-o anumit| perioad |; sexul cump |r |torilor ce cump |r | un anumit bun într-o anumit| perioad |; num |rul mediu
înregistrat de popula Ûia jude Ûelor unei Û|ri într-un anumit an; volumul anual al vânz |rilor unor m |rci de autoturisme, num |rul
voturilor înregistrate de partidele înscrise într-o campanie electoral| etc.
De regul|, datele de tip profil se refer | la starea pe care o au la un anumit moment indivizii apar Ûinând unor anumite
colectivit|Ûi, gospod |riile, firmele, ramurile, unit|Ûile administrativ-teritoriale, Û|rile lumii etc.

2.2.2.2 Date de tip serii de timp


Datele de tip serii de tim p, numite Õi serii cronologice sau, pur Õi simplu, serii de tim p, reprezint| rezultate ale unor
m |sur |tori efectuate asupra caracteristicilor unei unit|Ûi a popula Ûiei studiate, de-a lungul timpului, la momente succesive ale
evolu Ûiei acesteia, la anumite intervale de timp.
Intervalele de timp pentru care se fac m |sur |torile pot fi reprezentate de: ore sau frac Ûiuni de ore, zile, s |pt|mâni, decade,
luni, trimestre, semestre, ani. Deoarece intervalele sunt egale Õi reprezint| scurgerea timpului, observa Ûiile rezultate în urma
acestor m |sur |tori sunt succesive Õi, de regul|, echidistante în timp.
DefiniÛie: Datele de tip serii de tim p sau seriile cronologice reprezint| informa Ûii ob Ûinute prin m |sur |tori de natur |
dinamic |, efectuate asupra caracteristicilor unei unit|Ûi a unei popula Ûii la momente sau în intervale succesive de timp.
Datele reprezentate de seriile de timp se refer | la evolu Ûia în timp a st|rii unui individ, gospod |rii, zone geografice, Û|ri
etc. Datele de acest tip pot fi date de tip interval sau date de tip moment.
Datele de tip interval sunt datele care se refer | la caracteristici care sunt m |rimi de tip stoc, în timp ce datele de tip moment
sunt date care se refer | la caracteristici care sunt m |rimi de tip flux. Ôi în acest caz, datele de tipul seriilor de timp pot fi privite
ca reprezentând “sec Ûiuni informa Ûionale”, îns | aceste sec Ûiuni sunt de-a lungul axei timpului, de-a lungul evolu Ûiei, adic | sunt
sec Ûiuni longitudinale în raport cu axa timpului.

2.2.2.3 Date de tip panel


Datele de tip panel sunt date care reprezint| combina Ûii, mixturi ale datelor de tip profil Õi datelor de tipul seriilor de timp.
Ele sunt rezultate ale m |sur |torilor efectuate asupra caracteristicilor unor unit|Ûi individuale, atât de-a lungul unit|Ûilor
individuale, cât Õi de-a lungul timpului.
DefiniÛie: Datele de tip panel reprezint| informa Ûii ob Ûinute prin m |sur |tori mixte, de natur | static | Õi de natur | dina-
mic |, efectuate asupra caracteristicilor acelora Õi unit|Ûi ale unei popula Ûii la momente sau în intervale succesive de timp.
Datele de tip panel pot fi imaginate ca reprezentând “t|ieturi informa Ûionale mixte”, transversale Õi longitudinale, în raport

13
cu axa timpului. În cazul datelor de tip panel, observarea se face într-o not| de simultaneitate: atât asupra mai multor unit|Ûi
ale popula Ûiei, cât Õi asupra evolu Ûiei în timp a acestor unit|Ûi. Exemplul cel mai sugestiv pentru datele de tip panel este cel al
bugetelor de familie, în contextul c |rora se fac înregistr |ri pe perioade de mai mulÛi ani a veniturilor Õi cheltuielilor tuturor
familiilor care alc |tuiesc e Õantionul respectiv.

2.2.3 Scala de m|surare a variabilelor


A Õa cum am men Ûionat anterior, “materia prim |” în analiza datelor este reprezentat| de m |sur |torile efectuate asupra unor
caracteristici ale popula Ûiei statistice. În analiza datelor, aceste m |sur |tori sunt considerate a reprezenta valori ale unor variabile
definite în raport cu caracteristicile analizate. Indiferent de tipul ei, valoarea înregistrat| de o caracteristic | la nivelul unui obiect
este totdeauna rezultatul exprim |rii univoce a valorii respectivei caracteristici în func Ûie de “grada Ûiile” unei anumite scale.

2.2.3.1 Definirea scalei


M |surarea reprezint| un proces prin intermediul c |ruia se asociaz | numere sau simboluri unor caracteristici sau propriet|Ûi
ale unor obiecte sau ale unor subiec Ûi, care constituie obiectul studiului.
Atribuirea de numere sau simboluri pentru caracteristicile sau propriet|Ûile unor obiecte se face pe baza respect|rii unor
reguli prestabilite Õi prin utilizarea unor proceduri specifice. De exemplu, dac | obiectul studiului este reprezentat de indivizi
care sunt poten Ûiali cump |r |tori ai unui anumit produs, atunci caracteristicile c |rora este necesar a li se atribui numere sau
simboluri pot fi: vârsta, venitul, sexul, profesia etc.
M |surarea caracteristicilor sau propriet|Ûilor unor obiecte sau subiec Ûi este totdeauna caracterizat| de o anumit|
specificitate, determinat| de natura caracteristicii m |surate, Õi presupune, cu necesitate, existen Ûa unor repere, a unor sisteme
de referin Û|, cunoscute sub numele de scal|. Ca element fundamental al procesului de m |surare a caracteristicilor fenomenelor
Õi proceselor economice, scala poate fi definit| sub forma urm |toare.
DefiniÛie: O scal| reprezint| un etalon corespunz |tor, care stabile Õte modul dup | care sunt atribuite valori variabilelor;
a defini o scal| de m |surare este echivalent cu:
• a stabili o mulÛime de valori posibile ale variabilei, mulÛime numit| Õi spa Ûiu de selec Ûie;
• a preciza regulile dup | care sunt atribuite simboluri pentru elementele unei realit|Ûi date, adic | a defini o struc-
tur | a spa Ûiului de selec Ûie.
În func Ûie de natura variabilelor exprimate cu ajutorul lor, exist| patru tipuri de scale, pe care le von defini în cele ce
urmeaz |.
2.2.3.2 Tipuri de scale
Ca Õi procesul de m |surare ca atare, scala sau sistemul de referin Û| este, de asemenea, specific | naturii pe care o are
caracteristica supus | procesului de m |surare. Din acest punct de vedere, exist | mai multe tipuri de scale de m |surare: scala
nominal|, scala ordinal|, scala interval Õi scala raport. Primele dou | tipuri de scale sunt scale de tip non-m etric, iar ultimele
dou | sunt scale de tip m etric.

2.2.3.2.1 Scala nominal|


Scala nominal| este o scal| non-m etric |, pe baza c |reia valorile variabilelor sunt definite prin intermediul simbolurilor
nenumerice. M |surarea variabilelor pe scala nominal| este echivalent | cu procesul de codificare a variabilelor. Chiar în cazul
în care pentru codificare sunt folosite numere, aceste numere sunt, totu Õi, pur conven Ûionale.
DefiniÛie: Scala nominal| este o scal| non-metric |, prin intermediul c |reia valorilor posibile ale caracteristicilor
m |surate li se atribuie simboluri f|r | relevan Û| numeric |, în func Ûie de natura acestor valori.
Scala nominal| este utilizat| pentru a m |sura caracteristici ale c |ror valori sunt de natur | calitativ |, necuantificabil|.
Valorile pe care pot s| le ia caracteristicile de acest tip sunt cunoscute sub numele de categorii sau alternative. Variabilele
m |surate pe scala nominal| se numesc variabile nom inale Õi sunt variabile a c |ror form | de exprimare este de tip atributiv Õi
care pot fi folosite numai pentru stabilirea apartenen Ûei la o anumit| clas | a entit|Ûii descrise prin intermediul variabilei.
O clas | special| a variabilelor de tip nominal o reprezint| variabilele binare, care sunt variabile ce pot s | ia doar dou |
valori de tip nenumeric.
Variabilele de tip nominal sunt variabile discrete Õi pot fi utilizate numai în scopuri de clasificare de tip calitativ, natura
nenumeric | a acestor variabile f|când imposibil| utilizarea lor pentru compara Ûii, ierarhiz |ri sau ordon |ri.
În cazul m |sur |rii pe scala nominal|, valorilor pe care pot s | le ia caracteristicile supuse m |sur |rii, respectiv categoriilor
sau alternativelor, li se atribuie sim boluri, care sunt de natur | nenumeric |.
Pe scala nominal|, dou | valori diferite ale caracteristicii m |surate sunt eviden Ûiate prin intermediul a dou | simboluri
diferite. Elementele scalei nominale, “diviziunile” acesteia, sunt reprezentate de simbolurile atribuite valorilor caracteristicii
studiate, sau, mai exact, de categoriile respectivei caracteristici. Scala nominal| este reprezentat| chiar de mulÛimea acestor
simboluri. De exemplu, mul Ûimile:
,
,
,
reprezint| scale de tip nominal utilizate pentru a m |sura caracteristici cum ar fi sexul, domeniul de activitate, categoria social|,
profesia.
Ceea ce este caracteristic scalei nominale este faptul c | subiec Ûii studia Ûi nu pot fi compara Ûi din punct de vedere al valorii
pe care o înregistreaz | la caracteristica m |surat| pe aceast | scal|. Pe baza valorilor înregistrate pe scara nominal| nu se poate
afirma care subiect este “mai bine situat” din punct de vedere al caracteristicii studiate sau, cu atât mai pu Ûin, “în ce m |sur |”
un subiect este situat mai bine decât altul.

14
Tot pe aceast | scal|, caracteristicilor li se pot atribui Õi numere, numai c | aceste numere nu au sensul propriu-zis de num |r,
având practic aceea Õi semnifica Ûie ca Õi simbolurile. Atât simbolurile propriu-zise, cât Õi numerele cu rol de simbol, atribuite
caracteristicilor pe aceast | scal| de m |surare, au numai rol de clasificare în anumite grupe a subiec Ûilor sau de contorizare a
num |rului de subiec Ûi din fiecare categorie, neputând fi folosite în nici un tip de calcul numeric. Prin intermediul valorilor
m |surate pe scala nominal| subiec Ûii se diferen Ûiaz | între ei doar din punct de vedere al apartenen Ûei la o anumit| clas | sau al
apartenen Ûei la o anumit| categorie. Aceasta înseamn | c | utilizarea scalei nominale pentru m |surarea caracteristicilor
m |surabile pe aceast | scal| genereaz | clase sau categorii de subiec Ûi.
Pentru caracteristicile m |surate pe scala nominal|, poate fi calculat un num |r limitat de indicatori statistici, care reprezint|,
de fapt, contoriz |ri ale simbolurilor ap |rute pe scala nominal|. Ace Õti indicatori sunt modulul Õi frecven Ûa. În cazul
caracteristicilor m |surate pe scala nominal| poate fi eviden Ûiat| Õi distribu Ûia de frecven Û|.
Într-o analiz | de date, variabilele nominale pot fi reprezentate de o serie de variabile cum ar fi: sexul, categoria social|,
tipul familiei, profesia, marca unui produs etc.
Unica transformare de tip invariant a scalei nominale este reprezentat| de opera Ûia de recodificare, aceast| opera Ûie
neafectând apartenen Ûa la o anumit| clas | a valorilor m |surate pe acest| scal|.

2.2.3.2.2 Scala ordinal|


Scala ordinal| este o scal| non-m etric |, similar | scalei nominale, adic | o scal| de codificare cu deosebirea c | pe aceast|
scal| este posibil| ordonarea valorilor variabilelor. Aceast | scal| este folosit| cu prec |dere pentru m |surarea preferin Ûelor
consumatorilor.
Scala ordinal| permite clasificarea valorilor unei variabile în func Ûie de rangul acestora, îns | diferen Ûele între ranguri nu
sunt relevante Õi nu au sens. Acest tip de scal| nu d | posibilitatea stabilirii gradului în care caracteristicile a dou | entit|Ûi
distincte difer | între ele (mai mult, mai pu Ûin).
DefiniÛie: Scala ordinal| este o scal| non-metric |, prin intermediul c |reia valorilor posibile ale caracteristicilor li se
atribuie numere de ordine sau ranguri, în func Ûie de pozi Ûia acestor valori într-o ierarhie.
Variabilele m |surate pe aceast | scal| se numesc variabile ordinale, sunt variabile calitative de tip discret Õi nu pot fi
exprimate sub o form | numeric | real|. Ca exemple de variabile ordinale putem men Ûiona: categoria de venit (mic, mediu, mare),
nivelul studiilor (elementare, medii, superioare), preferin Ûa consumatorilor pentru un anumit produs (foarte mare, mare, mic |,
foarte mic |, deloc), nivelul calitativ al unui produs sau serviciu (inferior, mediu, superior), starea economic | (recesiune,
stagnare, expansiune) etc.
Scala ordinal| este utilizat| în cazul în care caracteristica subiec Ûilor supu Õi analizei determin | o diferen Ûiere a subiec Ûilor
din punct de vedere al poziÛiei pe care fiecare dintre ace Õtia o ocup | într-o ierarhie, într-o ordonare, adic | în cazul în care
caracteristica ia valori de tip ordinal. Valorile pe care pot s| le ia caracteristicile m |surate pe scala ordinal| sunt valori ordinale
sau note, cunoscute Õi sub numele de ranguri. Acestor valori li se atribuie fie numere de ordine, fie simboluri care eviden Ûiaz |
o anumit| ordine a valorilor caracteristicii.
Pe scala ordinal|, dou | valori diferite ale unei caracteristici sunt eviden Ûiate prin intermediul a dou | ranguri diferite, adic |
prin intermediul a dou | pozi Ûii diferite în cadrul ierarhiei. Elementele scalei ordinale, “diviziunile” acesteia, sunt reprezentate
de numerele sau de simbolurile folosite pentru reprezentarea rangurilor, respectiv de poziÛiile posibile în respectiva ordonare.
Scala nominal| este reprezentat| chiar de mulÛimea acestor numere sau simboluri.
Cu toate c | valorile caracteristicilor de tip ordinal nu sunt numere propriu-zise, ele diferen Ûiaz |, totu Õi, pozi Ûia unui subiect
în raport cu un alt subiect, “spun ceva” despre aceast | pozi Ûie. Valorile unei caracteristici m |surate pe scala ordinal| permit doar
ordonarea subiec Ûilor din punct de vedere al acestei caracteristici, determinând o ierarhizare a subiec Ûilor sau obiectelor.
Prin intermediul valorilor pe care le pot lua caracteristicile m |surate pe scala ordinal|, indivizii se diferen Ûiaz | între ei doar
din punct de vedere al rangului, al locului pe care îl ocup | în ierarhia generat| de scala ordinal|. Aceasta înseamn | c |
utilizarea scalei ordinale pentru m |surarea caracteristicilor m |surabile pe aceast | scal| genereaz | ierarhii, ordon |ri ale
subiec Ûilor.
M |surarea pe scala ordinal| permite compara Ûii între subiec Ûi din punct de vedere al caracteristicii m |surate, dar aceste
compara Ûii se refer | numai la modul în care un subiect “este situat” în raport cu altul, f|r | a se putea spune Õi “în ce m |sur |”
subiec Ûii difer | între ei dup | caracteristica respectiv |. Diferen Ûele dintre dou | valori succesive de pe scala ordinal| nu pot fi
considerate ca fiind egale, ele nedeterminând o distan Ûare egal| între indivizi, astfel încât s| se poat | afirma, de exemplu, c |
subiectul situat pe primul loc este “de trei ori mai bun” decât subiectul situat pe locul al treilea.
Pentru caracteristicile m |surate pe scala ordinal|, pot fi calcula Ûi o serie de indicatori statistici cum ar fi: modulul, mediana,
coeficientul de corela Ûie a rangurilor, frecven Ûa. De asemenea, pentru caracteristicile de tip ordinal se poate eviden Ûia Õi
distribu Ûia de frecven Û|. Este important s| se fac |, în acest context, precizarea c | media Õi diferen Ûele valorilor variabilelor
ordinale sunt nerelevante, nu au sens informa Ûional Õi nici sens logic.
Singura transformare invariant | a scalei ordinale este transla Ûia, adic | transformarea care p |streaz | ordinea valorilor unei
variabile. Analitic, acest tip de transformare invariant | a scalei ordinale poate fi definit astfel:

unde a este o constant |, pozitiv | sau negativ |, care d | sensul Õi m |rimea transla Ûiei valorilor scalei ordinale, valori reprezentate
de x.

2.2.3.2.3 Scala interval


Este o scal| quasi-m etric | pe care se poate defini un punct de referin Û|, dar acest punct nu este o origine "zero" real|, ci
conven Ûional|, arbitrar |. Valoarea "zero" pe acest tip de scal| nu indic | nicidecum absen Ûa fenomenului m |surat. Deci, pentru
scala de tip interval, originea scalei este arbitrar |, având importan Û| doar scalarea valorilor în interiorul intervalului.
Aceast | scal| permite scalarea valorilor unei variabile în cadrul unui interval de valori reale, f|r | a avea îns | o origine
precis | a acestor valori. Cu valorile m |surate pe aceast | scal| pot fi efectuate diferen Ûe, raporturi ale diferen Ûelor, dar nu are
sens determinarea raportului a dou | valori.

15
DefiniÛie: Scala interval este o scal| quasi-metric |, prin intermediul c |reia valorilor posibile ale caracteristicilor
m |surate li se atribuie valori numerice, f|r | ca pentru aceste valori numerice s | existe o origine prestabilit|.
Variabilele m |surate pe scala interval se numesc variabile tip interval Õi sunt variabile cantitative. Ele pot fi utilizate în
compara Ûii al c |ror rezultat permite o exprimare numeric |.
În cazul m |sur |rii pe scala interval, diferen Ûa dintre dou | valori succesive ale scalei are o semnifica Ûie numeric | sigur |,
permiÛând m |surarea modului în care subiec Ûii se distan Ûeaz| din acest punct de vedere. O astfel de scal| este, de exemplu, cea
în contextul c |reia m |surarea caracteristicilor const | în acordarea unui num |r de puncte sau în acordarea unei note, în func Ûie
de importan Ûa pe care o are caracteristica respectiv | la nivelul unui subiect, în func Ûie de magnitudinea sa.
O caracteristic | a scalei de tip interval este aceea c | evaluarea caracteristicii m |surate nu este afectat| dac | scala este
translatat| sau dac | scala este multiplicat| cu o anumit| constant|. Translatarea este echivalent | cu o schimbare a originii, care,
oricum, este o origine arbitrar |. Multiplicarea este echivalent | cu o m |rire propor Ûional| a distan Ûelor dintre valorile scalei, adic |
o m |rire care conserv | propor Ûiile între aceste distan Ûe. În consecin Û|, se poate spune c | transformarea pân | la care scala interval
r |mâne invariant |, este transformarea de tip liniar urm |toare:

unde a Õi b reprezint| dou | constante reale, iar x Õi y reprezint| valorile scalei originale, respectiv cele ale scalei transformate.
Opera Ûiile care pot fi efectuate cu valorile m |surate pe scala de tip interval sunt mai numeroase decât cele care sunt posibile
pe scala nominal| Õi ordinal |. În plus fa Û| de opera Ûiile permise pe primele dou | scale, scala interval mai permite: calculul
mediei, calculul abaterii standard, calculul momentelor, calculul coeficien Ûilor de corela Ûie Pearson. Ca exemplu de variabil|
tip interval, putem men Ûiona variabila reprezentat| de durata programului de lucru, timpul, ca variabil| specific | seriilor
cronologice etc.

2.2.3.2.4 Scala raport


Scala de tip raport este scala care are toate propriet|Ûile scalei de tip interval, îns |, în plus fa Û| de aceasta, are o origine
natural|, neconven Ûional|, care nu poate fi schimbat|. Este o scal| m etric |, pe care valorile sunt exprimate sub form | numeric |,
dar, spre deosebire de variabilele de tip interval, aceste valori sunt definite în raport cu o anumit| origine.
Originea scalei indic | absen Ûa propriet|Ûii, caracteristicii. În plus fa Û| de scalele precedente, pe aceast | scal| este definit
Õi raportul valorilor, adic | se poate compara de câte ori o valoare este mai mare decât alta.
DefiniÛie: Scala raport este o scal| metric |, prin intermediul c |reia valorilor posibile pe care le pot lua caracteristicile
m |surate li se atribuie numere definite in raport cu o origine prestabilit|.
Scala raport este invariant | pân | la o transformare propor Ûional| pozitiv |, adic | pân | la transformarea:

Variabilele m |surate pe scala raport se numesc variabile tip raport Õi sunt variabile cantitative. Cu aceste variabile sunt
permise toate opera Ûiile definite pentru variabilele numerice.
Ca exemple de variabile tip raport putem men Ûiona: pre Ûul, venitul, vârsta, salariul, profitul, volumul vânz |rilor, num |rul
cump |r |torilor etc.

2.3 Moduri de reprezentare a datelor


Pentru a se asigura o manipulare mai convenabil| Õi mai eficient|, datele utilizate în analiza datelor sunt reprezentate sub
o form | specific |, numit| forma matricial|. Aceast | form | de reprezentare a datelor ofer | atât avantajul unei structur |ri simple
Õi clare a datelor, cât Õi avantajul de a oferi posibilitatea generaliz |rii conceptului de mulÛime de date.
În cele mai multe ipostaze din analiza datelor, matricea este entitatea care define Õte Õi, în acela Õi timp, con Ûine totalitatea
informa Ûiilor, totalitatea datelor, supuse procesului de analiz |.
În principiu, datele primare sunt reprezentate în analiza de date sub trei forme matriciale principale: m atrici de observa Ûii,
m atrici sau tabele de contingen Û| Õi m atrici sau tabele de proximitate.

2.3.1 Matrici de observaÛii


O m atrice de observa Ûii este un tablou rectangular în care liniile reprezint| obiectele supuse m |sur |torilor, iar coloanele
reprezint| caracteristicile obiectelor. Elementele tabloului reprezint| valori înregistrate în procesul de m |surare pentru
caracteristicile obiectelor supuse m |sur |torilor. Aceste valori mai poart| Õi numele generic de scoruri. Matricile de observa Ûii
se mai numesc Õi matrici de tip "obiecte×caracteristici".
Pentru o analiz | de date în care num |rul obiectelor supuse analizei este T, iar num |rul de caracteristici ale obiectelor este
n, matricea de observa Ûii are forma urm |toare:

unde un element x ij reprezint| valoarea înregistrat| pentru cea de-a j-a caracteristic | a obiectului i. O linie i a matricii de
observa Ûii X define Õte un obiect O i Õi reprezint| valorile înregistrate de acest obiect la cele n caracteristici pe care le posed |.
O coloan | j a matricii de observa Ûii X reprezint| valorile înregistrate de caracteristica j pe mulÛimea tuturor celor T obiecte
supuse analizei. De regul|, în analiza de date, fiecare linie a matricii de observa Ûii X este numit| observa Ûie Õi fiecare coloan |
a acestei matrici este numit| variabil|.

16
În multe situa Ûii, nu pot fi ob Ûinute informa Ûii despre toate caracteristicile tuturor obiectelor supuse analizei. În cazul în care
datele ce definesc obiectele nu sunt complete, matricea de observa Ûii definit| mai sus poart| numele de m atrice de observa Ûii
cu valori om ise.

2.3.2 Matrici de contingenÛ|


Sunt tablouri rectangulare de dimensiune m×n, utilizate pentru reprezentarea datelor referitoare la frecven Ûele relative sau
absolute înregistrate pe o mulÛime de obiecte de valorile a dou | variabile de tip discret, prima variabil|, notat| cu u, având m
valori posibile, iar cea de-a doua variabil|, notat| cu v, având n valori posibile. Liniile unei matrici de contingen Û| reprezint|
valorile posibile ale primei variabile discrete, iar coloanele acestei matrici reprezint| valorile posibile ale celei de-a doua
variabile discrete. În analiza datelor, matricile de contingen Û| se mai numesc Õi matrici de tip "m odalit|Ûi×m odalit|Ûi".
Un element reprezint| frecven Ûa, absolut| sau relativ |, a obiectelor pentru care prima variabil| ia valoarea Õi cea de-a
doua variabil| ia valoarea . Acest element arat| la câte obiecte cele dou | variabile analizate au simultan valorile Õi .

2.3.3 Matrici de proximitate


Sunt matrici p |tratice de dimensiune n×n, utilizate pentru reprezentarea datelor cu privire la similaritatea sau nesimilaritatea
unor obiecte. Ordinul matricilor de proximitate este determinat de num |rul obiectelor supuse studiului.Elementele unei matrici
de proximitate reprezint| coeficien Ûi de similaritate, coeficien Ûi de nesimilaritate sau distan Ûe. Un element din aceast | matrice
m |soar | gradul de proximitate dintre obiectul i Õi obiectul j.
Matricile de proximitate se mai numesc Õi matrici de tip "obiecte×obiecte" Õi sunt utilizate în problemele de clasificare cu
ajutorul tehnicilor de tip cluster Õi în problemele de scalare multidimensional|.

17
Tema 3. Transformarea Õi sumarizarea datelor primare

3.1 Transformarea datelor primare


Sub forma lor iniÛial|, rezultat| din procesul de m |surare pe o scal | corespunz |toare Õi nesupuse nici unui proces de
transformare sau de prelucrare, datele sunt cunoscute sub numele de date primare, date brute sau date originale. În majoritatea
cazurilor, în analizele propriu-zise datele nu sunt folosite sub forma lor primar |, brut |. De obicei, înainte de a fi utilizate, datele
brute sunt supuse la dou | categorii de opera Ûii preliminare: opera Ûii de rafinare Õi opera Ûii de transformare.

3.1.1 Rafinarea datelor


Sunt situa Ûii în care, din diferite motive, este imposibil| utilizarea datelor sub forma lor brut|, primar |. Pentru a putea fi
utilizate, datele primare trebuie s | fie supuse mai întâi unui proces de purificare, de rafinare, care s| le asigure consisten Û|,
relevan Û| Õi comparabilitate.
Necesitatea rafin |rii datelor este determinat| de numero Õi factori, îns | cei mai importan Ûi dintre ace Õtia sunt cei lega Ûi de
existen Ûa datelor omise Õi a datelor necomparabile.
Un exemplu care poate s | sugereze necesitatea Õi utilitatea opera Ûiilor de rafinare este cel reprezentat de necesitatea de a
asigura comparabilitatea unor date privind indicatorii macroeconomici.
Deoarece majoritatea indicatorilor macroeconomici sunt exprima Ûi sub form | valoric |, m |rimea acestora este artificial Õi
puternic influen Ûat| de evolu Ûia pre Ûurilor. Aceast | influen Û| face ca valorile din diferite perioade ale acestor indicatori s | nu
fie comparabile între ele, deoarece influen Ûa perturbatorie a evolu Ûiei pre Ûurilor nu este uniform | de la o perioad | la alta. De
aceea, seriile de timp referitoare la evolu Ûia indicatorilor macroeconomici trebuie supuse unor opera Ûii de cur|Ûire, de rafinare.
Rafinarea datelor include o serie de opera Ûii specifice, dintre care mai frecvent utilizate sunt cele de interpolare, de extrapolare
Õi de ajustare.
3.1.1.1 Interpolarea datelor
Necesitatea interpol|rii datelor apare în leg |tur | cu seriile de timp, în situa Ûiile în care, în datele analizate, exist| observa Ûii
omise. Interpolarea reprezint| una dintre metodele cele mai frecvent utilizate pentru completarea datelor omise.
Prin metoda interpol|rii, completarea unei valori omise se face pe baza utiliz |rii celor dou | valori care o încadreaz |, adic |
a celor dou | valori vecine. Pentru a deduce din cele dou | valori cunoscute valoarea pentru observa Ûia omis |, se pot folosi mai
multe modalit|Ûi de interpolare: liniar |, exponen Ûial| etc.
În cazul interpol|rii liniare valoarea care va înlocui observa Ûia omis | se determin | ca medie aritmetic | a celor dou | valori
care încadreaz | valoarea omis |. Aceast | metod | poate fi aplicat | numai în cazul în care observa Ûiile sunt egal distan Ûate în timp.
O alt| modalitate de interpolare a valorilor omise este aceea a folosirii analizei de regresie. Pentru aceasta se construie Õte
un model de regresie adecvat, în care variabila dependent | este reprezentat| de variabila ale c |rei observa Ûii con Ûin valori omise,
iar variabila independent | este timpul.
Forma modelului se alege în func Ûie de tendin Ûa manifestat| de observa Ûiile variabilei dependente. Pe baza observa Ûiilor
existente cu privire la variabila dependent |, mai pu Ûin cele omise, se estimeaz | parametrii modelului, dup | care, cu ajutorul
modelului Õi a valorilor cunoscute pentru variabila timp, se determin | valorile care vor înlocui observa Ûiile omise.
3.1.1.2 Extrapolarea datelor
Este o alt| metod | de rafinare a datelor, care se folose Õte tot pentru completarea unor valori omise, îns | în cazuri mai
speciale. Spre deosebire de cazul precedent, valorile omise sunt la una din extremit|Ûile seriilor de timp, astfel încât aceste valori
au doar un singur vecin, ceea ce face imposibil| ob Ûinerea valorilor pentru observa Ûiile omise prin interpolare, adic | prin
“medierea” dup | o anumit| regul| a valorilor vecine.
Completarea valorilor omise poate fi f|cut | în acest caz aplicând aceea Õi tehnic | Õi acelea Õi reguli ca mai sus, adic |
utilizând analiza de regresie. Cu ajutorul modelului rezultat în urma estim |rii, pot fi produse valori care s | înlocuiasc |
observa Ûiile omise atât de la începutul, cât Õi de la finalul seriei de timp, prin simpla introducere în model a valorii momentului
de timp ce corespunde observa Ûiilor omise.
3.1.1.3 Ajustarea datelor
Opera Ûiile de ajustare a datelor se aplic | tot în cazul datelor de tipul seriilor de timp, Õi anume în situa Ûiile în care datele
con Ûin o serie de perturba Ûii cunoscute sub numele de zgomote. Cele mai frecvent întâlnite perturba Ûii care influen Ûeaz | datele
sunt perturba Ûiile aleatoare, cunoscute Õi sub numele de zgomot alb.
Opera Ûiile de ajustare au ca scop netezirea seriilor de date, prin eliminarea perturba Ûiilor încorporate în datele seriei de timp,
perturba Ûii care pot fi reprezentate componente accidentale sau ciclice ale evolu Ûiei fenomenelor sau proceselor studiate.
Opera Ûiile de ajustare a seriilor de timp mai sunt cunoscute Õi sub numele de opera Ûii de filtrare a datelor, iar seriile de date
rezultate în urma acestor opera Ûii sunt cunoscute sub numele de trend.

3.1.2 Prelucrarea preliminar| a datelor


A Õa cum am ar |tat anterior, înainte de utilizarea lor în analiza datelor, datele originale sunt supuse unui proces de
transformare, de prelucrare preliminar |.
Dou | dintre cele mai caracteristice opera Ûii pentru acest proces sunt reprezentate de opera Ûia de centrare a datelor
originale Õi de opera Ûia de standardizare a datelor originale.

18
3.1.2.1 Centrarea observaÛiilor
Opera Ûia de centrare a datelor const | în substituirea valorii fiec |rei observa Ûii apar Ûinând unei variabile cu o nou | valoare,
reprezentând abaterea valorii originale fa Û| de media calculat| prin luarea în considerare a observa Ûiilor iniÛiale.
Dac | analiza presupune existen Ûa unui num |r de n variabile Õi a unui num |r de T observa Ûii, atunci opera Ûia de centrare a
observa Ûiilor variabilei const | în calculul noilor observa Ûii, adic | al valorilor centrate, dup | rela Ûia:

,
unde reprezint| media celei de-a i-a variabile.
Datorit | faptului c | suma abaterilor valorilor originale ale observa Ûiilor fa Û| de medie este totdeauna nul |, adic |:

opera Ûia de centrare a valorilor observa Ûiilor efectuate asupra unei caracteristici va face ca variabilele centrate s | aib | media
nul|:

În cazul în care variabilele originale sunt centrate, ca urmare a faptului c | aceste variabile sunt de medie nul|, varian Ûa unei
variabile este propor Ûional| cu p |tratul lungimii vectorului reprezentat de observa Ûiile respectivei variabile, iar abaterea standard
este propor Ûional| cu lungimea aceluia Õi vector.
Dac | v este o variabil| centrat |, atunci cele T observa Ûii ale acesteia, , definesc un punct sau un vector v în
spa Ûiul T-dimensional al observa Ûiilor. Varian Ûa variabilei centrate v este, în acest caz:

Aceasta înseamn | c | varian Ûa variabilei centrate v poate fi scris | în func Ûie de lungimea vectorului v, astfel:
,

unde reprezint| lungimea vectorului v:

.
În mod similar, abaterea standard a variabilei centrate v poate fi scris | în func Ûie de lungimea vectorului v astfel:
.

Dac | v Õi w sunt dou | variabile centrate, atunci covarian Ûa dintre aceste variabile poate fi exprimat | în func Ûie de produsul
scalar al vectorilor v Õi w care reprezint| observa Ûiile celor dou | variabile. Covarian Ûa dintre variabilele centrate v Õi w este dat|
de rela Ûia:

Rezult| c |, în cazul variabilelor centrate v Õi w, covarian Ûa este propor Ûional| cu produsul scalar al vectorilor v Õi w care
reprezint| observa Ûiile celor dou | variabile:
,

unde reprezint| produsul scalar al vectorilor v Õi w.


Coeficien Ûii de corela Ûie de tip Pearson pentru variabile centrate pot fi Õi ei exprima Ûi în aceea Õi manier |. Coeficientul de
corela Ûie dintre variabilele centrate v Õi w este dat de rela Ûia:

Rezult| c |, în cazul variabilelor centrate, coeficientul de corela Ûie dintre dou | variabile este raportul dintre produsul scalar
al vectorilor ce reprezint| observa Ûiile asupra variabilelor Õi produsul lungimilor acestor vectori:

Deoarece raportul dintre produsul scalar a doi vectori Õi produsul lungimilor acestor doi vectori este egal cu cosinusul
unghiului dintre cei doi vectori, rezult| c |:
,
unde reprezint| unghiul format de cei doi vectori v Õi w.

19
3.1.2.2 Standardizarea observaÛiilor
Opera Ûia de standardizare a valorilor unei variabile const| în substituirea valorilor fiec |rei observa Ûii cu o nou | valoare
reprezentând raportul dintre valoarea centrat| a respectivei opera Ûii Õi abaterea standard a respectivei variabile. În condiÛiile
nota Ûiilor utilizate mai înainte, opera Ûia de standardizare a valorilor variabilei presupune calculul noilor valori dup | rela Ûia:

unde reprezint| media celei de-a i-a variabile, iar reprezint| abaterea standard a variabilei , adic | r |d |cina p |trat| a
varian Ûei, calculat| cu ajutorul rela Ûiilor:
• pentru cazul deplasat:

• pentru cazul nedeplasat:

În mod similar cu cazul variabilelor centrate, variabilele standardizate sunt variabile care au media aritmetic | nul|:

În plus fa Û| de aceasta, variabilele standardizate au proprietatea c | varian Ûa lor este egal| cu unitatea:

De asemenea, variabilele standardizate au proprietatea c | au covarian Ûele scalate în intervalul :


.
În cazul în care covarian Ûa are valoarea egal| cu 1, se consider | c | exist| o perfect| asociere liniar | direct| între cele dou |
variabile, iar în cazul în care covarian Ûa are valoarea egal| cu -1 se consider | c | între cele dou | variabile exist| o perfect|
asociere liniar | indirect|. De asemenea, dac | valoarea covarian Ûei este nul|, se consider | c | nu exist| asociere de tip liniar între
cele dou | variabile. O consecin Û| important| a acestei ultime propriet|Ûi este reprezentat| de faptul c |, în cazul variabilelor
standardizate, covarian Ûele sunt chiar coeficien Ûi de corela Ûie Pearson.
Dac | este o variabil| standardizat|, atunci cele T observa Ûii ale acesteia, , definesc un punct sau un vector z
în spa Ûiul T-dimensional al observa Ûiilor. Varian Ûa variabilei standardizate z este, în acest caz:

În aceste condiÛii, varian Ûa variabilei standardizate z poate fi scris | în func Ûie de lungimea vectorului z astfel:
,

unde reprezint| lungimea vectorului z:

.
În mod similar, abaterea standard a variabilei standardizate z poate fi scris | în func Ûie de lungimea vectorului z astfel:
.

Proprietatea variabilelor standardizate de a avea varian Ûa Õi, implicit, abaterea standard egale cu unitatea, eviden Ûiaz |
proprietatea conform c |reia, lungimea vectorului ce reprezint| observa Ûiile unei variabile standardizate este egal| cu ,
adic |:
.
Cele de mai sus arat| c | pentru a normaliza vectorii observa Ûiilor standardizate este suficient a împ |r Ûi fiecare component |
a acestora cu m |rimea , adic |:

Tot în condiÛiile stabilite anterior, covarian Ûa dintre dou | variabile standardizate z Õi w poate fi exprimat | în func Ûie de
vectorii z Õi w care reprezint| observa Ûiile celor dou | variabile. Covarian Ûa dintre variabilele standardizate z Õi w este dat| de
rela Ûia:

20
.

Rezult| c |, în cazul variabilelor standardizate z Õi w, covarian Ûa este propor Ûional| cu produsul scalar al vectorilor z Õi w,
care reprezint| observa Ûiile celor dou | variabile:
,

unde reprezint| produsul scalar al vectorilor z Õi w.


Ôi în cazul variabilelor standardizate, coeficien Ûii de corela Ûie de tip Pearson pot fi exprima Ûi prin intermediul produsului
scalar Õi lungimilor vectorilor corespunz |tori. Astfel, coeficientul de corela Ûie dintre variabilele standardizate z Õi w este dat
de rela Ûia:

Rezult| c |, în cazul variabilelor standardizate, coeficientul de corela Ûie dintre dou | variabile este identic cu covarian Ûa Õi
este propor Ûional cu produsul scalar al vectorilor ce reprezint| observa Ûiile asupra variabilelor:
.

3.2 Sumarizarea datelor primare


De cele mai multe ori, în analiza datelor nu sunt utilizate datele primare, brute, ci date derivate ob Ûinute din transformarea
celor primare. Analiza datelor presupune c | datele de intrare au o anumit| form | specific |, în func Ûie de natura metodelor,
instrumentelor Õi procedurilor de analiz | folosite.
În scopul ob Ûinerii informa Ûiilor sub forma care este necesar | pentru o analiz | a datelor, pe baza datelor primare disponibile
pentru analiz |, se calculeaz | o serie de m |rimi statistice cum ar fi: media, suma de p |trate, varian Ûa, covarian Ûa, corela Ûia etc.
Aceste m |rimi reprezint | esen Ûializ|ri particulare ale datelor primare, caracterizeaz | anumite aspecte ale datelor primare,
reprezentând, în acela Õi timp, elemente de intrare pentru orice analiz | de date. Pe de alt| parte, prin intermediul acestor m |rimi,
o foarte mare varietate de date, nedecelabil| Õi dificil| din punct de vedere al în Ûelegerii Õi interpret|rii semnifica Ûiei pe care
ea o reprezint|, poate fi sintetizat| informa Ûional, rezumat| numeric, sintetizare care este important | Õi util| atât pentru modul
de prezentare a unor date extrem de variate, cât Õi pentru modul de în Ûelegere a semnifica Ûiei reprezentat| de datele respective.
În continuare, vom face o scurt| prezentare a principalelor m |suri specifice sintetiz |rii numerice Õi a principalelor
modalit|Ûi de exprimare a acestora prin intermediul unor m |rimi specifice. De asemenea, vom face Õi o scurt| descriere Õi
prezentare a con Ûinutului acestor m |rimi Õi a modului de calcul al acestora.

3.2.1 M|sura tendinÛei centrale


Una dintre m |surile cele mai importante Õi mai relevante pentru descrierea valorilor unei caracteristici este cea reprezentat|
de tendin Ûa central|.
M |surarea tendin Ûei centrale are ca scop principal determinarea unei m |rimi care s | sintetizeze, s | rezume, multitudinea
de valori reprezentate de observa Ûiile efectuate asupra unor variabile, din punct de vedere al magnitudinii acestora.
Este evident c |, pentru a fi relevant |, m |rimea utilizat| pentru m |surarea tendin Ûei centrale trebuie s | fie un fel de “centru
de greutate” al observa Ûiilor disponibile, valorile observa Ûiilor fiind repartizate în jurul acestei m |rimi.
În figura urm |toare este eviden Ûiat| pozi Ûia posibil| a m |rimii care m |soar | tendin Ûa central|, m |rime notat| cu c.

Figura 3.1: Pozi Ûionarea indicatorului ce m |soar | tendin Ûa central|

Din punct de vedere geometric, determinarea unei m |suri pentru exprimarea tendin Ûei centrale este echivalent | cu a g |si
un vector care s | aib | acela Õi sens Õi aceea Õi direc Ûie cu vectorul ale c |rui componente sunt egale cu unitatea Õi care s | fie cât
mai apropiat de vectorul observa Ûiilor. În acest sens, se poate spune c |, în cazul metricii euclidiene, m |rimea care exprim | în
mod optimal tendin Ûa central| este media aritmetic |.
Tendin Ûa central| poate fi eviden Ûiat| prin intermediul unor indicatori statistici, între care cei mai importan Ûi sunt: media,
mediana Õi modulul. Fiecare dintre ace Õti indicatori exprim |, într-un fel sau altul, mai mult sau mai pu Ûin sugestiv, nivelul
caracteristicii analizate de-a lungul obiectelor.

21
3.2.2 M|sura variabilit|Ûii
O alt| m |sur | important | pentru sintetizarea valorilor unei caracteristici este aceea a variabilit|Ûii ce caracterizeaz |
observa Ûiile variabilei, a împr |Õtierii, a dispersiei acestor valori. Un indicator sintetic, utilizat pentru m |surarea Õi exprimarea
variabilit|Ûii valorilor unei caracteristici, este varian Ûa.
Variabilitatea care caracterizeaz | mulÛimea observa Ûiilor efectuate asupra unei anumite caracteristici este eviden Ûiat| prin
diferen Ûele care exist| între valorile pe care le înregistreaz | caracteristica pe mulÛimea subiec Ûilor, prin m |rimea varia Ûiilor
valorilor caracteristicii de la un subiect la altul.
Variabilitatea este important| atât din punct de vedere informa Ûional, cât Õi ca m |rime în contextul c |reia poate fi judecat|
relevan Ûa mediei. Cu cât variabilitatea unei mulÛimi de observa Ûii este mai mic |, cu atât media constituie o sintetizare, o
rezumare mai potrivit | Õi mai relevant | pentru mul Ûimea de observa Ûii.
Pe de alt| parte, cu cât variabilitatea este mai mare, cu atât mai pu Ûin media poate fi considerat| o expresie sintetic |
relevant | a valorilor observate. Prin urmare, se poate spune c | încrederea mai mare sau mai mic | pe care o putem acorda mediei
ca m |rime ce sintetizeaz | valorile observate depinde de m |rimea variabilit|Ûii acestor valori. Aceasta înseamn | c | pentru a avea
o m |sur | a relevan Ûei mediei este necesar s| se stabileasc | o m |sur | a variabilit|Ûii.
În principiu, o m |sur | a variabilit|Ûii valorilor unei caracteristici s-ar putea deduce prin luarea în considerare a varia Ûiilor
succesive, de la un individ la altul, înregistrate de valorile acestei caracteristici. O astfel de construc Ûie nu ar fi îns | consistent |
Õi m |sura rezultat| în urma acestei construc Ûii nu ar fi relevant|, din cauza faptului c | varia Ûiile succesive ale valorilor
caracteristicii pe mulÛimea indivizilor analiza Ûi nu ar avea comparabilitate, ele fiind determinate, de fiecare dat|, în raport cu
un reper variabil.
Varian Ûa este direct propor Ûional| cu m |rimea varia Ûiei valorilor caracteristicii m |surate sau cu m |rimea informa Ûiei care
este con Ûinut| de observa Ûiile disponibile pentru analiza de date. În condiÛiile nota Ûiilor anterioare, varian Ûa variabilei , notat|

cu , se determin | cu ajutorul formulei urm |toare:

În mod concret, varian Ûa reprezint| suma p |tratelor abaterilor valorilor individuale în raport cu media ce revine, în medie,
pe fiecare valoare individual|, adic | pe fiecare observa Ûie efectuat| asupra variabilei.
Ca rezultat al faptului c | variabilitatea poate exista sau nu poate exista, varian Ûa, ca m |sur | a acestei variabilit |Ûi, este
totdeauna o m |rime nenegativ |. Acesta este Õi unul din motivele pentru care varian Ûa poate fi considerat| ca o m |sur |
informa Ûional|, ca o m |sur | a cantit|Ûii de informa Ûie con Ûinut | în observa Ûiile disponibile.
Pornind de la modul în care varian Ûa m |soar | variabilitatea Õi de la importan Ûa pe care o are aceast| variabilitate în analiza
datelor, se poate face afirma Ûia c |, într-un anumit sens, varian Ûa reprezint| o m |sur | a informa Ûiei con Ûinute în datele analizate.
Aceast | proprietate remarcabil| a varian Ûei poate fi foarte simplu intuit | dac | ne gândim c | o mulÛime de date cu variabilitate
nul|, pentru care, implicit, varian Ûa este egal| cu zero, nu spune nimic din punct de vedere statistic, nu explic | nimic din ceea
ce se întâmpl| cu fenomenul la care se refer |. De fapt, în acest caz, deoarece toate observa Ûiile sunt egale, exist| o redundan Û|
informa Ûional| maxim |, toate observa Ûiile reprezentând, în fond, aceea Õi informa Ûie.
Pe de alt| parte, o mare variabilitate a datelor este semnul faptului c | fiecare observa Ûie este purt|toarea unei informa Ûii
specifice, diferit| de informa Ûia con Ûinut| în celelalte observa Ûii. Cu cât variabilitatea este mai mare, cu atât observa Ûiile difer |
mai mult între ele Õi fiecare din ele eviden Ûiaz | o informa Ûie cu relevan Û| mai mare, explicând într-o m |sur | din ce în ce mai
mare natura fenomenului analizat Õi modul de miÕcare a acestuia.
O deficien Û| major | a varian Ûei, ca indicator de m |surare a variabilit|Ûii, a cantit|Ûii de informa Ûie con Ûinut| în datele
primare, este legat| de faptul c | varian Ûele a dou | caracteristici sau a dou | variabile exprimate în unit|Ûi de m |sur | diferite nu
pot fi comparate. Compara Ûia varian Ûelor este, totuÕi, posibil| numai în cazul în care m |sur |torile caracteristicilor sunt exprimate
în acelea Õi unit|Ûi de m |sur |.
Tot în acest sens, exist| Õi o alt| deficien Û| important | a varian Ûei: aceea c | ea este o m |rime nescalat|. Cu toate c |
m |rimea varian Ûei este limitat| inferior, ea având o margine inferioar | reprezentat| de valoarea zero Õi eviden Ûiind lipsa
variabilit|Ûii sau constan Û|, ea nu este limitat| superior, nu are o margine superioar |:
.
Din acest motiv, apar dificult|Ûi legate de interpretarea magnitudinii varian Ûei Õi de utilizarea acesteia pentru efectuare de
compara Ûii.
O alt| problem | dificil|, care apare în leg |tur | cu varian Ûa, este aceea c | unit|Ûile de m |sur | în care aceasta este exprimat |
sunt diferite de unit|Ûile de m |sur | ale caracteristicii a c |rei variabilitate o m |soar |.
De fapt, varian Ûa este m |surat| în unit|Ûi de m |sur | care reprezint| p |trate ale unit|Ûilor de m |sur | ale observa Ûiilor
efectuate asupra caracteristicii considerate. Aceast | tr |s |tur | a varian Ûei creaz | o serie de dificult|Ûi legate de interpretarea
concret| a m |rimii acestui indicator al varia Ûiei.
Datorit | lipsei de semnifica Ûie a unit|Ûilor de m |sur | ale varian Ûei, pentru m |surarea varia Ûiei se utilizeaz | Õi un alt
indicator, derivat din varian Û| Õi reprezentat de r |d |cina p |trat| a varian Ûei. Acest indicator este cunoscut sub numele de abatere
standard Õi se calculeaz | cu ajutorul rela Ûiei:

22
.

Spre deosebire de varian Û|, exprimat | în unit|Ûi de m |sur | nefire Õti, nenaturale, abaterea standard este exprimat | în acelea Õi
unit|Ûi de m |sur | ca Õi observa Ûiile efectuate asupra caracteristicii.

3.2.3 M|sura leg|turii de tip liniar


Intensitatea Õi sensul leg |turii sau asocierii de tip liniar dintre dou | caracteristici ale unor obiecte sau indivizi reprezint|
o alt| m |sur | important | utilizabil| în sintetizarea numeric | a datelor.
M |sura asocierii de tip liniar poate fi exprimat | prin intermediul corel|rii varia Ûiilor simultane sau covaria Ûiilor a dou |
caracteristici pe o mulÛime de obiecte sau indivizi. Aceast | m |sur | eviden Ûiaz | cum se coreleaz |, cum se asociaz | valorile a
dou | caracteristici la nivelul unei mulÛimi de indivizi care posed | aceste caracteristici. M |rimea de baz | utilizat| pentru
exprimarea varia Ûiilor simultane a dou | caracteristici este reprezentat| de indicatorul cunoscut sub numele de covarian Û|. Pentru
cazul a dou | variabile Õi , covarian Ûa acestora se calculeaz | cu ajutorul formulei:

care, în cazul în care cele dou | variabile coincid, adic | , covarian Ûa coincide cu varian Ûa:

Covarian Ûa este o m |sur | a varia Ûiei simultane a dou | variabile, ea fiind, în valoare absolut |, cu atât mai mare cu cât valorile
absolute ale varia Ûiilor celor dou | variabile în jurul mediei sunt mai apropiate ca magnitudine, eviden Ûiind o anumit| propor-
Ûionalitate pe mulÛimea subiec Ûilor studia Ûi. Covarian Ûa este considerat| a fi o expresie numeric | a gradului de asociere a dou |
caracteristici ca urmare a faptului c |, în toate cazurile în care dou | variabile sunt semnificativ legate între ele, o varia Ûie într-un
sens a uneia dintre ele va determina o varia Ûie propor Ûional| de acela Õi sens (în cazul leg |turii directe) sau de sens contrar (în
cazul leg |turii inverse) a celeilalte variabile.
În mod similar cu varian Ûa, Õi în cazul exprim |rii covarian Ûei apare problema unor unit|Ûi de m |sur | nefire Õti, nenaturale.
Dup | modul în care este definit|, covarian Ûa este exprimat | în unit|Ûi de m |sur | care sunt de fapt produs al unit|Ûilor de m |sur |
ale caracteristicilor considerate. Ca Õi în cazul varian Ûei, exist| o dificultate Õi mai mare în leg |tur | cu m |sura numit| covarian Û|.
Aceasta const| în faptul c | ea este o m |rime nescalat|. De Õi, în valoare absolut|, covarian Ûa are o margine inferioar |,
reprezentat| de valoarea zero Õi care eviden Ûiaz | lipsa asocierii de tip liniar, ea nu este limitatat| superior, nu are o margine
superioar |:
.
Ca urmare a acestei propriet|Ûi, apar dificult|Ûi legate de interpretarea magnitudinii covarian Ûei Õi de utilizarea acesteia
pentru efectuare de compara Ûii.
O m |sur | scalat| a gradului de asociere liniar | între dou | variabile, care elimin | unele deficien Ûe ale covarian Ûei ca
indicator de m |surare a asocierii de tip liniar, o reprezint| coeficientul de corela Ûie Pearson. Pentru cazul a T observa Ûii
existente cu privire la dou | variabile , coeficientul de corela Ûie Pearson este dat de rela Ûia:

Spre deosebire de covarian Û|, coeficientul de corela Ûie este o m |rime scalat| în intervalul închis :
.
O valoare nul| a coeficientului de corela Ûie eviden Ûiaz | absen Ûa leg |turii de tip liniar între cele dou | variabile, dup | cum
o valoare absolut| egal| cu unitatea eviden Ûiaz | o leg |tur | liniar | perfect|, leg |tur | care este direct| dac | valoarea este egal|
cu 1 Õi invers | dac | valoarea este egal| cu -1.

3.2.4 M|suri generalizate ale variabilit|Ûii


A Õa cum am v |zut mai înainte, în accep Ûiunea sa comun |, varian Ûa reprezint| o m |sur | a variabilit|Ûii individuale, la nivelul
fiec |rei caracteristici. Fiecare din aceste varian Ûe individuale reprezint| o m |sur | a unei p |r Ûi din variabilitatea ce caracterizeaz |
observa Ûiile variabilelor analizate, oferind doar o imagine par Ûial| a variabilit|Ûi con Ûinute în aceste observa Ûii.
În mod corespunz |tor, mulÛimea valorilor varian Ûelor tuturor variabilelor supuse analizei, constituie o imagine mai
cuprinz |toare a variabilit|Ûii con Ûinut| în observa Ûiile respectivelor variabile. Din nefericire îns |, în acest caz, exprimarea
variabilit|Ûii nu este sintetizat|, cum ar fi de dorit, prin intermediul unui singur indicator, ci prin intermediul unei întregi mulÛimi
de indicatori.
Una dintre posibilit|Ûile de a da un r |spuns corespunz |tor problemei rezultate din necesitatea de a exprima cât mai adecvat

23
Õi mai sintetic variabilitatea con Ûinut| în observa Ûiile variabilelor analizate const| în definirea altor doi indicatori ai varian Ûei:
varian Ûa total| Õi varian Ûa generalizat|.

3.2.4.1 VarianÛa total|


Am ar |tat anterior c | m |surarea variabilit|Ûii este o problem | dificil| Õi c | utilizarea varian Ûei simple pentru sintetizarea
acesteia nu este satisf|c |toare. O modalitate de a elimina acest neajuns o reprezint| deducerea unei m |suri globale, unice, pentru
variabilitatea ce caracterizeaz | observa Ûiile variabilelor studiate.
O astfel de m |sur | a variabilit|Ûii este varian Ûa total|, care este unul dintre indicatorii importan Ûi în analiza datelor, utilizat
în numeroase proceduri de analiz | a datelor.
DefiniÛie: Varian Ûa total| m |soar | variabilitatea ce caracterizeaz | observa Ûiile unei mulÛimi de variabile Õi se define Õte
ca sum | a varian Ûelor individuale ale variabilelor:

Cu toate c | varian Ûa total| ofer | o imagine cuprinz |toare asupra variabilit|Ûii globale ce caracterizeaz | observa Ûiile
variabilelor analizate, ea m |soar | aceast| variabilitate doar în sens individual, neluând în considerare variabilitatea comun |,
simultan | a observa Ûiilor, adic | variabilitatea interac Ûiunilor.
O m |sur | interesant| a variabilit|Ûii totale, care Ûine seama atât de variabilitatea individual|, cât Õi de variabilitatea rezultat|
din interac Ûiuni, este reprezentat| de varian Ûa generalizat|.

3.2.4.2 VarianÛa generalizat|


O extindere important | a conceptului de m |sur | a variabilit|Ûii o reprezint| varian Ûa generalizat| care m |soar |
variabilitatea ce caracterizeaz | observa Ûiile mulÛimii de variabile, atât din punct de vedere individual, cât Õi din punct de vedere
al simultaneit|Ûii, al interactivit|Ûii informa Ûionale ce caracterizeaz | variabilele.
Pentru a da o interpretare intuitiv | varian Ûei generalizate, vom porni de la o construc Ûie geometric |. În acest scop, vom
considera c | variabilele Õi reprezint| doi vectori în spa Ûiul observa Ûiilor.
Exist| o strâns | leg |tur | între m |rimea unghiului format de cei doi vectori Õi corela Ûia dintre cele dou | variabile. Aceasta
const | în faptul c |, de fapt, coeficientul de corela Ûie este cosinusul unghiului dintre vectorii ce reprezint| cele dou | variabile.
Într-adev |r, dac | unghiul dintre cei doi vectori este zero, adic | vectorii se suprapun, leg |tura perfect| existent | în aceast |
situa Ûie este eviden Ûiat| atât printr-o valoare a coeficientului de corela Ûie egal| cu unitatea, cât Õi prin valoarea unitar | a
cosinusului unghiului respectiv. Invers, dac | unghiul dintre vectori este de 90 de grade, adic | vectorii sunt ortogonali, inexisten Ûa
leg |turii specifice acestei situa Ûii este eviden Ûiat| prin faptul c | atât coeficientul de corela Ûie, cât Õi cosinusul unghiului respectiv
sunt egale cu zero. Cele trei situa Ûii de corelare posibil| a dou | variabile Õi , ale c |ror observa Ûii sunt reprezentate prin
intermediul vectorilor , sunt eviden Ûiate în graficele din figura 3.2.

Figura 3.2: Situa Ûii posibile de corelare a dou | variabile reprezentate prin
intermediul vectorilor
Vom presupune c | unghiul format de cei doi vectori este n Õi c | cei doi vectori sunt scala Ûi prin înmulÛirea cu m |rimea
, adic | cei doi vectori scala Ûi au componentele de forma:

Lungimea unui astfel de vector va fi:

unde reprezint| cea de-a t-a observa Ûie efectuat| asupra variabilei x.
Dac | variabilele Õi sunt variabile centrate, adic | de medie nul|, atunci p |tratul lungimii vectorilor Õi
reprezint| chiar varian Ûele celor dou | variabile:

24
.

În cazul lipsei de corela Ûie, eviden Ûiat| prin ortogonalitatea celor doi vectori, aria paralelogramului este maxim |. Aceasta
corespunde unei situa Ûii în care redundan Ûa informa Ûional| aferent| observa Ûiilor efectuate asupra celor dou | variabile este nul|.
În cazul în care corela Ûia este perfect|, adic | cei doi vectori sunt coliniari, aria paralelogramului este minim |. În aceast | situa Ûie
redundan Ûa informa Ûional| corespunz |toare observa Ûiilor efectuate asupra celor dou | variabile, este maxim |. În figura 3.3, este
reprezentat| aria paralelogramului având ca laturi vectorii ce definesc cele dou | variabile analizate.

Figura 3.3: Interpretarea redundan Ûei informa Ûionale prin intermediul ariei
paralelogramului
Din punct de vedere al analizei datelor, situa Ûia de redundan Û| minim | este ideal|, aceasta eviden Ûiind faptul c | între cele
dou | variabile men Ûionate nu exist| nici o suprapunere informa Ûional|. În aceast | situa Ûie, variabilitatea indus | de cele dou |
variabile este maxim |, ceea ce din punct de vedere geometric este echivalent cu faptul c | vectorii sunt ortogonali, respectiv c |
aria paralelogramului este maxim |. Pe de alt| parte, situa Ûia de redundan Û| maxim | este cea mai pu Ûin dorit |, aceasta însemnând
c | cele dou | variabile reprezint| unul Õi acela Õi lucru din punct de vedere informa Ûional. În acest caz, variabilitatea
corespunz |toare celor dou | variabile este minim | Õi este eviden Ûiat| de coliniaritatea vectorilor ce reprezint| cele dou | variabile,
adic | de faptul c | aria paralelogramului este nul|.
În afar | de pozi Ûia pe care o au cei doi vectori unul fa Û| de altul, aria paralelogramului depinde Õi de lungimea fiec |ruia
dintre vectori, fiind cu atât mai mare, cu cât lungimea celor doi vectori este mai mare.
Deoarece p |tratul lungimii fiec |ruia din cei doi vectori este chiar varian Ûa corespunz |toare variabilei pe care
acesta o reprezint|, este evident c | aria paralelogramului este Õi m |sur | a varian Ûei variabilelor standardizate.
Cele men Ûionate anterior eviden Ûiaz | un fapt de o însemn |tate excep Ûional| pentru problematica m |sur |rii variabilit|Ûii
individuale Õi comune ce caracterizeaz | observa Ûiile unei mulÛimi de variabile: aria paralelogramului poate fi folosit| ca m |sur |
comun | atât pentru variabilitatea individual|, exprimat| prin intermediul varian Ûelor variabilelor, cât Õi pentru variabilitatea
comun |, exprimat| prin intermediul covarian Ûelor dintre aceste variabile.
Cele dou | situa Ûii men Ûionate eviden Ûiaz | faptul c | aria paralelogramului determinat de cei doi vectori poate fi utilizat|
pentru determinarea unei m |suri a redundan Ûei inform a Ûionale Õi a variabilit|Ûii generale ce caracterizeaz | observa Ûiile
variabilelor. O astfel de m |sur | este reprezentat| de p |tratul ariei paralelogramului ce corespunde celor doi vectori Õi este
cunoscut| sub numele de varian Û| generalizat|.

Deoarece baza paralelogramului este reprezentat| de lungimea vectorului , adic | de m |rimea , iar

în |lÛimea paralelogramului este dat| de rela Ûia:


,

aria paralelogramului va fi:


.

În cazul în care exist| un num |r de n variabile, varian Ûa generalizat| corespunz |toare acestora este chiar p |tratrul volumului
hiperparalelipipedului format de cei n vectori în spa Ûiul observa Ûiilor.
Din cele ar |tate mai sus rezult| c |, în sens geometric, varian Ûa generalizat| poate fi definit| sub forma urm |toare:
DefiniÛie: Varian Ûa generalizat| corespunz |toare spa Ûiului observa Ûiilor celor dou | variabile considerate este dat| de
rela Ûia:

Se poate ar |ta c | varian Ûa generalizat| este reprezentat| de determinantul matricii de covarian Û| ce corespunde variabilelor
supuse studiului, respectiv:
.
Varian Ûa generalizat| este o m |sur | extrem de important| a variabilit|Ûii totale, format| atât ca urmare a variabilit|Ûii

25
individuale ce caracterizeaz | variabilele, cât Õi ca urmare a variabilit|Ûii comune ce caracterizeaz | interac Ûiunea variabilelor.

3.3 Matrici utilizate în analiza multidimensional| a datelor


În urma efectu |rii unor opera Ûii preliminare asupra datelor primare, reprezentate prin intermediul matricii de observa Ûii X:

rezult| urm |toarele trei tipuri de matrici foarte importante în analiza datelor:
• matricea observa Ûiilor centrate;
• matricea observa Ûiilor standardizate;
• matricea produselor încruci Õate,
pe care le vom defini în continuare.

3.3.1 Matricea observaÛiilor centrate


Matricea observa Ûiilor centrate poate fi ob Ûinut| ca diferen Û| între matricea de observa Ûii Õi matricea ale c |rei coloane
sunt mediile celor n variabile:

3.3.2 Matricea observaÛiilor standardizate


Matricea observa Ûiilor standardizate poate fi ob Ûinut| ca produs între matricea variabilelor centrate Õi inversa matricii
diagonale V, ale c |rei elemente sunt abaterile standard ale celor n variabile:

3.3.3 Matricea produselor încruciÕate


Matricea produselor încruci Õate poate fi determinat| atât pentru variabilele originale, cât Õi pentru variabilele centrate Õi
standardizate. Pentru cazul variabilelor originale, matricea produselor încruciÕate se ob Ûine ca produs între transpusa matricii
X Õi matricea X:

Utilizând scrierea bazat| pe lungimile vectorilor de observa Ûii Õi pe produsele scalare ale acestora, matricea produselor
încruciÕate pentru situa Ûia în care variabilele sunt sub forma original| poate fi scris | sub forma:

unde este vectorul observa Ûiilor variabilei .


În cazul în care variabilele sunt centrate, matricea produselor încruciÕate poate fi determinat| astfel:

26
.

Folosind lungimile vectorilor de observa Ûii centrate Õi produsele scalare ale acestora, matricea produselor încruciÕate pentru
situa Ûia în care variabilele sunt centrate poate fi scris | sub forma:

3.3.4 Matricea de covarianÛ|


Matricea de covarian Û| constituie una dintre cele mai frecvent utilizate matrici în analiza datelor, majoritatea tehnicilor de
analiz | a datelor presupunând calculul acestei matrici. Pentru situa Ûia în care num |rul de variabile analizate este egal cu n,
covarian Ûele dintre orice dou | variabile pot fi aranjate sub forma unei matrici p |trate Õi simetrice, de dimensiune , numit|
m atrice de covarian Û|:

, unde .

În condiÛiile nota Ûiilor anterioare, matricea de covarian Û| pentru variabilele originale poate fi scris | cu ajutorul matricii
produselor încruciÕate pentru cazul variabilelor centrate, sub forma:

3.3.5 Matricea de corelaÛie


Matricea de corela Ûie este o alt| matrice important | în contextul multor metode Õi tehnici de analiz | a datelor. Matricea
de corela Ûie este o matrice important | în analiza datelor, în primul rând, pentru faptul c | o serie de metode Õi tehnici ale analizei
datelor îÕi bazeaz | procedurile pe analiza spectral| a acestei matrici.
În mod similar cu matricea de covarian Û|, se define Õte matricea de corela Ûie corespunz |toare celor n variabile originale,
care este o matrice simetric | având urm |toarea form |:

, unde .

Matricea de corela Ûie a variabilelor originale poate fi scris | cu ajutorul matricii produselor încruciÕate pentru cazul
variabilelor standardizate, astfel:

27
Tema 4. SpaÛii Õi distanÛe utilizate în analiza datelor

Interpretarea geometric | a obiectelor Õi variabilelor ca puncte din spa Ûii cu mai multe dimensiuni Õi, în mod implicit, ca
vectori din aceste spa Ûii este foarte util| pentru în Ûelegerea unor metode Õi tehnici de analiz | a datelor Õi pentru simplificarea
interpret|rii unor rezultate ob Ûinute în urma analizei.

4.1 Reprezentarea geometric| a observaÛiilor Õi variabilelor


În func Ûie de elementele care fac obiectul reprezent |rii, obiecte sau observa Ûii, respectiv variabile, în analiza datelor sunt
definite dou | tipuri de spa Ûii: spa Ûiul variabilelor Õi spa Ûiul observa Ûiilor. Aceste dou | spa Ûii au un rol fundamental în numeroase
ra Ûionamente Õi în definirea multor tehnici de analiz | multidimensional| a datelor. În fiecare din cele dou | spa Ûii sunt definite,
în principal, dou | opera Ûii importante: determinarea gradului de apropiere dintre punctele spa Ûiului Õi determinarea gradului
de asociere dintre punctele spa Ûiului.

4.1.1 SpaÛiul variabilelor


Obiectele sau observa Ûiile disponibile într-o analiz | de date pot fi privite ca puncte sau ca vectori dintr-un spa Ûiu ale c |rui
dimensiuni sunt reprezentate de variabilele ce caracterizeaz | obiectele. Într-o astfel de reprezentare, axele spa Ûiului corespund
variabilelor, iar valorile înregistrate de obiecte la fiecare din variabilele analizate sunt proiec Ûii ale punctelor reprezentate de
observa Ûii pe axele spa Ûiului.
Spa Ûiul în care sunt reprezentate observa Ûiile sau obiectele analizate este cunoscut în analiza datelor sub numele de spa Ûiul
variabilelor. Dac | num |rul de observa Ûii dintr-o analiz | de date este T, iar num |rul de variabile este n, cele T observa Ûii pot
fi privite ca puncte din spa Ûiul real n-dimensional.
DefiniÛie: Se nume Õte spa Ûiul variabilelor, spa Ûiul real n-dimensional în care sunt reprezentate obiectele supuse
analizei Õi ale c |rui axe sunt reprezentate de variabilele analizate.
În spa Ûiul variabilelor, un obiect, de exemplu cel de-al i-lea, este reprezentat prin intermediul vectorului n-dimensional:

Într-un astfel de spa Ûiu, pot fi determinate distan Ûele dintre obiecte, poate fi eviden Ûiat| Õi m |surat| variabilitatea obiectelor
de-a lungul axelor, pot fi determinate Õi m |surate eventuale leg |turi între obiecte etc.
Reprezentarea obiectelor în spa Ûiul variabilelor este foarte util| Õi sugestiv | pentru în Ûelegerea tehnicilor de analiz | a
discriminantului Õi de analiz | cluster, metodelor Õi tehnicilor de analiz | a leg |turilor etc.
Figura urm |toare con Ûine reprezentarea grafic | a celor dou | obiecte în spa Ûiul variabilelor, ale c |rui axe sunt reprezentate
de caracteristicile obiectelor.

Figura 4.1: Reprezentarea obiectelor în spa Ûiul variabilelor

În spa Ûiul variabilelor, obiectele analizate sunt reprezentate sub forma unui nor de puncte, centrul de greutate al norului
de puncte fiind chiar punctul care reprezint| mediile caracteristicilor obiectelor, punct care se nume Õte centroid al obiectelor.
DefiniÛie: Se nume Õte centroid în spa Ûiul variabilelor punctul ale c |rui coordonate sunt reprezentate de mediile celor
n variabile analizate, adic | punctul .

Cele n coordonate ale centrului de greutate sau ale centroidului obiectelor în spa Ûiul variabilelor sunt date de rela Ûiile
urm |toare:

28
,

unde reprezint| coordonata celui de-al t-lea obiect în raport cu cea de-a j-a ax | a spa Ûiului variabilelor.
Dac | obiectele din spa Ûiul variabilelor sunt privite ca vectori din acest spa Ûiu, atunci cosinusul unghiului dintre doi vectori
ce definesc dou | obiecte reprezint| m |sura leg |turii liniare ce exist| între cele dou | obiecte.
Ceea ce are importan Û| pentru caracterizarea obiectelor este poziÛia pe care fiecare obiect o are în spa Ûiul variabilelor,
poziÛie atât în raport cu axele spa Ûiului, cât Õi în raport cu alte obiecte.
Cea mai important | opera Ûie în spa Ûiul variabilelor este aceea a determin |rii gradului de apropiere sau de dep |rtare dintre
obiecte, astfel încât, m |rimea cea mai relevant | pentru caracterizarea obiectelor reprezentate în spa Ûiul variabilelor este distan Ûa.
Definirea Õi evaluarea distan Ûei în spa Ûiul variabilelor sunt posibile numai în condiÛiile în care pe spa Ûiul respectiv este
definit| o anumit| metric |.
Conceptul care st| la baza definirii unei metrici într-un anumit spa Ûiu este produsul scalar. În cazul spa Ûiului real n-
dimensional , produsul scalar dintre doi vectori x Õi y este num |rul real definit astfel:
.
Cu ajutorul produsului scalar poate fi definit| lungimea unui vector din spa Ûiul n-dimensional :

,
Õi distan Ûa euclidian | dintre doi vectori din spa Ûiul n-dimensional , respectiv:
.
Metrica în spa Ûiul variabilelor este introdus | prin intermediul distan Ûei euclidiene, în conformitate cu care, distan Ûa dintre
dou | obiecte este dat| de r |d |cina p |trat| a sumei p |tratelor diferen Ûelor coordonatelor celor dou | obiecte:
.
Analiza varian Ûei obiectelor de-a lungul axelor este extrem de important | deoarece, în cazul în care de-a lungul unei axe,
varian Ûa este nesemnificativ | în raport cu varian Ûele obiectelor în raport cu celelalte axe, se poate renun Ûa la acest | ax |,
considerându-se c | variabila ce reprezint| respectiva ax | nu are o semnifica Ûie relevant | în definirea obiectelor. Aceasta este
de fapt ideea central| care st | la baza tehnicilor de simplificare Õi de reducere a dependen Ûelor cauzale.

4.1.2 SpaÛiul observaÛiilor


În numeroase situa Ûii concrete, apare necesitatea analizei variabilelor ce definesc obiectele, analizei leg |turilor care exist|
între acestea sau a modului în care variabilele se asociaz |, astfel încât, analizele vizeaz | nu obiectele ca atare, ci caracteristicile
acestora, variabilele. Analizele de acest fel se afl| într-un anumit raport de dualitate cu analizele care se fac în spa Ûiul
variabilelor Õi presupun definirea unui spa Ûiu adecvat acestei situa Ûii: spa Ûiul observa Ûiilor.
În mod similar cu cazul obiectelor, variabilele implicate într-o analiz | de date pot fi reprezentate ca puncte sau ca vectori
într-un spa Ûiu ale c |rui dimensiuni sunt reprezentate de obiectele supuse analizei. Axele spa Ûiului în care sunt reprezentate
variabilele corespund observa Ûiilor sau obiectelor analizate.
Coordonatele variabilelor în spa Ûiul observa Ûiilor sunt valorile înregistrate de variabile la nivelul fiec |rui obiect, adic |
proiec Ûii ale punctelor reprezentate de variabile pe axele acestui spa Ûiu.
Spa Ûiul în care sunt reprezentate variabilele analizate este cunoscut în analiza datelor sub numele de spa Ûiul observa Ûiilor.
În cazul în care num |rul de variabile supuse analizei este n, iar num |rul de observa Ûii din aceast | analiz | este T, cele n variabile
pot fi privite ca puncte sau vectori din spa Ûiul real T-dimensional.
DefiniÛie: Se nume Õte spa Ûiul observa Ûiilor, spa Ûiul real T-dimensional , în care sunt reprezentate variabilele supuse
analizei Õi ale c |rui axe sunt reprezentate de observa Ûiile sau obiectele analizate.
În spa Ûiul observa Ûiilor, o variabil|, de exemplu cea de-a j-a, este reprezentat| prin intermediul vectorului T-dimensional:

În spa Ûiul observa Ûiilor, pot fi determinate Õi m |surate leg |turile de tip liniar dintre variabile, poate fi stabilit modul în care
variabilele sau caracteristicile obiectelor se asociaz |, pot fi stabilite distan Ûe între variabile etc. Ca Õi în cazul reprezent |rii
obiectelor în spa Ûiul variabilelor, reprezentarea variabilelor în spa Ûiul observa Ûiilor este util| în numeroase analize de tip
multidimensional, între cele dou | tipuri de reprezentare fiind o leg |tur | de tip dual.
Variabilele analizate reprezint| în spa Ûiul observa Ûiilor un nor de puncte, al c |rui centru de greutate este numit centroid
al variabilelor.

29
DefiniÛie: Se nume Õte centroid în spa Ûiul observa Ûiilor punctul ale c |rui coordonate sunt reprezentate de mediile celor
T observa Ûii analizate, adic | punctul .

Cele T coordonate ale centroidului variabilelor în spa Ûiul observa Ûiilor sunt date de rela Ûiile:

unde reprezint| valoarea medie înregistrat| de cele n variabile la cel de-al t-lea obiect. Reprezentarea variabilelor în spa Ûiul
observa Ûiilor Õi a centroidului acestora sunt eviden Ûiate în figura urm |toare.

Figura 4.2: Reprezentarea variabilelor în spa Ûiul observa Ûiilor

Ca Õi în cazul spa Ûiului variabilelor, definirea produsului scalar în spa Ûiul observa Ûiilor permite definirea conceptului de
distan Û| euclidian | între dou | variabile. De Õi aceast| distan Û| nu are relevan Ûa pe care o are în cazul obiectelor, exist| situa Ûii
în care m |surarea distan Ûei dintre variabile are o importan Û| practic |. Distan Ûa euclidian | dintre variabilele în spa Ûiul
observa Ûiilor este:
.

4.2 DistanÛa în analiza datelor


În orice proces de analiz | a datelor apare o foarte important| problem | de natur | metodologic |: m |surarea distan Ûei dintre
dou | obiecte sau indivizi. Alegerea modalit |Ûii de exprimare a distan Ûei dintre obiecte este anterioar | analizelor efective Õi
influen Ûeaz | în mod direct Õi sensibil calitatea rezultatelor ob Ûinute. Din aceste motive, consider |m c | este foarte util| definirea
conceptului de distan Û| Õi eviden Ûierea modalit|Ûilor care sunt cele mai potrivite pentru exprimarea acesteia.
Distan Ûa reprezint| unul dintre cele mai importante Õi mai frecvent utilizate concepte din domeniul analizei datelor. În
acela Õi timp, distan Ûa constituie una dintre cele mai relevante modalit|Ûi de sumarizare a informa Ûiilor manipulate în analiza
datelor, mai ales în situa Ûiile în care sunt investigate interdependen Ûele dintre fenomene Õi procese. Ca m |rime, distan Ûa se
calculeaz | pentru a evalua apropierea sau dep |rtarea dintre obiectele sau caracteristicile care se supun studiului, pentru a m |sura
gradul de similitudine sau nesimilitudine dintre acestea, din punct de vedere al caracteristicilor studiate.
Definirea Õi interpretarea conceptului de distan Û| presupune, în mod implicit, existen Ûa unui spa Ûiu în raport cu care are loc
nu numai definirea, ci Õi evaluarea numeric | a distan Ûei. Spa Ûiul în care este posibil a fi definit| o distan Û| se nume Õte spa Ûiu
metric Õi poate fi spa Ûiul variabilelor sau spa Ûiul observa Ûiilor.
Corespunz |tor celor dou | modalit|Ûi de reprezentare, în spa Ûiul variabilelor Õi în spa Ûiul observa Ûiilor, distan Ûa poate fi
utilizat| pentru a evalua apropierea sau dep |rtarea dintre puncte ale unui spa Ûiu multidimensional, puncte ce pot reprezenta atât
obiecte, cât Õi caracteristici.
DefiniÛie: Func Ûia real| se nume Õte distan Û| dac |, fiind date punctele , verific |
urm |toarele propriet|Ûi:
a. este nenegativ |:
b. este simetric |:
c. verific | inegalitatea triunghiului:
În func Ûie de modul în care distan Ûa este evaluat|, adic | în func Ûie de modul în care se evalueaz | gradul de dep |rtare sau
apropiere dintre dou | obiecte, exist| mai multe tipuri importante de distan Ûe: distan Ûa euclidian |, distan Ûa statistic |, distan Ûa
standadizat|, distan Ûa Mahalanobis etc.

4.2.1 DistanÛa euclidian|


Cea mai cunoscut | distan Û| utilizat| pentru a m |sura dep |rtarea sau apropierea unor puncte dintr-un spa Ûiu
multidimensional este distan Ûa în linie dreapt|, cunoscut| sub numele de distan Û| euclidian |.

30
DefiniÛie: Se nume Õte distan Û| euclidian | între dou | puncte x Õi y din spa Ûiul n-dimensional , func Ûia real| definit|
astfel:

unde reprezint| cea de-a i-a coordonat| a punctelor x, respectiv y.

Pentru a ilustra geometric distan Ûa euclidian |, vom considera cazul unui spa Ûiu bidimensional , presupunând c | cele dou |
puncte x Õi y sunt reprezentate de vectorii x Õi y din figura urm |toare.

Figura 4.3: Distan Ûa euclidian | dintre dou | puncte x Õi y

Dup | cum se poate observa, în conformitate cu teorema lui Pitagora, lungimea segmentului ce une Õte punctele x Õi y, adic |
distan Ûa dintre cele dou | puncte este:
.
Rezult| c | distan Ûa euclidian | dintre dou | puncte este num |rul nenegativ reprezentat de r |d |cina p |trat| a sumei p |tratelor
diferen Ûelor coordonatelor omoloage ale respectivelor puncte. Altfel spus, p |tratul distan Ûei euclidiene dintre dou | puncte este
egal cu suma p |tratelor diferen Ûelor dintre coordonatele omoloage ale celor dou | puncte.

4.2.2 DistanÛa euclidian| ponderat|


Din cauza specificit|Ûii domeniilor în care este utilizat| analiza datelor, folosirea distan Ûei euclidiene pentru a m |sura gradul
de apropiere sau de dep |rtare dintre obiecte ridic | dou | importante dificult|Ûi. Prima dificiltate se refer | la faptul c |, în analiza
datelor, dimensiunile spa Ûiului în care se face evaluarea distan Ûei nu sunt de aceea Õi natur |, nu sunt omogene. În domeniul fizicii,
m |surarea distan Ûelor prin intermediul distan Ûei euclidiene are consisten Ûa necesar |, deoarece toate dimensiunile spa Ûiului în
care se face m |surarea sunt omogene, au aceea Õi natur |, adic | sunt exprimate în unit|Ûi de m |sur | comparabile.
Spre deosebire de fizic |, în domeniul economic, punctele ce reprezint| obiectele studiate au de obicei caracteristici
eterogene, cu importan Û| diferit | Õi exprimate în unit|Ûi de m |sur | diferite, astfel încât, distan Ûa euclidian |, care presupune
însumarea p |tratelor unor diferen Ûe de natur | diferit|, îÕi pierde relevan Ûa.
O modalitate simpl| de asigurare a comparabilit|Ûii caracteristicilor obiectelor studiate, din punct de vedere al importan Ûei
pe care acestea o de Ûin în caracterizarea obiectelor const | în definirea unor ponderi sau unor coeficien Ûi de importan Û| pentru
caracteristicile studiate Õi utilizarea acestora în calculul unei distan Ûe euclidiene ponderate.
DefiniÛie: Considerând c | sunt ponderile atribuite celor n caracteristici ale obiectelor, distan Ûa euclidian |
ponderat| este definit| de rela Ûia:

Calculul distan Ûei euclidiene ponderate este echivalent cu calculul distan Ûei euclidiene, dar pentru cazul în care observa Ûiile
fiec |rei a i-a caracteristici au fost multiplicate cu m |rimea .

4.2.3 DistanÛa standardizat|


Dou | obiecte pot fi considerate a fi mai apropiate între ele dac | ele provin dintr-o popula Ûie cu o împr |Õtiere mai mare,
Õi mai dep |rtate dac | provin dintr-o popula Ûie cu o împr |stiere mai mic |. Aceast | constatare determin | necesitatea ca distan Ûa
euclidian | s | fie supus | unei transform |ri, unei adapt|ri, pentru a putea surprinde cele men Ûionate mai sus. O astfel de
transformare este cea reprezentat| de distan Ûa standardizat|.
O m |sur | de natur | statistic | a distan Ûei între obiecte, care Ûine seama de împr |Õtierea popula Ûiilor din care provin obiectele
este distan Ûa standardizat|.
În cazul multidimensional, când obiectele reprezint| puncte din spa Ûiul real n-dimensional, distan Ûa standardizat| între
obiectele se calculeaz | astfel:

31
.

4.2.4 DistanÛa Mahalanobis


Distan Ûa standardizat| ia în considerare numai variabilitatea individual| ce caracterizeaz | observa Ûiile variabilelor, ceea
ce echivaleaz |, în mod implicit, cu faptul c |, în calculul acestei distan Ûe variabilele sunt presupuse a fi necorelate.
O generalizare a distan Ûei standardizate, care, spre deosebire de distan Ûa standardizat|, ia în considerare Õi variabilitatea
interac Ûiunii dintre variabile, o reprezint| distan Ûa Mahalanobis.
Distan Ûa Mahalanobis ia în considerare atât variabilitatea individual| con Ûinut| în observa Ûiile efectuate asupra variabilelor,
cât Õi variabilitatea comun | con Ûinut| în respectivele observa Ûii.
Pentru a fi senzitiv | în raport cu variabilitatea individual|, în construc Ûia distan Ûei Mahalanobis sunt implicate varian Ûele
variabilelor, iar pentru a fi senzitiv | în raport cu variabilitatea comun |, în construc Ûia distan Ûei Mahalanobis sunt implicate
covarian Ûele Õi coeficien Ûii de corela Ûie.
DefiniÛie: În cazul bidimensional, în care se consider | obiecte având câte dou | caracteristici, , distan Ûa
Mahalanobis dintre dou | obiecte este dat| de rela Ûia:

unde r reprezint| coeficientul de corela Ûie dintre cele dou | variabile ce reprezint| caracteristicile obiectelor, Õi
reprezint| varian Ûele, iar reprezint| abaterile standard ale celor dou | variabile.

Este important s| observ |m c | distanÛa standardizat| Õi distan Ûa euclidian | sunt cazuri particulare ale distan Ûei Mahalanobis.
Într-adev |r, dac | cele dou | variabile ce caracterizeaz | obiectele sunt necorelate, adic | , distan Ûa Mahalanobis coincide cu
distan Ûa standardizat|. Pe de alt| parte, dac | varian Ûele variabilelor sunt egale cu unitatea Õi variabilele sunt necorelate, distan Ûa
Mahalanobis coincide cu distan Ûa euclidian |.
DefiniÛie: În cazul obiectelor multidimensionale, adic | al obiectelor caracterizate prin intermediul a n variabile,
distan Ûa Mahalanobis este definit| de m |rimea:

unde sunt vectori n-dimensionali ale c |ror componente sunt reprezentate de valorile caracteristicilor
obiectelor , iar S este matricea de covarian Û|.
Dac | cele n variabile ce caracterizeaz | obiectele sunt necorelate, matricea de covarian Û| S este o matrice diagonal|, elemen-
ele diagonale ale acesteia reprezentând varian Ûele variabilelor. În cazul în care variabilele sunt standardizate Õi necorelate,
matricea de covarian Û| S este matricea unitate, ceea ce înseamn | c | distan Ûa Mahalanobis se reduce la distan Ûa euclidian |.

32
Tema 5. Analiza intragrupal| Õi analiza intergrupal|

În analiza datelor apar foarte multe situa Ûii în care este necesar | analiza comparativ | a datelor provenind din popula Ûii
diferite sau analiza caracteristicilor care determin | diferen Ûierea unor grupe de obiecte din mulÛimea obiectelor analizate.
În anumite situa Ûii care apar în diferite analize de date, obiectele supuse analizei sunt caracterizate de o mare eterogenitate
dup | anumite caracteristici, astfel încât, pentru ob Ûinerea unor rezultate relevante este necesar ca analiza s | se fac | în mod
diferen Ûiat, în func Ûie de grupele care se contureaz | pe mulÛimea obiectelor în contextul respectivei eterogenit|Ûi.
O alt| conjunctur | în care analiza datelor conduce la investigarea grupelor de obiecte Õi a interrela Ûiilor dintre acestea este
aceea în care apare necesitatea clasific |rii unor obiecte în grupe cunoscute aprioric sau, mai general, necesitatea gener |rii unei
clasific |ri sau partaj |ri a obiectelor supuse analizei.
În general, analiza caracteristicilor de grupare sau analiza grupelor are ca scop s | verifice sau s | determine gradul de
omogenitate din interiorul grupelor Õi gradul de eterogenitate dintre grupe. În plus fa Û| de aceasta, în analiza caracteristicilor
de grupare se urm |re Õte Õi modul în care variabilele supuse analizei contribuie la diferen Ûierea grupelor de obiecte, la
discriminarea observa Ûiilor sau obiectelor. Necesitatea de a analiza observa Ûiile sau obiectele diferen Ûiate pe grupe apare în
contextul a numeroase probleme din domeniul analizei datelor, în cazul unora din ele având o importan Û| de excep Ûie.
În cele ce urmeaz |, vom face o scurt| prezentare a modului în care datele primare pot fi supuse unui proces de prelucrare
preliminar|, care s| implice analiza rela Ûiilor intragrupale Õi intergrupale.

5.1 Analiza de tip intragrupal


Analiza intragrupal| are ca scop principal eviden Ûierea gradului de omogenitate a obiectelor din fiecare grup |, determinarea
unei m |suri comune a similarit|Ûii obiectelor din fiecare grup |. O astfel de m |sur | este dat| de elementele matricii comune de
covarian Û|, care m |soar | similaritatea obiectelor în raport cu fiecare din variabilele care definesc obiectele analizate.
În general, dac | num |rul de grupe este G, num |rul de observa Ûii din cele G grupe este , iar matricile produselor
încruciÕate ale grupelor sunt , atunci m atricea comun | a produselor încruciÕate este definit| astfel:

M atricea com un | de covarian Û| este definit| ca fiind matricea rezultat| din împ |r Ûirea elementelor matricii comune a
produselor încruciÕate la num |rul gradelor de libertate:
,
adic | matricea:

unde este element al matricii comune a produselor încruciÕate.


Matricea comun | de covarian Û| exprim | cantitatea de varia Ûie prezent| în observa Ûiile fiec |reia din cele G grupe de
observa Ûii. M atricea comun | de covarian Û| este foarte important| în analiza datelor grupate, deoarece ea furnizeaz | informa Ûia
cu privire la omogenitatea sau similaritatea din interiorul grupelor, adic | omogenitatea intragrupal|.
De exemplu, dac | obiectele reprezentate de observa Ûiile fiec |rei grupe sunt identice din punct de vedere al tuturor
variabilelor, adic | toate observa Ûiile unei variabile coincid cu media, atunci elementele matricii comune de covarian Û| vor fi
nule, ceea ce eviden Ûiaz | omogenitate perfect| în interiorul grupelor. Valori mai mari decât zero ale elementelor matricii comune
de covarian Û| eviden Ûiaz | un anumit grad de eterogenitate a observa Ûiilor în cadrul grupelor, eterogenitate care este cu atât mai
mare cu cât valorile elementelor matricii comune de covarian Û| sunt mai mari.

5.2 Analiza de tip intergrupal


Analiza intergrupal| se bazeaz | pe studierea abaterilor înregistrate de mediile grupelor fa Û| de media general|, adic | media
calculat| prin luarea în considerare a tuturor observa Ûiilor, f|r | a Ûine seama de apartenen Ûa acestora la grupele existente. Aceste
medii sunt definite în raport cu fiecare din variabilele analizate.
Elementul cheie în analiza intergrupal| este reprezentat de suma p |tratelor abaterilor dintre grupe. Aceast | m |rime se

33
define Õte Õi se calculeaz | pentru fiecare din variabilele analizate. Pentru cea de-a i-a variabil|, suma p |tratelor abaterilor dintre
grupe este dat| de rela Ûia:

unde G reprezint| num |rul grupelor, reprezint| num |rul de observa Ûii din cea de-a j-a grup |, reprezint| media înregistrat|
de cea de-a i-a variabil| la nivelul celei de-a j-a grupe, iar reprezint| media celei de-a i-a variabile la nivelul tuturor
observa Ûiilor din cele G grupe.
O matrice important | utilizat| în analiza intergrupal| este m atricea produselor încruciÕate intergrupale, care se define Õte
astfel:

Matricea produselor încruci Õate intergrupal| este extrem de important | în analiza grupelor sau a caracteristicilor de
grupare, deoarece ea furnizeaz | informa Ûia cu privire la eterogenitatea grupelor de observa Ûii.
Ea reprezint| o m |sur | a diferen Ûelor care exist| între grupele de observa Ûii, ar |tând care este rolul variabilelor în
diferen Ûierea grupelor de observa Ûii.
Cu ajutorul matricii produselor încruciÕate intergrupale poate fi calculat| m atricea de covarian Û| intergrupal|:

Matricea de covarian Û| intergrupal| exprim | informa Ûia referitoare la eterogenitatea intergrupal|, ar |tând cât de mult se
diferen Ûiaz | grupele dup | fiecare din variabilele analizate.
Considerând c | num |rul total de observa Ûii este T Õi notând cu matricea produselor încruci Õate pentru totalitatea
observa Ûiilor centrate, indiferent de împ |r Ûirea lor pe grupe, adic | matricea:

este verificat| rela Ûia fundamental|:


.
Aceast | rela Ûie, foarte important | în analiza datelor, eviden Ûiaz | faptul c | matricea general| sau total| a produselor
încruci Õate ( ) poate fi descompus | sub forma a dou | matrici: matricea comun | sau cum ulat| a produselor încruci Õate ( )
Õi matricea produselor încruciÕate intergrupale ( ).
În termeni informa Ûionali, rela Ûia precedent | eviden Ûiaz | faptul c | informa Ûia total|, exprimat | de variabilitatea ce
caracterizeaz | toate observa Ûiile, poate fi împ |r Ûit| pe dou | componente:
• informa Ûia reprezentat| de variabilitatea existent| în interiorul grupelor Õi care este m |surat| prin matricea
comun | a produselor încruci Õate ;

34
• informa Ûia reprezentat| de variabilitatea existent| între grupe Õi care este m |surat| prin intermediul matricii
produselor încruci Õate intergrupale ;
A Õa cum am mai men Ûionat, cu ajutorul matricii comune de covarian Û| se exprim | similaritatea, omogenitatea intragrupal|,
iar cu ajutorul matricii de covarian Û| intergrupal| se exprim | eterogenitatea intergrupal|.
Din punct de vedere al unei singure variabile, se poate spune c |, exist| diferen Ûe cu atât mai mari între grupe cu cât suma
p |tratelor abaterilor intergrupale este mai mare în compara Ûie cu suma p |tratelor abaterilor intragrupale.
Aceast | afirma Ûie furnizeaz | implicit criteriul teoretic ideal pentru construirea celui mai bun algoritm de clasificare:
maximizarea sumei p |tratelor abaterilor intergrupale Õi minimizarea sumei p |tratelor abaterilor intragrupale.
În mod similar cu descompunerea matricii totale a produselor încruci Õate pe cele dou | componente, se poate defini Õi o
rela Ûie de descompunere a gradelor de libertate ce corespund totalit|Ûii observa Ûiilor, notate cu df, astfel:
,
unde reprezint| gradele de libertate corespunz |toare variabilit|Ûii intragrupale, adic |:
,
iar reprezint| gradele de libertate corespunz |toare variabilit|Ûii intergrupale, adic |:
.
Dup | cum se poate observa, într-adev |r suma reprezint| num |rul de grade de libertate ce caracterizeaz | cele T
observa Ûii:
.
Analiza caracteristicilor de grupare Õi matricile definite în leg |tur | cu aceasta sunt utilizate frecvent în probleme de
clasificare Õi discriminare. În capitolul destinat prezent|rii tehnicilor de recunoa Õtere a formelor, vom discuta, detaliat, modul
în care pot fi folosite procedurile de analiz | a grupelor.

35
Tema 6. Analiza componentelor principale

6.1 Necesitatea Õi importanÛa simplific|rii spaÛiului cauzal


Demersul Õtiin Ûific implicat în cadrul oric |rei probleme de analiz | Õi predic Ûie din domeniul economico-social include, ca
o etap | important | a sa, o detaliat| investigare a leg |turilor func Ûionale existente între variabilele explicative. Variabilele
explicative care intervin într-un demers Õtiin Ûific de acest fel, variabile cunoscute Õi sub numele de variabile independente,
reprezint| simboluri care exprim | diferite aspecte cantitative sau calitative ale unor fenomene care au calitatea de factori de
influen Û| sau de cauze pentru alte fenomene sau procese.
În domeniul analizei datelor se consider | c | ansamblul variabilelor explicative implicate într-o analiz | multidimensional|
particular | define Õte un anumit spa Ûiu numeric numit spa Ûiu iniÛial de cauzalitate. Dimensiunea acestui spa Ûiu este dat| de
num |rul de variabile cauzale implicate în analiz |, ceea ce înseamn | c | num |rul Õi natura axelor acestui spa Ûiu sunt determinate
de num |rul Õi natura variabilelor analizate. Fiecare variabil| cauzal| este reprezentat| pe câte o ax | a acestui spa Ûiu, un punct
de pe o anumit| ax | a spa Ûiului reprezentând o valoare posibil| pe care o poate lua variabila asociat| cu axa respectiv |. Punctele
spa Ûiului cauzal sunt reprezentate de obiectele supuse investiga Ûiei, iar proiec Ûiile acestor obiecte pe axele spa Ûiului sunt valorile
înregistrate de obiecte la caracteristicele asociate cu axele.
Remarc |: Analiza componentelor principale asigur | o descompunere exprimat | printr-un num |r redus de componente
Õi neredundant| a variabilit|Ûii totale din spa Ûiul cauzal iniÛial.
Din punct de vedere al analizei datelor, cea mai important| caracteristic | pe care o poate eviden Ûia spa Ûiul de cauzalitate,
caracteristic | fundamental|, de fapt, pentru toate tehnicile de analiz | multidimensional| a datelor, o reprezint| variabilitatea
acestui spa Ûiu de cauzalitate.
Ca expresie direct| Õi suficient de cuprinz |toare a cantit|Ûii de informa Ûie semnificativ | pe care o con Ûin datele supuse
analizei, variabilitatea spa Ûiului cauzal, pe de o parte, precum Õi modalit|Ûile prin intermediul c |rora aceasta poate fi exprimat |
sub cea mai simplificat| Õi sugestiv | form |, pe de alt| parte, definesc esen Ûa Õi con Ûinutul celor mai multe metode de analiz |
multidimensional| a datelor.
A Õa cum o s | vedem în continuare, variabilitatea con Ûinut | în spa Ûiul cauzal determinat de variabilele explicative poate fi
exprimat | sub mai multe forme posibile, forme mai mult sau mai pu Ûin eficiente din punct de vedere al posibilit|Ûilor acestora
de a eviden Ûia rela Ûiile de cauzalitate care au relevan Û| pe mulÛimea variabilelor explicative. Din acest punct de vedere, analiza
componentelor principale poate fi privit| ca o tehnic | de descompunere a variabilit|Ûii totale din spa Ûiul cauzal iniÛial pe un
num |r mai redus de componente Õi f|r | nici o suprapunere a contribu Ûiilor individuale la formarea acestei variabilit|Ûi.
Remarc |: Analiza componentelor principale este o tehnic | de analiz | multidimensional | care are ca scop
descompunerea variabilit|Ûii totale din spa Ûiul cauzal iniÛial sub forma unui num |r redus de componente Õi far | ca aceast|
descompunere s | con Ûin | redundan Ûe informa Ûionale.
În cazul specific al investiga Ûiilor din domeniul economico-social, ca rezultat direct al numeroaselor Õi variatelor interde-
penden Ûe manifestate pe mai multe paliere între variabilele explicative, spa Ûiul de cauzalitate este caracterizat de o complexitate
deosebit|. Acest grad ridicat de complexitate a manifest |rii leg |turilor cauzale dintre variabilele explicative determin | serioase
dificult|Ûi legate de exprimarea Õi interpretarea facil| a raporturilor de cauzalitate, astfel încât apare necesitatea unei reduceri,
unei simplific |ri a spa Ûiului cauzal. Aceast | reducere sau simplificare se refer | la reducerea dimensionalit|Ûii spa Ûiului cauzal,
la reducerea num |rului de axe în func Ûie de care se face reprezentarea punctelor în acest spa Ûiu.
Modalitatea cea mai adecvat| pentru realizarea acestui obiectiv de mare importan Û| Õi utilitate, este aceea a utiliz |rii
tehnicilor de analiz | multidimensional| cunoscute sub numele de analiza componentelor principale.
Remarc |: Analiza componentelor principale este o tehnic | de analiz | multidimensional| care are ca scop reducerea
dimensionalit|Ûii spa Ûiului cauzal iniÛial, în condiÛiile unei pierderi informa Ûionale minime.
Într-o exprimare extrem de sintetic |, se poate spune c | analiza componentelor principale este o metod | de analiz |
multidimensional| care are ca scop g |sirea unei anumite m odalit|Ûi de transform are a caracteristicilor iniÛiale ale unor obicte
sau forme, astfel încât, pe baza acestei transform |ri, s | se asigure o reprezentare optim al| a acestora, în condiÛiile folosirii unui
num |r mult mai redus de caracteristici.
Noile caracteristici rezultate în urma transform |rii caracteristicilor iniÛiale, al c |ror num |r este semnificativ mai redus, sunt
a Õa-numitele componente principale.
Caracterul de optimalitatate pe care transformarea men Ûionat| trebuie s |-l asigure noii modalit|Ûi de reprezentare a
obiectelor se refer | la pierderea de informa Ûie referitoare la obiecte, care are loc odat| cu trecerea de la vechile la noile
caracteristici.
Se consider | c | noile caracteristici asigur | o reprezentare optimal | a obiectelor dac | Õi numai dac | trecerea de la vechea
reprezentare la noua reprezentare se face sub restric Ûia minimiz |rii pierderii de informa Ûie. Aceasta înseamn | c | transformarea
caracteristicilor se determin | în a Õa fel încât pierderea de informa Ûie antrenat| de reducerea dimensionalit|Ûii caracteristicilor

36
s | fie minim |. Realizarea acestei cerin Ûe impuse transform |rii caracteristicilor presupune definirea unei performan Ûe, unei func Ûii
obiectiv specifice, astfel încât transformarea s | asigure, dup | caz, fie minimizarea, fie maximizarea acestei func Ûii obiectiv.
În cazul concret al analizei componentelor principale, performan Ûa este reprezentat| de maximizarea varian Ûei
caracteristicilor obiectelor, iar transformarea este o transformare de tip liniar.
Sintetizând cele men Ûionate anterior, putem spune c | analiza componentelor principale este utilizabil| pentru rezolvarea
a dou | categorii generale de probleme: simplificarea structurii dependen Ûei cauzale Õi reducerea dimensionalit|Ûii spa Ûiului
cauzal.

6.1.1 Simplificarea structurii dependenÛei cauzale


Leg |turile func Ûionale dintre variabilele explicative pot fi eviden Ûiate prin intermediul definirii unei structuri a dependen Ûei
acestor variabile Õi m |surate, de obicei, cu ajutorul coeficien Ûilor de covarian Û| Õi corela Ûie.
Remarc |: Sub forma sa cea mai simpl|, structura dependen Ûei este reprezentat| de mul Ûim ea variabilelor cauzale
supuse analizei.
Necesitatea eviden Ûierii structurii dependen Ûei cauzale Õi a interpret|rii corecte a acesteia apare în orice analiz | care are
ca scop investigarea cauzalit|Ûilor Õi este fundamental| pentru orice proces de cunoa Õtere Õtiin Ûific |.
Pentru a facilita posibilitatea unei interpret|ri sugestive a cauzalit|Ûii este necesar ca structura dependen Ûei specifice unei
mulÛimi de variabile cauzale s | fie cât mai simplu Õi mai clar exprimat |, f |r | manifestarea perturbatorie a unor redundan Ûe
informa Ûionale. Eviden Ûierea unei structuri a dependen Ûei cât mai simple Õi mai clare reprezint|, de fapt, unul dintre principalele
scopuri urm |rite în analiza datelor. Pe baza unei astfel de structuri pot fi formulate concluzii mai clare cu privire la rela Ûiile de
cauzalitate manifestate la nivelul ansamblului de variabile explicative.
De cele mai multe ori îns |, datorit | complexit|Ûii leg |turilor cauzale Õi naturii specifice a informa Ûiilor ce caracterizeaz |
variabilele analizate, o exprimare simpl| Õi clar |, sintetic | Õi neredundat| a cauzalit|Ûilor este deosebit de dificil| Õi nu poate
fi ob Ûinut| în mod direct. Realizarea acestui deziderat poate fi ob Ûinut| îns | indirect, prin utilizarea unor instrumente specifice,
cu ajutorul c |rora s | se poat | face o anumit| sim plificare a spa Ûiului cauzal determinat de variabilele explicative.
Remarc |: Prin simplificarea spa Ûiului cauzal se în Ûelege reducerea dimensionalit|Ûii acestuia, astfel încât s| se ob Ûin |
un spa Ûiu cauzal de dimensiune mai mic | (spa Ûiul redus) Õi care s| permit| o reprezentare mai simpl| Õi mai sugestiv | a
obiectelor.
În spa Ûiul cauzal rezultat în urma acestei simplific |ri, spa Ûiu a c |rui cardinalitate este mult mai redus | în compara Ûie cu
spa Ûiul cauzal iniÛial, este mult mai u Õor s| se eviden Ûieze morfologia leg |turilor cauzale Õi s| se exprime o structur | adecvat|
a dependen Ûelor.

6.1.1.1 Eliminarea redundanÛelor informaÛionale


În situa Ûia în care investiga Ûia Õtiin Ûific | are ca obiect direct spa Ûiul cauzal iniÛial, este foarte dificil s | se deduc | Õi s| se
exprime o dependen Û| structural | care s| eviden Ûieze cu claritate contribu Ûiile nete ale variabilelor analizate la formarea
variabilit|Ûii întregului spa Ûiu cauzal, mai ales atunci când aceste variabile sunt intercorelate.
Corelarea variabilelor cauzale determin | o structur | complicat| Õi amalgamat| a dependen Ûei, o structur | redundant|, care
include anumite suprapuneri informa Ûionale ale influen Ûelor variabilelor cauzale. Faptul c | structura cauzal| iniÛial| este
complicat| Õi include numeroase suprapuneri informa Ûionale genereaz | o serie de dificult|Ûi privind în Ûelegerea clar | a
raporturilor de cauzalitate Õi formularea unor concluzii pertinente privind structurile de cauzalitate analizate.
O alt| problem | important | a analizei datelor, complementar | într-un anumit sens redundan Ûei informa Ûionale, const | în
aceea c | variabilitatea con Ûinut| în spa Ûiul iniÛial nu este la fel de semnificativ | în toate direc Ûiile, de-a lungul tuturor axelor
spa Ûiului, existând situa Ûii în care, dup | o anumit| direc Ûie, variabilitatea s | fie neglijabil| din punct de vedere al magnitudinii.
În situa Ûii de acest fel se poate renun Ûa la includerea în analiz | a informa Ûiei corespunz |toare acestor direc Ûii, aceast|
renun Ûare fiind echivalent | cu a considera în analiz | un spa Ûiu de cauzalitate de dimensiune mai redus |.

6.1.2 Reducerea dimensionalit|Ûii


În viziunea specific | analizei componentelor principale, unit|Ûile elementare ale popula Ûiei, obiectele supuse studiului, sunt
considerate a fi puncte dintr-un spa Ûiu ale c|rui axe reprezint| caracteristicile posedate de respectivele obiecte. Aceasta înseamn |
c | în contextul analizei componentelor principale valorile caracteristicilor, adic | observa Ûiile, sunt coordonate ale punctelor ce
definesc elementele popula Ûiei analizate.
La baza analizei componentelor principale st| ideea c | reprezentarea unit|Ûilor în sistemul iniÛial de coordonate, adic | în
sistemul pe ale c |rui axe sunt m |surate caracteristicile originale ale unit|Ûilor, nu este totdeauna cea mai potrivit |, considerându-
se c | poate exista a alt| modalitate de reprezentare mai relevant|, mai eficient| din punct de vedere informa Ûional.
Aceast | modalitate de reprezentare, mai avantajoas | din punct de vedere informa Ûional, poate fi ob Ûinut| considerând un
nou spa Ûiu de reprezentare, spa Ûiu care define Õte prin axele sale, în mod implicit, noi caracteristici ale obiectelor. Coordonatele
obiectelor în acest nou spa Ûiu sunt valorile înregistrate de obiecte la aceste noi caracteristici.
În contextul simboliz |rii cu ajutorul variabilelor, noile caracteristici sunt numite componente principale, iar valorile
înregistrate de obiecte la aceste noi caracteristici sunt numite scoruri.
Având în vedere logica pe care se bazeaz | determinarea lor, se consider | c | noile caracteristici sunt mai relevante Õi mai
adecvate pentru evaluarea informa Ûional| a obiectelor. Este evident c | problema realiz|rii noii reprezent |ri îÕi pierde sensul dac |

37
noile caracteristici nu preiau, într-un fel sau altul, con Ûinutul informa Ûional al caracteristicilor iniÛiale. Mai mult decât atât, noua
reprezentare se construie Õte în a Õa fel încât conservarea informa Ûional| s | fie maxim |, acceptându-se, totu Õi, o pierdere
informa Ûional| minimal|.
Din punct de vedere geometric, analiza componentelor principale este echivalent| cu o “rescriere” a unit|Ûilor unei
popula Ûii într-un nou sistem de axe, cu o reprezentare mai adecvat | din punct de vedere informa Ûional a acestor unit|Ûi. Noul
sistem de coordonate rezultat din analiza componentelor principale este caracterizat prin trei tr |s |turi fundamentale:
• are o dimensiune redus|;
• axele sale sunt ortogonale;
• coordonatele în acest sistem sunt maximizatoare de varian Û|.
Problema reprezent |rii într-un spa Ûiu mai redus este cunoscut | sub numele de problem | a reducerii dimensionalit|Ûii. Din
acest motiv, analiza componentelor principale este cunoscut| Õi ca tehnic | de reducere a dimensionalit|Ûii.
Dac | vom considera c | exist| n variabile originale, reprezentate de elementele mulÛimii , esen Ûa analizei
componentelor principale poate fi reprezentat| în mod simplificat prin intermediul transform |rii urm |toare:
,

unde reprezint| mulÛimea componentelor principale, iar transformarea este astfel încât asigur |, prin
intermediul componentelor principale, conservarea variabilit|Ûii din spa Ûiul cauzal iniÛial într-o propor Ûie maxim posibil|.
Pentru a ilustra restric Ûiile sub care poate fi f|cut | reducerea dimensionalit|Ûii, vom considera reprezent |rile grafice din
figura urm |toare, referitoare la un num |r de 10 obiecte care posed | câte dou | caracteristici. Obiectele au fost alese astfel s |
sugereze atât con Ûinutul procesului de reducere a dimensionalit|Ûii, cât Õi necesitatea acestui proces.
În aceast | figur | sunt eviden Ûiate dou | modalit|Ûi de reprezentare a celor 10 obiecte: prima este cea original|, adic | aceea
în care obiectele sunt reprezentate în coordonatele iniÛiale, netransformate, iar cea de-a doua este cea rezultat| în urma reducerii
dimensionalit|Ûii.

Figura 6.1: Exemplificarea reducerii dimensionalit|Ûii


de la dou | axe - Õi , la o singur | ax | - W

În cadrul primei reprezent |ri, obiectele sunt considerate a fi puncte din planul , cele dou | coordonate ale fiec |ruia
dintre aceste puncte, m |surate pe axele reprezentate de Õi , fiind evalu |ri ale dou | presupuse caracteristici. Ceea ce este
deranjant în contextul acestei reprezent |ri iniÛiale a obiectelor este faptul c | rezolu Ûia acestor obiecte de-a lungul axei este
foarte mic |. Obiectele pot fi distinse cu dificultate unele de altele, unele fiind chiar confundabile. În termeni statistici, rezolu Ûia
sc |zut | a obiectelor în sistemul de coordonate ini Ûial este echivalent | cu o variabilitate sc |zut | a primei caracteristici, de-a
lungul obiectelor. Mai departe, aceast| variabilitate sc |zut | poate fi interpretat| ca însemnând o semnifica Ûie redus | a primei
caracteristici, din punct de vedere ale puterii ei de a diferen Ûia obiectele analizate.
Reducerea dimensionalit|Ûii const |, în acest caz, în trecerea de la dou | dimensiuni la o singur | dimensiune. Ca urmare a
reducerii dimensionalit|Ûii, se trece de la reprezentarea obiectelor prin intermediul a dou | coordonate la reprezentarea obiectelor
prin intermediul unei sinngure coordonate. Aceasta înseamn | trecerea de la reprezentarea în plan la reprezentarea pe o dreapt|.
Noua ax | rezultat| în urma reducerii dimensionalit|Ûii, notat| în grafic cu W, poate fi interpretat| ca fiind expresia unei
caracteristici noi, rezultat| din combinarea într-o anumit| form |, a celor dou | caracteristici originale.
Se poate observa c | reprezentarea rezultat| în urma reducerii dimensionalit|Ûii cre Õte rezolu Ûia obiectelor. Aceasta înseamn|
c | noua caracteristic |, simbolizat| prin intermediul variabilei W , este caracterizat| de o mai mare variabilitate de-a lungul
obiectelor, comparativ cu caracteristica simbolizat| prin intermediul variabilei . Noua variabil| W poate fi interpretat| ca

38
fiind o component| principal|.
În urma reducerii dimensionalit|Ûii s-a ob Ûinut o nou | entitate informa Ûional|, care poate fi interpretat| ca reprezentând o
nou | caracteristic | a obiectelor. Informa Ûia con Ûinut| în aceast| nou | entitate este mai relevant | decât informa Ûia con Ûinut| în
observa Ûiile f|cute asupra primei caracteristici a obiectelor.

6.1.3 Necesitatea reducerii dimensionalit|Ûii


Necesitatea de a simplifica spa Ûiul cauzal iniÛial, de a exprima cauzalitatea sub o form | mai simpl |, prin intermediul unui
num |r mai redus de variabile, apare în numeroase probleme de analiz | a datelor Õi, în plus, condiÛioneaz | posibilit|Ûile de
aplicare a multor proceduri specifice analizei datelor.
Problema reducerii dimensionalit|Ûii define Õte în mod sintetic atât esen Ûa tehnicilor de analiz | a componentelor principale,
cât Õi scopul majorit |Ûii modalit|Ûilor de utilizare a acestor tehnici.
Anterior am eviden Ûiat faptul c | în orice activitate de cunoa Õtere Õtiin Ûific | apare necesitatea identific |rii unei structuri
simple Õi clare a dependen Ûei, ar |tând c |, pentru realizarea acestui scop, trebuie s | se fac | o reducere, o simplificare a
cauzalit|Ûii. Modalitatea de abordare cea mai adecvat| pentru realizarea acestui scop este cea bazat| pe tehnicile oferite de
analiza componentelor principale.
Separat de aceast | important | Õi general| modalitate de utilizare, reducerea dimensionalit|Ûii spa Ûiului de cauzalitate este
deosebit de util | Õi pentru rezolvarea unor probleme concrete cum ar fi cele legate de selectarea variabilelor de influen Û|,
simplificarea modelelor matematice, eliminarea redundan Ûelor informa Ûionale, vizualizarea rela Ûiilor de cauzalitate complexe,
compresia Õi restaurarea datelor în informatic | etc.
În continuare, vom face o scurt| prezentare a modului în care analiza componentelor principale poate fi folosit| pentru
solu Ûionarea fiec |reia dintre problemele men Ûionate.

6.1.3.1 Selectarea variabilelor de influenÛ|


Caracteristica principal | a celor mai multe probleme de analiz | Õi predic Ûie din domeniul economico-social este dat| de
faptul c | dimensiunea spa Ûiului cauzal investigat, dimensiune determinat| de num |rul de variabile ce pot fi identificate drept
cauze care determin | evolu Ûia unui fenomen efect, este foarte mare.
Deoarece nu toate variabilele de influenÛ| au aceea Õi importan Û| în formarea caracteristicilor fenomenului efect, este necesar
ca aceste variabile s | fie supuse unui proces de filtrare, prin intermediul c |ruia unele variabile s | fie eliminate, iar altele re Ûinute,
în func Ûie de semnifica Ûia fiec |reia dintre acestea.
Selectarea variabilelor independente, în func Ûie de semnifica Ûia influen Ûei pe care o au acestea asupra caracteristicilor
fenomenului efect, poate fi f|cut | Õi cu ajutorul tehnicilor de reducere a dimensionalit|Ûii.
În afara procesului de filtrare a variabilelor independente în func Ûie de importan Ûa acestora, în analiza datelor apare frecvent
necesitatea de a grupa sau categorisi variabilele independente în func Ûie de natura influen Ûei pe care acestea o exercit|.
Clasificarea variabilelor explicative este foarte important| mai ales în domeniul economico-financiar, unde apare în mod
frecvent necesitatea identific |rii unor grupe specifice de variabile, care eviden Ûiaz | anumite caracteristici globale ale structurilor
economice, cum ar fi: dezvoltarea economic |, dezvoltarea social|, for Ûa financiar | etc.
De Õi exist | numerose metode Õi tehnici care pot fi utilizate scopul grup |rii variabilelor de influen Û|, totu Õi, analiza
componentelor principale este printre metodele cele mai simple Õi mai eficiente în acest sens.

6.1.3.2 Simplificarea modelelor matematice


În condiÛiile în care specificitatea investiga Ûiilor din domeniul economico-social este reprezentat| de complexitate, apare
necesitatea ca în procesul de modelare a fenomenelor Õi proceselor economico-sociale s| se ia în considerare o mulÛime foarte
mare de variabile cauzale. Aceasta determin | îns | ob Ûinerea unor modele prea complicate, care includ un num |r mult prea mare
de variabile cauzale Õi care creaz | numeroase dificult|Ûi de ordin metodologic Õi tehnic.
Exist| multe motive care fac dificil| Õi incomod | re Ûinerea în cadrul unui model matematic de analiz | sau predic Ûie a unui
num |r foarte mare de variabile Õi care conduc la necesitatea unei anumite simplific |ri a modelului din acest punct de vedere.
În primul rând, semnifica Ûia fiec |rei variabile într-un model care include un num |r prea mare de variabile este foarte mult
diminuat|. De exemplu, dac | în construc Ûia unui model au fost re Ûinute peste 100 de variabile Õi presupunând pentru simplificare
c |, din punct de vedere al scopului urm |rit, semnifica Ûia fiec |rei variabile este comparabil| cu a celorlalte, ar rezulta pentru
fiecare variabil| o "contribu Ûie" mai mic | decât un procent. În acest fel, semnifica Ûia fiec |rei variabile apare mult diminuat|,
devine aproape neglijabil|, ea fiind mai redus | chiar decât cea a erorilor de observare sau a factorilor cu influen Û| accidental|.
În al doilea rând, ob Ûinerea informa Ûiilor necesare estim |rii unui model care con Ûine un num |r foarte mare de variabile
ar implica un efort Õi un cost prohibitive, în anumite situa Ûii fiind greu sau chiar imposibil de ob Ûinut informa Ûii semnificative
pentru toate variabilele; în cazul unui astfel de model, pentru a p |stra un num |r de grade de libertate suficient de ridicat în
vederea asigur |rii unei semnifica Ûii rezonabile pentru estimarea parametrilor modelului, ar fi necesar un num |r foarte mare de
observa Ûii efectuate asupra fiec |rei variabile.
În al treilea rând, este posibil ca în cazul unui num |r mare de variabile s | avem o probabilitate ridicat| de existen Û| a unor
variabile foarte puternic intercorelate, includerea acestor variabile în model însemnând, în afara introducerii unui anumit grad
de redundan Û| informa Ûional|, Õi dificult|Ûi serioase de estimare a modelului ca urmare a apariÛiei fenomenului de colinearitate
sau m ulticolinearitate.
În al patrulea rând, un num |r foarte mare de variabile re Ûinute într-un model ar ridica serioase probleme de complexitate

39
a calculului chiar în raport cu ridicatele performan Ûe ale configura Ûiilor hardware actuale, presupunând implicit costuri foarte
ridicate de prelucrare.
Având în vedere cele men Ûionate, rezult| c | procesul de construire a modelului presupune necesitatea efectu |rii unor
simplific |ri Õi unor transform |ri corespunz |toare asupra mul Ûimii de variabile independente.
În toate situa Ûiile de acest fel, analiza componentelor principale poate servi ca un puternic instrument complementar, atât
în faza de construire a modelelor, cât Õi în faza de estimare a parametrilor acestor modele.

6.1.3.3 Compresia Õi restaurarea datelor


O problem | important | din domeniul informaticii, legat| în special de eficien Ûa cu care are loc transmiterea Õi stocarea
informa Ûiei, este aceea a compresiei Õi restaur |rii datelor.
Analiza componentelor principale este una dintre tehnicile cele mai frecvent utilizate pentru solu Ûionarea unei astfel de
probleme, pentru activitatea de dezvoltare a algoritmilor de comprimare Õi restaurare a datelor. Eliminarea redundan Ûelor
informa Ûionale, asigurat| prin intermediul utiliz |rii analizei componentelor principale, ofer | un foarte mare avantaj pentru orice
proces de stocare Õi transmitere de informa Ûie din sistemele informa Ûionale.
Dac | noua reprezentare a obiectelor asigurat| prin aplicarea tehnicilor de analiz | a componentelor principale este înso Ûit|
de o pierdere informa Ûional| neglijabil|, atunci atât în stocarea, cât Õi în transmiterea de informa Ûie, pot fi utilizate ca purt|toare
de informa Ûie noile caracteristici ale obiectelor. Cum num |rul acestora este mult mai redus în compara Ûie cu num |rul
caracteristicilor iniÛiale, rezult| c | manipularea informa Ûiei se poate face cu consum mai mic de resurse, cu costuri mai reduse.

6.1.3.4 Vizualizarea unor relaÛii de cauzalitate complexe


În situa Ûia în care num |rul de variabile explicative este mai mare decât trei, nu mai exist| posibilitatea de a vizualiza
poziÛionarea obiectelor ale c |ror caracteristici sunt decrise prin intermediul acestor variabile, dep |Õindu-se limita maxim posibil|
a reprezent |rilor grafice, limit| dat| de contextul tridimensional.
Chiar Õi în cazul în care num |rul de variabile explicative este egal cu trei, reprezentarea grafic | tridimensional| a obiectelor
devine greoaie Õi, de cele mai multe ori, este lipsit| de relevan Û|.
Prin intermediul analizei componentelor principale pot fi create condiÛiile necesare pentru ca s | poat| fi reprezentate grafic
chiar obiecte ce sunt caracterizate de un num |r foarte mare de variabile.
Modalitatea concret| de reprezentare grafic | a obiectelor const | în determinarea primelor dou | componente principale,
corespunz |toare variabilelor originale Õi reprezentarea obiectelor într-un spa Ûiu ortogonal ale c |rui axe sunt reprezentate de cele
dou | componente principale.
Calitatea reprezent|rii grafice realizat| prin intermediul acestei modalit|Ûi depinde de m |sura în care cele dou | componente
principale exprim | con Ûinutul informa Ûional al variabilelor originale, respectiv de propor Ûia pe care componentele principale
o preiau din varian Ûa spa Ûiului cauzal iniÛial.
Situa Ûiile men Ûionate mai sus contureaz | câteva dintre cele mai importante argumente justificative pentru necesitatea de
a efectua o simplificare, o reducere a complexit|Ûii cauzalit|Ûii, f|r | îns | ca aceast| reducere s | determine o pierdere important |
din informa Ûia semnificativ |, relevant|.
O astfel de simplificare este echivalent | cu o reducere, de dorit cât mai semnificativ |, a dimensiunii spa Ûiului cauzal, o
trecere de la un spa Ûiu cu un num |r foarte mare de dimensiuni la un spa Ûiu cu un num |r mai redus de dimensiuni ,asigurând
prin aceast | trecere un procent cât mai ridicat de conservare a informa Ûiei con Ûinut| în spa Ûiul cauzal iniÛial.
Orientarea axelor spa Ûiului redus trebuie s | fie astfel încât s| permit| o descompunere neredundant | a variabilit|Ûii
spa Ûiului cauzal iniÛial pe factori de influen Û|, o exprimare a structurii dependen Ûei f|r | nici o suprapunere a contribu Ûiilor
individuale ale factorilor cauzali.
Remarc |: Prin descompunere neredundant| a variabilit|Ûii spa Ûiului cauzal iniÛial se în Ûelege exprimarea varian Ûei
totale care caracterizeaz | acest spa Ûiu ca sum | a varian Ûelor unui num |r mai mic de noi variabile, în condiÛiile în care
acestea sunt necorelate între ele.
Este evident c | ob Ûinerea unei astfel de simplific |ri nu poate avea loc printr-o reducere a dimensiunii spa Ûiului cauzal iniÛial
f|cut | în mod simplist, bazat| pe renun Ûarea arbitrar | la unele din variabilele cauzale Õi re Ûinerea variabilelor cauzale r |mase,
mai ales atunci când importan Ûa aprioric | a variabilelor pare a fi aproximativ egal|.
Singura posibilitate de a face o astfel de simplificare, sub restric Ûiile men Ûionate mai sus, este cea a definirii unor noi varia-
bile, mai pu Ûine la num |r decât variabilele iniÛiale, care s | exprime într-o manier | consistent | semnifica Ûia informa Ûional| a
variabilelor originale Õi care s | asigure într-o m |sur | suficient de mare "conservarea" informa Ûiei con Ûinute în variabilele iniÛiale.

6.1.4 Domenii ale utiliz|rii analizei componentelor principale


Exist| numeroase situa Ûii concrete în care se dore Õte ob Ûinerea unor informa Ûii cu caracter mai special, care s | eviden Ûieze
profunzimea Õi subtilitatea interdependen Ûelor existente la nivelul unei realit|Ûi oarecare. Aceste situa Ûii conduc, în mod
inevitabil, la necesitatea utiliz |rii tehnicilor specifice analizei componentelor principale.
Pentru a ilustra natura situa Ûiilor în care apare necesitatea utiliz |rii tehnicilor de analiz | a componentelor principale,
men Ûion |m urm |toarele exemple:
• într-o cercetare intrepins| la nivelul unui num |r de firme dintr-un anumit domeniu, în scopul determin |rii for Ûei
financiare a acestora, a fost identificat un num |r foarte mare de indicatori economico-financiari, astfel încât este foarte
dificil| deducerea unei ierarhii financiare pe mulÛimea firmelor analizate; pentru opera Ûionalizarea informa Ûiilor repre-

40
zentate de ace Õti indicatori Õi pentru cre Õtrea relevan Ûei acestora este necesar | utilizarea analizei componentelor principale;
• o investiga Ûie Õtiin Ûific | în domeniul social are ca scop identificarea unor tipologii socio-culturale, specifice unor
zone geografice; informa Ûiile de natur | social| Õi cultural| disponibile pot fi utilizate pentru construirea acestor tipologii
numai în condiÛiile existen Ûei unor metode Õi tehnici adecvate, în rândul c |rora analiza componentelor principale ocup |
cel mai important loc;
• în activitatea de control al calit|Ûii produc Ûiei se dore Õte ca, pe baza a numeroase informa Ûii privitoare la desf |Õurarea
procesului de fabrica Ûie, s | se defineasc | un num |r mic de indicatori relevan Ûi pentru a aprecia dac | procesul se desf |Õoar |
în parametrii calitativi corespunz |tori; ace Õti indicatori pot fi ob Ûinu Ûi prin utilizarea tehnicilor specifice analizei
componentelor principale;
• într-o cercetare din domeniul economico-financiar a fost identificat un model în care variabilele independente sunt
afectate de fenomenul de colinearitate; în aceste condi Ûii este posibil ca erorile standard ale estima Ûiilor parametrilor s|
fie foarte mari, astfel încât calitatea modelului s | fie negativ afectat|; pentru a putea ob Ûine estima Ûii corespunz |toare este
necesar ca variabilele originale s | fie substituite cu alte variabile noi, necorelate, cum ar fi componentele principale.
Analiza datelor, indiferent dac | respectivele date sunt de natur | economic |, social|, medical|, biologic | sau tehnic |, repre-
zint| domeniul predilect al utiliz |rii analizei componentelor principale. Utilizarea analizei componentelor principale în analiza
datelor are loc atât în sens individual, ca tehnic | independent| de analiz | a datelor, cât Õi împreun |, în complementaritate, cu
alte metode Õi tehnici de analiz |.
Analiza componentelor principale este folosit| în probleme de analiz | a datelor atât în faza iniÛial| a acestora, ca tehnic |
de analiz| preliminar |, cât Õi în fazele ulterioare ale acestor analize, în special în faza de interpretare a rezultatelor.
În cele ce urmeaz |, vom preciza câteva dintre cele mai importante domenii Õi activit|Ûi ale analizei datelor, în care utilizarea
analizei componentelor principale este nu numai posibil|, ci Õi strict necesar |.
• analiza preliminar | a datelor;
• construirea modelelor matematice;
• solu Ûionarea problemelor de analiz | factorial|;
• scalarea multidimensional|;
• recunoa Õterea formelor;
• analiza grafic |;
• prezentarea Õi interpretarea rezultatelor.
Anterior, am eviden Ûiat necesitatea simplific |rii spa Ûiului cauzal Õi am men Ûionat unele din situa Ûiile în care aceast |
simplificare se impune. Tehnica specific | folosit| pentru reducerea dimensiunii spa Ûiului cauzal iniÛial, în sensul prezentat
anterior, poart| numele de analiza com ponentelor principale, iar noile variabile care definesc spa Ûiul redus de cauzalitate se
numesc com ponente principale. În cadrul paragrafelor urm |toare, vom face o definire a analizei componentelor principale,
precum Õi a noilor variabile construite în contextul acestei analize, respectiv a componentele principale.

6.2 Definirea analizei componentelor principale


În mod concret Õi într-o viziune simplificat|, tehnica pe care se bazeaz | analiza componentelor principale const | în calculul
proiec Ûiilor fiec |rui punct din spa Ûiul iniÛial, determinat de variabilele originale supuse analizei, pe axele unui nou spa Ûiu, a
c |rui dimensiune este semnificativ mai redus|. În sens riguros, dar totu Õi foarte general, analiza componentelor principale poate
fi definit| sub urm |toarea form |:
DefiniÛie: Analiza com ponentelor principale este o metod | de analiz | multidimensional| care are ca scop determinarea
unor noi variabile, numite com ponente principale Õi exprimate sub forma combina Ûiilor liniare de variabilele originale,
astfel încât aceste variabile noi s| fie caracterizate de o variabilitate maxim |.
În mod firesc, num |rul de combina Ûii liniare posibil a fi formate cu variabilele originale este extrem de mare. Deoarece,
din punct de vedere al principiilor pe care se bazeaz | activitatea de analiz | a datelor, prezint| interes deosebit numai acele
combina Ûii liniare semnificative din punct de vedere informa Ûional, caracterizate de o mare variabilitate, este necesar | o triere,
o selectare a acestor combina Ûii liniare. Efectuarea acestei select |ri presupune definirea unui criteriu care s | stea la baza deciziei
de re Ûinere sau de eliminare a unei anumite combina Ûii liniare.
În cadrul analizei componentelor principale acest criteriu este bazat pe magnitudinea varian Ûei fiec |rei combina Ûii liniare
Õi poate fi formulat astfel: se elimin | combina Ûiile liniare cu varian Û| mic |, nesemnificativ | Õi se re Ûin pentru studiu acele
combina Ûii liniare care au o varian Û| maxim |.
Re Ûinerea în analiz | doar a acelor combina Ûii liniare care au varian Û| maxim | are ca scop final realizarea unui eventual
context în care variabilele originale s | poat | fi înlocuite cu un num |r mult mai mic de astfel de combina Ûii liniare, în condiÛiile
în care prin intermediul combina Ûiilor liniare re Ûinute se preia o parte cât mai mare din variabilitatea con Ûinut| în observa Ûiile
variabilelor originale.

6.3 Definirea componentelor principale


Dup | cum am mai ar |tat, componentele principale sunt noi variabile al c |ror con Ûinut informa Ûional, preluat în exclusivitate
de la variabilele originale, este definit, mai ales, în raport cu leg |turile care exist| între variabilele originale.

41
Sintetizând cele men Ûionate pân | acum în leg |tur | cu componentele principale, putem da urm |toarea definiÛie a acestora:
DefiniÛie: Com ponentele principale sunt variabile vectoriale abstracte, definite sub forma unor combina Ûii liniare de
variabilele originale Õi care au urm |toarele dou | propriet|Ûi fundamentale:
• sunt necorelate dou | câte dou | Õi suma p |tratelor coeficien Ûilor care definesc combina Ûia liniar | ce corespunde
unei componente principale este egal| cu unitatea;
• prima component | principal | este o combina Ûie liniar | normalizat| a c |rei varian Û| este maxim |, cea de-a doua
component | principal | este o combina Ûie liniar | necorelat| cu prima component | principal | Õi care are o varian Û| cât
mai mare posibil|, îns | mai mic | decât cea a primei componente etc.
Verificarea primei propriet|Ûi de c |tre coeficien Ûii combina Ûiilor liniare ce definesc componentele principale face ca ace Õti
coeficien Ûi, priviÛi sub form | vectorial|, s | alc |tuiasc | un sistem ortonormal.
Componentele principale sunt vectori ortogonali care preiau cât mai mult din varian Ûa variabilelor vector originale astfel:
prima component | principal | preia maximul posibil din varian Ûa variabilelor originale, a doua component | principal | preia
maximul din varian Ûa r |mas | dup | ce este eliminat| varian Ûa preluat| de prima component | Õ.a.m.d.
Verificarea primei propriet|Ûi de c |tre coeficien Ûii combina Ûiilor liniare ce definesc componentele principale face ca ace Õti
coeficien Ûi, priviÛi sub form | vectorial|, s | alc |tuiasc | un sistem ortonormal.
Componentele principale sunt vectori ortogonali care preiau cât mai mult din varian Ûa variabilelor vector originale astfel:
prima component | principal | preia maximul posibil din varian Ûa variabilelor originale, a doua component | principal | preia
maximul din varian Ûa r |mas | dup | ce este eliminat| varian Ûa preluat| de prima component | Õ.a.m.d.

6.3.1 Caracteristici ale componentelor principale


În calitatea lor de construc Ûii abstracte, rezultate din utilizarea unor tehnici specifice, componentele principale reprezint|
noi variabile care, prin propriet|Ûile interesante pe care acestea le au, ofer | noi Õi subtile posibilit|Ûi de analiz | Õi interpretare
informa Ûional| a datelor originale.
Din punct de vedere geometric, variabilele numite componentele principale definesc un nou spa Ûiu al obiectelor, în
contextul c |ruia sunt verificate urm |toarele propriet|Ûi relevante pentru definirea analizei componentelor principale:
• axele noului spa Ûiu sunt ortogonale dou | câte dou | Õi definesc noile variabile numite componente principale;
• coordonatele obiectelor în noul spa Ûiu, adic | proiec Ûiile obiectelor pe axele acestuia, sunt evalu |ri obiectelor
în raport cu noile variabile Õi se numesc scoruri ale componentelor principale sau scoruri principale.
• din punct de vedere teoretic, num |rul de componente principale este egal cu num |rul de variabile originale;
nu toate componentele principale au îns | o semnifica Ûie informa Ûional| considerabil |, astfel cele mai pu Ûin
semnificative din punct de vedere informa Ûional sunt eliminate;
• componentele principale sunt combina Ûii liniare de varian Û| maximal| ale variabilelor originale;
• componentele principale sunt scalate în func Ûie de magnitudinea varian Ûei acestora, prima fiind componenta
principal | cu varian Û| maxim |, iar ultima fiind componenta principal | cu varian Û| minim |;
• componentele principale sunt necorelate dou | câte dou |;
• suma varian Ûelor componentelor principale coincide cu suma varian Ûelor variabilelor originale, astfel încât
componentele principale preiau în totalitate variabilitatea con Ûinut| în variabilele originale.
Sintetizând cele ar |tate mai sus, putem spune c | analiza componentelor principale este o metod | de reexprimare a
variabilelor originale sub forma unui num |r mai mic de noi variabile, numite componente principale, care sunt combina Ûii liniare
de varian Û| maxim | ale variabilelor originale.
Cu ajutorul componentelor principale se poate defini o structur | a dependen Ûei dintre variabilele originale mai simpl| Õi
mai clar |, deci mai u Õor de interpretat. În cazul în care num |rul de componente principale este egal cu num |rul variabilelor
originale putem privi analiza componentelor principale ca pe o metod | de rota Ûie, de regul| ortogonal|, a axelor spa Ûiului iniÛial,
semnifica Ûia fiec |rei noi axe fiind m |surat| prin varian Ûa asociat| unei componente principale.

6.4 Logica analizei componentelor principale


Cele mai interesante Õi mai utile aspecte ale analizei componentelor principale sunt în primul rând legate, nu de aparatul
matematic pe care aceast| analiz | se bazeaz |, ci de multiplele Õi nuan Ûatele interpret|ri posibile pe care aceasta le ofer |.
Pentru a da o ilustrare intuitiv | clar |, bazat| pe o interpretare geometric | simplificat|, ra Ûionamentului primar care st | la
baza analizei componentelor principale, vom dedica aceast| parte, în exclusivitate, interpret|rilor Õi exemplific |rilor numerice.
În acest sens, vom considera contextul numeric oferit de exemplul urm |tor, context care va servi ca referin Û| pentru multe din
interpret|rile Õi exemplific |rile ulterioare.

Exem plul 6.1


Vom considera cazul unui num|r de 10 obiecte sau observaÛii, referitoare la dou| variabile, . Tabelul urm|tor conÛine
observaÛiile iniÛiale disponibile pentru cele dou| variabile, precum Õi valorile centrate ce corespund acestor observaÛii.

42
Valorile observaÛiilor iniÛiale Õi centrate
Tabelul 6.1
Valori iniÛiale Valori centrate
ObservaÛia

O1 7,0 10,0 0,6 -0,5


O2 5,0 11,0 -1,4 0,5
O3 10,0 15,0 3,6 4,5
O4 2,0 5,0 -4,4 -5,5
O5 5,0 10,0 -1,4 -0,5
O6 6,0 13,0 -0,4 2,5
O7 7,0 12,0 0,6 1,5
O8 9,0 11,0 2,6 0,5
O9 7,0 8,0 0,6 -2,5
O10 6,0 10,0 -0,4 -0,5
Media 6,4 10,5 0 0
VarianÛa 4,933 7,389 4,933 7,389

VarianÛa individual| pentru fiecare din cele dou| variabile este 4,933, respectiv 7,389, iar varianÛa total|, corespunz|toare celor dou|
variabile, , este 12,322:
.
În aceste condiÛii, se poate spune c| rolul informaÛional al celor dou| variabile este aproximativ acelaÕi, c| cele dou| variabile au
aproximativ aceeaÕi contribuÛie la formarea variabilit|Ûii totale ce caracterizeaz| spaÛiul cauzal iniÛial. Prima variabil| are o contribuÛie la
formarea varianÛei totale de 46,45%, iar cea de-a doua variabil| contribuie cu 53,55% la formarea varianÛei totale:
.

Pentru observaÛiile din tabelul anterior, matricea produselor încruciÕate, matricea de covarianÛ| Õi matricea de corelaÛie, corespunz|toare
celor dou| variabile , sunt urm|toarele:

În cazul observaÛiilor centrate, matricea produselor încruciÕate, matricea de covarianÛ| Õi matricea de corelaÛie sunt urm|toarele:

Dup| cum se poate observa, în urma operaÛiei de centrare se modific| doar matricea produselor încruciÕate, matricea de covarianÛ| Õi
matricea de corelaÛie r|mânând neschimbate. Matricea de corelaÛie evidenÛiaz| faptul c| cele dou| variabile sunt corelate, la nivelul unui
coeficient de corelaÛie de 0,736, adic|:
.

Având în vedere intensitatea relativ ridicat| a leg |turii dintre cele dou | variabile originale, este de a Õteptat ca aceste variabi-
le s | poat | fi sintetizate prin intermediul unei singure componente principale, în condiÛiile unei pierderi informa Ûionale minime.

6.4.1 RotaÛia axelor Õi maximizarea varianÛei


Logica analizei componentelor principale se bazeaz | pe ideea fundamental| c | se pot face anumite transform |ri asupra
observa Ûiilor iniÛiale, care s | determine maximizarea varian Ûei individuale pentru anumite variabile Õi minimizarea varian Ûei
pentru alte variabile. Pe aceast | cale, se accentueaz | semnifica Ûia logico-informa Ûional| a unor variabile Õi se diminueaz | cea
a altor variabile.
Maximizarea varian Ûei unor variabile, în detrimentul varian Ûei celorlalte variabile, conduce la cre Õterea contribu Ûiei
variabilelor a c |ror varian Û| este maximizat| la formarea varian Ûei totale. Maximizarea varian Ûei unor variabile Õi, pe aceast |
baz |, accentuarea semnifica Ûiei informa Ûionale a acestor variabile în raport cu celelalte este cu atât mai relevant | cu cât între
variabilele originale exist| leg |turi mai puternice, respectiv sunt mai puternic corelate. A Õa cum o s | ar |t|m în continuare,
transform |rile care asigur | maximizarea varian Ûelor individuale ale unor variabile sunt reprezentate de transform |rile de
coordonate corespunz |toare efectu |rii unor rota Ûii ortogonale ale axelor originale.
Pentru a eviden Ûia modul în care pot fi deduse componentele principale, adic | noile variabile care au proprietatea de a
conserva variabilitatea ce caracterizeaz | spa Ûiul cauzal iniÛial Õi care sunt necorelate, vom proceda la rota Ûii succesive ale celor
dou | axe iniÛiale, m |surând varian Ûa ce caracterizeaz | cele dou | variabile pentru fiecare pozi Ûie modificat| prin rota Ûie a
sistemului de axe. Ca urmare a faptului c | sistemul de axe este rotit cu un anumit num |r de grade, coordonatele celor dou |
variabile se modific | în mod corespunz |tor, astfel încât, reprezentarea observa Ûiilor în noile coordonate este diferit|.
Dac | vom considera c | în sistemul iniÛial de axe punctul reprezentat de cea de-a t-a observa Ûie are coordonatele ,

43
atunci rota Ûia axelor cu un anumit unghi va determina o modificare a coordonatelor acestui punct, respectiv a valorilor celor
dou | observa Ûii.
În cazul în care unghiul de rota Ûie este , noile coordonate ale punctului , notate Õi , sunt date de rela Ûiile
urm |toare:

Prin intermediul exemplului urm |tor se eviden Ûiaz | modul în care se schimb | varian Ûa fiec |rei variabile odat | cu efectuarea
unei rota Ûii a axelor originale.

Exem plul 6.2


Considerând datele din Exemplul 6.1, pentru o rotaÛie a axelor cu un unghi de 10 grade, coordonatele primei observaÛii centrate,
respectiv coordonatele punctului (0,6; -0,5), devin 0,504 Õi -0,597:
.
În tabelul urm|tor sunt prezentate coordonatele celor dou| variabile într-un sistem de axe în care axele sunt rotite cu 10, 30, 45, 60 Õi
90 grade. Penultima linie a tabelului conÛine varianÛele celor dou| variabile, calculate pentru fiecare poziÛie obÛinut| din rotaÛia axelor cu
un num|r de grade.
Dup| cum se poate observa, varianÛele celor dou| variabile sunt diferite pentru diferitele poziÛii ale axelor, deÕi suma acestor varianÛe,
adic| varianÛa total|, r|mâne neschimbat| prin rotaÛia axelor. Aceasta înseamn| c| variabilitatea conÛinut| în observaÛiile corespunz|toare
sistemului de axe iniÛial este integral conservat| odat| cu rotaÛia axelor.
Coordonatele observaÛiilor variabilelor în condiÛiile rotaÛiei axelor
Tabelul 6.2
Coordonatele variabilelor pentru diferite unghiuri de rotaÛie

ObservaÛia 10 grade 30 grade 45 grade 60 grade 90 grade

0,504 -0597 0,269 -0,733 0,071 -0,778 -0,133 -0,769 -0,500 -0,60

-1,292 0,736 -0,962 1,133 -0,636 1,343 -0,267 1,462 0,500 1,400

4,327 3,806 5,368 2,097 5,728 0,636 5,697 -0,868 4,500 -3,60

-5,288 -4,652 -6,561 -2,563 -7,000 -0,778 -6,963 1,060 -5,500 4,400

-1,466 -0,249 -1,462 0,267 -1,343 0,636 -1,133 0,962 -0,500 1,400

0,040 2,531 0,904 2,365 1,485 2,051 1,965 1,596 2,500 0,400

0,851 1,373 1,269 0,999 1,485 0,636 1,599 0,230 1,500 -0,60

2,647 0,041 2,502 -0,867 2,192 -1,485 1,733 -2,002 0,500 -2,60

0,157 -2,566 -0,730 -2,465 -1,343 -2,192 -1,865 -1,769 -2,500 -0,60

-0,481 -0,423 -0,596 -0,233 -0,636 -0,071 -0,633 0,096 -0,500 0,400

VarianÛa 6,527 5,795 9,396 2,926 10,606 1,716 10,624 1,698 7,389 4,933
VarianÛa total| 12,322 12,322 12,322 12,322 12,322

Este evident c| rotaÛia axelor cu 90 de grade, determin| interschimbarea valorilor observaÛiilor celor dou| variabile. În mod
corespunz|tor, are loc Õi interschimbarea valorilor varianÛelor celor dou| variabile.
Pentru a ilustra modificarea valorilor pe care le iau varianÛele, în tabelul urm|tor sunt prezentate varianÛele individuale ale celor dou|
variabile, varianÛa total| Õi ponderile varianÛelor individuale în varianÛa total|, pentru coordonatele calculate corespunz|tor unor rotaÛii ale
axelor iniÛiale din 5 în 5 grade.

Schimbarea varianÛelor individuale pentru diferite unghiuri de rotaÛie a axelor


Tabelul 6.3
Procent faÛ| de varianÛa
Unghi VarianÛa individual| VarianÛ| total| (%)
de rotaÛie total|

0 4,9333 7,3888 12,3221 46,45 53,55


5 5,7237 6,5984 12,3221 52,97 47,03
10 6,5274 5,7947 12,3221 59,41 40,59

44
Procent faÛ| de varianÛa
Unghi VarianÛa individual| VarianÛ| total| (%)
de rotaÛie total|

15 7,3200 5,0021 12,3221 65,55 34,45


20 8,0774 4,2448 12,3221 71,23 28,77
25 8,7765 3,5456 12,3221 76,25 23,75
30 9,3962 2,9259 12,3221 80,49 19,51
35 9,9175 2,4046 12,3221 83,79 16,21
40 10,3248 1,9973 12,3221 86,07 13,93
45 10,6055 1,7166 12,3221 87,25 12,75
50 10,7512 1,5709 12,3221 87,30 12,70
52,7214 10,7720 1,5501 12,3221 87,42 12,58
55 10,7574 1,5647 12,3221 86,22 13,78
60 10,6240 1,6982 12,3221 84,03 15,97
65 10,3549 1,9672 12,3221 80,82 19,18
70 9,9584 2,3637 12,3221 76,66 23,34
75 9,4466 2,8756 12,3221 71,70 28,30
80 8,8349 3,4872 12,3221 66,08 33,92
85 8,1420 4,1802 12,3221 59,96 40,04
90 7,3888 4,9333 12,3221 81,59 18,41

În figura urm|toare este reprezentat| varianÛa variabilei pentru fiecare rotaÛie cu corespunz|toare rotaÛiei axelor din 5 în 5 grade.

Figura 6.2: Reprezentarea grafic | a varian Ûei primei variabile în func Ûie de
m |rimea unghiului de rota Ûie a axelor
Dup| cum se poate observa, pe m|sur| ce unghiul de rotaÛie creÕte, varianÛa creÕte, atingând un maxim pentru un unghi de rotaÛie de
52,7 grade, dup| care varianÛa începe s| se reduc|. Pe de alt| parte, pe m|sur| ce varianÛa primei variabile creÕte, varianÛa celei de-a doua
variabile scade, astfel încât suma celor dou| varianÛe sau varianÛa total| r|mâne constant|. Similar, sc|derea varianÛei primei variabile este
însoÛit| de creÕterea varianÛei celei de-a doua variabile. Aceasta înseamn| c| atunci când varianÛa variabilei este maxim|, varianÛa variabilei
este minim|. În final, se spoate spune c|, rotaÛia axelor iniÛiale cu un unghi de 52,7 grade maximizeaz| varianÛa variabilei Õi minimizeaz|
varianÛa variabilei . Aceast| rotaÛie a axelor cu un unghi de 52,7 grade este chiar transformarea de care este nevoie pentru a maximiza
relevanÛa observaÛiilor primei variabile.

Exemplul precedent eviden Ûiaz | faptul c | prin rota Ûia axelor cu un anumit num |r de grade se poate ob Ûine o diferen Ûiere
a semnifica Ûiei variabilelor originale, din punct de vedere al propor Ûiei pe care acestea o explic | din varian Ûa total|. În aceste
condiÛii, se pune problema de a g |si o rota Ûie optimal | a axelor, astfel încât în noul sistem de axe semnifica Ûiile informa Ûionale
ale variabilelor s| fie cât mai accentuate, problem | care define Õte în mod sintetic Õi sugestiv esen Ûa logicii componentelor
principale.

6.4.2 Transformarea coordonatelor obiectelor prin rotaÛia axelor


Ca urmare a rota Ûiei axelor cu un num |r oarecare de grade are loc, în mod implicit, o modificare a coordonatelor ini Ûiale
ale obiectelor. Pentru ilustrarea modului în care are loc modificarea coordonatelor obiectelor, ca urmare a rota Ûiei axelor, vom
considera exemplul urm |tor.

Exem plul 6.3


Presupunând contextul informaÛional din Exemplul 6.1, vom calcula coordonatele ce corespund obiectelor în condiÛiile în care axele

45
sunt rotite în aÕa fel încât s| asigure maximizarea varianÛei primei variabile. Coordonatele noilor punctelor, reprezentate de observaÛiile celor
dou| variabile în sistemul de axe rotit cu un unghi de 52,7 grade, sunt prezentate în tabelul urm|tor.

Coordonatele observaÛiilor în sistemul de axe rotit cu 52,7 grade


Tabelul 6.4
Coordonate transformate
ObservaÛia

-0,344 -7,803
-4,502 14,168
57,611 -1,388
-70,414 1,696
-12,458 8,111
17,469 18,325
15,569 4,312
19,727 -17,659
-16,258 -19,917
-6,401 0,154
Media 0 0
VarianÛa 10,7720 1,5501

Dac| vom presupune c| cele dou| serii de observaÛii din tabel, rezultate în urma transform|rii reprezentate de rotaÛia axelor cu un unghi
de 52,7 grade, sunt observaÛiile corespunz|toare unor noi variabile, notate cu , vom putea spune c| am definit dou| noi variabile,
care sunt necorelate Õi care au varianÛele în aÕa fel încât varianÛa primei variabile este maximal|. Aceste noi variabile sunt chiar
componentele principale, iar observaÛiile corespunz|toare acestora Õi definite de relaÛiile:
,

reprezint| scorurile componentelor principale.


Prima component| principal| are varianÛa 10,772, iar cea de-a doua component| principal| are varianÛa 1,5501. În acest fel, prima
component| principal| preia 87,42% din varianÛa total| Õi deci sintetizeaz|, explic| într-o proporÛie suficient de mare cele dou| variabile
originale. Matricea produselor încruciÕate, matricea de covarianÛ| Õi matricea de corelaÛie pentru cele dou| componente principale sunt:

În consecinÛ|, în locul observaÛiilor ce corespund celor dou| variabile originale, în analiz| pot fi utilizate observaÛiile corespunz|toare
primei componente principale, adic| scorurile acesteia, în condiÛiile unei pierderi informaÛionale de 12,78%.
Axele noului spaÛiu, rezultate din rotaÛia axelor iniÛiale cu 52,7 grade, sunt definite, în mod similar, de urm|torii doi vectori:
, respectiv: .

Cei doi vectori, , care definesc noile axe, sunt vectori de lungime unitar| Õi sunt ortogonali, adic| verific| urm|toarele relaÛii:

Unghiul dintre vectorul , reprezentând prima ax| nou|, Õi vectorul , reprezezntând prima din axele iniÛiale, reprezint| chiar unghiul
de rotaÛie a axelor, respectiv 52,72 grade. În virtutea ortogonalit|Ûii, aceeaÕi valoare o are Õi unghiul dintre vectorul Õi vectorul .
Cosinusurile unghiurilor dintre vectorii fiec|reia dintre cele cele dou| perechi vor fi:

iar acestora le vor corespunde acelaÕi unghi, de 52,72 grade:


.
În graficul din figura urm|toare este sunt reprezentate atât axele iniÛiale, cât Õi noile axe, adic| axele rotite cu 52,72 grade. Coordonatele
observaÛiilor în noile axe, adic| valorile din tabelul anterior, reprezint| proiecÛiile punctelor pe noile axe ale spaÛiului.

46
Figura 6.3: Reprezentarea grafic | a observa Ûiilor în sistemul de axe
rotite cu 52,72 grade

Referitor la exemplificarea anterioar | cu privire la logica determin |rii componentelor principale, putem face urm |toarele
observa Ûii finale:
• rota Ûia axelor iniÛiale cu un anumit unghi, în vederea maximiz |rii varian Ûei de-a lungul unei axe, nu modific | pozi Ûia
sau configura Ûia punctelor reprezentate de observa Ûiile originale; ceea ce se schimb | sunt doar coordonatele acestora în
raport cu noile axe;
• noile axe rezultate în urma rora Ûiei care maximizeaz | varian Ûa dup | prima ax | definesc dou | noi variabile, numite
com ponente principale Õi care au proprietatea c | au media nul|;
• cele dou | variabilele numite componente principale reprezint| combina Ûii liniare de variabilele originale Õi sunt
necorelate între ele;
• coordonatele noilor variabile sunt proiec Ûiile punctelor reprezentate de observa Ûiile iniÛiale Õi se numesc scoruri ale
com ponentelor principale;
• cele dou | componente principale conserv | integral varian Ûa total| corespunz |toare variabilelor originale, adic |
suma varian Ûelor celor dou | componente principale este egal| cu suma varian Ûelor celor dou | variabile originale;
• prima component | principal | are varian Û| maxim al|, preluând maximum posibil din varian Ûa total| ce
caracterizeaz | variabilele originale.

6.4.3 Corelarea variabilelor Õi componentelor principale


Eficien Ûa exprim |rii variabilelor originale prin intermediul componentelor principale este strâns legat | de gradul de
corelare a variabilelor originale Õi, mai ales, de felul în care sunt structurate aceste variabile din punct de vedere al corel|rii.
În leg |tur | cu gradul de corelare a variabilelor originale, se poate face o observa Ûie extrem de interesant| din punct de
vedere teoretic Õi foarte util| din punct de vedere practic. Aceast| observa Ûie se refer | la faptul c | exist| o puternic | leg |tur |
între gradul de corelare a variabilelor originale Õi num |rul de componente principale cu ajutorul c |rora pot fi reexprimate,
în mod eficient, variabilele originale.
Dac | pe mulÛimea variabilelor originale se eviden Ûiaz | cu claritate existen Ûa unor submulÛimi formate din variabile care
au proprietatea c | sunt foarte puternic corelate între ele, pe de o parte, Õi foarte slab corelate cu variabile apar Ûinând altor
submulÛimi, pe de alt| parte, atunci se poate face afirma Ûia c | variabilele originale pot fi reexprimate suficient de bine printr-un
num |r de componente principale egal cu num |rul de submulÛimi de acest fel.
Remarc |: Se poate spune c |, în general, num |rul de componente principale este egal cu num |rul grupelor de variabile
care sunt foarte puternic corelate între ele.
Cu cât gradul de corelare a variabilelor din interiorul fiec |rei submulÛimi este mai ridicat Õi al variabilelor din mulÛimi
diferite este mai sc |zut, cu atât este mai mare puterea de reprezentare a informa Ûiei iniÛiale prin intermediul unui num |r de
componente principale egal cu num |rul submulÛimilor.
De pild |, dac | gradul de corelare a oric |ror dou | variabile din mulÛimea de variabile originale este foarte sc |zut, exist|
pu Ûine Õanse de reu Õi s| se exprime convenabil variabilele originale printr-un num |r componente principale mai mic decât al
variabilelor originale. Dac |, dimpotriv |, corelarea oric |ror dou | dou | variabile este foarte puternic |, atunci variabilele originale
pot fi exprimate suficient de bine chiar prin intermediul unei singure componente principale.
Vom ilustra leg |tura direct| care exist| între gradul de corelare al variabilelor Õi num |rul de componente principale cu
ajutorul urm |torului exemplu.

Exem plul 6.4


În cadrul acestui exemplu vom ar|ta cum, în funcÛie de diferite moduri în care se coreleaz| variabilele originale, rezult| diferite
posibilit|Ûi de reprezentare a acestora prin intermediul componentelor principale. Pentru început, vom considera cazul unui num|r de 5
variabile originale, care au proprietatea c| sunt foarte slab corelate între ele. Matricea de corelaÛie pentru aceste variabile, matrice care
evidenÛiaz| necorelarea variabilelor, este urm|toarea:

47
.

Valorile proprii pentru aceast| matrice de corelaÛie Õi semnificaÛiile lor relative se g|sesc în tabelul urm|tor.

InformaÛii cu privire la valorile proprii ale matricii de corelaÛie


Tabelul 6.5
Pondere
Nr. Crt. Valori proprii Pondere (%)
cumulat| (%)
1 1,292867 25,857 25,857
2 1,112724 22,255 48,112
3 0,965477 19,309 67,421
4 0,893816 17,877 85,298
5 0,735115 14,702 100,000

Analiza valorilor proprii prezentate în tabel arat| c| exprimarea prin intermediul componentelor principale a celor 5 variabile originale
poate fi satisf|c|toare numai dac| se folosesc 4 sau chiar 5 componente principale. Acest lucru se întâmpl| deoarece chiar contribuÛia
ultimelor componente principale la explicarea varianÛei totale este relativ ridicat|, astfel încât renunÛarea la ele este echivalent| cu o pierdere
semnificativ| de informaÛie.
Cazul limit| pentru situaÛia de necorelare a variabilelor originale este cel în care matricea de corelaÛie este egal| cu matricea unitate.
În acest caz, toate valorile proprii sunt egale cu unitatea, iar contribuÛia fiec|reia la formarea varianÛei totale este de 20%, adic| un procent
relativ ridicat. Rezult| c| pentru a asigura conservarea varianÛei totale în proporÛie de peste 80% este necesar| luarea în considerare a tuturor
componentelor principale.
Vom considera acum o a doua situaÛie, opus| celei precedente, Õi anume aceea în care toate variabilele originale sunt puternic corelate.
Matricea de corelaÛie presupus| pentru acest caz este:
.

Tabelul urm|tor conÛine situaÛia celor 5 valori proprii corespunz|toare matricii de corelaÛie considerate.

InformaÛii cu privire la valorile proprii ale matricii de corelaÛie


Tabelul 6.6
Nr. Pondere
Valori proprii Pondere (%)
Crt. cumulat| (%)
1 4,828053 96,561 96,561

2 0,082870 1,657 98,218

3 0,067152 1,343 99,561

4 0,017526 0,351 99,912

5 0,004399 0,088 100,000

În acest caz, o singur| component| principal|, Õi anume prima, poate fi folosit| pentru a sintetiza din punct de vedere informaÛional toate
cele 5 variabile originale. Prin intermediul acestei componente principale se asigur| conservarea a peste 96% din variabilitatea conÛinut| în
spaÛiul cauzal iniÛial, determinat de cele 5 variabile.
Ôi în aceast| situaÛie exist| un caz limit|, anume acela în care matricea de corelaÛie are toate elementele egale cu unitatea, expresie a
unei corel|ri perfecte a oric|ror dou| variabile originale. În acest caz, prima valoare proprie este egal| cu 5,0, iar celelalte patru valori proprii
sunt nule. Aceasta înseamn| c| prima component| principal| asigur| captarea întregii variabilit|Ûi individuale, varianÛa ei fiind egal| cu
varianÛa total| din spaÛiul cauzal iniÛial.
Rezult| c| prima component| principal| exprim| din punct de vedere informaÛional toate cele 5 variabile originale, f|r| pierdere de
informaÛie. Acest lucru este natural deoarece corelarea perfect| a oric|ror dou| variabile originale nu înseamn| altceva decât c| aceste
variabile sunt identice.
În sfârÕit, o a treia situaÛie pe care vrem s-o lu|m în considerare este aceea în care pe mulÛimea variabilelor originale se evidenÛiaz| grupe
de variabile puternic corelate.Vom considera cazul a 6 variabile originale, pe mulÛimea c|rora se evidenÛiaz| trei grupe de variabile puternic
corelate. Matricea de corelaÛie care exprim| o astfel de situaÛie este urm|toarea:

48
.

Din analiza matricii de corelaÛie se poate observa c| exist| trei grupe de variabile corelate puternic: , , respectiv
. Pe de alt| parte, între cele trei grupe exist| leg|turi foarte slabe. Aceasta înseamn| c| pentru a exprima cele 6 variabile sunt sufi-
ciente, practic, doar trei componente principale, care vor acoperi variabilitatea din spaÛiul celor 6 variabile într-o proporÛie foarte mare. În
tabelul urm|tor sunt prezentate cele 6 valori proprii ale acestei matrici de corelaÛie Õi informaÛiile privind ponderea fiec|rei valori proprii.

InformaÛii cu privire la valorile proprii ale matricii de corelaÛie


Tabelul 6.7
Nr. Pondere
Valori proprii Pondere (%)
Crt. cumulat| (%)
1 2,308133 38,469 38,469
2 1,766032 29,434 67,903
3 1,750709 29,178 97,071
4 0,132365 2,206 99,287
5 0,042761 0,713 100,000
6 0,000000 100,000 100,000

Într-adev|r valorile proprii Õi ponderea lor în varianÛa total| arat| c| primele trei componente principale preiau din variabilitatea spaÛiului
iniÛial 97,071%. Fiecare dintre aceste trei componente principale exprim| variabilele originale din fiecare cele trei grupe de varibile corelate.
Astfel, se justific| ideea c| num|rul de componente principale este egal cu num|rul de submulÛimi de variabile originale puternic corelate.

6.5 Modelul matematic al componentelor principale


În scopul formul |rii modelului matematic care st| la baza analizei componentelor principale, vom considera c | spa Ûiul
cauzal iniÛial supus investig |rii este determinat de un num |r de n variabile explicative notate . Aceste variabile
simbolizeaz | caracteristici ale obiectelor supuse analizei, ceea ce înseamn | c | fiecare obiect este presupus a fi caracterizat de
n variabile.
Activitatea de determinare a componentelor principale poate fi descris | prin intermediul unei transform |ri de tipul urm |tor:
,
unde sunt dou | spa Ûii vectoriale reale, iar dimensiunea celui de-al doilea spa Ûiu este mult mai mic | decât dimensiunea
primului spa Ûiu, respectiv .
Prin intermediul transform |rii , un anumit obiect x, apar Ûinând spa Ûiului n-dimensional , este transformat într-un
obiect w, apar Ûinând spa Ûiului k-dimensional . Transformarea vizeaz | atât modificarea coordonatelor obiectului, cât Õi
reducerea num |rului acestor coordonate.
Vom ar |ta în continuare c |, dac | Õi , atunci transformarea este o aplica Ûie liniar | de tipul urm |tor:
,
unde A este o matrice de numere reale, de dimensiune .
Rezolvarea problemei const | în determinarea matricii A, astfel încât un obiect w s | constituie o reprezentare cât mai bun |
pentru obiectul x.

6.5.1 RelaÛiile de definire a componentelor principale


Am anticipat anterior c |, de fapt, componentele principale sunt combina Ûii liniare de variabilele originale, combina Ûii care
au îns | o serie de propriet|Ûi. În condiÛiile ipotezelor Õi preciz |rilor anterioare, putem privi cele n componente principale,
corespunz |toare spa Ûiului cauzal analizat, sub forma unui vector n-dimensional, notat cu w:

49
Fiecare coordonat| a acestui vector reprezint| o component | principal | definit| în raport cu variabilele originale, cu
ajutorul combina Ûiei liniare urm |toare:
(6.1)

Este evident c | pentru determinarea componentei principale este necesar | determinarea coeficien Ûilor , care definesc
combina Ûia liniar | corespunz |toare acestei componente principale.
A Õa cum o s | vedem în continuare, coeficien Ûii sunt chiar coordonatele vectorilor proprii corespunz |tori matricii de
covarian Û| a variabilelor originale , iar varian Ûele componentelor principale sunt chiar valorile proprii ale acestei
matrici.
Conform definiÛiei componentelor principale, determinarea acestor coeficien Ûi trebuie s | se fac | în a Õa fel încât componenta
principal | s | aib | varian Ûa maxim |.
Considerând c | cei n coeficien Ûi ai combina Ûiei liniare de mai sus sunt coordonatele vectorului n-dimensional
, respectiv:

putem defini componenta principal | sub forma urm |toare:

(6.2)

unde coordonatele vectorului sunt alese astfel încât s | se asigure maximizarea varian Ûei componentei principale .
Deoarece ccea de-a i-a component | principal |, , este în realitate o transformare liniar| a elementelor vectorului x,
presupus a fi repartizat normal, de medie : Õi matrice de covarian Û| G, rezult| c | aceast| component | principal | este ea îns |Õi,
de asemenea, o variabil| aleatoare, repartizat| normal.
Pe baza rela Ûiei (6.2), care define Õte componenta principal | , pot fi deduse media Õi varian Ûa acestei componente
principale astfel:
.
Rezult| c |:
.
Având f|cute preciz |rile de mai sus, vom trece în continuare la descrierea modelului matematic pe care se bazeaz | analiza
componentelor principale.

6.5.2 Formularea modelului matematic


Am ar |tat anterior c | solu Ûionarea problemei de analiz | a componentelor principale din punct de vedere matematic este
echivalent | cu rezolvarea problemei de extrem urm |toare:

unde criteriul de optim poate fi maxim sau minim, în func Ûie de natura func Ûiei . Dac | func Ûia este o func Ûie de tip distan Û|,
atunci criteriul de optim va fi reprezentat de minimizarea func Ûiei . În cazul în care func Ûia este o m |sur | a cantit|Ûii de
informa Ûie adus | de noua modalitate de reprezentare a obiectelor, criteriul de optim va i reprezentat de maximizarea func Ûiei .
O astfel de situa Ûie este specific | variantei standard de solu Ûionare a problemei componentelor principale, în care se urm |re Õte
maximizarea varian Ûei componentelor principale, ca m |sur | a cantit|Ûii de informa Ûie exprimat | de fiecare dintre acestea.
În scopul definirii modelului matematic al analizei componentelor principale, vom considera c | vectorii "(i) reprezint|
coloanele unei matrici A de dimensiune n×n de forma:

De asemenea, vom presupune c | x este vectorul ale c |rui coordonate sunt variabilele originale Õi c | w este

50
vectorul ale c |rui coordonate sunt componentele principale . În aceste condiÛii, combina Ûiile liniare care definesc
componentele principale pot fi scrise sub forma:

sau, în scriere matricial|, sub forma:

Pe baza acestor nota Ûii, m odelul matem atic al analizei com ponentelor principale poate fi definit astfel:

(6.3)

A Õa cum vom vedea în continuare, cele n coloane ale matricii A reprezint | de fapt vectorii proprii normaliza Ûi ai matricii
de covarian Û| G, iar varian Ûa fiec |rei componente principale , care este o varian Û| maximal | în raport cu varian Ûele
componentelor principale anterioare, este reprezentat| chiar de valoarea proprie a aceleea Õi matrici de covarian Û|. Aceast |
modalitate de determinare a elementelor matricii A este echivalent| cu calculul proiec Ûiilor obiectelor de tip pe subspaÛiul
liniar generat de vectorii coloanelor matricii A.
Am v |zut anterior c | cele n componente principale ale spa Ûiului cauzal determinat de variabilele originale , sunt
definite de combina Ûiile liniare:
,

ale c |ror ponderi se determin | în a Õa fel încât s| maximizeze varian Ûa componentelor principale .
În scopul simplific |rii nota Ûiilor, vom renun Ûa, temporar, la unii dintre indicii care apar în rela Ûii. Astfel, vom considera
în continuare c | w este nota Ûia generic | pentru o anumit| component | principal |, iar " este nota Ûia generic | pentru vectorul
coeficien Ûilor ce definesc combina Ûia liniar | pentru aceast | component | principal |.
În acest sens, vom avea grij | s | specific |m explicit, la fiecare apariÛie a nota Ûiei w, dac | este vorba de vectorul w sau de
componenta principal | w Õi s| men Ûion |m explicit indicele componentei principale atunci când o privim ca pe un element al
vectorului componentelor principale w.

6.5.3 Formularea problemei de maximizare a varianÛei


Din punct de vedere teoretic, problema determin |rii componentele principale poate fi formulat| ca o problem | de
maximizare cu restric Ûii, iar elementele implicate în definirea componentelor principale sunt solu Ûiile acestei probleme. Criteriul
de optim ata Õat acestei probleme de extrem este reprezentat de maximizarea varian Ûei componentelor principale, astfel încât
acestea s | preia o propor Ûie cât mai mare din variabilitatea spa Ûiului cauzal iniÛial. În condiÛiile folosirii nota Ûiei simplificate,
men Ûionat| anterior, varian Ûa componentei principale w poate fi scris | astfel:
.
Principala problem | care se pune în leg |tur | cu definirea componentelor principale este aceea a determin |rii necunoscutelor
reprezentate de coordonatele vectorului " astfel încât varian Ûa componentei principale w, adic | Var(w), s | fie maxim |. Din
nefericire, problema determin |rii acestor necunoscute este o problem | nedeterminat|. Astfel, admi Ûând c | vectorul " este o
solu Ûie a problemei, rezult| c | Õi produsul a ", unde a este o constant | arbitrar |, este o solu Ûie a aceleia Õi probleme, iar varian Ûa
componentei principale w este cu atât mai mare cu cât lu |m o valoare mai mare pentru constanta a.
Pentru a avea asigurarea c | problema enun Ûat| este bine determinat|, va trebui s| impunem o restric Ûie asupra vectorului
necunoscut " , cea mai natural| restric Ûie fiind dat|, în acest caz, de condiÛia ca lungimea vectorului " s | fie unitar |:
.
Verificarea acestei restric Ûii în definirea componentelor principale este echivalent| cu o fixare a scalei coeficien Ûilor Õi ofer |
asigurarea c | efectuarea oric |rei opera Ûii de scalare asupra coeficien Ûilor combina Ûiilor liniare care definesc componentele
principale, nu determin | modificarea varian Ûelor acestora.
În aceste condiÛii, problema determin |rii componentelor vectorului " ce definesc combina Ûia liniar | reprezentând
componenta principal | w se reduce la rezolvarea urm |toarei probleme de extrem cu leg |turi:

51
(6.4)

unde variabilele de alegere sau necunoscutele problemei sunt reprezentate de componentele vectorului ". Vectorul , care este
solu Ûie a acestei probleme, define Õte o component | principal| de varian Û| maximal |.
Rezolvarea problemei de extrem condiÛionat precedente poate fi f|cut | cu ajutorul metodei multiplicatorilor lui Lagrange,
metod | care reduce problema de extrem condiÛionat la o problem | de extrem liber. Func Ûia Lagrangean asociat| problemei de
extrem (6.4), folosit| pentru rezolvarea indirect| a acestei probleme de extrem, are forma urm |toare:
(6.5)

CondiÛiile necesare de extrem pentru func Ûia Lagrangean definit| de rela Ûia (6.5) sunt date de anularea derivatelor par Ûiale
în raport cu componentele vectorului " Õi cu multiplicatorul 8, respectiv:

(6.6)

Din prima condiÛie necesar | de extrem, care mai poate fi scris | Õi sub forma urm |toare:
.
rezult| c | solu Ûia a problemei de extrem (6.4) este chiar unul din vectorii proprii ai matricii de covarian Û| G, anume cel
asociat valorii proprii a aceleia Õi matrici. Mai mult, se observ | c | valoarea maxim | a formei p |tratice este, în punctul
de extrem , egal| cu , respectiv:
.
Aceast | ultim | rela Ûie eviden Ûiaz | faptul c | varian Ûa unei componente principale este egal| cu o valoare proprie a matricii
de covarian Û|.

6.5.4 Deducerea componentelor principale


Rezultatele ob Ûinute mai sus arat| c | determinarea coeficien Ûilor combina Ûiei liniare ce define Õte componenta principal |
w, în condiÛiile maximiz |rii varian Ûei acestei componente principale, este echivalent| cu a alege dintre cele n valori proprii ale
matricii de covarian Û| G pe cea mai mare Õi a determina componentele vectorului de ponderi " ce define Õte respectiva
component | pricipal | prin calculul vectorului propriu al matricii G asociat cu acea valoare proprie.
A Õa cum vom vedea în continuare, pentru fiecare valoare proprie din cele n valori proprii ale matricii de covarian Û| G,
vom avea câte o solu Ûie a problemei de maxim de mai sus, adic | câte un vector "(i) Õi deci câte o component | principal | .
Presupunând c | cele n valori proprii ale matricii de covarian Û| G sunt ordonate în a Õa fel încât:
,
prima component | pricipal | w 1, care va avea varian Ûa maxim | 81, este dat| de combina Ûia liniar |:
.
(1)
Vectorul " este acel vector propriu al matricii de covarian Û| G c |ruia îi corespunde valoarea proprie cea mai mare, ,
adic | este vectorul care verific | restric Ûiile de mai jos:

Valoarea proprie 81 este r |d |cin | a ecua Ûiei caracteristice:


,
iar I este nota Ûia pentru matricea unitate.
Determinarea în acest fel a componentei principale , face ca aceasta s | aib | propriet|Ûile ilustrate prin rela Ûiile urm |toare:
.
Dup | determinarea primei componente principale w 1, urmeaz | determinarea celei de-a doua componente principale w,
component | care trebuie s | fie caracterizat|, la rândul s |u, de urm |toarele propriet|Ûi: s | aib | varian Û| maximal| Õi s | fie
necorelat| cu prima component| principal| w 1.

Exem plul 6.5


Pentru a ilustra modul de calcul implicat de analiza componentelor principale, vom considera cazul unui num|r de 10 obiecte, fiecare
obiect având un num|r de 5 caracteristici exprimate prin intermediul variabilelor . M|sur|torile efectuate asupra
caracteristicilor celor 10 obiecte sunt presupuse a fi cele din tabelul urm|tor.

52
ObservaÛii iniÛiale
Tabelul 6.8
Caracteristici
Obiecte

O1 3,31 3,02 4,27 5,31 4,24


O2 2,76 3,94 4,14 8,07 11,08
O3 10,86 15,16 15,19 6,42 6,55
O4 9,29 9,71 10,94 8,15 11,34
O5 8,36 9,12 11,91 7,13 8,33
O6 12,07 11,12 13,69 8,05 11,01
O7 4,73 2,99 4,76 18,12 28,21
O8 8,77 14,13 13,56 6,17 5,99
O9 18,10 21,00 13,67 11,16 23,39
O10 4,58 8,83 7,43 14,84 16,97
Medie 8,283 9,902 9,957 9,342 12,711
Abatere
4,716 5,798 4,378 4,150 7,845
standard
EstimaÛia pentru matricea de covarianÛ| corespunz|toare celor 5 variabile originale este urm|toarea:

iar valorile proprii ale matricii de covarianÛ| sunt:

Suma celor 5 valori proprii, reprezentând varianÛele celor 5 componente principale, este egal| cu suma varianÛelor variabilelor originale:

Vectorii proprii ai matricii de covarianÛ| E, corespunz|tori valorilor proprii menÛionate anterior sunt prezentaÛi sub forma liniilor matricii
urm|toare:

Cei 5 vectori proprii sunt de lungime egal| cu unitatea Õi sunt ortogonali doi câte doi, astfel încât matricea U este ortogonal|. Deoarece
suma varianÛelor primelor dou| componente principale reprezint| 96,623% din varianÛa celor 5 variabile originale, adic|:

se poate considera c| cele 5 variabile originale pot fi reexprimate suficient de bine din punct de vedere informaÛional - în limita unei pierderi
de 3,4% - prin intermediul primelor dou| componente principale ale c|ror ecuaÛii sunt:

Coordonatele celor 10 obiecte în spaÛiul redus, ale c|rui axe sunt reprezentate de primii doi vectori ai matricii de covarianÛ| E, sunt
prezentate în tabelul urm|tor:

Scorurile principale ale obiectelor


Tabelul 6.9
Coordonatele obiectelor
Obiectele

O1 -54,037 -101,762

53
Coordonatele obiectelor
Obiectele

O2 7,284 -82,893
O3 -78,067 44,211
O4 -17,385 3,534
O5 -44,532 -7,746
O6 -29,873 33,017
O7 174,078 -34,196
O8 -76,982 21,818
O9 56,611 144,532
O10 62,904 -20,515

În analiza componentelor principale coordonatele obiectelor în spaÛiul redus se mai numesc Õi scoruri principale ale obiectelor.
Dac| vom presupune c| au fost reÛinute p componente principale Õi dac| vom nota cu matricea de dimensiune , ale c|rei coloane
sunt cei p vectori proprii care definesc cele p componente principale, atunci matricea scorurilor poate fi determinat| astfel:
.

Liniile matricii W reprezint| scorurile corespunz|toare noilor variabile sau observaÛiile celor p componente principale. O dat|
determinate, scorurile principale pot fi folosite în analiz| ca substitut al observaÛiilor originale, simplificând, în acest fel, baza informaÛional|
iniÛial|. În leg|tur| cu aceast| problem|, consider|m c| este extrem de important s| facem precizarea c| scorurile principale sunt mai potrivite
pentru a fi folosite în analize deoarece sunt mai puÛin afectate de erori, în comparaÛie cu m|sur|torile originale. Faptul c| scorurile principale
sunt mai robuste în raport cu perturbaÛiile introduse de erori, c| au o anumit| invarianÛ| în raport cu erorile, le face s| devin| mai importante
din punct de vedere informaÛional decât observaÛiile originale. Deoarece noul spaÛiu redus are numai dou| axe, cele 10 obiecte pot fi repre-
zentate grafic în acest spaÛiu. Reprezentarea grafic| din figura urm|toare arat| poziÛionarea celor 10 obiecte în raport cu axele noului spaÛiu.

Figura 4.6: Reprezentarea obiectelor în spa Ûiul redus

În condiÛiile în care obiectele reprezint| entit|Ûi reale, un astfel de grafic poate servi ca baz| eficient| pentru o analiz| a mulÛimii de
obiecte. PoziÛionarea obiectelor în raport cu cele dou| axe ofer| o prim| imagine cu privire la leg|turile dintre obiecte, evidenÛiind cu claritate
similarit|Ûile sau nesimilarit|Ûile dintre acestea.

6.6 Propriet|Ûile componentelor principale


Componentele principale au o serie de propriet|Ûi extrem de interesante, care decurg chiar din modul lor de definire Õi care
sunt importante pentru a în Ûelege natura Õi con Ûinutul acestor construc Ûii abstracte.
Una dintre propriet|Ûile men Ûionate se refer | la faptul c | varian Ûa fiec |rei componente principale este maxim | Õi este egal|
cu o valoare proprie a matricii de covarian Û|. Alt| proprietate a componentelor principale este aceea c | ele sunt necorelate
dou | câte dou |, aceast| proprietate fiind echivalent |, în cazul în care componentele principale sunt distribuite dup | legea de
probabilitate normal|, cu proprietatea de independen Û|.
În afara acestor propriet|Ûi, implicate de îns |Õi modul lor de definire, componentele principale au o alt| serie de propriet|Ûi
deosebit de importante pentru modelarea matematic |, în general, Õi pentru analiza economic |, în special. În continuare, vom
prezenta pe scurt fiecare dintre aceste propriet|Ûi.

6.6.1 Distribuirea dup| legea normal|


În condiÛiile în care variabilele originale sunt repartizate normal, vectorul componentelor principale w este repartizat

54
norm al cu media Õi matricea de covarian Û| 7, adic |:
,
unde 7 este matricea diagonal| ale c |rei elemente sunt valorile proprii ale matricii de covarian Û| G.
Normalitatea celor n variabile reprezentând componentele principale rezult| din faptul c | acestea sunt combina Ûii liniare
de cele n variabile originale, care, prin ipotez |, sunt variabile normale. Pentru a ar |ta c | matricea de covarian Û| a vectorului
w este matricea 7 este suficient s | ar |t|m c | dac |:
,
x fiind repartizat normal, cu matricea de covarian Û| G, atunci matricea de covarian Û| a transform |rii liniare w este:
.

6.6.2 Conservarea varianÛei totale


Componentele principale au o proprietate care le face s | fie adecvate din punct de vedere informa Ûional pentru a substitui
variabilele originale. Aceast | proprietate se refer | la faptul c | prin intermediul componentelor principale se asigur | conservarea
variabilit|Ûii din spa Ûiul cauzal iniÛial.
Componentele principale asigur | conservarea integral| a varian Ûei totale a variabilelor originale ,
ceea ce înseamn | c |:

Exem plul 6.6


Vom presupune c| estimaÛia pentru o matrice de covarianÛ| corespunz|toare observaÛiilor efectuate asupra a 3 variabile este de forma
urm|toare:
.

Elementele diagonale ale acestei matrici reprezint| varianÛele corespunz|toare celor trei variabile originale, respectiv:
.
Cele trei valori proprii corespunz|toare acestei matrici de covarianÛ| au valorile urm|toare:
.
AÕa cum se poate observa imediat, este verificat| proprietatea menÛionat| anterior, respectiv:
.

6.6.3 Conservarea varianÛei generalizate


Componentele componentele principale asigur | conservarea integral| a varian Ûei generalizate a variabilelor
originale . Aceasta înseamn | c |:
.
Aceast | proprietatea eviden Ûiaz | calitatea informa Ûional| pe care o au componentele principale de a reprezenta o
reexprimare a variabilelor originale.

Exem plul 6.7


Considerând matricea de covarianÛ| din exemplul precedent, se poate observa c| determinantul acestei matrici este egal cu produsul
celor trei valori proprii, respectiv este egal cu determinantul matricii de covarianÛ| ce corepunde celor trei componente principale:
.

6.6.4 DependenÛa de unit|Ûile de m|sur|


Componentele principale Õi varian Ûele acestora depind de unit|Ûile de m |sur | în care sunt m |surate variabilele
originale . Aceasta înseamn | c |, odat | cu schimbarea unit|Ûilor de m |sur| ale variabilelor originale se schimb | atât
componentele principale, cât Õi varian Ûele acestora.
Cunoa Õterea propriet|Ûilor pe care le au componentele principale este deosebit de important | în procesul de analiz | a
datelor, permiÛând stabilirea modific |rilor induse asupra componentelor principale Õi asupra m |rimilor asociate acestora de c |tre
transform |rile aplicate asupra observa Ûiilor variabilelor originale.

55
6.7 Matricea factor
O matrice important | utilizat | în contextul analizei componentelor principale, ale c |rei elemente ofer | premize pentru
interpret|ri interesante, este matricea factor, pe care o vom defini în continuare.
În acest scop, vom presupune c | cele n componente principale sunt reprezentate prin intermediul vectorului w, iar matricea
de covarian Û| a componentelor principale este matricea diagonal | . De asemenea, vom considera leg |tura dintre vectorul
variabilelor originale Õi vectorul componentelor principale ca fiind dat| de rela Ûia:
,
unde A este matricea vectorilor proprii ai matricii de covarian Û| . Atunci matricea de covarian Û| dintre vectorul x al
variabilelor originale Õi vectorul w al componentelor principale poate fi definit| sub forma:
,
matricea de covarian Û| a componentelor principale 7 fiind matricea diagonal| format| din valorile proprii ale matricii de
covarian Û| . Pe baza acestui rezultat, matricea de corela Ûie dintre vectorii n-dimensionali Õi w poate fi definit| sub forma:

,
unde Var(x) este matricea diagonal| ale c |rei elemente sunt reprezentate de varian Ûele variabilelor originale, iar Var(w) este
matricea diagonal| ale c |rei elemente sunt varian Ûele compontelor principale. Deci matricea Var(x) are forma:

iar matricea Var(w) este chiar matricea 7.


Úinând seama de exprimarea anterioar | a covarian Ûei dintre x Õi w, matricea de corela Ûie dintre x Õi w devine:

.
Matricea este o matrice foarte important | pentru analiza componentelor principale Õi este cunoscut| sub numele de
m atrice factor. Modalitatea detaliat| în care aceast| matrice poate fi calculat| este definit| de rela Ûia:

Dup | efectuarea produselor matriciale în rela Ûia de mai sus, matricea cap |t| forma urm |toare:

un element generic din matricea factor fiind determinat de rela Ûia:

Elementele matricii factor se numes intensit |Ûiale factorilor Õi au o interpretare deosebit de interesant| din punct de
vedere al leg |turii dintre variabilele originale Õi componentele principale . Astfel, elementul care se

g |se Õte la intersec Ûia liniei i cu coloana j în matricea factor , adic | elementul , reprezint| coeficientul de corela Ûie

dintre cea de-a i-a variabil| standardizat| Õi cea de-a j-a component| principal| .
Intensit|Ûile factorilor sunt indicatori ai m |surii în care variabilele originale particip | la formarea componentelor principale
sau, mai corect, ai m |surii în care componentele principale sintetizeaz | informa Ûia con Ûinut| în variabilele originale. Cu cât este

56
mai mare valoarea coeficientului de corela Ûie dintr o variabil| original| Õi o component | principal |, cu atât este mai adecvat|
Õi mai complet| exprimarea informa Ûional| a variabilei originale prin intermediul componentei principale respective.
Matricea factor este foarte important | deoarece, pe baza analizei valorilor elementelor ei, pot fi identificate o serie de
partiÛii sau cluster-e pe mulÛimea variabilelor, parti Ûii sau clustere care, asociate cu anumite componente principale, pot conduce
la stabilirea unor semnifica Ûii intuitive pentru acele componente. Aceasta înseamn | c | analiza elementelor matricii factor
poate permite identificarea acelor variabile originale care sunt reprezentate prin intermediul unei anumite componente principale
Õi, pe aceast | baz |, crearea posibilit|Ûii de atribuire a unei semnifica Ûii concrete pentru fiecare component| principal|.
În cazul în care variabilele care intr | în componen Ûa vectorului x sunt standardizate, varian Ûele acestora sunt egale cu
unitatea, ceea ce înseamn | c | matricea este egal| cu matricea unitate. Rezult| c |:

.
În acest caz, coeficientul de corela Ûie dintre ce-a de-a i-a variabil| original| Õi cea de-a j-a component | principal | este
definit sub forma:
.
În aceast | variant |, matricea factor are o proprietate important | care const | în aceea c | suma p |tratelor elementelor din
fiecare coloan | a sa coincide cu varian Ûa componentei principale care se asociaz | cu respectiva coloan |, respectiv:

Ca rezultat al acestei propriet|Ûi, p |tratul unui coeficient de corela Ûie din matricea factor poate fi interpretat ca m |sur | a
contribu Ûiei pe care o are fiecare variabil| original| la formarea varian Ûei componentei principale.

Exem plul 6.8


Vom presupune c| pentru cazul a patru variabile originale matricea de covarianÛ| este de forma urm|toare:

Valorile proprii ale acestei matrici sunt , , Õi . Vectorii proprii


corespunz|tori acestor valori proprii sunt reprezentaÛi sub forma coloanelor matricii :

Matricea factor, obÛinut| din înmulÛirea coloanelor matricii cu r|d|cina p|trat| a valorii proprii corespunz|toare componentelor prin-
cipale Õi din împ|rÛirea liniilor cu abaterea standard corespunz|toare variabilelor originale, este exprimat| prin intermediul urm|torului tablou:

Leg|tura foarte puternic| exprimat| de primii doi coeficienÛi de corelaÛie din prima coloan| evidenÛiaz| faptul c| prima component|
principal| exprim| conÛinutul informaÛional al variabilelor originale . În mod similar, corelaÛia foarte puternic| exprimat| de ultimii
doi coeficienÛi din cea de-a doua coloan| arat| c| cea de-a doua component| principal| sintetizeaz| informaÛional variabile originale
. Din faptul c| primele dou| valori proprii reprezint| 99,77% din suma tuturor valorilor proprii rezult| c| cele patru variabile
originale pot fi exprimate prin intermediul primelor dou| componente principale, cu pierdere neglijabil| de informaÛie.

57
Tema 7. Analiza factorial|

7.1 Scopul analizei factoriale


Înc | de la începuturile utiliz |rii sale în activitatea de cercetare Õtiin Ûific |, analiza factorial| a fost folosit|, aproape exclusiv,
pentru a fundamenta o serie de teorii psihologice referitoare la comportamentul Õi abilitatea uman |. Utilizarea analizei factoriale
în acest scop se bazeaz | pe o facilitatea extraordinar| pe care o ofer | acest instrument, facilitate care const | în existen Ûa
posibilit|Ûii de m |surare indirect|, de cuantificare a unor factori neobservabili.
În psihologie, precum Õi în alte Õtiin Ûe din domeniul economico-social, apare frecvent necesitatea identific |rii Õi studierii
unor entit|Ûi informa Ûionale complexe, care nu pot fi observabile în sens statistic, ceea ce înseamn | c |, în mod implicit, aceste
entit|Ûi nu pot fi direct m |surabile. Aceste entit|Ûi sunt cunoscute în analiza factorial| sub numele de factori comuni Õi factori
specifici. Ca exemple de astfel de entit|Ûi informa Ûionale de acest tip putem men Ûiona statusul social, abilitatea managerial|,
inteligen Ûa, profilul psihologic etc.
Exist| îns | posibilitatea de utiliza alte entit|Ûi informa Ûionale, care au proprietatea c | sunt m |surabile Õi care reflect|
entit|Ûile informa Ûionale neobservabile men Ûionate anterior, astfel încât prin intermediul acestora putem face o evaluare indirect|
a entit|Ûilor neobservabile. Entit|Ûile informa Ûionale utilizate pentru aceast | evaluare indirect| sunt cunoscute în analiza
factorial| sub numele de indicatori.
În acest sens, analiza factorial| poate fi privit| ca o modalitate de a explica Õi interpreta leg |turile dintre anumite variabile
observabile (variabile indicator) în termeni de m |rimi care nu pot fi direct observabile (factori). De exemplu, rezultatele
înregistrate la anumite teste de performan Û|, care au natur | observabil| Õi direct m |surabil|, pot fi explicate Õi interpretate în
termenii unui factor abstract Õi neobservabil în mod direct, care este nivelul de inteligen Û| al celor testa Ûi.

7.2 ImportanÛa Õi necesitatea sintetiz|rii cauzalit|Ûii


O problem | important| în cadrul procesului de studiere Õi descriere a rela Ûiilor de cauzalitate dintre fenomenele Õi procesele
economice, cu o pondere foarte mare în analiza Õi predic Ûia din domeniul economico-social, este cea legat | de necesitatea de
a sintetiza rela Ûiile de cauzalitate. Aceast | problem | este direct Õi strâns legat| de o alt| problem | de importan Û| teoretic |
fundamental|, a c |rei rezolvare apare cu necesitate în orice investiga Ûie de natur | economico-social|, Õi anume problema
m |sur |rii indirecte, a m |sur |rii factorilor de natur | neobservabil|.
Necesitatea sintetiz |rii rela Ûiilor de cauzalitate, a detect|rii unor rela Ûii de cauzalitate ascunse Õi a evalu |rii unor factori de
natur | neobservabil| apare în mod frecvent, în contextul solu Ûion |rii unor probleme de m |surare Õi cuantificare dintr-o mare
varietate de domenii: economic, social, politic, psihologic etc. În general, domeniile în care apar probleme de acest fel sunt
domenii caracterizate de complexitate Õi de imposibilitatea efectu |rii unor m |sur |tori experimentale.

7.2.1 M|surarea factorilor neobservabili


În orice investigare sau activitate de cercetare Õtiin Ûific | din domeniul economico-social intervine, aproape în mod
inevitabil, o problem | extrem de dificil|, a c |rei rezolvare dep |Õe Õte cadrul standard, presupunând utilizarea unor ra Ûionamente
Õi instrumente de mare subtilitate Õi rafinament Õtiin Ûific. O astfel de problem | apare, cu exclusivitate, în câmpul m |sur|rii Õi
cuantific |rii economico-sociale, Õi este legat| de existen Ûa factorilor laten Ûi, a factorilor ascun Õi, a factorilor de natur |
neobservabil|. Ace Õti factori sunt cunoscu Ûi în analiza factorial| sub numele de factori comuni.

Exem plul 7.1


Este evident, de exemplu, c| fiecare Ûar| din lumea contemporan| are un anumit nivel de dezvoltare economic|, dispune de o anumit|
forÛ| economic|. Aceast| caracteristic| este comun| tuturor Û|rilor lumii, îns| are valori diferite de la o Ûar| la alta.
ForÛa economic| de care dispune o anumit| Ûar|, la un moment dat, este o apreciere de natur| eminamente sintetic|, abstract|, care poate
fi considerat| ca rezultant| a compunerii Õi agreg|rii unui num|r foarte mare de fenomene Õi procese economice, de influenÛe Õi
interdependenÛe. Este evident c| este foarte dificil, chiar imposibil, ca o astfel caracteristic| extrem de complex| s| poat| fi apreciat| în mod
direct, doar prin intermediul unei singure m|rimi, pe baza unui singur indicator, indiferent dac| acest indicator este ritmul creÕterii economice,
volumul produsului intern brut, volumul schimburilor economice externe, rata inflaÛiei, rata Õomajului sau oricare alt indicator
macroeconomic. În aceste condiÛii, se poate afirma cu certitudine c| nu pot exista nici metodologia, nici unit|Ûile de m|sur| Õi nici
instrumentele cu ajutorul c|rora s| se poat| calcula, în mod direct Õi la un nivel de rigoare acceptabil, nivelul de dezvoltare a unei Û|ri.
Prin urmare, nivelul de dezvoltare economic| a unei Û|ri constituie un exemplu relevant de ceea ce înseamn| un factor neobservabil.
Cu toate acestea, prin utilizarea unor tehnici de analiz| specifice, pot fi deduse m|suri numerice unice, indicatori agregaÛi, care s| reflecte
gradul de dezvoltare economic| a unei Û|ri în toat| complexitatea sa.
În obÛinerea m|surilor agregate de acest fel sunt utilizaÛi indicatori macroeconomici parÛiali, din categoria celor enumeraÛi anterior.
InformaÛiile purtate de aceÕti indicatori sunt considerate a fi semnale generate de factorul latent numit nivel de dezvoltare economic|.
RaÛionamentul teoretic pe care se fundamenteaz| evalu|rile de acest fel const| în presupunerea c| factorul latent induce variaÛii, mai
mult sau mai puÛin semnificative, în magnitudinea unor indicatori de natur| observabil|. Cu cât variaÛiie induse sunt mai puternice, cu atât

58
se consider| c| respectivii indicatori au o capabilitate mai ridicat| de a servi la exprimarea, indirect|, a factorului latent. Astfel, pentru un
exemplu de tipul celui menÛionat anterior, se poate considera c| volumul produsului intern brut, ritmul creÕterii economice, productivitatea
social| a muncii, nivelul de instruire a populaÛiei, volumul schimburilor economice externe etc., sunt rezultate ale unui anumit nivel de
dezvoltare, sunt expresii ale acestui nivel de dezvoltare Õi, în consecinÛ|, pot servi la evaluarea acestuia.
În ceea ce priveÕte leg|tura dintre valoarea unei variabile indicator Õi factorul comun, facem precizarea c| m|rimea înregistrat| de
valoarea unui indicator nu este determinat| în mod exclusiv de factorul comun, ea depinzând, în afar| de acesta, Õi de influenÛa altor factori,
cunoscuÛi sub numele de factori specifici. InfluenÛa acestor factori este diferit| de la un indicator la altul Õi nu este comparabil| pe mulÛimea
acestor indicatori. Dat| fiind natura lor, din rândul factorilor specifici fac parte Õi erorile sau reziduurile.
De exemplu, produsul intern brut Õi volumul schimburilor economice externe au o determinare comun|, dat| de nivelul de dezvoltare
a economiei, dar au Õi o determinare specific|, dat| de m|rimea Û|rii, în cazul primului indicator, respectiv de poziÛia geografic| a Û|rii, în
cazul celui de-al doilea indicator. M|rimea Û|rii este factor specific pentru produsul intern brut, iar poziÛia geografic| a Û|rii este indicator
specific pentru volumul schimburilor externe.
Schematic, leg|turile dintre indicatori, pe de o parte, Õi factorul comun Õi specifici, pe de alt| parte poate fi prezentat| schematic sub
forma din figura urm|toare.

Figura 7.1: Exemplificarea unor leg |turi factoriale posibile

M |surarea influen Ûei specificului local asupra volumului vânz |rilor dintr-un produs, evaluarea aptitudinilor manageriale
ale unei persoane, cuantificarea imaginii pe care o firm | o are pe pia Û|, m |surarea for Ûei financiare a unei firme, aprecierea
gradului de dezvoltare economic | a Û|ri, evaluarea gradului de profitabilitate a unei firme etc., reprezint| probleme care conduc
la necesitatea efectu |rii unor evalu |ri de tip indirect, pe baz | de intermediere, f|cându-se apel la o serie de entit|Ûi observabile,
cunoscute sub numele de teste sau indicatori.
Pe baza informa Ûiilor colaterale Õi cu ajutorul unor instrumente specifice, pot fi ob Ûinute dimension |ri de natur | cantitativ |
pentru factorii neobservabili Õi pot fi construite scale de m |surare pe care ace Õtia s | poat | fi evalua Ûi.
Un rol unic în acest sens, rol bine determinat Õi extrem de important în activitatea de evaluare Õi cuantificare a factorilor
de natur | neobservabil| Õi de construire a unor scale de m |surare pentru ace Õti factori, revine tehnicilor de analiz | cunoscute
sub numele generic de analiz| factorial|.
Deducerea, pe cale indirect|, a informa Ûiilor referitoare la factorii neobservabili se bazeaz | pe identificarea unor variabile
indicator sau pe construirea unor teste, care s| furnizeze informa Ûiile necesare aplic |rii tehnicilor de analiz | factorial|.
Pe baza informa Ûiilor referitoare la variabilele de tip indicator, analiza factorial| îÕi propun | de deduc | substan Ûa
informa Ûional| con Ûinut| în observa Ûiile acestor variabile indicator, substan Û| comun | tuturor acestor variabile.

7.2.2 Detectarea substanÛei informaÛionale comune


Ideea fundamental| care st | la baza oric |rui demers ce vizeaz | sintetizarea rela Ûiilor de cauzalitate este aceea c |, în general,
influen Ûele exercitate de variabilele explicative ce intervin într-o rela Ûie de cauzalitate complex | reprezint| o intermediere a
influen Ûelor unor alÛi factori, comuni unor submulÛimi ale acestor variabile Õi afla Ûi în spatele acestora.
Cu alte cuvinte, se consider | c | influen Ûele exercitate de variabilele explicative, variabile care, în aparen Û|, par a fi cauze
directe ce determin | un anumit efect, nu sunt altceva decât forme particulare de manifestare indirect|, intermediar |, ale unor
alte influen Ûe de natur | primordial| Õi sintetic |, influen Ûe specifice unor factori neobservabili, cu caracter latent.
Acceptând ipoteza c | influen Ûele fiec |ruia din ace Õti factori comuni, cu natur | latent |, se manifest | prin intermediul uneia
sau a mai multor variabile explicative, putem separa aceste variabile în submulÛimi de variabile ce au un element comun, iar
prin intermediul acestor submulÛimi s| definim o corect| Õi sugestiv | structur | a dependen Ûei.
În sensul ideii exprimate anterior, problema sintetiz |rii rela Ûiilor de cauzalitate devine echivalent| cu problema detect|rii
Õi cuantific |rii unei anumite substan Ûe comune, de natur | pur informa Ûional|, con Ûinut| de o submulÛime a variabilelor
explicative supuse studiului.
Aceast | substan Û| poate fi interpretat| ca fiind fundamentul informa Ûional comun al variabilelor explicative ce alc |tuiesc
respectiva submulÛime Õi care exist|, sub form | mascat| Õi latent |, dincolo de aparen Ûa relevat| de valorile ob Ûinute pe baza

59
m |sur |torilor efectuate asupra acestor variabile.
Din punct de vedere teoretic, se consider | c | m |rimea cantit|Ûii din aceast| substan Û| reg |sit| în fiecare variabil| este cea
care determin |, în cea mai mare parte, nivelul Õi evolu Ûia respectivelor variabile, constituind în acela Õi timp fundamentul
invizibil care genereaz | Õi dimensioneaz | rela Ûiile de interdependen Û| dintre variabile.
În func Ûie de cantitatea din respectiva substan Û| comun |, con Ûinut| în fiecare variabil| explicativ |, se poate determina o
structur | riguroas | a dependen Ûei acestora, se pot construi "cluster-e" de variabile explicative Õi se pot deduce informa Ûii a c |ror
natur | s | nu mai fie parazitat| de modalit|Ûile particulare de manifestare a formei fenomenelor descrise de respectivele variabile.

7.3 Domenii ale utiliz|rii analizei factoriale


Printre domeniile a c |ror investigare presupune cu preponderen Û| existen Ûa unui instrument de analiz | care s | permit|
depistarea substan Ûei comune con Ûinut| în variabilele urm |rite putem men Ûiona pe cel sociologic Õi pe cel psihologic.
Instrumentul a c |rui opera Ûionalitate Õi eficien Û| sunt unanim recunoscute în rezolvarea problemelor care au ca scop
sintetizarea rela Ûiilor de cauzalitate este analiza factorial|.
În domeniul economic aplica Ûiile analizei factoriale sunt întâlnite în majoritatea analizelor Õi predic Ûiilor care vizeaz |
prospectarea pie Ûii, fundamentarea strategiilor Õi deciziilor manageriale la nivelul agen Ûilor economici, comportamentul
consumatorilor sau procesul decizional din domeniul financiar-bancar.
Practic, nu exist| analiz | de date sau predic Ûie din domeniul economic care s | nu apeleze, cel pu Ûin în faza preliminar |,
la utilizarea unui instrument cum este cel oferit de analiza factorial|.
Printre cele mai frecvent întâlnite aplica Ûii ale analizei factoriale în domeniul economic putem men Ûiona pe cele care au
ca scop determinarea unor indici agrega Ûi pentru diferite fenomene economice complexe sau pe cele care îÕi propun clasificarea
Õi ierarhizarea unor op Ûiuni sau entit|Ûi economice în func Ûie de mai multe criterii economice Õi sociale.
Din ce în ce mai mult în ultimul timp folosirea analizei factoriale este întâlnit | Õi în domeniul politologiei. Studiile riguroase
de fundamentare a strategiilor politice folosesc analiza factorial| în special pentru determinarea op Ûiunilor politice ale
electoratului înaintea organiz |rii scrutinurilor Õi pentru cunoa Õterea motiva Ûiilor concrete care determin | aceste op Ûiuni.

7.4 Definirea analizei factoriale Õi a conceptelor acesteia


Analiza factorial| este unul dintre cele mai eficiente Õi mai frecvent utilizate instrumente utilizate în modelarea statistico-
matematic | a problemelor economic-sociale. Posibilit|Ûile largi pe care acest instrument de lucru le ofer | în probleme de analiz |
Õtiin Ûific | Õi de interpretare a datelor sunt ilustrate prin existen Ûa unui num |r foarte mare de aplica Ûii Õi prin bogata literatur | de
specialitate dedicat| problemelor teoretice Õi practice specifice domeniului.
Prin intermediul tehnicilor de acest fel se încearc | aplicarea unor transform |ri Õi aproxim |ri, astfel încât s| se ob Ûin |
reprezent|ri în subspa Ûii cu mai pu Ûine dimensiuni, respectiv în subspa Ûii unidimensionale, bidimensionale sau, cel mult, tridi-
mensionale. Aceste transform |ri Õi aproxim |ri trebuie s | fie aplicate în a Õa fel încât s| se verifice condiÛia ca distan Ûele ob Ûinute
în noul spa Ûiu între obiecte sau variabile s | reflecte cât mai bine distan Ûele existente între acestea în spa Ûiul original. Noul spa Ûiu,
rezultat din efectuarea analizei factoriale, se nume Õte spa Ûiu factor, spa Ûiu redus sau spa Ûiu factorial.
Utilizarea analizei factoriale în solu Ûionarea problemelor specifice analizei datelor se face sub forma a dou | modalit|Ûi de
abordare: modalitatea exploratorie Õi modalitatea confirmatorie.

7.4.1 Definirea conceptelor fundamentale


În analiza factorial| sunt manipulate o serie de concepte importante, al c |ror con Ûinut Õi interpretare se caracterizeaz |, de
cele mai multe ori, prin multiple Õi subtile aspecte informa Ûionale. Conceptul fundamental al analizei factoriale este cel de factor
comun sau de factor latent, celelelate concepte utilizate fiind definite, într-o m |sur | mai mare sau mai mic |, în raport cu acest
concept de referin Û|.
Factorul comun este o construc Ûie abstract|, care încearc | s| exprime sub o form | numeric | o entitate informa Ûional|
neobservabil|, ascuns | în spatele unei mari variet|Ûi de manifest|ri eterogene, dar a c |rei semnifica Ûie este extrem de important |,
atât din punct de vedere teoretic, cât Õi practic. Factorul comun are o natur | similar | cu cea a unui factor cauzal cu semnifica Ûie
stabil| Õi consistent |, a c |rui existen Û| Õi manifestare influen Ûeaz | valorile unei întregi mulÛimi de variabile numite indicatori.
DefiniÛie: Factorul com un sau factorul latent reprezint| o entitate informa Ûional| de natur | general|, care exprim |
o caracteristic | esen Ûial| a unui fenomen sau proces din realitate, îÕi exercit| influen Ûa asupra tuturor elementelor unei
mulÛimi de indicatori Õi care nu poate fi supus | unei proces direct de observare Õi m |surare.
Dup | cum rezult| Õi din definiÛie, caracteristica principal | a factorilor comuni const| în aceea c | ei sunt m |rimi
neobservabile. Cu toate c | factorii comuni nu pot fi m |sura Ûi direct, pot fi definite Õi supuse procesului de observare Õi m |surare
o serie de alte entit|Ûi informa Ûionale, care au proprietatea c | reflect|, într-o m |sur | mai mare sau mai mic |, factori comuni.
Aceste entit|Ûi informa Ûionale sunt variabilele indicator, care sunt considerate a fi forme de manifestare cantitativ | indirect|
a factorilor comuni Õi care prin valorile lor indic | atât prezen Ûa factorilor comuni, cât Õi intensitatea cu care se manifest | ace Õtia.
Factorii comuni pot fi priviÛi ca variabile aleatoare, care au o anumit| distribu Ûie de probabilitate. De regul|, se consider |
c | factorii comuni sunt repartiza Ûi dup | legea de probabilitate normal |. Vom nota num |rul de factori comuni cu p, iar pentru
cei p factori comuni vom folosi nota Ûiile .

60
Ob Ûinerea de informa Ûii necesare pentru deducerea unor aproxim |ri cantitative pentru factorii comuni este bazat| pe
existen Ûa unor variabile speciale denumite indicatori, teste sau m |suri.
DefiniÛie: Indicatorul sau testul este o variabil| ale c |rei observa Ûii, cunoscute sub numele de scoruri, sunt utilizate
în cadrul analizei factoriale în scopul de a produce evalu |ri numerice pentru factorul sau factorii comuni.
În analiza factorial| se presupune c | leg |tura dintre variabilele indicator Õi factorii comuni poate fi exprimat | sub o form |
liniar |, exprimare care conduce la necesitatea estim |rii coeficien Ûilor care intervin în definirea respectivei forme.
Prin raportare la contextul terminologiei utilizate în cadrul analizei componentelor principale, se poate spune c | indicatorii
sau testele sunt reprezentate de variabilele originale. Vom presupune în continuare c | în analiz | exist| n indicatori sau n teste
Õi vom simboliza ace Õti indicatori cu .
Observa Ûiile existente cu privire la cei n indicatori, observa Ûii ob Ûinute prin extragerea unui e Õantion aleator de volum T
din popula Ûia ale c |rei unit|Ûi sunt caracterizate de cei n indicatori, reprezint| scorurile indicatorilor sau scorurile testelor.
O ipotez | important | a analizei factoriale const | în presupunerea conform c |reia nivelul unei variabile indicator se
formeaz | ca urmare a unor influen Ûei conjugate, exercitate atât de factorul sau factorii comuni, cât Õi de un factor unic. În afara
acestor influen Ûe cu natur | semnificativ |, asupra nivelului unei variabile indicator se mai exercit| Õi influen Ûa erorilor de
m |surare, influen Û| considerat| a fi neglijabil|.
Departe de a avea o semnifica Ûie m |car comparabil| cu aceea a factorilor comuni, factorul unic are, totu Õi, o natur | similar |
cu cea a acestor factori: influen Ûeaz | nivelul unei variabile indicator Õi are natur | neobservabil|. Spre deosebire de factorul
comun, a c |rui influen Û| se manifest | la nivelul tuturor variabilelor indicator, factorul unic este caracterizat prin aceea c |
influen Ûa sa are o natur | particular |, unilateral|, considerat| a se exercita sau exprima numai la nivelul unei singure variabile
indicator. Din acest motiv, num |rul de factori unici coincide cu num |rul de indicatori sau de teste.
Vom folosi pentru notarea celor n factori unici, care sunt asocia Ûi celor n indicatori, simbolurile . Factorul unic
poate fi definit sub forma urm |toare:
DefiniÛie: Factorul unic reprezint| o entitate informa Ûional| de natur | particular |, care îÕi exercit| influen Ûa în mod
unilateral, asupra unei singure variabile indicator, Õi care nu poate fi supus | unei proces direct de observare Õi m |surare.
În analiza factorial| variabilele indicator sunt considerate a fi dependente de factorii comuni Õi de factorul unic, în mod
similar cu dependen Ûa descris | de modelele de regresie, în care variabila dependent| este reprezentat| de indicator sau test,
variabilele independente sunt reprezentate de factorii comuni, iar termenul eroare este reprezentat de factorul unic Õi de factorul
rezidual. Considerând cazul celei de-a i-a variabile indicator, un astfel de model de regresie are forma urm |toare:

Deosebirea acestui tip de model fa Û| de un model de regresie autentic, const | în aceea c | variabilele sale independente,
, sunt variabile aleatoare neobservabile.
Vom ilustra Õi vom concretiza con Ûinutul celor trei m |rimi fundamentale definite anterior, respectiv indicator, factor comun
Õi factor unic, prin intermediul urm |torului exemplu.

Exem plul 7.2


În scopul evalu|rii nivelului de inteligenÛ| general| Õi a capacit|Ûii de memorare ce caracterizeaz| fiecare dintre cei 10 studenÛi ai unei
grupe ipotetice, vom presupune c| dispunem de notele obÛinute de aceÕtia la 5 examene: Matematic|, Informatic|, Economie, Istorie, Englez|.
Rezultatele se g|sesc în tabelul urm|tor.
SituaÛia notelor obÛinute de studenÛii unei grupe
Tabelul 7.1
Note obÛinute Medie
Student
Matematic| Informatic| Economie Istorie (h) Englez| (g) student
S1 6,25 8,25 7,25 8,00 8,50 7,65
S2 5,50 7,50 7,50 6,75 7,00 6,85
S3 9,25 9,75 9,25 8,50 8,25 9,00
S4 8,00 7,75 9,00 8,50 9,25 8,50
S5 5,75 6,00 7,25 10,00 8,25 7,45
S6 7,50 8,00 6,75 8,75 9,00 8,00
S7 10,00 9,25 9,00 9,00 9,25 9,30
S8 9,50 9,75 8,50 10,00 9,00 9,35
S9 6,50 8,25 9,25 9,75 10,00 8,75
S10 5,25 6,75 7,00 8,25 8,50 7,15
Media 7,350 8,125 8,075 8,750 8,700
VarianÛa 3,1139 1,5035 1,0285 1,0139 0,6500
În limbajul analizei factoriale, cele cinci examene reprezint| variabilele indicator sau testele. Factorii comuni sunt, în acest caz,
inteligenÛa Õi memoria. Notele obÛinute de studenÛi la examene reprezint| scorurile testelor.

61
Ipoteza raÛionamentului specific analizei factoriale este aceea c| rezultatele obÛinute de studenÛi sunt intercorelate, ca urmare a faptului
c| ele sunt influenÛate de dou| caracteristici care sunt comune tuturor studenÛilor: inteligenÛa Õi capacitatea de memorare.
În tabelul urm|tor sunt prezentaÛi coeficienÛii de corelaÛie dintre cele cinci variabile indicator. Faptul c| notele obÛinute la cele cinci
discipline sunt corelate, între ele, într-o m|sur| mai mare sau mai mic|, constituie suportul pentru a considera c| în obÛinerea acestor note
se manifest| ceva care este comun tuturor disciplinelor, indiferent de natura acestora. În aceste condiÛii, este natural a presupune c| elementele
comune, care determin| corelarea rezultatelor, Ûin de inteligenÛa nativ| a indivizilor Õi de capacitatea lor de memorare.
Matricea de corelaÛie a variabilelor indicator
Tabelul 7.2
Discipline Matematic| Informatic| Economie Istorie Englez|
Matematic| 1,00 0,86 0,77 0,15 0,30
Informatic| 0,86 1,00 0,73 0,09 0,24
Economie 0,77 0,73 1,00 0,23 0,39
Istorie 0,15 0,09 0,23 1,00 0,73
Englez| 0,30 0,24 0,39 0,73 1,00
InteligenÛa Õi capacitatea de memorare reprezint| doi factori care influenÛeaz| notele obÛinute de fiecare student la fiecare dintre
examenele susÛinute, cu diferenÛe de la student la student, în funcÛie de inteligenÛa Õi memoria proprii fiec|ruia dintre studenÛi.
În afara celor doi factori comuni, nota obÛinut| de studenÛi la fiecare dintre examene este influenÛat| Õi de un factor unic, factor care
reprezint| aptitudinile studentului pentru domeniul de care aparÛine disciplina respectiv|. De exemplu, separat de nivelul de inteligenÛ| Õi
de capacitatea de memorare, un student poate avea aptitudini speciale pentru domeniul Informaticii. InfluenÛa acestor aptitudini asupra notei
obÛinute la informatic| se va concretiza prin intermediul factorului unic asociat cu acest indicator, adic| prin intermediul factorului unic .
Rezult| c| performanÛele obÛinute de studenÛi la fiecare examen pot fi descrise cu ajutorul unor ecuaÛii de regresie de forma:

unde definesc variabilele indicator, care reprezint| notele la cele cinci examene, sunt cei doi factori comuni care
influenÛeaz| notele, iar reprezint| factorii unici celor cinci discipline considerate. M|rimile reprezint| coeficienÛii
corespunz|tori celor doi factori comuni.
Efectuând analiza factorial| pe datele conÛinute în tabelul de mai sus, am obÛinut urm|toarele rezultate:

Cei doi factori comuni, inteligenÛa Õi capacitatea de memorare, explic| o proporÛie semnificativ de mare din varianÛa total| a variabilelor
indicator, respectiv un procent de 78,30%, din care primul factor deÛine 53,58%, iar cel de-al doilea 24,72%.
Cu toate acestea, rezultatele manifest| o inadvertenÛ| logic| legat| de interpretarea celui de-al doilea factor comun. Aceast| inadvertenÛ|
const| în faptul c|, în cazul variabilelor indicator Istorie Õi Englez|, coeficienÛii corespunz|tori factorului Memorie au valori negative.
ExistenÛa acestor coeficienÛi cu valori negative ridicate conduce la o interpretare aberant|, interpretare conform c|reia capacitatea de
memorare ar influenÛa foarte puternic performanÛele la Istorie Õi Englez|, îns| în sens negativ.
Deoarece exist| soluÛia obÛinut| nu este unic|, poate fi c|utat| alt| soluÛie, care s| fie compatibil| cu o interpretare natural| Õi corect|
a factorilor. Aceast| soluÛie poate fi obÛinut| printr-o procedur| de transformare a coeficienÛilor factorilor, procedur| cunoscut| sub numele
de rotaÛia structurii factor. În urma aplic|rii acestei proceduri, poate obÛine o interpretare mai corect| a factorilor Õi o creÕtere a semnificaÛiei
acesteia, în condiÛiile în care contribuÛia total| a factorilor comuni la formarea variabilit|Ûii variabilelor indicator r|mâne neschimbat|.
În cazul exemplului nostru, prin aplicarea procedurii de rotaÛie a structurii factor au fost obÛinute rezultate care conduc la urm|toarea
form| a modelului factorial:

Se poate observa c| inadvertenÛa legat| de interpretarea celui de-al doilea factor a disp|rut, în condiÛiile în care proporÛia explicat| de
cei doi factori din varianÛa total| a variabilelor indicator a r|mas tot la nivelul de 78,30%. Ceea ce s-a modificat în urma rotaÛiei este structura
acestei proporÛii pe cei doi factori, structur| conform c|reia, din procentul de 78,30%, primul factor deÛine 47,17%, iar cel de-al doilea
31,13%.
Rezultatele obÛinute evidenÛiaz| c| indicatorii reprezentând notele la Matematic|, Informatic| Õi Economie exprim| foarte bine nivelul
de inteligenÛ| al studenÛilor, dup| cum indicatorii care reprezint| notele la Istorie Õi Englez| reflect| foarte bine capacitatea de memorare a
studentului. ContribuÛiile factorilor unici sunt relativ reduse, cu excepÛia Economiei, unde se înregistreaz| o contribuÛie ceva mai ridicat|
a factorului unic.
În graficul din figura urm|toare sunt prezentate leg|turile dintre cele trei categorii de m|rimi Õi sunt evidenÛiate intensit|Ûile cu care
aceste leg|turi se manifest|.

62
Figura 7.2: Exemplificarea leg |turilor dintre notele la examene,
nivelul de inteligen Û| Õi capacitatea de memorare

7.4.2 Definirea analizei factoriale


Analiza factorial| este unul dintre cele mai puternice, mai subtile Õi mai utile instrumente de analiz | a datelor, eficien Ûa
utiliz |rii ei fiind de necontestat în aproape toate fazele importante ale unui astfel de demers, inclusiv în faza exploratorie a
analizei. Scopul principal al analizei factoriale este acela al deducerii unor construc Ûii ipotetice, al identific |rii unor factori
esen Ûiali, prin intermediul c |rora s | poat | fi explicate interdependen Ûele existente între elementele unei mulÛimi de variabile
indicator.
Spre deosebire de analiza componentelor principale, care are ca scop reexprimarea unei propor Ûii cât mai mari din variabi-
litatea spa Ûiului cauzal iniÛial, analiza factorial| îÕi propune s| g |seasc | cea mai bun | modalitate de reproducere a corela Ûiilor
manifestate între elementele unei mulÛimi de indicatori, cea mai bun | modalitate de reexprimare a interdependen Ûelor dintre
variabilele indicator. Din punct de vedere al acestui scop, analiza factorial| poate fi definit| sub forma urm |toare:
DefiniÛie: Analiza factorial| este o analiz | multivariat|, care are ca scop s | explice corela Ûiile manifestate între o serie
de variabile, numite indicatori sau teste, prin intermediul unui num |r mai mic de factori ordona Ûi Õi necorela Ûi, numiÛi
factori comuni.
Proprietatea de necorelare a factorilor, care apare în definiÛia anterioar |, se refer | la definirea Õi determinarea acestora sub
restric Ûia inexisten Ûei redundan Ûei informa Ûionale. În mod similar, ordonarea factorilor se refer | la ierarhizarea acestora într-o
manier | descresc |toare, în func Ûie de m |rimea varian Ûei fiec |rui factor.
Ca metod | de analiz | multidimensional|, analiza factorial| este folosit|, în principal, în rezolvarea problemelor al c |ror
scop este legat de:
• studierea nivelelor diferite de manifestare a interdependenÛelor dintre variabilele explicative, în special atunci când num|rul
acestora este foarte mare;
• detectarea unei structuri simplificate Õi clare a relaÛiilor de interdependenÛ| existente între variabilele explicative;
• obÛinerea unei "cluster-iz|ri", unei clasific|ri a variabilelor explicative prin intermediul unor entit|Ûi numite factori, astfel încât
variabilele aparÛinând unui anumit factor s| fie puternic intercorelate;
• obÛinerea unor informaÛii specifice, sub forma aÕa-numiÛilor factori, pe baza c|rora s| se poat| face o interpretare sintetic| a
relaÛiilor de cauzalitate;
• verificarea unor ipoteze cu privire la existenÛa unei structuri factoriale particulare sau cu privire la existenÛa unui anumit num|r
de factori comuni;
• sintetizarea potenÛialului cauzal comun al mai multor variabile explicative sub forma unui num|r cât mai redus de factori.
Privit| în sens restrâns, ca mulÛime de proceduri logice Õi numerice executate pe date de un anumit tip, analiza factorial|
poate fi definit| ca reprezentând un proces a c |rui desf |Õurare include urm |toarele etape esen Ûiale:
• determinarea num|rului minimal de factori comuni cu ajutorul c|ruia pot fi explicate în mod optimal corelaÛiile existente între
variabilele indicator;
• efectuarea unor rotaÛii ale factorilor, în scopul determin|rii soluÛiei factor sub cea mai simpl| Õi mai clar| form|;
• estimarea intensit|Ûilor factorilor, structurii leg|turilor, comunalit|Ûilor Õi varianÛelor factorilor unici;
• deducerea unor interpret|ri adecvate pentru factorii comuni;
• estimarea scorurilor factorilor.
Dintre toate activit|Ûile implicate de analiza factorial|, problema care ridic | cele mai multe dificult|Ûi în executarea acestei
analize este aceea a estim |rii comunalit|Ûilor, sau, ceea ce este acela Õi lucru, estimarea intensit|Ûii factorilor comuni.

7.4.3 Tipurile analizei factoriale


În func Ûie modalitatea în care este implicat| în studiu Õi de scopul concret în care este folosit|, analiza factorial| poate fi
considerat| ca fiind de dou | tipuri: analiz| factorial| exploratorie Õi analiz| factorial| confirm atorie.

63
DefiniÛie: Analiza factorial| exploratorie reprezint| acea modalitate de utilizare a analizei factoriale care are ca scop
detectarea unei structuri a dependen Ûei Õi generarea unor construc Ûii teoretice, cunoscute sub numele de factori comuni.
În varianta sa de analiz | exploratorie, analiza factorial| reprezint| o tehnic | de identificare a structurii dependen Ûei, de
generare a unor construc Ûii teoretice. Analiza factorial| de tip exploratoriu nu presupune cunoa Õterea aprioric | a structurii
dependen Ûei cauzale sau cunoa Õterea aprioric | a factorilor.
DefiniÛie: Analiza factorial| confirm atorie reprezint| acea modalitate de utilizare a analizei factoriale, care are ca
scop confirmarea unor ipoteze Õi teorii privind structura unei dependen Ûe cauzale.
În analiza factorial| confirmatorie, structura dependen Ûei cauzale sau construc Ûia cauzal| teoretic | sunt presupuse a fi
cunoscute, adic | date prin ipotez |. Prin intermediul teoriei de acest tip se urm |re Õte confirmarea unei anumite teorii, verificarea
acestei teorii pe cale empiric |.

7.5 Structura general| a modelului factorial


În formularea sa cea mai general|, formulare extrem de necesar | pentru preciz |ri cu caracter terminologic Õi pentru
formularera unor ipoteze de natur | teoretic |, modelul analizei factoriale are la baz | dou | ipoteze fundamentale.
Prima ipotez | se refer | la presupunerea c | c | nivelul sau valorile unui ansamblu de variabile aleatoare se
formeaz | ca rezultat exclusiv al influen Ûei a trei categorii de factori:
• o mulÛime format| din p factori comuni, , a c |ror influen Û| se consider | a se exercita asupra fiec |reia
dintre cele n variabile considerate;
• o mulÛime format| din n factori unici, , a c |ror influen Û| se consider | a se exercita în mod individual,
fiecare factor unic influen Ûând una Õi numai una dintre variabilele considerate;
• o mulÛime de n factori reziduali, , a c |ror influen Û| se consider | a fi exercitat| tot în mod individual,
fiecare factor rezidual influen Ûând câte o singur | variabil|.
Din punct de vedere statistic, se consider | c | influen Ûele semnificative, care trebuie re Ûinute în analiz |, sunt cele exercitate
de factorii comuni Õi unici, în timp ce influen Ûele factorilor reziduali, se consider | a avea caracter accidental, nesemnificativ.
La nivelul fiec |rei variabile, influen Ûa factorului rezidual corespunz |tor poate fi considerat| a fi neglijabil| Õi este asimilabil|
erorilor de m |surare. Din acest motiv, factorii reziduali se mai numesc Õi erori.
În ceea ce prive Õte factorii comuni, exist| posibilitatea ca în cazul anumitor variabile influen Ûa lor asupra acestor variabile
s | fie neglijabil| sau chiar nul|, ceea ce înseamn | c | factorii respectivi pot fi elimina Ûi din lista factorilor pentru variabila
respectiv |. În aceste condiÛii, este posibil ca schema de influen Û| pentru anumite variabile s | con Ûin | mai mulÛi factori comuni,
iar pentru alte variabile mai pu Ûini. Num |rul de factori comuni cu influen Û| semnificativ | asupra variabilei indicator determin |
complexitatea variabilei indicator respective.
Faptul c | influen Ûele considerate sunt structurate pe cele trei categorii de factori, determin | o anumit| structur | a modelului
factorial general, structur | eviden Ûiat| de rea Ûiile urm |toare:

unde func Ûiile sunt func Ûii reale de p+1 variabile, func Ûii care pot fi liniare sau nelininare în raport cu variabilele.
Cu toate c | func Ûiile pot fi, în principiu, liniare sau neliniare, aproape în toate cazurile, atât în cele legate de teoria
analizei factoriale, cât Õi în cele legate de utilizarea acesteia în aplica Ûii, este considerat| varianta liniar |, ceea ce înseamn | c |
rela Ûiile care definesc modelul au forma urm |toare:

Coeficien Ûii factorilor sunt cunoscu Ûi sub numele de intensit|Ûiale factorilor. Prin magnitudinea sa coeficientul m |soar |
intensitatea influen Ûei exercitate de factorul corespunz |tor asupra nivelului variabilei indicator, iar prin semnul s |u m |soar |
sensul influen Ûei exercitate.
DefiniÛie: Se nume Õte intensitate a unui factor comun în raport cu o variabil| indicator m |rimea , care arat|
cu câte unit|Ûi se modific | nivelul variabilei indicator , atunci când nivelul factorului cre Õte cu o unitate.

Cea de-a doua ipotez | pe care se fundamenteaz | analiza factorial| este aceea c | în con Ûinutul informa Ûional al variabilelor
aleatoare se reg |sesc informa Ûii cu privire la factorii comuni Õi unici, ceea ce înseamn | c | ele pot fi folosite ca
indicatori ai acestor factori, ca semnale informa Ûionale generate de ace Õti factori.

64
Având în vedere c | la nivelul unei variabile indicator, nu se poate face, sub nici o form |, o distinc Ûie clar | între factorul
unic Õi factorul rezidual, din motive legate de simplificare Õi de crearea posibilit|Ûilor de solu Ûionare efectiv | a problemei de
analiz | factorial|, factorul rezidual este neglijat sau, ceea ce înseamn | acela Õi lucru, este unificat cu factorul unic. În consecin Û|,
modelul factorial cap |t| forma urm |toare:

Dac | vom face nota Ûiile urm |toare:

, ,

atunci modelul factorial poate fi scris sub forma urm |toare:


.
În raport cu aceast| ultim | form | a modelului factorial se define Õte conceptul de configura Ûie factorial|, concept care este
folosit Õi într-un sens mai larg, cu referire la întregul set de ecua Ûii care define Õte modelul.
În continuarea prezent |rii, vom nota matricea de corela Ûie a variabilelor indicator cu , respectiv:

unde elementele diagonale sunt egale cu unitatea, respectiv .


Deoarece, de regul| variabilele indicator sunt considerate a fi centrate, matricea de corela Ûie a acestora coincide cu matricea
de covarian Û|. În ceea ce prive Õte cei n factori comuni, vom nota matricea de covarian Û| a acestora sub forma urm |toare:

unde elementul diagonal din aceast | matrice reprezint| varian Ûa factorului comun , iar elementul nediagonal reprezin-
t| covarian Ûa dintre factorul . În anumite situa Ûii, pentru varian Ûa factorului comun se folose Õte nota Ûia , adic |
. Dac | factorii comuni sunt m |rimi standardizate, atunci matricea de corela Ûie a factorilor comuni coincide cu matricea
de covarian Û| a acestor factori. În aceast| situa Ûie, elementele diagonale sunt egale cu unitatea, respectiv .

7.6 Descompunerea variabilit|Ûii spaÛiului iniÛial


În mod similar cu analiza componentelor principale, analiza factorial| îÕi propune s | reexprime variabilitatea con Ûinut|
în spa Ûiul cauzal iniÛial, într-o manier | diferen Ûiat|, în func Ûie de rolul pe care îl au în formarea acesteia factorii comuni, pe de
o parte, Õi factorii unici, pe de alt| parte.
În cadrul acestui paragraf, vom trata modul în care varian Ûa unei variabile aleatoare poate fi descompus | în componente
relevante din punct de vedere al interpret|rilor interdependen Ûelor cauzale.

7.6.1 SpaÛiul factor Õi exprimarea conÛinutului s|u informaÛional


Prin utilizarea tehnicile de analiz | multidimensional| care au ca scop reducerea dimensionalit|Ûii, variabilitatea spa Ûiului
cauzal n-dimensional, determinat de mulÛimea de variabile indicator , este conservat| într-o propor Ûie, mai mare sau
mai mic |, prin intermediul variabilit|Ûii induse de un num |r mai redus de factori abstrac Ûi , , care sunt factorii
comuni. Împreun | cu factorul unic, ace Õti factori determin | un spa Ûiu (p+1)-dimensional numit spa Ûiul test sau spa Ûiul factor.
DefiniÛie: Spa Ûiul test sau spa Ûiul factor este un spa Ûiu real, de dimensiune (p+1), ale c |rui axe sunt ortogonale dou |
câte dou | Õi sunt reprezentate de factorii comuni Õi de factorul unic .

65
Variabilitatea ce caracterizeaz | celor dou | spa Ûii implicate în analiz |, spa Ûiul original Õi spa Ûiul test, este m |surat| prin
intermediul varian Ûei sau dispersiei.
În analiza datelor se consider | c |, pentru oricare dintre variabilele care definesc spa Ûiul cauzal original, varian Ûa este o
m |sur | a informa Ûiei con Ûinut| în observa Ûiile efectuate asupra respectivei variabile.
Între gradul de variabilitate specific unei variabile Õi semnifica Ûia informa Ûional-statistic | produs | de observa Ûiile f|cute
asupra respectivei variabile exist| un stabil raport de direct| propor Ûionalitate, considerându-se c | o variabil| este cu atât mai
semnificativ | cu cât variabilitatea sa este mai mare.

7.6.2 Componentele varianÛei


Dup | cum am mai eviden Ûiat, spre deosebire de analiza componentelor principale, în contextul c |reia variabilitatea ce
caracterizeaz | spa Ûiul cauzal iniÛial este privit| nediferen Ûiat, în analiza factorial| variabilitatea spa Ûiului cauzal iniÛial este
considerat| a fi o compunere de variabilit|Ûi, care se formeaz | sub influen Ûa factorilor considera Ûi.
Corespunz |tor celor trei categorii generale de factori considera Ûi a influen Ûa variabila indicator , respectiv comuni, unici

Õi reziduali, în analiza factorial| se postuleaz | ipoteza conform | c |reia varian Ûa , corespunz |toare variabilei , poate fi
împ |r Ûit| în trei compomnente importante:
• componenta , numit| comunalitate, care este acea parte a varianÛei totale ce exprim| informaÛia comun| tuturor
variabilelor care definesc spaÛiul cauzal n-dimensional Õi care se formeaz| sub influenÛa factorilor comuni .
• componenta , numit| unicitate, care este acea parte a varianÛei totale ce exprim| informaÛie semnificativ| de natur|
specific|, caracteristic| variabilei particulare Õi care se formeaz| sub influenÛa factorului unic ;
• componenta , numit| rezidualitate sau eroare, care este acea parte a varianÛei totale format| sub influenÛa factorului
rezidual asociat cu variabila respectiv| Õi exprim| informaÛie nesemnificativ| cu caracter specific variabilei .

Pe baza celor trei tipuri de influen Ûe men Ûionate anterior, varian Ûa variabilei indicator poate fi descompus | sub forma:

sau, utilizând nota Ûiile corespunz |toare, sub forma:

unde m |rimile , Õi reprezint|, a Õa cum o s | ar |t|m în continuare, tot varian Ûe. Aceast | rela Ûie define Õte descompunerea
varian Ûei unei variabile indicator în func Ûie de varian Ûele celor trei categorii factori care influen Ûeaz | variabila respectiv |. De Õi
cele trei componente ale descompunerii au natur | de varian Ûe, ele nu trebuie identificate ca reprezentând varian Ûe ale factorilor,
deoarece descompunerea este f|cut | doar în func Ûie de varian Ûele factorilor. Cu excep Ûia celei de-a treia componente a
descompunerii, care este chiar varian Ûa factorului rezidual, primelor dou | componente nu li se poate atribui calitatea de varian Ûe
ale factorilor.
Primele dou | componente sunt determinate de coeficien Ûii care pondereaz | varian Ûelor factorilor, ceea ce înseamn | c | ele
reprezint| contribu Ûii ale varian Ûelor factorilor la formarea varian Ûei variabilei indicator. De fapt, în condiÛiile unor ipoteze
privind necorelarea factorilor, forma complet| a rela Ûiei de descompunere a varian Ûei variabilei indicator poate fi scris | astfel:

Este evident c | p |tratele coeficien Ûilor care pondereaz | varian Ûele factorilor reprezint| contribu Ûii ale factorilor la formarea
varian Ûei variabilei indicator. Forma simplificat| a descompunerii rezult| din impunerea ipotezei c | varian Ûele factorilor comuni
Õi unic sunt egale cu unitatea Õi din definirea comunalit|Ûii ca sum | a contribu Ûiilor factorilor comuni la formarea varian Ûei
indicator, respectiv:
.
Componenta cea mai important | a varian Ûei variabila indicator este comunalitatea, care exprim | contribu Ûia factorilor
comuni la formarea varian Ûei variabilei indicator Õi care poate fi privit|, la rândul s|u, ca o varian Û|.
DefiniÛie: Com unalitatea este acea parte a varian Ûei unei variabile indicator, care exprim | variabilitatea indus | de
influen Ûa factorilor comuni .

Având în vedere c | la formarea variabilit |Ûii unei variabile indicator contribuie, în principiu, to Ûi cei n factori comuni,
comunalitatea poate fi descompus |, la rândul s|u, în raport cu cele n influen Ûe.
Cea de-a doua component | a varian Ûei variabilei indicator, numit| unicitate, exprim | contribu Ûia factorului unic la formarea
varian Ûei variabilei indicator Õi are, de asemenea, natur | de varian Û|. Ea se mai nume Õte Õi varian Û| unic |, Õi se define Õte astfel:
DefiniÛie: Unicitatea este acea parte a varian Ûei unei variabile indicator, care exprim | variabilitatea indus | de influen Ûa
factorului unic Õi care nu poate fi explicat| prin intermediul factorilor comuni.

66
Ultima component | a varian Ûei variabilei indicator, respectiv cea datorat| factorului rezidual, reflect| influen Ûa erorilor de
m |surare asupra form |rii variabilit|Ûii variabilei indicator Õi se mai nume Õte Õi varian Û| rezidual| sau varian Û| eroare. De cele
mai multe ori, aceast| influen Û| este considerat| a fi neglijabil| în raport cu celelalte influen Ûe.
Cu excep Ûia varian Ûei reziduale, care exprim | influen Ûa factorilor cu natur | accidental|, a cauzelor aleatorii, imprevizibile
Õi nesemnificative, celelalte dou | componente, comunalitatea Õi unicitatea, exprim | influen Ûe de natur | sistematic | asupra
form |rii variabilit|Ûii variabilei indicator, influen Ûe cu caracter permanent Õi stabil. Din acest punct de vedere, varian Ûa variabilei
indicator poate fi privit| ca fiind suma a dou | tipuri de varian Ûe: varian Ûa sistematic | Õi varian Ûa rezidual|. Dac | vom nota
varian Ûa sistematic | cu , adic |:

,
atunci varian Ûa variabilei indicator poate fi scris | sub forma:
.
Din aceast | reformulare rezult| c | varian Ûa variabilei indicator poate fi descompus | ca sum | a dou | componente numite
sistematicitate Õi rezidualitate, respectiv:
.
Pe de alt| parte, influen Ûa factorului unic Õi influenÛa factorului rezidual se caracterizeaz | prin faptul c | au o
direc Ûionalitate specific |, bine determinat|, fiind raportate numai la o anumit| variabil| indicator. Din acest punct de vedere,
contribu Ûia celor doi factori la formarea varian Ûei variabilei indicator este numit| specificitate, care se define Õte sub forma:
.
Pe baza acestei noi redefiniri a componentelor, varian Ûa variabilei indicator poate fi rescris | sub forma urm |toare:
,
ceea ce înseamn | c |:
.

Exem plul 7.3


Pentru a evidenÛia componentele prin intermediul c|rora poate fi descompus| varianÛa variabilelor indicator, vom considera datele din
exemplul 7.1 Õi vom efectua analiza factorial| pe matricea de corelaÛie urm|toare:

Valorile proprii corespunz|toare matricii de corelaÛie evideÛiaz| faptul c| exist| doi factori comuni importanÛi, care explic| un procent
de 78,30% din varianÛa total| a variabilelor indicator. În tabelul urm|tor sunt prezentate informaÛiile referitoare la contribuÛia varianÛelor
factorilor la formarea varianÛei totale a variabilelor indicator.
ContribuÛiile iniÛiale ale varianÛelor factorilorla formarea varianÛei totale a variabilelor indicator
Tabelul 7.3
Factor Valoare VarianÛ| explicat| Procent varianÛ| explicat|
comun proprie Individual Cumulat Individual Cumulat
2,679102 2,358245 2,679102 53,58204 53,58204

1,235815 1,556673 3,914917 24,71630 78,29835

DiferenÛ| - 1,085083 5,000000 21,70164 100,00000


Dup| rotaÛia structurii factor, efectuat| în scopul asigur|rii unei interpretabilit|Ûi mai corecte pentru cei doi factori, varianÛele factorilor
Õi contribuÛiile acestora la formarea varianÛei variabilelor indicator se modific| astfel:
ContribuÛiile modificate ale varianÛelor factorilor la formarea varianÛei totale a variabilelor indicator
Tabelul 7.4

Factor Valoare VarianÛ| explicat| Procent varianÛ| explicat|


comun proprie Individual Cumulat Individual Cumulat
2,358245 2,358245 2,679102 47,16490 47,16490

1,556673 1,556673 3,914917 31,13346 78,29836

DiferenÛ| - 1,085083 5,000000 21,70164 100,00000


În ceea ce priveÕte descompunerea varianÛei variabilelor indicator pe componente, vom considera c| cele dou| componente sunt
reprezentate de comunalitate Õi specificitate, ceea ce înseamn| c| presupunem o comasare a factorului unic cu factorul rezidual. Rezultatele

67
descompunerii varianÛei sunt prezentate în tabelul urm|tor.
Descompunerea varianÛei variabilelor indicator
Tabelul 7.5

Variabila Intensit|Ûi Tipuri de varianÛe


indicator InteligenÛ| Memorie Total| Comunalitate Specificitate
Matematic| 0,93797 0,13158 1,00000 0,89710 0,10290
Informatic| 0,90689 0,06630 1,00000 0,82685 0,17315
Economie 0,78539 0,25461 1,00000 0,68167 0,31833
Istorie 0,05008 0,78158 1,00000 0,61338 0,38662
Englez| 0,19147 0,92696 1,00000 0,89592 0,10408
VarianÛ| 2,358245 1,556673 5,00000 3,91492 1,08508
Pentru fiecare variabil| indicator, prima component| a varianÛei, comunalitatea, reprezint| suma p|tratelor intensit|Ûilor celor doi factori.
De exemplu, pentru prima variabil| indicator, comunalitatea se obÛine astfel:
.
InformaÛiile referitoare la specificitate, adic| datele din ultima coloan|, au fost determinate prin diferenÛ| între varianÛa fiec|rei variabile
Õi comunalitatea corespunz|toare celor doi factori. De exemplu, pentru cazul primei variabile indicator, specificitatea se determin| astfel:
.
Facem precizarea c| aceast| component| a varianÛei include influenÛa combinat| a factorului unic Õi a factorului rezidual. De asemenea,
se poate verifica faptul c| suma p|tratelor intensit|Ûilor care apar în coloana fiec|rui factor comun reprezint| varianÛa factorului comun
respectiv. În cazul primului factor, vom avea:

7.7 ConfiguraÛia factor Õi structura factor


În analiza factorial| se definesc dou | concepte fundamentale, care sintetizeaz | o serie de m |rimi importante, specifice
analizei factoriale. Aceste m |rimi sunt reprezentate de coeficien Ûii factorilor Õi de coeficien Ûii de corela Ûie dintre variabilele
indicator Õi factori, iar sintetizarea este f|cut | prin intermediul conceptelor numite configura Ûie factor Õi structur | factor.

7.7.1 Definirea configuraÛiei factor


Conceptul de configura Ûie factor sau configura Ûie factorial| se refer | la intensit|Ûile factorilor comuni Õi poate fi definit
astfel:
DefiniÛie: Se nume Õte configura Ûie factor mulÛimea intensit|Ûilor corespunz |toare factorilor comuni ce apar într-un
model factorial.
Dac | se Ûinea seama Õi de interven Ûia într-un model de analiz | factorial| a factorului specific, atunci poate fi definit
conceptul de configura Ûie factor extins |.
Configura Ûia factor este foarte important | în cadrul analizei factoriale din mai multe puncte de vedere. În primul rând,
elementele care intr | în alc |tuirea configura Ûiei factor caracterizeaz | intensitatea Õi sensul influen Ûelor exercitate de factori
asupra form |rii nivelului variabilelor indicator. De asemenea, configura Ûia factor, în varianta sa extins |, este important | deoarece
ea se constituie ca o reprezentare simplificat| Õi complet| a modelului factorial.
Un alt element de importan Û| pentru configura Ûia factorial| rezult| din faptul c | elementele acesteia stau la baza deter-
min |rii elementelor structurii factor Õi pot fi utilizate în reproducerea, pe diferite nivele, a corela Ûiilor dintre variabilele indicator.
În sfâr Õit, configura Ûia factor este util | în efectuarea unor compara Ûii între diferite sisteme de factori, care sunt exprimabile prin
intermediul aceleia Õi combina Ûii de indicatori.

7.7.2 Definirea structurii factor


O problem | important | a analizei factoriale, a c |rei solu Ûionare Ûine de esen Û| analizei factoriale, este aceea a determin |rii
corela Ûiilor dintre variabilele indicator Õi factorii comuni, pe de o parte, Õi dintre variabilele indicator Õi factorii specifici, pe de
alt| parte.
Pe baza conceptului de corela Ûie între variabilele indicator Õi factori, poate fi definit cel de-al doile concept, structura factor
sau structura factorial|. Structura factor mai este cunoscut| în teoria destinat| analizei factoriale Õi sub numele de m atrice
factor. Matricea factor are aceea Õi interpretare cu cea dat | în cazul componentelor principale.
DefiniÛie: Se nume Õte structur | factor sau structur | factorial| mulÛimea coeficien Ûilor de corela Ûie dintre variabilele
indicator ale unui model factorial Õi factorii comuni inclu Õi în acest model.
Importan Ûa structurii factor în cadrul analizei factoriale const| în aceea c | ea eviden Ûiaz | corela Ûiile existente între

68
variabilele indicator Õi factorii comuni Õi faciliteaz | interpretarea esen Ûei factorilor comuni, prin prisma naturii pe care o au
variabilele indicator. Spre deosebire de configura Ûia factorial| care sintetizeaz | exprimarea variabilelor indicatori sub form |
de combina Ûii liniare de factorii comuni Õi specifici, structura factorial| eviden Ûiaz | schema leg |turilor existente între indicatori
Õi factori.
Structura factorial| este considerat| în cadrul analizei factoriale ca fiind una dintre numeroasele solu Ûii posibile pentru o
anumit| problem | concret|. De altfel, structura factorial| mai este cunoscut| în literatura de specialitate Õi sub numele de solu Ûie
factor sau solu Ûie factorial|.
În numeroase situa Ûii practice, solu Ûia factorial| ob Ûinut| iniÛial nu întrune Õte toate condiÛiile necesare pentru a permite o
interpretare facil | a factorilor. De multe ori, se poate întâmpla, ca elementele structurii factor s| sugereze interpret|ri ale
factorilor care s | vin | în contradic Ûie cu posibila esen Û| ce poate fi atribuit|, în mod logic, factorilor.
În aceste situa Ûii este necesar | g |sirea altor solu Ûii factor, care s | permit| o mai bun | interpretare Õi o mai consistent |
interpretare a factorilor. În scopul cre Õterii posibilit|Ûilor de interpretare Õi a consisten Ûei acestor interpret|ri, structura factor
poate fi supus | unei proces de rota Ûie, în urma c |ruia rezult| structura factor rotit|.

7.8 Calculul scorurilor factoriale


O anumit| observa Ûie, corespunz |toare unui factor dat, este determinat| sub forma unui scor corespunz |tor respectivului
factor, scor format pe baza contribu Ûiei variabilelor originale. Exprimarea generic | a scorurilor pentru un anumit factor în func Ûie
de variabilele originale este dat| de urm |toarea rela Ûie:
,
unde b ij reprezint| coeficien Ûii scorurilor factor Õi sunt elemente ale transpusei matricii factor F. Sub form | matricial| aceast|
rela Ûie poate fi scris | astfel:
.
În mod practic, exprimarea celor T observa Ûii efectuate asupra variabilelor originale sub forma scorurilor factor, respectiv
calculul concret al scorurilor factor, se bazeaz | pe urm |toarele rela Ûii:

unde z kj reprezint| scorurile factorilor, b ki este elementul din linia k Õi coloana i a transpusei matricii factor, iar x ij este cea de-a
j-a observa Ûie efectuat| asupra celei de-a i-a variabile originale.
Dac | vom considera matricea de observa Ûii X, ale c |rei linii reprezint| cele n variabile originale Õi ale c |rei coloane
reprezint| cele T observa Ûii f|cute asupra acestor variabile, ca având forma urm |toare:

Õi matricea factor F definit| mai sus, atunci matricea Z de dimensiune p×T definit| astfel:
,
se nume Õte m atricea scorurilor factor. Scorurile factor determinate în acest fel pot fi folosite în analize ulterioare, în locul
valorilor variabilelor originale.

Exem plul 7.4


În cadrul unei cercet|ri având ca obiectiv determinarea nivelului de dezvoltare economico-social| a 10 zone geografice din Ûar|, a fost
selectat un num|r de 6 indicatori de natur| economico-social|: capitalul industrial, cifra de afaceri a firmelor, profiturile obÛinute,
cheltuielile pentru înv|Û|mânt, cheltuielile pentru cultur| Õi cheltuielile pentru s|n|tate. Valorile înregistrate, la nivelul unui an, de cele 10
zone geografice la cei Õase indicatori sunt cuprinse în tabelul urm|tor.
Indicatori economico-sociali ai zonelor geografice
Tabelul 7.6
Capital Cifra Cheltuieli Cheltuieli Cheltuieli
Zona Profituri
industrial afaceri învaÛ|mânt cultur| s|natate

Z1 2148,900 1210,550 545,600 588,560 257,860 501,650


Z2 1056,550 1213,010 531,790 1045,790 424,770 631,150
Z3 2198,990 1088,890 565,130 956,020 418,230 698,470
Z4 2632,350 1820,490 670,400 925,580 292,300 679,330
Z5 1636,510 1067,480 459,570 635,510 263,940 451,970
Z6 2267,880 1647,610 554,970 737,490 255,550 520,530
Z7 1906,490 1853,010 855,100 656,820 290,810 628,740

69
Capital Cifra Cheltuieli Cheltuieli Cheltuieli
Zona Profituri
industrial afaceri învaÛ|mânt cultur| s|natate

Z8 2756,080 1708,620 724,730 754,030 320,480 454,930


Z9 1299,630 1077,580 401,760 768,900 205,690 592,250
Z10 1160,220 1059,650 305,210 459,540 206,590 477,780
Media 1906,361 1374,690 561,427 752,824 293,622 563,680
Abatere std 600,378 338,329 158,985 180,565 76,285 93,416
Matricea de corelaÛie corespunz|toare valorilor celor 6 variabile indicator din tabel, este urm|toarea:

Matricea de corelaÛie are primele dou| valori proprii Õi , ceea ce înseamn| c| exist| doi factori comuni asociaÛi
acestor valori proprii, factori care justific| un procent de 73,02% din varianÛa variabilelor indicator.
În tabelul urm|tor sunt prezentate informaÛii cu privire la modul în care varianÛa total| a variabilelor indicator poate fi explicat| prin
intermediul a doi factori comuni.
ContribuÛiile iniÛiale ale varianÛelor factorilor la formarea varianÛei totale a variabilelor indicator
Tabelul 7.7

Factor Valoare VarianÛ| explicat| Procent varianÛ| explicat|


comun proprie Individual Cumulat Individual Cumulat
2,72029 2,72029 2,72029 45,3381 45,3381

1,66104 1,66104 4,38132 27,6839 73,0220

DiferenÛ| - 1,61868 6,00000 26,79797 100,00000


În tabelul urm|tor sunt prezentate informaÛii referitoare la o prim| soluÛie obÛinut| din aplicarea analizei factoriale. Tabelul conÛine
informaÛii cu privire la intensit|Ûile factorilor, la descompunerea varianÛei variabilelor indicator între factorii comuni Õi factorul specific,
dprecum Õi la coeficientul de corelaÛie multipl| dintre fiecare variabil| indicator Õi cei doi factori comuni.
CoeficienÛii factorilor comuni Õi componenÛa varianÛei variabilelor indicator
Tabelul 7.8
VarianÛ|
CoeficienÛii
Indicatori Comun|
factorilor Total| Specific|
E S E+S
0,60126 -0,37631 1,00000 0,36152 0,14161 0,50313 0,49687 0,50461
0,76731 -0,53782 1,00000 0,58876 0,28925 0,87801 0,12199 0,84882
0,85686 -0,34414 1,00000 0,73421 0,11843 0,85264 0,14736 0,87266

0,63448 0,69868 1,00000 0,40256 0,48815 0,89072 0,10928 0,81838

0,56859 0,61254 1,00000 0,32329 0,37521 0,69850 0,30150 0,80812

0,55673 0,49837 1,00000 0,30995 0,24837 0,55832 0,44168 0,60667


Total - - 6,00000 2,72029 1,66103 4,38132 1,61868
Procent - - 100,0% 45,34% 27,68% 73,02% 26,98%
Având în vedere natura variabilelor indicator utilizate Õi rezultatele obÛinute, se poate trage concluzia c| cei doi factori comuni pot fi
interpretaÛi ca reprezentând gradul de dezvoltare economic| (E) Õi gradul de dezvoltare social| (S). ConfiguraÛia factorial| Õi structura factor,
corespunz|toare soluÛiei iniÛiale, sunt prezentate în tabelul urm|tor.
Descompunerea varianÛei variabilelor indicator
Tabelul 7.9
Variabila ConfiguraÛia factor Structura factor VarianÛ| comun|
indicator E S E S E S
0,60126 -0,37631 0,60126 -0,37631 0,36152 0,14161

0,76731 -0,53782 0,76731 -0,53782 0,58876 0,28925

0,85686 -0,34414 0,85686 -0,34414 0,73421 0,11843

70
0,63448 0,69868 0,63448 0,69868 0,40256 0,48815

0,56859 0,61254 0,56859 0,61254 0,32329 0,37521

0,55673 0,49837 0,55673 0,49837 0,30995 0,24837

VarianÛ| comun| total| 2,72029 1,66103


Deoarece elementele configuraÛiei factoriale rezultate din analiz|, configuraÛie reprezentat| de valorile din coloanele 2 Õi 3 ale tabelului,
au semne care vin în contradicÛie cu o interpretare convenabil| a celor doi factori, în termeni de grad de dezvoltare economic| Õi grad de
dezvoltare social|, este necesar| obÛinerea unei alte soluÛii factor, care s| permit| o mai bun| interpretare a factorilor. Aceast| nou| soluÛie
factor poate fi obÛinut| prin efectuarea unei rotaÛii a structurii factor. Rezultatele obÛinute în urma rotaÛiei structurii factor sunt prezentate
în tabelul urm|tor.
CoeficienÛii factorilor comuni Õi componenÛa varianÛei variabilelor indicator dup| rotaÛia structurii factor
Tabelul 7.10
VarianÛ|
CoeficienÛii
Indicatori Comun|
factorilor Total| Specific|
E S E+S
0,70639 0,06434 1,00000 0,49899 0,00414 0,50313 0,49687 0,50461

0,93632 0,03627 1,00000 0,87669 0,00132 0,87801 0,12199 0,84882

0,89039 0,24465 1,00000 0,79279 0,05985 0,85264 0,14736 0,87266

0,08221 0,94019 1,00000 0,00676 0,88396 0,89072 0,10928 0,81838

0,08190 0,83174 1,00000 0,00671 0,69179 0,69850 0,30150 0,80812

0,14155 0,73368 1,00000 0,02004 0,53829 0,55832 0,44168 0,60667


Total - 6,00000 2,20198 2,17935 4,38190 1,61868
Procent - 100,00 36,70% 36,32% 73,02% 26,98%
Analiza soluÛiei obÛinute în urma rotaÛiei structurii factor, evidenÛiaz| cu claritate c| primul factor comun este puternic corelat cu primele
trei variabile indicator, iar cel de-al doilea factor este puternic corelat cu ultimele trei variabile indicator. În ambele situaÛii, coeficienÛii de
corelaÛie au valori pozitive Õi mai mari decât 0,70, justificând ideea de corelaÛie puternic|.
Faptul c| primele trei variabile indicator, respectiv capitalul industrial, cifra de afaceri Õi profiturile, sunt de natur| economic|, iar
ultimele trei variabile indicator, respectiv cheltuielile pentru înv|Û|mânt, cheltuielile pentru cultur| Õi cheltuielile pentru s|n|tate, sunt de
natur| social|, permite ca primului factor comun s| i se atribuie semnificaÛia de factor economic, iar celui de-al doilea factor comun s| i se
atribuie semnificaÛia de factor social. Corelarea foarte puternic| dintre cele dou| grupe de variabile indicator Õi cei doi factori comuni
constituie un temei pentru a considera c|, într-adev|r, primul factor comun reprezint| gradul de dezvoltare economic|, iar cel de-al doilea
factor comun reprezint| gradul de dezvoltare social|.
În afara celor doi factori comuni, nivelul variabilelor indicator se formeaz| Õi sub influenÛa factorilor specifici. M|sura în care factorii
specifici influenÛeaz| variabilele indicator este reflectat| de m|rimea varianÛei specifice. Modelul factorial, corespunz|tor informaÛiilor
definite anterior, este reprezentat de urm|toarele ecuaÛii factoriale:

Efectuând analiza factorial| pe datele conÛinute în tabelul de mai sus, am obÛinut urm|toarea form| estimat| a ecuaÛiilor modelului
factorial:

În graficul din figura urm|toare sunt prezentate leg|turile dintre variabilele indicatori Õi factori Õi sunt evidenÛiate intensit|Ûile cu care
aceste leg|turi se manifest|.

71
Figura 7.3: Exemplificarea leg |turilor dintre indicatori Õi factori

Identificarea celor doi factori comuni, evaluarea influenÛei lor asupra variabilelor indicator Õi evaluarea corelaÛiilor existente între factorii
comuni Õi variabilele indicator, permit reprezentarea grafic| a variabilelor indicator în sistemul de axe factoriale. Aceast| reprezentare este
util| deoarece ea ofer| o imagine cu privire la modul în care variabilele indicator se asociaz| între ele, pe de o parte, Õi cu factorii comuni,
pe de alt| parte. În figura urm|toare se g|seÕte reprezentarea grafic| a variabilelor indicator, în sistemul de axe ce corespunde celor doi factori
comuni. Reprezentarea grafic| este suficient de sugestiv| pentru a observa Õi a înÛelege modul în care se asociaz| variabilele indicator,
asociere determint| de leg|tura lor cu factorii comuni.

Figura 7.4: Exemplificarea leg |turilor indicatori Õi factorii comni Õi specifici


În figura urm|toare sunt vizualizate grafic poziÛiile pe care le au cele 10 zone geografice în raport cu cele dou| axe factoriale, care au
semnificaÛia de dezvoltare economic|, respectiv de dezvoltare social|.
O astfel de vizualizare a entit|Ûilor de tip obiect este extrem de util| deoarece ea evidenÛiaz| foarte clar valorile pe care le înregistreaz|
obiectele la caracteristicile latente, neobservabile, caracteristici reprezentabile prin intermediul de factorilor comuni. Pe baza acestor valori,
obiectele analizate pot fi supuse unor aprecieri de natur| gobal| Õi sunt create premize pentru efectuarea unor comparaÛii multicriteriale.
Pentru cazul exemplului considerat, din reprezentarea grafic| rezult| c| cea mai bine situat| din punct de vedere economic este “Zona
4", c| “Zona 2" Õi “Zona 3” stau foarte bine din punct de vedere social, dup| cum “Zona 10" este cea mai vitregit|, atât din punct de vedere
economic, cât Õi social.

72
Figura 7.5: Exemplificarea leg |turilor indicatori - factorii comuni Õi specifici

Posibilit|Ûile pe care le ofer| analiza factorial| în acest sens sunt cu atât mai utile, cu cât efectuarea unor astfel de evalu|ri Õi de aprecieri
nu putea fi f|cut| pe baza variabilelor indicator. În situaÛia în care structura factor este supus| unei rotaÛii care nu mai conserv| ortogonalitatea
axelor, se obÛin factori comuni care sunt corelaÛi, iar structura factor rezultat| difer| de configuraÛia factor.
Pentru datele din acest exemplu, efectuarea unei rotaÛii oblice a axelor a condus la obÛinerea a doi factori comuni care sunt corelaÛi la
nivelul unui coeficient de 0,254037, adic|:
.
Aceasta înseamn| c| axele factoriale nu mai sunt ortogonale, ele formând un unghi ascuÛit , a c|rui valoare este:
.
În aceast| situaÛie, comunalitatea fiec|rei variabile indicator este definit| de relaÛia urm|toare:
.
Rezultatele obÛinute în urma efectu|rii rotaÛiei de acest tip, adic| a rotaÛiei bazate pe oblicitatea axelor, sunt prezentate în tabelul urm|tor.

CoeficienÛii factorilor comuni Õi componenÛa varianÛei


variabilelor indicator dup| rotaÛia neortogonal| a structurii factor
Tabelul 7.11
VarianÛ|
CoeficienÛii
Indicatori Comun|
factorilor Total| Specific|
E S E&S Total
0,61824 -0,02381 1,00000 0,38223 0,00057 -0,00748 0,37532 0,62468

0,82509 -0,07497 1,00000 0,68077 0,00562 -0,03143 0,65497 0,34503

0,76058 0,11483 1,00000 0,57848 0,01319 0,04438 0,63604 0,36396

-0,03472 0,82326 1,00000 0,00120 0,67776 -0,01452 0,66445 0,33555

-0,02259 0,72725 1,00000 0,00051 0,52889 -0,00835 0,52105 0,47895

0,04146 0,63358 1,00000 0,00172 0,40142 0,01335 0,41649 0,58351


Total - 6,00000 1,64491 1,62745 -0,00406 3,26830 2,73170
Procent - 100,00 27,42% 27,12% -0,068% 54,47% 45,53%

Deoarece factorii comuni sunt corelaÛi, structura factorial| este diferit| de configuraÛia factorial|. În tabelul urm|tor sunt prezentate
informaÛiile referitoare la configuraÛia factor Õi la structura factor, corespunz|toare rezultatelor anterioare.
ConfiguraÛia factor Õi structura factor
Tabelul 7.12
Indicatori ConfiguraÛia factor Structura factor

0,70639 0,06434 0,61824 -0,02381

0,93632 0,03627 0,82509 -0,07497

0,89039 0,24465 0,76058 0,11483

73
0,08221 0,94019 -0,03472 0,82326

0,08190 0,83174 -0,02259 0,72725

0,14155 0,73368 0,04146 0,63358

7.9 Criterii de alegere a num|rului de factori


Utilizarea analizei factoriale pentru rezolvarea unor probleme specifice presupune Õi determinarea num |rului de factori
comuni ce vor fi re Ûinu Ûi în model. De Õi decizia de a re Ûine un anumit num |r de factori este, în principiu, subiectiv |, exist| o
serie de criterii care pot s | orienteze utilizatorul atunci când ia o astfel de decizie.

7.9.1 Criteriul procentului de acoperire


În general, alegerea num |rului de factori care s| fie inclu Õi în modelul factorial depinde de propor Ûia din variabilitatea
comun | con Ûinut| în spa Ûiul cauzal iniÛial pe care utilizatorul dore Õte s-o exprime prin intermediul unei succesiuni de factori
comuni. O estima Ûie aproximativ | a acestei propor Ûii, pentru cazul în care num |rul de factori re Ûinu Ûi este egal cu k, poate fi
ob Ûinut| cu ajutorul formulei:

unde k reprezint| num |rul de factori re Ûinu Ûi în model, n reprezint| num |rul variabilelor originale, iar 8 i reprezint| valoarea
proprie în raport cu care este definit factorul comun i.
Dezavantajul major al utiliz |rii unei astfel de aproxima Ûii în problemele de analiz | factorial| este dat de faptul c | m |rimea
p k arat| care este ponderea varian Ûei primelor k componente principale în varian Ûa total| Õi nu ponderea varian Ûei explicate de
primii k factori comuni în varian Ûa spa Ûiului test; acest lucru reprezint| un inconvenient deoarece între componentele principale
Õi factorii comuni exist|, a Õa cum am mai ar|tat, o deosebire de esen Û|.

7.9.2 Criteriul lui Kaiser


Acest criteriu poate fi folosit atunci când analiza factorial| este efectuat| pe o matrice de corela Ûie, adic | atunci când se
presupune c | variabilele originale sunt standardizate. În conformitate cu acest criteriu, num |rul de factori necesari a fi inclu Õi
într-un model de analiz| factorial| este egal cu num |rul de valori proprii mai mari sau egale cu 1.
Justificarea acestui criteriu este dat| de faptul c |, pentru analiz |, prezint| importan Û| numai acei factori comuni a c |ror
varian Û| este cel pu Ûin egal| cu varian Ûa variabilelor originale, variabile care, fiind normalizate, au varian Ûa unitar |.
În afara faptului c | un astfel de criteriu poate fi folosit numai în cazul în care se lucreaz | cu variabile normalizate,
dezavantajul principal al criteriului Kaiser este dat de faptul c | aplicarea lui conduce la re Ûinerea în model a unui num |r prea
mare de factori.

7.9.3 Criteriul "granulozit|Ûii"


Dup | acest criteriu, num |rul de factori ce vor fi re Ûinu Ûi în modelul de analiz | factorial| se stabile Õte pe baza unei analize
grafice a valorilor proprii. Graficul pe care se face analiza se construie Õte luând în abscis | num |rul de ordine al valorilor proprii,
iar în ordonat| valorile acestor valori proprii.
Faptul c |, a Õa cum Õtim, valorile proprii sunt ordonate dup | magnitudinea lor descresc |toare va face ca graficul s| aib |
forma aproximativ | a unei curbe de tipul exponen Ûialei negative.
Num |rul de factori ce se vor re Ûine în model este determinat de punctul de pe grafic în dreapta c |ruia panta curbei devine
neglijabil|, num |rul de ordine al valorii proprii corespunz |toare acestui punct determinând num |rul de factori ce se vor re Ûine.
Dezavantajul acestui criteriu const | în faptul c | aplicarea sa conduce la re Ûinerea în modelul analizei factoriale a unui num |r
prea mic de factori comuni.
În practic |, alegerea unui anumit num |r de factori comuni este puternic dependent | de natura problemei analizate Õi de
scopul urm |rit în utilizarea analizei factoriale. De multe ori, scopurile practice urm |rite în analize de acest fel pot conduce la
necesitatea de a ob Ûine un singur factor sau cel mult doi. Construirea unui model cu unul sau doi factori comuni are Õi avantajul,
care nu este de neglijat, c | faciliteaz | reprezentarea grafic | a m |rimilor analizei factoriale, reprezentare care poate s | fie
deosebit de util| în faza de interpretare a rezultatelor.

74
Tema 8. Metode Õi tehnici de recunoaÕtere a formelor

8.1 ImportanÛa Õi necesitatea recunoaÕterii formelor


În cele mai multe dintre activit|Ûile umane apare necesitatea de a încadra, de a diferen Ûia, de a grupa sau de a clasifica
anumite entit|Ûi sau obiecte sub forma unor categorii sau clase, a c |ror delimitare trebuie s | fie foarte clar | Õi foarte natural|.
Semnifica Ûia concret| a acestor categorii trebuie s | aib | o echivalen Û| corespunz |toare în realitatea studiat|, s | fie consistent |
Õi relevant | pentru procesul de cunoa Õtere, s| aib | un anumit grad de generalitate Õi s| ofere o interpretabilitate simpl| Õi
natural|.
Diferen Ûierea obiectelor pe categorii sau clase se face în func Ûie de propriet|Ûile fundamentale ale obiectelor, iar criteriile
de asociere a obiectelor sub form | de clase au la baz | gradul de asem |nare a propriet|Ûilor respectivelor obiecte, m |surat în
func Ûie de magnitudinea valorilor acestor propriet|Ûi.
Necesitatea de a grupa sau clasifica obiecte apare foarte frecvent Õi în domenii foarte variate ale cunoa Õterii Õi activit|Ûii
umane, cum ar fi: analiza financiar |, marketingul, asigur |rile, informatica, biologia, medicina, arheologia, meteorologia,
criminalistica, psihologia, Õtiin Ûa politic | sau domeniul militar.
În domeniul informaticii, cerin Ûele legate de cre Õterea performan Ûelor în utilizarea tehnicii de calcul au determinat
necesitatea dezvolt|rii Õi implement |rii unor dispozitive hardware Õi a unor instrumente software pentru recunoa Õterea vocii
umane Õi a scrisului de mân |. De asemenea, în domeniul economic, manifestarea comportamentului ra Ûional al agen Ûilor
economici face necesar | existen Ûa posibilit |Ûii de a identifica, de exemplu, activit|Ûile rentabile, clien Ûii solvabili sau pie Ûele
poten Ûiale. Cele mai potrivite Õi cele mai eficiente instrumente utilizabile pentru solu Ûionarea problemelor de acest fel s-au
dovedit a fi metodele Õi tehnicile de clasificare sau de recunoa Õtere a formelor.
În general, oamenii dispun de o serie de sim Ûuri naturale, cum ar fi auzul, v |zul, mirosul, pip |itul etc., sim Ûuri care le permit
acestora s | perceap | anumite propriet|Ûi ale obiectelor pe care le analizeaz | Õi, pe aceast | cale, s | poat | structura, clasifica sau
ierarhiza aceste obiecte sub forma unor submulÛimi specifice Õi distincte.
Într-o activitate de clasificare, oamenii se pot folosi, în afara sim Ûurilor naturale pe care le posed |, Õi de cuno Õtin Ûele pe
care le au cu privire la obiectele pe care trebuie s | le clasifice sau cu privire la propriet |Ûile acestor obiecte. În plus fa Û| de
acestea, oamenii mai pot apela Õi la o serie de modele, instrumente Õi tehnici speciale, de natur | statistico-matematic |, cu
ajutorul c |rora s | poat | clasifica mai u Õor Õi mai corect obiectele analizate.
Pe baza sim Ûurilor naturale pe care le au ca fiin Ûe umane Õi a cuno Õtin Ûelor de care dispun, oamenii pot diferen Ûia, clasifica
sau grupa cu relativ | u Õurin Û| cele mai variate categorii de obiecte. Exist| îns | numeroase situa Ûii în care sim Ûurile naturale ale
indivizilor Õi informa Ûiile de care ace Õtia dispun nu mai sunt suficiente pentru a putea discrimina corect între anumite obiecte
sau pentru a face clasific |ri corecte ale acestor obiecte. Aceste situa Ûii sunt întâlnite în cazul obiectelor de tip multidimensional,
adic | în cazul obiectelor cu mai multe caracteristici, mai ales dac | aceste caracteristici sunt exprimabile sub o form | numeric |,
iar obiectele care trebuie clasificate sunt în num |r foarte mare.
În cazul în care obiectele sunt de tip multidimensional, cu caracteristici numeroase Õi preponderent cantitative, diferen Ûierea
acestora pe categorii specifice nu se mai poate face numai pe cale intuitiv |, exclusiv pe baza sim Ûurilor naturale, fiind necesar
s | se apeleze la o serie de metode Õi tehnici specifice, de mare complexitate Õi cu un solid fundament statistico-matematic.

8.2 Definirea recunoaÕterii formelor


Activit|Ûile Õtiin Ûifice care au ca scop diferen Ûierea Õi structurarea unor mul Ûimi de obiecte pe categorii sau clase specifice,
în func Ûie de propriet|Ûile fundamentale ale obiectelor, sunt cunoscute sub denumiri variate, cum ar fi: clasificare, clusterizare,
grupare sau discriminare.
Aceste denumiri sunt folosite în literatura de specialitate a domeniului cu sens terminologic diferit, în func Ûie de tipul Õcolii
de care apar Ûine respectiva literatur |. De exemplu, în literatura anglo-saxon | termenul de clusterizare este folosit pentru a
descrie activit|Ûile de clasificare necontrolat|, iar termenul de clasificare este folosit pentru a defini activit|Ûile specifice
sistemelor de recunoa Õtere controlat|. În acela Õi timp, în literatura francez | termenul de clasificare este folosit pentru a face
referire la clasificarea de tip necontrolat, iar termenul de discriminare este folosit pentru descrierea activit|Ûilor de tip controlat.
În cadrul acestei teme, vom utiliza termenul de clasificare în dou | accep Ûiuni. Prima accep Ûiune va fi folosit| cu sens
generic, acoperind atât con Ûinutul conceptului de clasificare controlat|, cât Õi con Ûinutul conceptului de clasificare necontrolat|.
Cea de-a doua accep Ûiune va fi folosit| cu sens particular, cu referire la clasificarea de tip necontrolat. Pentru clasificarea de
tip necontrolat vom folosi îns | Õi termenii de clusterizare Õi de grupare. De asemenea, pentru referirea la clasificarea de tip
controlat vom utiliza, aproape exclusiv, termenul de discriminare.
În general, putem spune c | discriminarea Õi clusterizarea reprezint| activit|Ûile de aranjare sau de asociere a unor obiecte,
indivizi sau observa Ûii, sub forma unor grupe, categorii sau clase, în func Ûie de gradul de asem |nare sau de deosebire dintre
acestea.
Totalitatea tehnicilor de clasificare, adic | de discriminare Õi de clusterizare, este cunoscut| Õi sub numele generic de teoria
recunoa Õterii formelor.

75
Metodele Õi tehnicile de clasificare, respectiv teoria recunoa Õterii formelor, reprezint| una dintre cele mai moderne Õi
interesante probleme ale gândirii Õtiin Ûifice contemporane, constituind un domeniu Õtiin Ûific c |ruia i se acord | o importan Û| din
ce în ce mai mare, iar aplica Ûiile acestora sunt din ce în ce mai numeroase Õi mai variate.
Domeniu bine conturat al inteligen Ûei artificiale, cu tendin Û| din ce în ce mai accentuat| de autonomizare, recunoa Õterea
formelor s-a dezvoltat în strâns | interdependen Û| cu progresele înregistrate în domeniul tehnicii de calcul Õi informaticii, ultimele
decenii fiind caracterizate printr-o dezvoltare exploziv | a tehnicilor de acest fel.
Scopul general al teoriei recunoa Õterii formelor îl reprezint| identificarea la nivelul unor mulÛimi complexe Õi eterogene
de forme sau obiecte a unor structuri, grup |ri, clase sau clustere existente la nivel latent în cadrul acestor mul Ûimi Õi care se
contureaz | în mod natural, în func Ûie de asem |n |rile Õi deosebirile existente între elementele acestor mul Ûimi.
Dezvoltarea tehnicilor de recunoa Õtere a formelor poate fi privit| atât ca proces independent, impus de necesitatea adâncirii
cunoa Õterii din diverse domenii de activitate Õi stimulat de evolu Ûia tehnicii de calcul, cât Õi ca un r |spuns la necesit|Ûile de
simplificare Õi perfec Ûionare a schimbului informa Ûional om-ma Õin |.
Având aplica Ûii în cele mai diverse Õi surprinz |toare domenii de activitate, teoria recunoa Õterii formelor a cunoscut în
ultimii ani progrese cu adev |rat uimitoare, ajungându-se în prezent la un nivel de performan Û| tehnico-Õtiin Ûific | care permite
chiar construirea unor ma Õini specializate în recunoa Õterea anumitor tipuri de forme.
Aflat| la intersec Ûia unor domenii fundamentale cum sunt Õtiin Ûa calculatoarelor, teoria informa Ûiei, teoria deciziei,
geometria, teoria probabilit|Ûilor Õi statistica matematic |, recunoa Õterea formelor cunoa Õte în prezent aplica Ûii a c |ror palet|
se întinde de la cercetarea antropologic | Õi pân | la proiectarea harware Õi software.
În domeniul economico-social teoria recunoa Õterii formelor îÕi g |se Õte o larg | utilizare mai ales în procesul de analiz| a
datelor Õi în activitatea de predic Ûie. Problema clasific |rii unei mulÛimi de obiecte este o problem | standard, frecvent întâlnit |
în investigarea socio-economic |, iar abordarea ei presupune utilizarea metodelor Õi tehnicilor specifice teoriei recunoa Õterii
formelor.
Numeroase probleme din domeniul analizei datelor, începând cu cele legate de identificarea caracteristicilor definitorii
pentru cele mai diverse categorii de fenomene Õi terminând cu cele legate de delimitarea func Ûional|, ierarhizarea structural|
sau sintetizarea informa Ûional| a unor mulÛimi de fenomene Õi procese economico-sociale, îÕi g |sesc rezolvarea prin intermediul
aplic |rii unor concepte Õi instrumente a c |ror paternitate este, indiscutabil, legat| de teoria recunoa Õterii formelor.
Metodele Õi tehnicile apar Ûinând teoriei recunoa Õterii formelor sunt de neînlocuit în analizele care opereaz | cu cantit|Ûi mari
de informa Ûie, unde necesitatea de a esen Ûializa Õi sintetiza interdependen Ûele implic | un proces continuu de clasificare Õi
structurare a informa Ûiilor. Practic, tehnicile de recunoa Õtere a formelor reprezint| instrumente cu ajutorul c |rora poate fi
st|pânit| Õi controlat| marea complexitate informa Ûional| ce caracterizeaz | fenomenele Õi procesele economico-sociale.
O utilizare Õi mai larg | a teoriei recunoa Õterii formelor este întâlnit | în domeniul predic Ûiilor. Activitatea de realizare a
predic Ûiilor poate fi privit| ca un proces ale c |rui caracteristici sunt foarte apropiate, mergând chiar pân | la identificare, de
caracteristicile specifice ale unui proces de recunoa Õtere a formelor.
Evaluarea st|rilor pe care le poate avea în viitor un fenomen apar Ûinând unei realit|Ûi date reprezint|, de fapt, un proces
de recunoa Õtere a acelor forme de evolu Ûie a fenomenului care au cea mai mare probabilitate de realizare. Mai mult, atât în
activitatea de predic Ûie, cât Õi în procesul de clasificare sau de recunoa Õtere a formelor, modalit|Ûile de abordare au o natur |
preponderent probabilistic |. Pe de alt| parte, problema recunoa Õterii formelor este, ea îns |Õi, o problem | de predic Ûie în care,
pornind de la anumite caracteristici ale obiectelor analizate, obiecte numite Õi forme, se fac predic Ûii cu privire la apartenen Ûa
acestor obiecte la anumite clase. De altfel, stabilirea apartenen Ûei formelor la anumite clase reprezint | scopul principal al
utiliz |rii tehnicilor de recunoa Õtere a formelor.
Semnificativ pentru leg |tura dintre activitatea de predic Ûie Õi teoria recunoa Õterii formelor este faptul c |, în prezent, cele
mai moderne metode Õi tehnici din domeniul predic Ûiei sunt cele bazate pe o nou | clas | de modele, specifice contur |rii unei noi
modalit|Ûi de abordare în domeniul teoriei recunoa Õterii formelor, numite re Ûele neuronale. Modalit|Ûile de abordare Õtiin Ûific |
bazate pe re Ûele neuronale sunt mult mai concordante cu pronun Ûata complexitate Õi imprevizibilitate ce caracterizeaz |
comportamentul fenomenelor Õi proceselor economico-sociale Õi ofer | o serie de avantaje importante, în compara Ûie cu alte
metode Õi tehnici utilizate în acela Õi scop.
Avantajele pe care le are modelarea de tip re Ûea neuronal | sunt comparabile cu avantajele pe care le ofer | modelarea de
tip fuzzy în compara Ûie cu modelarea clasic |. Spre deosebire de modelele de tip tradiÛional, care opereaz | în condiÛii de
simplificare sever |, justificabil| sau nu, a realit|Ûii, modelele de analiz | Õi predic Ûie bazate pe conceptul de re Ûea neuronal| au
avantajul unei mai mari flexibilit|Ûi Õi al unei mai mari compatibilit|Ûi cu specificitatea realit|Ûii modelate, simularea realit|Ûii
prin intermediul lor având un mai mare grad de naturale Ûe.
Pe de alt| parte, modelele de tip re Ûea neuronal| au avantajul unei continue adaptabilit|Ûi în raport cu modific |rile
intervenite în evolu Ûia fenomenelor modelate Õi unei continue autoperfec Ûion |ri. De asemenea, modelarea bazat | pe re Ûele
neuronale nu presupune dezvoltarea Õi utilizarea unui aparat matematic foarte sofisticat, ceea ce face ca implementarea Õi
utilizarea tehnicilor de acest fel s | fie accesibile unor categorii foarte largi de analiÕti Õi cercet|tori.
Re Ûelele neuronale reprezint| modele de mare generalitate Õi flexibilitate, a c |ror structur | func Ûional| este continuu
adaptabil| Õi configurabil| specificului evolu Ûiei unui anumit fenomen Õi care încearc | s| simuleze activit|Ûile de evaluare Õi
decizie proprii creierului uman.
Tehnicile de recunoa Õtere a formelor pot fi utilizate în domeniul economico-social pentru rezolvarea unor probleme cum
ar fi: analiza datelor cu grad ridicat de eterogenitate, fundamentarea criteriilor de alegere a proiectelor de dezvoltare, clasificarea
deciziilor în func Ûie de impactul acestora asupra diverselor compartimente ale vie Ûii economico-sociale, detectarea unor perioade

76
cu caracter specific din evolu Ûia unor sisteme economice, stabilirea politicilor de creditare în domeniul financiar-bancar,
evaluarea eficien Ûei activit|Ûilor de promovare a unor produse, determinarea perioadelor cele mai potrivite pentru vânzarea
anumitor sortimente de m |rfuri, identificarea celor mai profitabile domenii de afaceri, clasificarea Õi ierahizarea unor entit|Ûi
economico-sociale etc.
DefiniÛie: Teoria recunoa Õterii formelor poate fi definit| ca reprezentând totalitatea normelor, principiilor, metodelor
Õi instrumentelor de analiz | Õi decizie utilizate în scopul de a identifica apartenen Ûa unor forme sau obiecte (unit|Ûi,
fenomene, evenimente, ac Ûiuni, procese etc.) la anumite clase cu individualitate bine determinat|.
Se poate spune c | recunoa Õterea formelor însumeaz | toate încerc |rile de construire a acelor modele care simuleaz | modul
în care omul cuantific |, analizeaz |, interpreteaz | Õi anticipeaz | comportamentul evolutiv al fenomenelor Õi proceselor.
Din punct de vedere al teoriei sistemelor, recunoa Õterea formelor poate fi privit| ca un sistem general în care intr |rile
reprezint| mulÛimea caracteristicilor obiectelor ce urmeaz | a fi clasificate, ie Õirile reprezint| mulÛimea claselor posibile din care
pot face parte obiectele analizate, iar func Ûia de transfer exprim | mecanismul decizional prin care un anumit obiect este
identificat ca f|când parte dintr-o anumit| clas |.

8.3 Concepte fundamentale ale teoriei recunoaÕterii formelor


În teoria recunoa Õterii formelor se opereaz | cu o mulÛime de concepte care sunt specifice acestui domeniu Õi se utilizeaz |
o terminologie proprie. Dintre numeroasele conceptele utilizate în teoria recunoa Õterii formelor, trei pot fi considerate ca fiind
fundamentale Õi definitorii pentru esen Ûa Õi scopurile teoriei recunoa Õterii formelor: forma, clasa Õi clasificatorul.
Forma reprezint| expresia numeric | a obiectului studiat în vederea clasific |rii lui într-o anumit| clas | Õi este rezultatul
cuantific |rii principalelor caracteristici posedate de obiectul respectiv.
De Õi utilizarea alternativ | Õi cu acela Õi sens a termenilor obiect Õi form | nu ridic | nici un fel de problem | legat| de
în Ûelegere, cei doi termeni se deosebesc, totu Õi, între ei. În timp ce obiectul este o entitate cu existen Û| real|, forma este doar
o reprezentare matematic | a obiectului, definit| sub forma unui vector n-dimensional, ale c |rui componente definesc
caracteristicile obiectului real.
Cu toate c | exist| aceast| deosebire de esen Û| între obiect Õi form |, în cele mai multe din situa Ûii vom utiliza cele dou |
concepte în mod intervertibil, ca având sens echivalent, nef|când deosebire între obiect Õi form | decât în situa Ûiile în care apare
necesitatea unei stricte nuan Û|ri a celor dou | concepte.
DefiniÛie: Forma sau obiectul este o entitate informa Ûional| individual|, caracterizat| prin intermediul unui vector n-
dimensional, ale c |rui componente definesc valorile caracteristicilor acesteia, Õi care face obiectul procesului de clasificare
sau de predic Ûie.
Formele implicate într-un proces de clasificare pot fi: cump |r |tori, clien Ûi, salaria Ûi, votan Ûi, produse, firme, zone
geografice, Û|ri, activit|Ûi economice, titluri de valoare etc.
Una dintre ipotezele fundamentale pe care se bazeaz | teoria recunoa Õterii formelor este aceea c | obiectele analizate sunt
caracterizate de un anumit grad de eterogenitate. Aceasta înseamn | c | se asum |, în mod implicit, existen Ûa posibilit|Ûii definirii
unor clase distincte pe mulÛimea obiectelor. Pe de alt| parte, se mai presupune c | anumite obiecte apar Ûinând mulÛimii analizate
au ceva comun, sunt caracterizate printr-un anumit grad de omogenitate.
În virtutea acestei ultime presupuneri, variabilele explicative ce reprezint| caracteristicile obiectelor au o "substan Û|"
comun | pentru anumite submulÛimi ale obiectelor. Cele dou | cerin Ûe impuse mul Ûimii obiectelor analizate sunt cunoscute sub
numele de similaritate Õi disimilaritate.
Clasa, grupa sau clusterul reprezint| o submulÛime distinct| de obiecte care verific | urm |toarele dou | propriet|Ûi: obiectele
care alc |tuiesc o clas | sunt omogene din punct de vedere al caracteristicilor lor definitorii; dou | obiecte între care exist|
diferen Ûe semnificative din punct de vedere al caracteristicilor definitorii fac parte din clase diferite.
DefiniÛie: Clasa, grupa sau clusterul reprezint| o entitate informa Ûional| distinct | Õi cu semnifica Ûie concret|, format|
din totalitatea obiectelor ale c |ror caracteristici sunt identice sau difer | foarte pu Ûin Õi care sunt semnificativ diferite de
caracteristicile obiectelor din alte clase sau grupe.
De exemplu, în cazul în care scopul utiliz |rii tehnicilor de clasificare vizeaz | diferen Ûierea firmelor din punct de vedere
al riscului care afecteaz | performan Ûele financiare ale acestora, clasele sau grupele pot fi urm |toarele: “firme s |n |toase
financiar”, “firme cu probleme financiare temporare”, “firme cu risc ridicat de faliment”. Dac | tehnicile de clasificare sunt
utilizate pentru a fundamenta deciziile de acordare a creditelor, atunci pot exista dou | clase: “clien Ûi solvabili” Õi “clien Ûi
insolvabili”.
În figurile urm |toare sunt ilustrate dou | situa Ûii, referitoare la dou | popula Ûii distincte: prima popula Ûie este caracterizat|
printr-un grad relativ ridicat de omogenitate, astfel încât ea nu se structureaz | în mod natural sub forma unor clase Õi deci nu
prezint| interes din punct de vedere al tehnicilor de clasificare. Cea de-a doua popula Ûie are o natur | eterogen |, fiind structurat|,
cu eviden Û|, sub forma a dou | clase distincte.

77
Figura 8.1: MulÛime relativ omogen | Figura 8.2: MulÛime structurat| pe 2 clase

Num |rul de clase care alc |tuiesc mul Ûimea de ie Õire a unui sistem de recunoa Õtere a formelor variaz | în func Ûie de specificul
domeniului pentru care se folose Õte acest sistem Õi de scopurile urm |rite.
Clasificatorul este un model statistico-matematic care, pe baza informa Ûiilor referitoare la caracteristicile unui anumit
obiect, determin | decizia de clasificare a obiectului într-o anumit| clas |. Clasificatorul poate fi privit ca fiind setul de principii,
reguli sau criterii, în func Ûie de care obiectele analizate sunt atribuite unei clase sau alteia.
DefiniÛie: Clasificatorul sau criteriul de clasificare reprezint| regula sau mul Ûimea de reguli pe baza c |rora obiectele
care apar Ûin mulÛimii analizate sunt afectate sau atribuite unor clase sau grupe bine definite.
În func Ûie de natura regulilor utilizate în procesul de clasificare, exist| mai multe categorii de clasificatori: clasificatori ie-
rarhici, clasificatori de cost minim, clasificatori de distan Û| minimal|, clasificatori de tip Bayes-ian, clasificatori euristici etc.

8.4 Formularea problemei generale de clasificare


Sub cea mai general| form | a sa, problema de clasificare poate fi formulat| în termenii teoriei deciziei, iar metodele de
clasificare pot fi definite sub forma unor instrumente decizionale specifice.
Vom descrie în continuare modul în care problema de clasificare poate fi definit| ca o problem | decizional|. În acest scop,
vom presupune existen Ûa unei popula Ûii de forme sau de obiecte, notat| cu Õi definit| sub forma:
,
unde M reprezint| num |rul de unit|Ûi ale popula Ûiei analizate.
Fiecare obiect care alc |tuie Õte popula Ûia este definit prin intermediul unui num |r de N caracteristici, pe care le vom nota
cu Õi care se numesc variabile explicative. În acest fel, un obiect din popula Ûia poate fi reprezentat sub forma
unui vector N-dimensional de forma:
.
Variabilele explicative, care definesc caracteristicile obiectelor analizate, sunt m |rimile în func Ûie de care se stabile Õte
apartenen Ûa unui obiect din popula Ûia la una dintre clasele popula Ûiei , adic | m |rimile în func Ûie de care se poate face
împ |r Ûirea acestei popula Ûii pe grupe sau clase. Variabilele explicative pot fi variabile de tip calitativ sau cantitativ. Ele pot fi
m |surate pe una dintre cele patru scale cunoscute, respectiv scala nominal|, scala ordinal|, scala interval sau scala raport.
În cazul în care variabilele explicative sunt de tip cantitativ, mulÛimea lor poate fi privit| ca o submulÛime a spa Ûiului real
N-dimensional, ceea ce înseamn | c | .
Dintre elementele care reprezint| variabilele explicative unele pot s| aib | o putere de discriminare mai redus|, iar altele
pot s| aib | o putere de discriminare mai mare. Din acest punct de vedere, în construirea algoritmilor de clasificare trebuie s |
fie selectate acele variabile care au puterea de discriminare cea mai mare. De exemplu, în clasificarea firmelor în func Ûie de
riscul posibil al evolu Ûiei viitoare a acestora, este plauzibil s | consider |m c | o variabil| cum ar fi “ponderea for Ûei de munc |
feminine” are o influen Û| mai redus | în diferen Ûierea firmelor pe clase de risc, în timp ce o variabil| cum ar fi “rata profitului”
are o putere mult mai mare de discriminare a firmelor pe categorii de risc, în func Ûie de gradul de risc care poate afecta evolu Ûia
acestora.
Variabilele cu puterea de discriminare cea mai mare, definesc acele caracteristici ale obiectelor care permit o diferen Ûiere
mai puternic | a claselor în care pot fi grupate respectivele obiecte Õi se numesc variabile descriptor. Pentru un anumit obiect,
vectorul de valori ale variabilelor descriptor reprezint| chiar forma asociat| respectivului obiect.
Vom presupune în continuare c | variabilele cu putere mare de discriminare reprezint| o submulÛime, pe care o vom nota
cu , a mulÛimii , respectiv:
.
Luând în considerare numai variabilele descriptor, orice obiect din popula Ûia poate s | fie reprezentat prin intermediul
unui vector n-dimensional de forma:
,
vector cunoscut sub numele generic de form |.

78
Vom nota în continuare cu mulÛimea formelor asociate tuturor obiectelor din popula Ûia , mulÛime cunoscut | sub
numele de spa Ûiul formelor. Dac | cele n caracteristici ale obiectelor din popula Ûia au valori numerice de tip continuu, atunci
mulÛimea este o submulÛime a spa Ûiului real n-dimensional, respectiv .
Din punct de vedere concret, popula Ûia de obiecte poate fi alc |tuit | din firme, b |nci, clien Ûi, cump |r |tori, Û|ri, zone
economice etc. În cazul în care obiectele din popula Ûia sunt firme, variabilele descriptor pot fi reprezentate de o serie de
indicatori economico-financiari, care caracterizeaz | activitatea acestor firme, cum ar fi: cifra de afaceri, m |rimea profitului, rata
pofitului, gradul de îndatorare, volumul investiÛiilor etc.
În raport cu o manifestare sau cu o ac Ûiune viitoare, elementele popula Ûiei se pot g |si într-una din mai multe st |ri
poten Ûiale, numite st|ri ale naturii. St|rile naturii reprezint| conjuncturi fizice, economice sau sociale, în raport cu care
mulÛimea de obiecte analizate se structureaz | sub forma unor categorii bine individualizate.
Vom nota cu mulÛimea st|rilor naturii Õi vom presupune existen Ûa aprioric | a K st |ri posibile ale naturii, ceea ce
înseamn | c | mulÛimea este de forma:
.
Cele K st|ri posibile ale naturii se caracterizeaz | prin exhaustivitate Õi prin exclusivitate reciproc |. Aceasta înseamn | c |
în afara celor K st|ri ale naturii nu mai poate exista nici o alt| stare posibil| a naturii, respectiv c | dou | st|ri diferite ale naturii
nu se pot manifesta niciodat| simultan. De exemplu, din punct de vedere al perspectivelor de evolu Ûie în viitor, firmele dintr-o
anumit| Ûar | se pot g |si, la un moment dat, în trei st|ri posibile: firme performante, firme cu dificult|Ûi temporare Õi firme cu
risc ridicat de faliment. Determinarea, dinainte, a st|rii posibile în care se va afla o firm | în viitor, prezint| o importan Û| maxim |
pentru orice decident, client sau investitor.
Caracteristica principal | a unei probleme de clasificare const | în faptul c | de Õi st|rile posibile ale naturii sunt cunoscute
aprioric, ca num |r, ca natur | Õi ca plauzibilitate a manifest |rii, iar fiecare element al popula Ûiei se g |se Õte în mod sigur într-
una, Õi numai într-una, din aceste st |ri, de obicei nu se cunoa Õte, cu precizie Õi în mod aprioric, în care dintre st|rile naturii se
g |se Õte fiecare dintre unit|Ûile popula Ûiei.
Principala problem | care se pune în acest context const | în identificarea st|rii în care se afl| o anumit| unitate din popula Ûia
, adic | în stabilirea apartenen Ûei acestei unit|Ûi la o anumit| categorie, clas | sau grup |. Cele K st|ri ale naturii, în care se pot
g |si elementele mulÛimii , definesc o împ |r Ûire a popula Ûiei în K grupe sau clase, pe care le vom nota cu .
Spre deosebire de st |rile naturii, care pot fi privite ca fiind realiz |ri ale unei variabile aleatoare de tip discret, clasele sau
grupele reprezint| submulÛimi de obiecte din popula Ûia , toate obiectele dintr-o astfel de submulÛime având proprietatea c |
se g |sesc în aceea Õi stare a naturii.
În calitatea sa de submulÛime a popula Ûiei , o clas | poate fi definit| sub forma urm |toare ,
unde este num |rul de obiecte din clasa k.
Ca o consecin Û| direct| a propriet|Ûilor pe care le au cele K st |ri ale naturii, clasele care trebuie identificate la nivelul
popula Ûiei , verific | urm |toarele dou | propriet|Ûi:

Prima proprietate implic | faptul c | orice obiect din popula Ûia face parte, cu necesitate, dintr-una din cele K clase. Cea
de-a doua proprietate implic | faptul c | un anumit obiect nu poate s | fie afectat sau atribuit, în acela Õi timp, la dou | clase diferite.
Mai mult decât atât, este verificat|, în plus fa Û| de cele dou | condiÛii, Õi condiÛia:
.
Modul în care mul Ûimea st|rilor naturii poate induce o structurare pe clase a popula Ûiei este ilustrat în tabelul urm |tor.
Tabelul 8.1
Clase în Variabile
St|ri ale naturii Obiecte pe clase
popula Ûia descriptor

... ...

Scopul principal al metodelor Õi tehnicilor de clasificare este acela de a explica apartenen Ûa obiectelor mul Ûimii la
grupele sau clasele , utilizând în acest scop informa Ûiile reprezentate de valorile variabilelor descriptor .
Explicarea apartenen Ûei obiectelor mul Ûimii la cele K clase presupune, de fapt, deducerea sau identificarea unui criteriu
de clasificare sau a unei reguli de clasificare, care s| descrie modul de structurare a obiectelor popula Ûiei pe clase. Criteriul de

79
clasificare mai este cunoscut Õi sub numele de clasificator.
Deducerea criteriului de clasificare se face pe baza informa Ûiilor furnizate de un e Õantion extras din popula Ûia , e Õantion
format din obiecte a c |ror apartenen Û| la clasele poate fi cunoscut| sau necunoscut| în mod aprioric.
Având în vedere cele men Ûionate anterior, problema general| a clasific |rii poate fi formulat| sub forma urm |toare:
Problema general| a clasific |rii: Fiind dat| o mulÛime de obiecte, se cere s| se determine criteriul sau regula care s |
descrie apartenen Ûa obiectelor la clasele sub forma c |rora se structureaz | respectiva mulÛime de obiecte.
În func Ûie de cunoa Õterea sau necunoa Õterea aprioric | a apartenen Ûei la cele K clase a obiectelor care apar Ûin e Õantionului
extras din popula Ûia , metodele de clasificare se împart în dou | mari categorii: de clasificare controlat| Õi de clasificare
necontrolat|.
Odat | ce criteriul de clasificare a fost stabilit, el poate fi folosit, în continuare, pentru efectuarea de predic Ûii privind
apartenen Ûa la o anumit| clas | a unor noi obiecte, din afara e Õantionului existent, obiecte a c |ror apartenen Û| nu este cunoscut|
aprioric. Dup | ce criteriul de clasificare a fost identificat, Õi cu condiÛia ca apartenen Ûa obiectelor apar Ûinând e Õantionului
disponibil s | fie cunoscut|, el poate fi utilizat Õi pentru verificarea corectitudinii cu care acesta poate face clasificarea, adic |
pentru testarea calit|Ûii clasificatorului. Calitatea criteriului de clasificare poate fi testat | chiar pe obiectele din e Õantionul pe
care acest criteriu a fost identificat. În acest scop, fiecare obiect din e Õantion, a c |rui apartenen Û| la o anumit| clas | este
cunoscut| în mod efectiv, este reclasificat cu ajutorul respectivului criteriu, iar rezultatul noii clasific |ri este comparat cu
clasificarea real|.
Testarea clasificatorului poate s | conduc | la o clasificare corect| a unor obiecte din e Õantionul analizat Õi la o clasificare
incorect| a altor obiecte din acest e Õantion. Aceasta înseamn | c | utilizarea clasificatorului respectiv poate s | conduc | la situa Ûia
în care obiectele care apar Ûin în mod real unei anumite clase s | fie clasificate fie în clasa corect|, fie incorect, în oricare din
celelalte clase.
Modul în care un clasificator asigur | clasificarea obiectelor cu apartenen Û| cunoscut| poate fi descris prin intermediul unei
matrici, numit| matricea corectitudinii clasific |rii sau, mai simplu, matricea clasific |rii, care con Ûine informa Ûiile necesare
pentru a aprecia corectitudinea clasific |rii obiectelor.
Dac | vom considera un e Õantion format din T obiecte, care apar Ûin claselor , atunci matricea de clasificare
are forma din tabelul urm |tor.
Matricea clasific |rii
Tabelul 8.2
Clase de predic Ûie Obiecte
Clase reale
... de clasificat

...

...

... ... ... ... ... ...


...

Obiecte ...
clasificate
Un element al matricii de clasificare arat| num |rul de obiecte apar Ûinând în mod real clasei Õi care, prin utilizarea
tehnicilor de recunoa Õtere a formelor, sunt clasificate în clasa . Definind în acest fel elementele matricii de clasificare, rezult|
c | num |rul de obiecte clasificate corect este reprezentat de suma elementelor de pe diagonala principal | a matricii clasific |rii,
respectiv:

Similar, num |rul de obiecte clasificate incorect este reprezentat de suma elementelor aflate în afara diagonalei principale
a matricii clasific |rii, respectiv:
.

Suma valorilor dintr-o linie a matricii de clasificare reprezint| num |rul de obiecte din clasa de provenien Û| ce corespunde
liniei respective, indiferent de clasele în care au fost clasificate acestea. Astfel, reprezint| num |rul de obiecte din clasa de
provenien Û| , indiferent de clasa în care acestea au fost clasificate. În mod similar, suma valorilor dintr-o coloan | a matricii
de clasificare reprezint| num |rul de obiecte clasificate în clasa corespunz |toare coloanei, indiferent de clasa de provenien Û|
a obiectelor. Rezult| c | reprezint| num |rul de obiecte clasificate în clasa , indiferent de clasa de provenien Û| a acestora.
Pe baza informa Ûiilor din matricea de clasificare pot fi defini Ûi o serie de indicatori care caracterizeaz | corectitudinea
clasific |rii. Printre ace Õtia men Ûion |m:

80
• gradul de clasificare corect|:

• gradul de clasificare incorect|:

Împreun | cu alÛi indicatori specifici, cei doi indicatori defini Ûi anterior sunt folosiÛi pentru a aprecia calitatea unui clasifi-
cator, adic | m |sura în care acesta reu Õe Õte s | detecteze în mod corect apartenen Ûa obiectelor la clasele popula Ûiei analizate. O
clasificare este cu atât mai corect|, cu cât valoarea indicatorului este mai mare.
Totalitatea activit|Ûilor desf |Õurate în contextul unui proces de recunoa Õtere a formelor, împreun | cu mulÛimea de metode
Õi tehnici utilizate în scopul stabilirii apartenen Ûei formelor la anumite clase sau grupe, determin | conceptul cunoscut sub numele
de sistem de recunoa Õtere a formelor.

8.5 Sisteme de recunoaÕtere a formelor


Complexitatea activit|Ûilor care apar în cadrul solu Ûion |rii oric |rei probleme de recunoa Õtere a formelor, succesiunea Õi
condiÛionarea fazelor care compun demersul logic întreprins în cadrul acestor probleme, precum Õi func Ûionalitatea specific |
ce caracterizeaz | acest demers, confer | procesului de recunoa Õtere a formelor un pronun Ûat caracter de sistem. Din acest motiv,
totalitatea activit|Ûilor implicate într-un proces de recunoa Õtere a formelor, ansamblul informa Ûiilor manipulate în acest context
Õi mulÛimea procedurilor, algoritmilor, metodelor Õi tehnicilor utilizate în acest scop, sunt privite ca reprezentând un sistem,
numit sistem de recunoa Õtere a formelor.
Ca sistem de prelucrare informa Ûional|, un sistem de recunoa Õtere a formelor este format dintr-o mulÛime de activit|Ûi,
reguli, proceduri, metode Õi tehnici, care au ca scop general identificarea apartenen Ûei unui obiect sau unei forme la o anumit|
clas | bine determinat| din popula Ûia analizat|.
Func Ûionarea unui sistem de recunoa Õtere a formelor presupune existen Ûa aprioric | a unor informa Ûii, care vor fi folosite
în procesul de clasificare. Aceste informa Ûii pot fi reprezentate, dup | caz, fie de o întreag | popula Ûie de forme, fie numai de un
e Õantion de forme, extrase dintr-o popula Ûie de interes.
Intr |rile unui sistem de recunoa Õtere a formelor sunt reprezentate de vectorii de propriet|Ûi ale obiectelor, adic | de formele
propriu-zise, iar ie Õirile sistemului de recunoa Õtere a formelor sunt reprezentate de clasele de apartenen Û| ale formelor de intrare,
clase identificate cu ajutorul unor reguli specifice de clasificare. Vectorii de propriet|Ûi ale obiectelor sunt rezultatul unor
procese de observare, m |surare Õi înregistrare a nivelurilor caracteristicilor mul Ûimilor sau submulÛimilor de obiecte, iar
informa Ûiile privind apartenen Ûa obiectelor la anumite clase sau categorii sunt rezultatul unor procese de evaluare complex |,
bazate pe utilizarea unor proceduri Õi instrumente specifice, de natur | statistico-matematic |.
Exist| dou | tipuri fundamentale de sisteme de recunoa Õtere a formelor: sisteme de recunoa Õtere necontrolat| Õi sisteme
de recunoa Õtere controlat|. Aceste dou | tipuri de sisteme de recunoa Õtere a formelor sunt determinate de scopurile urm |rite,
de natura informa Ûiilor pe care le prelucreaz |, de specificitatea metodelor Õi intrumentelor utilizate, precum Õi de natura
rezultatelor ob Ûinute cu ajutorul acestora.

8.5.1 Sisteme de recunoaÕtere necontrolat|


Sistemele de recunoa Õtere necontrolat| a formelor sunt sistemele în cadrul c |rora nu se dispune de informa Ûii iniÛiale
referitoare la num |rul de clase Õi la apartenen Ûa formelor la anumite clase, construirea claselor f|cându-se progresiv, pe m |sura
cre Õterii num |rului de forme analizate, iar num |rul de clase posibile fiind stabilit doar în faza final| a procesului de
recunoa Õtere.
Caracteristica principal | a sistemelor de recunoa Õtere necontrolat| a formelor const | în faptul c | nu se cunoa Õte
apartenen Ûa obiectelor analizate la o clas | sau alta. Aceasta înseamn | c |, în mod implicit, nu se cunoa Õte cu precizie nici
num |rul de clase. În leg |tur | cu aceast | ultim | afirma Ûie, consider |m c | este necesar s| facem urm |toarea precizare important |:
o serie de algoritmi de clasificare necontrolat|, cum ar fi de exemplu algoritmii de partiÛionare, presupun fixarea aprioric | a
num |rului de clase în care vor fi împ |r Ûite obiectele analizate. Aceasta nu înseamn | îns | c | este cunoscut, în mod real, Õi
num |rul de clase, ci doar c | se face o presupunere cu privire la acest num |r.
Principiile, procedurile, metodele Õi tehnicile apar Ûinând sistemelor de recunoa Õtere necontrolat| a formelor sunt cunoscute
sub denumirea general| de tehnici de clasificare, clasificare nesupervizat| sau analiz| cluster.
Analiza cluster este o tehnic | de clasificare caracterizat| prin faptul c | afectarea formelor sau obiectelor în clustere sau
grupe se face progresiv Õi f|r | a cunoa Õte aprioric num |rul de clase, în func Ûie de verificarea a dou | criterii fundamentale:
a. obiectele sau formele clasificate în fiecare clas | s | fie cât mai similare din punct de vedere al anumitor caracteristici;
b. obiectele clasificate într-o clas | s | se diferen Ûieze cât mai mult de obiectele clasificate în oricare din celelalte clase.
Primul criteriu de afectare a formelor pe clase cere ca fiecare clas | s | fie cât mai omogen | în raport cu caracteristicile luate
în considerare pentru clasificarea obiectelor. Cel de-al doilea criteriu cere ca fiecare clas | s | difere cât mai mult din punct de
vedere al caracteristicilor de clasificare.
În func Ûie de caracteristicile procedurilor pe care le utilizeaz |, de ipotezele ini Ûiale pe care se bazeaz | Õi de natura
rezultatelor ob Ûinute cu ajutorul lor, metodele de analiz | cluster se împart în dou | mari categorii: metode de clusterizare

81
ierarhic | Õi metode de clasificare prin partiÛionare sau metode iterative.
Prima categorie include metodele de clusterizare prin agregare Õi metodele de clusterizare prin divizare. Pentru fiecare
dintre cele dou | tipuri de clusterizare exist| mai multe proceduri specifice, între care men Ûion |m: metoda agreg |rii simple,
metoda agreg |rii complete, metoda agreg |rii medii, metoda lui Ward etc.
Cea de-a doua categorie include o serie de algoritmi, între care men Ûion |m: algoritmul celor K-medii, algoritmul celor K-
medoizi, algoritmul CLARA, algoritmul fuzzy etc.
În ceea ce prive Õte rezultatele furnizate de sistemele de recunoa Õtere necontrolat| a formelor, preciz |m c | ie Õirile acestor
sisteme nu se reduc, de regul|, la o unic | Õi simpl | configurare a obiectelor analizate pe clase, ci includ mai multe variante de
configurare a obiectelor pe clase, variante con Ûinute într-o entitate informa Ûional| numit| structur | cluster sau ierarhie cluster.
Ierahia cluster ofer | posibilitatea cercet|torului de a alege o anumit| configurare a obiectelor pe clase, ceea ce înseamn |,
implicit, Õi alegerea unui anumit num |r de clase.
Sistemele de recunoa Õtere necontrolat| sunt utilizate mai mult pentru scopuri de sistematizare, grupare Õi sintetizare
informa Ûional|, în situa Ûiile în care sunt analizate cantit|Ûi foarte mari de date Õi aceste date se caracterizeaz | printr-un grad
ridicat de eterogenitate. În acest sens, tehnicile de recunoa Õtere necontrolat| a formelor sunt foarte utile Õi eficiente în activit|Ûile
de analiz | preliminar | a datelor. Utilizarea analizei cluster în aceast | faz | a analizei datelor este important | deoarece ea permite
organizarea mai eficient | a datelor eterogene. Reg |sirea informa Ûiilor în cadrul masivelor de date structurate cu ajutorul
tehnicilor de analiz | cluster devine mult mai u Õoar |, iar datele pot fi interpretate mult mai consistent.

8.5.2 Sisteme de recunoaÕtere controlat|


Sistemele de recunoa Õtere controlat| a formelor sunt acele sisteme în cadrul c |rora se presupune existen Ûa aprioric | a unui
num |r dat de clase Õi a unui set de forme, numite prototipuri sau referin Ûe, a c |ror apartenen Û| la aceste clase este cunoscut|.
Acest set de forme este reprezentat de e Õantionul de obiecte extrase din popula Ûia supus | studiului, e Õantion cunoscut Õi sub
numele de set de formare sau set de înv |Ûare.
DefiniÛie: Setul de formare sau setul de înv |Ûare este un e Õantion de forme extrase din popula Ûia studiat|, forme a c |ror
apartenen Û| la clasele popula Ûiei este cunoscut| Õi pe baza c |rora sunt deduse criteriile formale de clasificare.
În cadrul sistemelor de recunoa Õtere controlat| a formelor, datele reprezentate de setul de formare includ atât informa Ûii
referitoare la propriet|Ûile esen Ûiale ale obiectelor supuse analizei, cât Õi informa Ûii referitoare la apartenen Ûa acestor obiecte la
clasele existente. Pe baza acestor informa Ûii iniÛiale, se deduc regulile Õi criteriile de decizie pentru parti Ûionarea sub form | de
regiuni sau clase a mulÛimii de obiecte supus | studiului sau a spa Ûiului în care iau valori caracteristicile obiectelor.
De fapt, în cazul tehnicilor de acest fel informa Ûiile con Ûinute în setul de formare sunt folosite pentru a face inferen Ûe cu
privire la împ |r Ûirea popula Ûiei totale pe clase. Mai mult decât atât, din aplicarea tehnicilor de clasificare controlat| rezult| Õi
un set de reguli Õi criterii formale de clasificare, adic | un clasificator. Aceste reguli Õi criterii sunt folosite, în continuare, pentru
clasificarea unor noi forme neclasificate înc |, forme a c |ror apartenen Û| este necunoscut|, adic | pentru a face predic Ûii cu privire
la apartenen Ûa noilor forme.
În mod uzual, setul iniÛial de forme este împ |r Ûit în dou | subseturi folosite în scopuri diferite: primul subset este numit set
de formare Õi con Ûine acele forme utilizate pentru deducerea regulilor Õi criteriilor de clasificare, adic | pentru construirea
clasificatorului propriu-zis; al doilea subset este numit set de predic Ûie Õi con Ûine acele forme utilizate pentru testarea
clasificatorului construit pe baza setului de formare.
DefiniÛie: Sistemul de recunoa Õtere controlat| a formelor reprezint| totalitatea activit|Ûilor Õi procedurilor care au ca
scop deducerea unor criterii de partajare a unei popula Ûii de entit|Ûi informa Ûionale (obiecte sau variabile), sub forma unui
num |r cunoscut de clase, pe baza cunoa Õterii caracteristicilor Õi a apartenen Ûei elementelor unui e Õantion provenit din
respectiva popula Ûie.
Spre deosebire de tehnicile de clasificare necontrolat|, care se bazeaz |, în principal, pe utilizarea conceptului de distan Û|,
elementul fundamental al tehnicilor de clasificare controlat| este un model formal, numit clasificator. În cazul analizei
discriminante, clasificatorul este reprezentat de func Ûiile discriminat sau de func Ûiile de clasificare.

8.6 Analiza cluster


Preocup |rile legate de metodele Õi tehnicile de analiz | cluster dateaz | de peste o jum |tate de secol. Primele Õi cele mai
sistematice studii dedicate acestui domeniu sunt reprezentate de lucr |rile elaborate de Sokal Õi Sneath în anul 1963 Õi de Lance
Õi W illiams în anul 1967. Ulterior, preocup |rile Õtiin Ûifice din domeniul analizei cluster s-au înmulÛit aproape exponen Ûial Õi s-au
diversificat extrem de mult.
În multitudinea preocup |rilor Õi lucr |rilor dedicate domeniului analizei cluster pot fi identificate dou | importante curente
Õtiin Ûifice, reprezentate de Õcoala american | Õi de Õcoala francez |. Printre cei mai de seam | reprezentan Ûi ai Õcolii franceze se
num |r |: J. P. Benzecri, M. Jambu, L. Lebart, A. Morineau, B. Escofier, G. Saporta Õi M. Bardos.
Analiza cluster are ca scop c |utarea Õi identificarea de clase, grupe sau clustere în cadrul unor mulÛimi de obiecte sau
forme, astfel încât elementele care apar Ûin aceleia Õi clase s | fie cât mai asem |n |toare, iar elementele care apar Ûin la clase diferite
s | fie cât mai deosebite între ele. Altfel spus, analiza cluster este o modalitate de examinare a similarit|Ûilor Õi disimilarit|Ûilor
dintre obiectele apar Ûinând unei anumite mulÛimi, în scopul grup |rii acestor obiecte sub forma unor clase distincte între ele Õi
omogene în interior.

82
Aceasta înseamn | c | în toate situa Ûiile, criteriul general de clasificare este, de fapt, un criteriu combinat, care poate fi
formulat sub urm |toarea form |:
Criteriu general de clasificare: Clasificarea obiectelor în clase se face în a Õa fel încât s| se asigure o variabilitate
minim | în interiorul claselor Õi o variabilitate maxim | între clase.
Termenul de analiz| cluster a fost utilizat pentru prima oar | în anul 1939, de c |tre R. C. Tyron, în lucrarea “Cluster
Analysis”. Acest termen este folosit în prezent ca nume generic pentru o mulÛime variat| de proceduri Õi algoritmi de clasificare
de tip necontrolat.
Prin intermediul analizei cluster fiecare obiect din mulÛimea analizat| este atribuit unei singure clase, iar mul Ûimea claselor
este o mulÛime discret| Õi neordonabil|. Clasele rezultate în urma utiliz |rii analizei cluster au o semnifica Ûie concret| Õi
generalizatoare, pe baza c |reia pot fi efectuate o serie de interpret|ri Õi pot fi formulate o serie de concluzii importante pentru
procesul de cunoa Õtere.
Clasele sau grupele sub forma c |rora se structureaz | mul Ûimile de obiecte se mai numesc Õi clustere. Un cluster este o
submulÛime format| din obiecte similare, adic | din obiecte care sunt suficient de asem |n |toare între ele din punct de vedere
al caracteristicilor care le definesc.
DefiniÛie: Clusterul este o submulÛime format| din obiecte care au proprietatea c | gradul de disimilaritate dintre oricare
dou | obiecte apar Ûinând clusterului este mai mic decât gradul de disimilaritate dintre orice obiect care apar Ûine clusterului
Õi orice obiect care nu apar Ûine clusterului respectiv.
Clusterul poate fi privit Õi ca reprezentând o regiune a unui spa Ûiu multidimensional, caracterizat| printr-o densitate relativ
mare de puncte sau de obiecte. De exemplu, în cazul aplica Ûiilor informatice, clusterul poate s| fie reprezentat de o submulÛime
de documente de acela Õi tip sau cu con Ûinut asem |n |tor. Aceste documente pot fi programe surs |, pagini W EB, fiÕiere de tip
text, fiÕiere HTML etc. Un astfel de document poate fi privit ca un punct dintr-un spa Ûiu multidimensional, în care fiecare
dimensiune a spa Ûiului este asociat| cu un anumit cuvânt. Coordonatele care definesc pozi Ûia unui document în acest spa Ûiu sunt
reprezentate de frecven Ûele cu care apar diferitele cuvinte în cadrul documentului.
Din punct de vedere geometric, ca mulÛimi de puncte dintr-un anumit spa Ûiu, clusterele pot avea forme foarte diferite, mai
mult sau mai pu Ûin regulate. Astfel, forma clusterelor poate s| fie de tip convex sau concav, de tip compact sau de tip alungit
etc. În figura urm |toare sunt ilustrate câteva dintre formele posibile ale clusterelor, pentru cazul particular al obiectelor de tip
bidimensional.

Figura 8.3: Forme posibile ale clusterelor de obiecte bidimensionale

Tipurile de forme pe care le pot avea clusterele în realitate sunt foarte importante în analiza cluster, deoarece atât eficien Ûa
procesului de clasificare, cât Õi calitatea solu Ûiilor, depind foarte mult de formele clusterelor, mai ales în cazul unor algoritmi
de clasificare ierarhic | prin agregare.
De regul|, analizele de tip cluster reprezint| proceduri de clasificare de tip necontrolat, în care nu este cunoscut| aprioric
nici apartenen Ûa anumitor obiecte la anumite clase, nici num |rul de clase posibile. Num |rul de clase sau clustere este variabil
Õi este stabilit concomitent cu activitatea de clasificare propriu-zis |.
DefiniÛie: Analiza cluster poate fi definit| ca reprezentând o mulÛime de principii, metode Õi algoritmi de clasificare,
având ca scop organizarea datelor sub forma unor structuri informa Ûionale semnificative, relevante.
Analiza cluster este o analiz| explorativ |, de tip multidimensional, care are ca scop gruparea unor entit|Ûi informa Ûionale,
cu natur | fizic | sau abstract|, în clase sau clustere alc |tuite din entit|Ûi inform Ûionale cu grad ridicat de similaritate.
Din punct de vedere concret, efectuarea unei clasific |ri cu ajutorul metodelor Õi tehnicilor de analiz | cluster const | în
ob Ûinerea unor solu Ûii cluster sau a unor partiÛii, reprezentate de o mulÛime de clase sau clustere notate cu , care
verific | propriet|Ûile men Ûionate anterior. În cazul anumitor metode de clasificare, rezultatele clasific |rii sunt reprezentate de
solu Ûii cluster unice, în timp ce în cazul altor metode de clasificare, cum ar fi metodele de clasificare ierarhic | de tip
aglomerativ, sunt reprezentate de mulÛimi de solu Ûii cluster, numite ierarhii de solu Ûii cluster sau ierarhii de partiÛii. În aceste
situa Ûii, este necesar s| se aleag | din mulÛimea de solu Ûii cluster, adic | din ierarhia de parti Ûii, o singur | solu Ûie cluster sau o
singur | parti Ûie.
De Õi alegerea unei anumite parti Ûii se face, în principal, în func Ûie de scopurile urm |rite în analiz |, pentru a se ob Ûine o
clasificare consistent | Õi semnificativ |, este necesar alegerea parti Ûiei s| se bazeze pe o evaluare cât mai riguroas | a calit|Ûii
tuturor parti Ûiilor care alc |tuiesc ierarhia cluster.

83
Din punct de vedere strict teoretic, analiza cluster poate fi privit| ca reprezentând o modalitate specific | de construire a
uneia sau a mai multor partiÛii pe mulÛimea obiectelor analizate. Orice parti Ûie de acest fel define Õte o solu Ûie cluster, adic | un
anumit mod de grupare pe clase a obiectelor mul Ûimii supuse studiului.
Din punct de vedere strict matematic, analiza cluster poate fi privit| ca o modalitate de alegere a celei mai adecvate partiÛii
sau submulÛimi din cadrul familiei de p |r Ûi a mulÛimii de obiecte analizate.
În analiza cluster, ierarhiile cluster sunt formate dintr-un num |r de T solu Ûii cluster, fiecare solu Ûie con Ûinând clustere din
ce în ce mai mari, respectiv clustere cu niveluri de agregare din ce în ce mai ridicate. O ierarhie cluster are o structur | de forma
urm |toare:

unde T este num |rul de obiecte, iar este num |rul de clustere din solu Ûia cluster de la nivelul i.
În cazul metodelor ierarhice aglomerative, num |rul de clustere din prima parti Ûie este egal cu num |rul de obiecte, adic |
. De asemenea, num |rul de clustere dintr-o parti Ûie de la un anumit nivel este mai mic cu 1 decât num |rul de clustere din
parti Ûia de la nivelul inferior Õi mai mare cu 1 decât num |rul de clustere din parti Ûia de la nivelul superior, respectiv:
.
Având în vedere c | prima parti Ûie ob Ûinut| dintr-o clasificare ierarhic | aglomerativ | este solu Ûie cluster de tip banal,
reprezentat| chiar de lista obiectelor supuse clasific |rii, rezult| c | num |rul de parti Ûii propriu-zise, ob Ûinute ca solu Ûii ale
clasific |rilor de acest tip, este egal cu T-1.
Analiza cluster se deosebe Õte în mod fundamental de procedurile de natur | statistic |, cum ar fi cele care au ca scop
verificarea semnifica Ûiei, prin faptul c | ea nu se bazeaz | Õi nu presupune îndeplinirea aprioric | a nici unei ipoteze specifice. În
consecin Û|, prin esen Ûa sa, analiza cluster constituie un important Õi eficient instrument de analiz| exploratorie.
Se poate spune c | scopul general al analizelor de tip cluster este acela de creare a a Õa-numitelor taxonomii sau tipologii.
Construc Ûia tipologiilor este bazat | pe analiza asem |n |rilor Õi deosebirilor existente între obiectele unei mulÛimi date.
Necesitatea de a construi tipologii apare în cele mai diverse domenii de activitate, existen Ûa tipologiilor oferind largi
posibilit|Ûi pentru analiza Õi interpretarea fenomenelor apar Ûinând acestor domenii.
De Õi folosirea tehnicilor de analiz | cluster nu este specific | doar pentru anumite domenii de activitate, totu Õi, utilizarea
cea mai frecvent | a acestora este întâlnit | în domeniul marketingului, în investiga Ûiile de natur | psihosocial| sau în evalu |rile
econo-micosociale la nivel teritorial.
În domeniul marketingului, se deta Õeaz | aplica Ûiile tehnicilor de analiz | cluster în studierea comportamentului
consumatorilor. Aceste aplica Ûii vizeaz | evaluarea Õanselor pe care poate s | le aib | lansarea unui produs nou, identificarea unor
noi pie Ûe, modalit|Ûile de segmentare a pie Ûii sau identificarea poziÛion |rii pe pia Û| a produselor diferiÛilor produc |tori.
Posibilitatea de a deduce tipologii specifice pe mul Ûimea clienÛilor unei firme este deosebit de important | pentru fundamentarea
Õi stabilirea politicilor comerciale ale firmei.
În cazul determin |rii pozi Ûion |rii pe pia Û| a diferitelor m |rci ale unui produs, analiza cluster este folosit| pentru a clasifica
m |rcile de fabrica Ûie, în func Ûie de similitudinea sau disimilitudinea percep Ûiilor pe care le manifest | consumatorii fa Û| de aceste
m |rci. Pe baza modului în care se clasific | m |rcile Õi a caracteristicilor consumatorilor care îÕi manifest | preferin Ûele, un
produc |tor poate identifica m |rcile concurente Õi tr |s |turile specifice ale categoriilor de consumatori care prefer | produsul
acestui produc |tor. De exemplu, m |rcile aflate în aceea Õi clas| cu marca unui produc |tor sunt m |rci concurente, deoarece ele
se adreseaz | aceluia Õi segment de consumatori.
Tehnicile specifice analizei cluster sunt deosebit de necesare Õi utile în orice proces de analiz | a datelor, nu numai în cele
care vizeaz | în mod direct necesit |Ûi legate de clasificare. De exemplu, utilizarea acestor tehnici este extrem de important |
pentru acele procese de analiz | în care cantitatea de informa Ûie ce trebuie prelucrat| este atât de mare Õi variat| încât extragerea
a ceea ce este legic, esen Ûial Õi semnificativ în aceast| cantitate informa Ûional |, devine imposibil| dac | nu sunt folosite
instrumente corespunz |toare de sintetizare Õi structurare a informa Ûiei brute. În acest context, tehnicile de analiz | cluster sunt
utilizate, cu prec |dere, pentru sistematizarea informa Ûiilor supuse analizei, activitate care este strict necesar | în faza de analiz |
preliminar| a datelor.
Identificarea pe o mare cantitate de informa Ûii brute a unor categorii, clase sau grupe informa Ûionale reprezint| unul dintre
scopurile generale Õi, în acela Õi timp, principale ale oric |rei analize cluster.
În mod sintetic, efectuarea unei analize cluster, având ca scop clasificarea unei mulÛimi de obiecte, cuprinde urm |toarele
etape:
• alegerea caracteristicilor în func Ûie de care se va face clasificarea;
• alegerea tipului de m |sur | pentru evaluarea proximit|Ûii dintre obiecte;
• stabilirea regulilor de formare a claselor sau clusterelor;
• construirea claselor, adic | încadrarea obiectelor în clase;
• verificarea consisten Ûei Õi semnifica Ûiei clasific |rii;

84
• alegerea unui num |r optimal de clustere, în func Ûie de natura problemei de clasificare Õi de scopurile care se
urm |resc;
• interpretarea semnifica Ûiei clusterelor;
Rezultatele unei analize cluster sunt reprezentate fie de o singur | solu Ûie cluster, fie de ierarhii cluster, care con Ûin diferite
modalit|Ûi de configurare a obiectelor pe clase, adic | mai multe solu Ûii cluster. În cel de-al doilea caz, pe baza efectu |rii unei
“t|ieturi” în ierarhia cluster, utilizatorul are posibilitatea alegerii unei configura Ûii a obiectelor pe un anumit num |r dorit de clase.
Pe baza rezultatelor ob Ûinute în urma efectu |rii unei analize cluster, pot fi deduse anumite legit|Ûi care guverneaz | evolu Ûia
unor popula Ûii de fenomene, pot fi identificate anumite principii utile pentru procesul de cunoa Õtere sau pot fi formulate o serie
de concluzii Õtiin Ûifice cu caracter de generalitate. În acest sens, analiza cluster Õi rezultatele ob Ûinute pe baza acesteia pot
contribui la:
• definirea unor scheme de clasificare formal| Õi a unor tipologii, pe baza c |rora realit|Ûile complexe pot fi mai
bine cunoscute Õi în Ûelese;
• identificarea unor modele statistico-matematice cu ajutorul c |rora mulÛimi complexe Õi eterogene de fenomene
Õi procese pot fi sintetizate Õi reprezentate sub o form | simplificat| Õi inteligibil|;
• definirea mai corect| Õi mai complet| a caracteristicilor fundamentale ale unor popula Ûii de fenomene Õi
procese;
• deducerea unor m |suri numerice adecvate pentru caracterizarea dimensiunilor popula Ûiilor de fenomene Õi
pentru eviden Ûierea modific |rilor care au loc în nivelul Õi structura acestora;
• identificarea unor entit|Ûi individuale care sunt reprezentative pentru clase Õi categorii complexe de fenomene
Õi procese.
Din cele de mai sus, rezult| c | analiza cluster poate fi privit |, în general, ca un instrument care are ca scop reducerea unor
mulÛimi de obiecte, sau chiar de variabile, la un num |r mai restrâns de entit|Ûi informa Ûionale, care sunt clasele sau clusterele.
Din acest punct de vedere, se poate face o analogie între analiza cluster Õi analiza componentelor principale, cu men Ûiunea c |
în analiza componentelor principale reducerea vizeaz |, de regul|, variabilele.
În sensul s|u obiÕnuit, ca ansamblu de metode Õi tehnici de clasificare a obiectelor, analiza cluster este o analiz | efectuat|
în spa Ûiul variabilelor. Într-adev |r, cele mai multe utiliz |ri ale tehnicilor de analiz | cluster sunt cele care au ca scop clasificarea
obiectelor, Õi nu clasificarea variabilelor.
Exist| îns | Õi situa Ûii în care analiza cluster este folosit| pentru clasificarea variabilelor care caracterizeaz | obiectele, adic |
situa Ûii în care analiza este efectuat| în spa Ûiul obiectelor. În aceste situa Ûii, analiza cluster poate servi ca instrument de agregare
a caracteristicilor obiectelor, sub forma unor caracteristici generale Õi cu relevan Û| ridicat| din punct de vedere al posibilit|Ûilor
de interpretare.
Remarc |: Analiza cluster poate fi utilizat| atât pentru clasificarea obiectelor, cât Õi pentru clasificarea variabilelor care
definesc obiectele.
Spre deosebire de utilizarea analizei cluster pentru clasificarea obiectelor, situa Ûie în care specificitatea este reprezentat|
de faptul c | distan Ûele sunt evaluate pentru perechi de obiecte, în cazul utiliz |rii analizei cluster pentru clasificarea variabilelor,
evaluarea distan Ûelor se face pentru perechi de variabile.

8.6.1 Tipul informaÛiilor primare utilizate în analiza cluster


Problema cea mai important | a oric |rui tip de analiz | cluster este aceea a modului în care poate fi m |surat| proximitatea,
respectiv gradul de apropiere sau gradul de dep |rtare, dintre obiecte Õi dintre clustere.
Orice proces de clasificare a obiectelor este definit în raport cu o anumit| m |sur | a gradului de apropiere sau de dep |rtare
dintre obiectele analizate, indiferent de metoda sau algoritmul pe care se bazeaz | acest proces. Aceast | m |sur | poate fi
reprezentat| fie de un indicator de similaritate, fie de un indicator de disimilaritate. Fiecare dintre cele dou | categorii de
indicatori va fi definit| Õi analizat| în continuare.
În general, m |surarea gradului de proximitate dintre obiecte se face cu ajutorul a dou | grupe de indicatori, cunoscute sub
numele de indicatori de similaritate Õi indicatori de disimilaritate. Indicatorii de similaritate Õi indicatorii de disimilaritate pot
fi utiliza Ûi atât în analizele cluster efectuate pe obiecte, cât Õi în analizele cluster efectuate pe variabile.
Indicatorii de similaritate Õi de disimilaritate pot fi utiliza Ûi ca baz | informa Ûional| în orice proces de clasificare datorit |
faptului c | ei pot induce o rela Ûie de ordine pe mulÛimea perechilor de obiecte sau de variabile Õi, în consecin Û|, pot contribui
la clasificarea obiectelor sau variabilelor.
Cu cât valoarea unui indicator de similaritate este mai mare, cu atât obiectele sau variabilele pentru care acest indicator
se evalueaz | pot fi considerate a fi mai asem |n |toare, respectiv mai apropiate. De asemenea, o valoare foarte mic | a
indicatorului de similaritate eviden Ûiaz | faptul c | cele dou | obiecte sau cele dou | variabile sunt mai dep |rtate între ele.
Indicatorii de disimilaritate sunt m |rimi numerice care exprim | cât de deosebite sau cât de dep |rtate sunt dou | obiecte
sau dou | variabile. Indicatorii de disimilaritate se mai numesc Õi indicatori sau coeficien Ûi de deosebire sau de distan Ûare a
obiectelor sau variabilelor. Cu cât valoarea unui indicator de disimilaritate este mai mare, cu atât cele dou | obiecte sau cele dou |
variabile pentru care se calculeaz | sunt mai diferite, adic | mai distan Ûate între ele.
Cea mai important | Õi cea mai utilizat| categorie de indicatori de disimilaritate este reprezentat| de indicatorii de tip
distan Û|. De multe ori îns |, conceptul de distan Û| este utilizat Õi pentru a desemna indicatori de similaritate, cu toate c | ace Õtia
exprim | gradul de apropiere dintre dou | entit|Ûi informa Ûionale.
Spre deosebire de indicatorii de similaritate, care pot fi cel mai bine utiliza Ûi pentru exprimarea gradului de proximitate

85
dintre obiectele cu caracteristici de tip calitativ, indicatorii de disimilaritate sunt m |rimi mai potrivite pentru m |surarea
proximit|Ûii în cazul obiectelor cu caracteristici de tip cantitativ.
În leg |tur | cu aceast| deosebire, facem precizarea c | exist| situa Ûii în care indicatorii de similaritate pot fi utiliza Ûi nu numai
în cazul variabilelor de tip calitativ, ci Õi în cazul variabilelor de tip cantitativ. Acest lucru este posibil în situa Ûiile în care
variabilele de tip cantitativ sunt supuse unor transform |ri adecvate.
Cu toate c | indicatorii de similaritate Õi indicatorii de disimilaritate sunt priviÛi, de regul|, ca fiind dou | categorii distincte,
putem face afirma Ûia c | ambele categorii exprim |, într-un anumit fel, dou | fa Ûete ale aceluia Õi lucru. Mai mult decât atât, în
anumite condiÛii, indicatorii de similaritate pot fi transforma Ûi în indicatori de disimilaritate. Diferen Ûele dintre aceste categorii
de indicatori Ûin de natura variabilelor în raport cu care sunt evalua Ûi Õi de modalit|Ûile de calcul specifice fiec |rui tip de
indicator.
Informa Ûiile utilizate, în ultim | instan Û|, în analiza cluster sunt reprezentate sub forma unor matrici simetrice de tip
obiecte×obiecte, numite, dup | caz, matrici de proximitate, matrici de similaritate, matrici de asociere, matrici de inciden Û|,
matrici de disimilaritate sau matrici de distan Ûe. Atât liniile, cât Õi coloanele matricilor de acest fel se refer | la obiectele
analizate, astfel încât num |rul lor este egal cu num |rul de obiecte supuse analizei. Elementele acestor matrici sunt m |rimi
numerice care exprim | proximitatea dintre perechile de obiecte care eticheteaz | rândurile Õi coloanele matricilor.
În cazul particular al clasific |rii variabilelor, informa Ûiile utilizate efectiv în analiz | sunt reprezentate sub forma unor
matrici de tipul variabile×variabile. Elementele acestor matrici sunt m |rimi numerice care exprim | gradul de proximitate dintre
perechile de variabile aflate în liniile Õi coloanele acestor matrici.
Rezult| c | matricile de proximitate con Ûin indicatori de disimilaritate (distan Ûe) sau indicatori de similaritate pentru toate
perechile posibile de obiecte sau de variabile. În construirea matricilor de proximitate pot fi utilizate, în func Ûie de propriet|Ûile
obiectelor la care se refer |, atât variabile de tip cantitativ, cât Õi variabile de tip calitativ.
Tipurile indicatorilor de similaritate sau de disimilaritate utiliza Ûi în evaluarea proximit|Ûilor trebuie s | fie adecvate Õi
compatibile cu natura datelor existente. De asemenea, în evaluarea proximit|Ûilor trebuie s | se ia în considerare toate variabilele
care au o relevan Û| ridicat| din punct de vedere al clasific |rii. Omiterea unor variabile din calculul proximit|Ûilor poate conduce
la ob Ûinerea unor solu Ûii inconsistente.
Datele din matricile de proximitate pot fi reprezentate sub forma unui graf specific, care eviden Ûiaz | pozi Ûionarea spa Ûial|
relativ | a obiectelor sau a variabilelor Õi care ofer | o imagine sugestiv |, de ansamblu, asupra distan Û|rii respectivelor entit|Ûi
informa Ûionale.
Baza informa Ûional| pentru determinarea matricilor de proximitate o reprezint| a Õa-numitele matrici de observa Ûii, care
sunt matrici de tipul obiecte×variabile sau matrici de tipul variabile×obiecte, în func Ûie de tipul analizei efectuate. În primul
caz, rândurile matricilor de observa Ûii reprezint| obiectele analizate, iar coloanele acestor matrici reprezint| caracteristicile
re Ûinute în analiz |, adic | variabilele descriptor. În cel de-al doilea caz, interpret|rile rândurilor Õi coloanelor sunt inversate.
Entit|Ûile informa Ûionale supuse procesului de clasificare cu ajutorul metodelor Õi tehnicilor de analiz | cluster sunt
reprezentate de obiecte sau variabile. Obiectele implicate într-o analiz | cluster se mai numesc indivizi, observa Ûii, articole sau
înregistr |ri. Din punct de vedere al modului de reprezentare extern |, mulÛimile de informa Ûii referitoare la aceste entit|Ûi sunt
organizate sub forma unor fiÕiere sau baze de date. Fiecare înregistrare din cadrul unui fiÕier sau unei baze de date define Õte
un anumit obiect. De obicei, în analiza cluster se presupune c | toate obiectele sunt caracterizate prin intermediul aceleia Õi
mulÛimi de variabile descriptor. Variabilele descriptor utilizate în analiza cluster pot s | fie de acela Õi tip, cantitativ sau calitativ,
sau pot s | fie de tipuri diferite. În fiecare dintre cele dou | cazuri, evaluarea gradului de proximitate dintre obiecte se face în mod
diferit.
Cele mai mari probleme apar în cazul în care variabilele descriptor sunt de tipuri diferite, deoarece în acest caz proximit|Ûile
par Ûiale, evaluate în raport cu variabile diferite, au natur | incompatibil| Õi nu pot fi agregate în mod direct în scopul ob Ûinerii
unui indicator de proximitate la nivelul ansamblului de variabile. O astfel de situa Ûie apare, de exemplu, când unele variabile
sunt de tip interval sau raport, iar altele sunt de tip nominal. A Õa cum o s | vedem în cadrul paragrafului 10.3.3.4, situa Ûiile de
acest fel impun utilizarea unor proceduri specifice de construire a indicatorilor de proximitate.
Matricile de observa Ûii pot con Ûine fie rezultatele m |sur |torilor directe, efectuate asupra variabilelor originale, fie
rezultatele ob Ûinute în urma unor transform |ri specifice, efectuate asupra variabilelor originale. M |rimile din cea de-a doua
categorie sunt reprezentate de scorurile componentelor principale sau de scorurile factorilor Õi se ob Ûin prin efectuarea, pe
observa Ûiile originale existente, a unei analize a componentelor principale sau a unei analize factoriale.
În analiza cluster, matricile de observa Ûii con Ûin informa Ûii cu caracter complet, adic | informa Ûii referitoare la întreaga
mulÛime de obiecte supuse clasific |rii. Spre deosebire de aceasta, în cazul analizei discriminante informa Ûiile con Ûinute în
matricea de observa Ûii sunt informa Ûii cu caracter par Ûial, referitoare la un e Õantion de obiecte extrase din popula Ûia de obiecte
supus | analizei.

8.6.2 Evaluarea distanÛelor dintre obiecte Õi tipuri de distanÛe


Prin natura lor numeric |, variabilele de tip cantitativ, adic | variabilele m |surate pe scalele de tip raport, interval Õi,
eventual, ordinal, permit o definire mai natural| a conceptului de distan Û|. Pentru variabilele de tip nominal, inclusiv variabilele
de tip binar, distan Ûele se calculeaz | într-un mod specific, compatibil cu natura acestor variabile.
Pentru evaluarea disimilarit|Ûilor dintre obiectele ale c |ror caracteristici sunt de tip cantitativ sau dintre variabile de tip can-
titativ, pot fi folosite mai multe tipuri de distan Ûe, cum ar fi: distan Ûa Euclidian | (simpl |, ponderat| sau p |trat|), distan Ûa Man-
hattan, distan Ûa CebîÕev, distan Ûa Minkovski, distan Ûa Camberra, distan Ûa Mahalanobis, distan Ûa Pearson, distan Ûa Jambu etc.

86
• DistanÛa Euclidian|
Distan Ûa Euclidian |, care mai este cunoscut| Õi sub numele de norm | de tip , este distan Ûa cea mai frecvent utilizat| în
problemele de analiz | cluster. Ea se calculeaz | ca r |d |cin | p |trat| a sumei p |tratelor diferen Ûelor coordonatelor celor dou |
obiecte sau variabile pentru care se evalueaz | distan Ûa.
Distan Ûa Euclidian | m |soar | dep |rtarea dintre dou | obiecte sau dintre dou | variabile “în linie dreapt|” Õi este definit| sub
forma urm |toare:

Distan Ûa Euclidian | exprim | proximitatea dintre obiecte ca distan Û| între dou | puncte din spa Ûiul Euclidian, respectiv ca
distan Û| m |surat| în linie dreapt|. În acest sens, de exemplu, distan Ûa dintre ora Õul Bucure Õti Õi ora Õul New-York nu este o
distan Û| de tip Euclidian deoarece ea este exprimat | de-a lungul curburii sau rotunjimii globului p |mântesc, Õi nu în linie
dreapt|.

• DistanÛa Manhattan
Distan Ûa Manhattan, numit| Õi distan Û| rectangular |, distan Û| “City-Block“ sau norm | de tip , se calculeaz | ca sum |
a valorilor absolute ale diferen Ûelor coordonatelor celor dou | obiecte sau celor dou | variabile analizate Õi este definit| de
rela Ûiile:

Deoarece diferen Ûele de coordonate utilizate în calculul s |u nu sunt amplificate printr-o ridicare la o putere, distan Ûa
Manhattan este mai robust | în raport cu prezen Ûa în date a valorilor aberante.
Distan Ûa Manhattan poate fi calculat| Õi în varianta ponderat|, calculul f |cându-se în mod similar cu cel al distan Ûei
Euclidiene ponderate. De asemenea, distan Ûa Manhattan poate fi utilizat| în cazul în care obiectele au caracteristici care sunt
m |surate pe scala de tip interval Õi pe scala de tip raport.

• DistanÛa CebîÕev
Distan Ûa CebîÕev, cunoscut| Õi sub numele de “maxim al dimensiunilor“ sau norm | de tip , este o distan Û| de tip valoare
absolut| Õi se determin | ca fiind valoarea maxim | a valorilor absolute ale diferen Ûelor dintre coordonatele obiectelor sau
variabilelor, respectiv:
.

Distan Ûa CebîÕev poate fi utilizat| atunci când se dore Õte ca dou | obiecte sau variabile s | apar| ca fiind diferite, dac | ele
difer | chiar Õi doar din punct de vedere al unei caracteristici, respectiv al unui obiect. În alte situa Ûii, nu este recomandabil s |
se foloseasc | acest tip de distan Û|.

• DistanÛa Mahalanobis
Distan Ûa Mahalanobis este una dintre cele mai cunoscute, mai importante Õi mai frecvent utilizate distan Ûe. Ea este o form |
generalizat| a conceptului de distan Û| Õi se calculeaz | sub formele urm |toare:
,
unde sunt vectori coloan | reprezentând liniile i Õi j din matricea de observa Ûii X, sunt vectori coloan |
reprezentând liniile p Õi q din matricea de observa Ûii Y, iar este nota Ûia pentru inversa matricii de covarian Û|, matrice
calculat| în spa Ûiul variabilelor - în primul caz, respectiv în spa Ûiul observa Ûiilor - în al doilea caz. Se poate observa c |, în cazul
în care matricea de covarian Û| este egal| cu matricea unitate, distan Ûa Mahalanobis se reduce la distan Ûa Euclidian | p |trat|.
Distan Ûa M ahalanobis reprezint| singurul tip de distan Û| care ia în considerare, într-o manier | complet|, gradul de
dispersare al mulÛimii de obiecte sau al mulÛimii de variabile analizate, precum Õi gradul de corelare al respectivelor entit|Ûi
informa Ûionale. Utilizarea distan Ûei Mahalanobis este recomandat|, mai ales în situa Ûiile în care variabilele care descriu obiectele
sunt corelate între ele. Distan Ûa Mahalanobis este utilizat| Õi în cazul tehnicilor de clasificare controlat|, pe baza acestei distan Ûe
fiind dezvoltat chiar un criteriu opera Ûional de discriminare.

8.6.3 Evaluarea distanÛelor dintre clustere


O problem | dificil| care apare în analiza cluster, este legat| de necesitatea evalu |rii distan Ûelor dintre clase sau clustere.
Dificultatea acestei probleme este dat| de faptul c | distan Ûele dintre clase sau clustere sunt, de fapt, distan Ûe între mulÛimi de
obiecte sau distan Ûe între mulÛimi de variabile.
Problema evalu |rii distan Ûelor dintre clustere apare în special în cazul analizei cluster de tip ierarhic, în care construirea

87
arborelui de clustere poate fi f|cut | pe baza comas |rii succesive sau diviz |rii succesive a clusterelor. Comasarea clusterelor este
numit| amalgamare sau agregare, iar divizarea clusterelor este numit| dezagregare.
Teoretic, procesul de agregare sau dezagregare succesiv | a clusterelor se bazeaz | pe definirea unei distan Ûe limit| între
clustere, distan Û| numit| Õi prag de agregare, respectiv prag de dezagregare. În principiu, decizia de comasare a dou | clustere
sau de divizare a unui cluster este luat| numai dac | distan Ûa dintre aceste clustere este mai mic |, respectiv mai mare decât
distan Ûa limit| fixat|.
Dac | în cazul evalu |rii gradului de apropiere sau dep |rtare dintre dou | obiecte lucrurile sunt relativ simple, fiind suficient
s | se calculeze una din distan Ûele men Ûionate mai sus, în cazul în care este necesar a fi evaluat gradul de apropiere sau dep |rtare
dintre dou | clustere lucrurile devin ceva mai complicate Õi presupun existen Ûa unei metode specifice de evaluare.
Distan Ûa dintre dou | clustere este, de fapt, o distan Û| dintre dou | mulÛimi de puncte, adic | o distan Û| mai dificil de evaluat.
Ca distan Û| între dou | mulÛimi de puncte, distan Ûa dintre dou | clustere poate fi m |surat| cu ajutorul uneia dintre mai multe
metode posibile.
Dintre metodele propuse pentru evaluarea distan Ûelor dintre clustere men Ûion |m: metoda celor mai apropia Ûi vecini, metoda
celor mai dep |rta Ûi vecini, metoda distan Ûei medii între perechi, metoda centroidului Õi metoda lui Ward etc.

8.6.3.1 Metoda celor mai apropiaÛi vecini


Metoda celor mai apropiaÛi vecini evalueaz| distanÛa dintre dou| clustere ca fiind distanÛa minim| dintre toate perechile posibile de
forme din cele dou| clustere. Aceasta înseamn| c| distanÛa dintre dou| clustere este m|surat| prin distanÛa dintre cele mai apropiate obiecte
aparÛinând celor dou| clase.
DefiniÛie: Metoda celor mai apropia Ûi vecini evalueaz | distan Ûa dintre dou | clustere ca distan Û| între dou | obiecte, unul
din primul cluster, iar cel|lalt din cel de-al doilea cluster, care sunt cele mai apropiate între ele în sensul distan Ûei utilizate.
În figura urm|toare este vizualizat| distanÛa dintre dou| clustere, evaluat| dup| metoda celor mai apropiaÛi vecini.

Figura 8.4: Distan Ûa dintre dou | clustere în cazul metodei celor mai
apropia Ûi vecini
8.6.3.2 Metoda celor mai dep|rtaÛi vecini
Metoda celor m ai dep |rta Ûi vecini este metoda dup | care distan Ûa dintre dou | clase este m |surat| prin distan Ûa dintre cele
mai dep |rtate obiecte apar Ûinând celor dou | clustere. Pe baza acestei metode, dou | clustere sunt considerate a fi mai apropiate
sau mai dep |rtate, în func Ûie de proximitatea dintre cele mai dep |rtate obiecte din cele dou | clustere.
DefiniÛie: Metoda celor mai dep |rta Ûi vecini evalueaz | distan Ûa dintre dou | clustere ca distan Û| între dou | obiecte, unul
din primul cluster, iar cel|lalt din cel de-al doilea cluster, care sunt cel mai dep |rtate între ele în sensul distan Ûei utilizate.
Calculul distan Ûei dintre dou | clustere cu ajutorul metodei celor mai dep |rta Ûi vecini se face pe baza datelor din matricea
distan Ûelor dintre obiectele din cele dou | clustere, prin identificarea în aceast | matrice a elementului cu valoarea cea mai mare.

Figura 8.5: Distan Ûa dintre dou | clustere în cazul metodei celor mai
dep |rta Ûi vecini
Pentru evaluarea distan Ûelor dintre obiectele cele mai dep |rtate din cele dou | clustere poate fi utilizat| oricare dintre
metodele cunoscute de calcul a distan Ûelor dintre obiecte, în func Ûie de natura variabilelor care definesc obiectele supuse
clasific |rii.

8.6.3.3 Metoda distanÛei medii dintre perechi


Metoda distan Ûei medii dintre perechile de obiecte evalueaz | distan Ûa dintre dou | clustere prin intermediul distan Ûei medii
dintre toate perechile posibile de obiecte care apar Ûin celor dou | clustere.

88
DefiniÛie: Metoda distan Ûei medii dintre perechi evalueaz | distan Ûa dintre dou | clustere ca medie a distan Ûelor dintre
oricare dou | obiecte care apar Ûin celor dou | clustere, unul primului cluster, iar cel|lalt din celui de-al doilea cluster.
Evaluarea distan Ûei dintre dou | clustere cu ajutorul metodei distan Ûei medii între perechile de obiecte se face pe baza datelor
din matricea distan Ûelor dintre obiectele din cele dou | clustere, calculând media acestor distan Ûe.
În figura urm |toare este sugerat| o interpretare geometric | a modului de calcul a distan Ûei dintre clustere cu ajutorul
metodei distan Ûei medii dintre perechi.

Figura 8.6: Ilustrarea grafic | a metodei distan Ûei medii dintre perechi

Ca Õi în cazul celorlalte dou | metode, pentru evaluarea distan Ûelor dintre obiectele celor dou | clustere, poate fi utilizat|
oricare dintre metodele cunoscute de calcul al distan Ûelor dintre obiecte.

8.6.3.4 Metoda centroidului


Metoda centroidului este metoda dup | care distan Ûa dintre dou | clustere este m |surat| ca distan Û| între centroizii celor
dou | clustere. În acest fel, dou | clustere sunt considerate mai apropiate sau mai dep |rtate, în func Ûie de gradul de apropiere sau
de dep |rtare dintre centroizii lor.
Centroidul sau centrul de greutate al unui cluster reprezint| obiectul, real sau abstract, ale c |rui caracteristici au ca valori
chiar mediile caracteristicilor obiectelor care compun clusterul respectiv.
DefiniÛie: Metoda centroidului evalueaz | distan Ûa dintre dou | clustere ca distan Û| între centroizii celor dou | clustere.
Evaluarea distan Ûei dintre dou | clustere cu ajutorul metodei centroidului se face calculând mai întâi centroizii celor dou |
clustere, dup | care se evalueaz | distan Ûa dintre clustere ca distan Û| între ace Õti centroizi.
Figura urm |toare ilustreaz| interpretarea geometric | a calculului distan Ûelor dintre clustere cu ajutorul metodei centroidului.
În aceast | figur |, centroizii celor dou | clustere sunt marca Ûi prin cele dou | puncte de dimensiune mai mare.

Figura 8.7: Distan Ûa dintre clustere în cazul metodei centroidului


Deoarece centroidul este vectorul mediilor corespunz |toare tuturor obiectelor dintr-un cluster, în calculul distan Ûei dintre
dou | clustere cu ajutorul metodei centroidului sunt luate în considerare, în mod implicit, toate obiectele din fiecare cluster.

8.6.3.5 Metoda lui Ward


Metoda lui Ward este o metod | de evaluare a distan Ûei dintre dou | clustere, care se bazeaz | pe maximizarea gradului de
omogenitate a clusterelor sau, ceea ce este acela Õi lucru, pe minimizarea variabilit|Ûii intracluster. De regul|, gradul de omoge-
nitate a unui cluster se consider | a fi cu atât mai mare, cu cât suma total| a p |tratelor abaterilor intracluster este mai mic |.
Elementul caracteristic al metodei lui W ard este reprezentat de faptul c | prin comasarea a dou | clustere se urm |re Õte
ob Ûinerea unei omogenit|Ûi maxime la nivelul tuturor clusterelor care apar Ûin unei configura Ûii date a obiectelor pe clustere. În
acest sens, se poate spune c | distan Ûa W ard dintre dou | clustere m |soar | variabilitatea intracluster cumulat|, pe care o induce
comasarea celor dou | clustere la nivelul configura Ûiei cluster rezultate. În acest sens, distan Ûa W ard poate fi definit| sub forma
urm |toare:
DefiniÛie: Metoda lui Ward evalueaz | distan Ûa dintre dou | clustere sum | total| a p |tratelor abaterilor la nivelul
configura Ûiei cluster rezultate din comasarea celor dou | clustere pentru care se evalueaz | distan Ûa.
Spre deosebire de alte metode de calcul a distan Ûelor între clustere, distan Ûa W ard ofer | o serie de avantaje. Aceste avantaje
decurg din faptul c | ea este singura dintre metodele de evaluare a distan Ûelor dintre clustere, care exprim | distan Ûele din punct
de vedere al minimiz |rii variabilit|Ûii intracluster sau, ceea ce înseamn | acela Õi lucru, din punct de vedere al maximiz |rii
variabilit|Ûii intercluster.

89
8.6.4 Metode Õi tehnici de analiz| cluster
Analiza cluster are ca scop c |utarea Õi identificarea în datele supuse analizei a unor grupuri sau clustere, în func Ûie de
similarit|Ûile Õi disimilarit|Ûile dintre obiectele la care se refer | respectivele date.
Cea mai important | etap | din cadrul unei analize cluster este cea a form |rii clusterelor sau claselor. Algoritmii care pot
fi utiliza Ûi pentru realizarea activit|Ûii de construire a clusterelor cunosc o mare varietate, care include algoritmi euristici,
algoritmi de optimizare Õi algoritmi fuzzy. Diferen Ûele dintre modul de construire a clusterelor dup | un algoritm sau altul, sunt
determinate, în principal, de natura metodei utilizate pentru evaluarea distan Ûelor între clustere. Mai mult, chiar tipul analizei
cluster rezult| din natura algoritmului utilizat pentru construirea clusterelor.
Din punct de vedere al naturii lor, al modului de operare Õi al tipului de solu Ûii pe care le furnizeaz |, metodele de analiz |
cluster pot fi împ |r Ûite în dou | mari categorii: metode de tip ierarhic Õi metode de tip iterativ sau de partiÛionare.
Algoritmii sau metodele de tip ierarhic au ca scop producerea mai multor solu Ûii cluster, solu Ûii numite ierarhii cluster.
Caracteristica principal | a acestor algoritmi const | în faptul c | num |rul de clustere nu este cunoscut aprioric.
Remarc |: În cazul metodelor de clasificare ierarhic |, num |rul de clustere nu este cunoscut aprioric.
Exist| dou | categorii de algoritmi de clasificare ierarhic |: algoritmi de agregare Õi algoritmi de dezagregare.
Rezultatele furnizate de algoritmii de clasificare ierarhic | includ mai multe variante de clasificare a obiectelor, fiecare
variant | de clasificare con Ûinând structuri cluster cu un num |r variabil de clustere. Structurile cluster ob Ûinute cu ajutorul
algoritmilor de acest fel se numesc structuri cluster multinivel.
Remarc |: Algoritmii de clasificare ierarhic | furnizeaz | mai multe solu Ûii, de tip multinivel, care se numesc ierarhii
cluster Õi care difer | între ele prin num |rul de clustere pe care le includ Õi prin gradul de agregare al clusterelor.
Cea mai sintetic | solu Ûie a unei structuri cluster ob Ûinute cu ajutorul metodelor de clasificare ierarhic | este format| dintr-un
singur cluster, care include toate obiectele analizate. Cea mai detaliat| solu Ûie a unei structuri cluster de acest fel include un
num |r maxim de clustere, egal cu num |rul de obiecte analizate, fiecare cluster con Ûinând un singur obiect. Aceasta înseamn |
c | num |rul posibil de solu Ûii dintr-o structur | cluster ob Ûinut | cu ajutorul algoritmilor ierarhici este mai mic cu unu decât
num |rul de obiecte supuse clasific |rii. Acest num |r este determinat de num |rul de nivele ierarhice ale solu Ûiei Õi este dat de
rela Ûia urm |toare:
.
Alegerea dintre cele solu Ûii ale unei structuri cluster a celei mai potrivite solu Ûii cluster r |mâne la latitudinea
cercet|torului Õi se face, în principal, în func Ûie de obiectivele urm |rite în analiz |.
Algorimii sau metodele de tip iterativ au ca scop producerea unei structuri cluster format| dintr-o singur | solu Ûie cluster.
O astfel de structur | cluster se nume Õte structur | cluster uninivel Õi con Ûine o singur | cluster, care include un num |r fixat de
clustere.
Remarc |: Algoritmii de clasificare prin parti Ûionare furnizeaz | solu Ûii unice, adic | solu Ûii de tip uninivel.
Caracteristica principal | a algoritmilor de parti Ûionare este dat| de faptul c | num |rul de clustere este fixat aprioric de c |tre
analistul de informa Ûii. Algoritmii din aceast | categorie mai sunt cunoscu Ûi Õi sub numele de algoritmi de partiÛionare.
Remarc |: În cazul metodelor de clasificare prin parti Ûionare, num |rul de clustere este cunoscut aprioric.
În func Ûie de natura criteriului utilizat în procesul propriu-zis de clasificare, metodele de analiz | cluster pot fi împ |r Ûite în
dou | categorii: metode euristice Õi metode algoritmice.
Metodele euristice includ procedurile de clasificare dezvoltatea pe baza unei anumite euristici. O euristic | este o modalitate
intuitiv | de solu Ûionare a unei anumite probleme particulare. Euristicile reprezint| seturi de reguli sau de recomand |ri cu caracter
general, deduse pe baza unor ra Ûionamente teoretice sau pe baza unor observa Ûii statistice. În general, conceptul de euristic | este
opus conceptului de algoritm Õi este utilizat pentru a defini metode Õi tehnici non-algoritmice.
Prin natura lor, metodele de clasificare ierarhic | sunt metode euristice. Astfel, metoda agreg |rii simple, metoda agreg |rii
complete, metoda agreg |rii medii, metoda centroidului sau metoda lui W ard, sunt metode de tip euristic.
Metodele algoritmice includ procedurile de clasificare de tip formal, bazate pe existen Ûa unui anumit algoritm de solu Ûionare
a problemei. Un algoritm este o mulÛime de finit| Õi complet definit| de opera Ûii, pa Õi sau proceduri, a c |ror execu Ûie determin |
ob Ûinerea unui anumit rezultat sau a unei anumite solu Ûii. Orice algoritm se compune din trei p |r Ûi esen Ûiale: ini Ûializarea,
procedura sau schema iterativ | Õi criteriul de oprire.
Deoarece includ toate componentele caracteristice unui algoritm, metodele de clasificare prin parti Ûionare sunt metode cu
natur | preponderent algoritmic |. Spre deosebire de aceste metode, cele trei componente ale unui algoritm nu se reg |sesc în mod
explicit Õi în cazul metodelor de clasificare ierarhic |.

8.6.4.1 Analiza cluster de tip ierarhic


Analiza cluster de tip ierarhic sau arborescent este o metod | de clasificare bazat | pe gruparea obiectelor pe baz | de
agregare succesiv | în clase din ce în ce mai largi de obiecte sau de dezagregare succesiv | în clase din ce în ce mai mici.
Ipoteza fundamental| a analizei cluster de tip ierarhic este aceea la nivelul mulÛimilor supuse studiului exist| mai multe
niveluri de structurare natural| a obiectelor pe grupe sau clase, eviden Ûiindu-se o imbricare sau o includere, de tip arborescent,
a structurilor con Ûinute la nivel latent în cadrul acestor mul Ûimi.
Ipoteza de baz | a clasific |rii ierarhice: În cadrul mulÛimilor de obiecte analizate se diferen Ûiaz | o multitudine de
structuri de tip latent, care sunt caracterizate printr-o imbricare de natur | arborescent|.

90
În cea mai mare parte a lor, algoritmii de clasificare ierahic | sunt algoritmi de tip euristic. Exist| îns | Õi o categorie aparte
de algoritmi de clasificare ierarhic |, reprezentat| de algoritmii de tip model formal, care genereaz | structurile cluster pe baza
maximiz |rii verosimilit|Ûii.
Rezultatul utiliz |rii analizei cluster de tip ierarhic îl reprezint| o mulÛime de structuri particulare de clustere, numit| arbore
al clasific |rii sau arbore ierarhic.
Structurile cluster care alc |tuiesc arborerele de clasificare includ un num |r de clustere diferit. O solu Ûie cluster ce
corespunde unui nivel mai ridicat de agregare con Ûine un num |r de clustere mai mic cu 1 decât o solu Ûie cluster corespunz |toare
proximului nivel ierarhic inferior. Aceasta înseamn | c | structurile cluster de tip ierarhic sunt caracterizate prin nivele diferite
de agregare, cuprinse între un nivel minim Õi un nivel maxim.
Structura cluster cu cel mai înalt nivel de agregare este format | dintr-un singur cluster, care include toate obiectele supuse
clasific |rii. Structura cluster cu cel mai redus nivel de agregare este format| dintr-un num |r de clustere egal cu num |rul de
obiecte analizare, fiecare cluster incluzând un singur obiect.
Num |rul de clustere din dou | structuri cluster succesive difer | printr-o unitate, structura cluster cu nivel mai înalt de
agregare con Ûinând cu un cluster mai pu Ûin decât structura cluster precedent |.
Cu cât nivelul de agregare al structurilor cluster este mai ridicat, cu atât similarit|Ûile dintre obiectele unui cluster sunt mai
reduse, adic | clusterele sunt mai eterogene. Acest lucru se explic | prin faptul c | un cluster de la un nivel de agregare mai înalt
con Ûine un num |r mai mare de obiecte decât un cluster de la un nivel de agregare mai redus.
În funcÛie de condiÛiile iniÛiale de la care se porneÕte în construirea structurilor cluster Õi de sensul în care se desf|Õoar| construirea
acestora, algoritmii de clasificare de tip ierarhic pot fi împ|rÛiÛi în dou| mari categorii:
• algoritmi de clasificare prin agregare, amalgamare sau combinare;
• algoritmi de clasificare prin dezagregare sau divizare.
Algoritmii de dezagregare construiesc clusterele într-o manier| descendent|, pornind cu toate obiectele într-un singur cluster Õi
continuând, prin divizarea succesiv| a acestuia, pân| la obÛinerea unor clustere care conÛin câte un singur obiect.
Algoritmii de agregare sau de amalgamare construiesc clustere într-o manier| ascendent|, pornind de la clustere care conÛin câte un
singur obiect Õi continuând, prin comasare succesiv| a clusterelor, pân| la obÛinerea unui cluster care include toate obiectele.
În cazul procedurilor de clasificare prin agregare, în fiecare pas se comaseaz| într-un singur cluster fie dou| obiecte, fie un obiect Õi
un cluster, fie dou| clustere diferite. În fiecare etap| a procedurilor divizative, un cluster este divizat fie sub forma a dou| clustere, fie sub
forma unui cluster Õi unui obiect, fie sub forma a dou| obiecte.
Num|rul de paÕi necesari pentru obÛinerea unei soluÛii cluster de tip ierarhic depinde de num|rul de obiecte supuse clasific|rii Õi este
diferit pentru cele dou| categorii de metode de clasificare ierarhic|.
Procesele de agregare Õi de dezagragare a clusterelor, specifice celor dou| categorii de proceduri de clasificare ierahic|, presupun
utilizarea unor metode specifice de evaluare a distanÛelor dintre clustere.

8.6.4.1.1 Metode de clasificare ierarhic| prin agregare


Algoritmii de agregare sau amalgamare se bazeaz | în mod exclusiv pe evaluarea disimilarit|Ûilor dintre clustere, adic | pe
evaluarea de distan Ûe intercluster. Datorit | simplit|Ûii lor, rezultat| din naturale Ûea ideii de comasare, algoritmii de agregare sunt
mai frecvent utiliza Ûi în activit|Ûile de clasificare, în compara Ûie cu algoritmii baza Ûi pe dezagregare. Indiferent de tipul
algoritmului concret care este utilizat, în orice procedur | bazat| pe agregare construc Ûia arborelui ierarhic de clustere presupune
parcurgerea urm |toarelor etape generale:
• iniÛial se porne Õte cu un num |r de clustere egal cu num |rul de obiecte, fiecare cluster fiind alc |tuit dintr-un singur
obiect, respectiv:
;
• ulterior, de-a lungul a mai multor etape, clusterele ini Ûiale sunt succesiv agregate în vederea ob Ûinerii unor clase din ce
în ce mai complexe. Num |rul total de etape ale procedurii este egal cu . Agregarea este f|cut | pe baza unei m |suri
de disimilaritate între clusterele existente la un moment dat, respectiv pe baza uneia dintre distan Ûele specifice. În fiecare
etap |, pe care o vom nota cu t, sunt agregate doar dou | clustere, respectiv acele clustere pentru care distan Ûa dintre ele este
minim |, în compara Ûie cu distan Ûele dintre orice dou | clustere existente în acea etap |. Aceast | distan Û| se nume Õte distan Û|
de agregare Õi poate fi definit| astfel:
,

unde reprezint| num |rul de clustere existente în etapa t. Cele dou | clustere care se comaseaz | într-unul singur sunt
clusterele pentru care se ob Ûine distan Ûa de agregare. Distan Ûa de agregare se nume Õte prag de agregare Õi este specific |
fiec |rei etape între care exist| o distan Û| egal| cu distan Ûa de agregare. Structura cluster ob Ûinut| în etapa t este de forma:
.
Pe m |sura construirii ierarhiei cluster, pragul de agregare cre Õte continuu, iar num |rul de clustere se reduce cu 1 în
fiecare etap |. Ca urmare a relax |rii succesive a pragului de agregare, gradul de agregare a obiectelor în clustere cre Õte
continuu.
• în ultima etap | a agreg |rii toate obiectele sunt incluse într-un singur cluster, respectiv:
.
Aceast | procedur | de clasificare pe baz | de agregare este comun | tuturor algoritmilor din aceast | categorie. Diferen Ûele

91
dintre algoritmii de clasificare ierarhic | prin agregare sunt date doar de modul specific în care sunt evaluate distan Ûele dintre
clustere.
În cadrul figurii urm |toare sunt vizualizate etapele necesare pentru o clasificare de tip ierarhic prin metode de agregare.

Etapa 0 Etapa 1 Etapa 2 Etapa 3 Etapa 4


Figura 8.8: Ilustrarea grafic | a etapelor clasific |rii ierarhice prin agregare

Evaluarea distan Ûelor dintre clusterele ob Ûinute la un moment dat din desf |Õurarea analizei cluster de tip agregare ierarhic |,
exceptând prima etap | în care clasele sunt alc |tuite din câte un singur obiect, poate fi f|cut | folosind oricare dintre metodele
de m |surare a distan Ûelor dintre clustere, metode prezentate anterior.
Spre deosebire de cazul clasific |rii ierarhice prin agregare, în cazul procedurii bazate pe dezagregare se procedeaz |
oarecum invers. Se porne Õte cu un cluster care include toate obiectele Õi din acesta sunt diferen Ûiate clustere din ce în ce mai
mici, pân | când se ob Ûin clustere formate din câte un singur obiect.
Datorit | faptului c | tehnicile de clusterizare bazate pe agregare sunt cele mai frecvent utilizate, vom prezenta în continuare
principalele tipuri ale acestora. Construirea arborilor de clustere prin dezagregare este similar | celei ob Ûinute prin agregare.
În func Ûie de tipul distan Ûelor utilizate pentru agregarea clusterelor, exist| patru metode euristice de clasificare ierahic |:
metoda agreg |rii simple, metoda agreg |rii complete, metoda agreg |rii medii, metoda centroidului Õi metoda lui Ward sau
metoda varian Ûei.

8.8.4.1.1.1 Metoda agreg|rii simple


În analiza cluster bazat| pe agregare simpl| afectarea unui obiect la un cluster se face numai dac | acel obiect are un anumit
grad de disimilaritate cu unul dintre obiectele care apar Ûin deja clusterului. Clusterizarea de acest tip se mai nume Õte Õi analiz|
cluster de distan Û| minim | sau analiz| cluster de tip MIN.
Metoda agreg |rii simple se bazeaz | pe exprimarea proximit|Ûii dintre dou | clustere prin intermediul distan Ûei dintre cele
mai apropiate obiecte din cele dou | clustere. Evaluarea acestei distan Ûe se face cu ajutorul metodei celor mai apropia Ûi vecini.
DefiniÛie: Metoda agreg |rii simple este o metod | de clasificare ierarhic | de tip ascendent, care comaseaz | în fiecare
etap | a clasific |rii acele dou | clustere pentru care distan Ûa dintre cei mai apropia Ûi vecini este cea mai mic |, în compara Ûie
cu alte perechi de clustere.
În figura urm |toare, este ilustrat felul în care sunt comasate dou | clustere în cazul utiliz |rii metodei agreg |rii simple.

Figura 8.9: Comasarea clusterelor dup | metoda agreg |rii simple

Cea mai mic | distan Û| între cei mai apropia Ûi vecini din cele trei perechi posibile de clustere este distan Ûa , care
corespunde perechii de clustere . Ca urmare, clusterul 1 va fi comasat cu clusterul 2, rezultând un nou cluster,
care va con Ûine obiectele din cele dou | clustere.

8.8.4.1.1.2 Metoda agreg|rii complete


Aceast | metod | de clusterizare este similar | cu metoda agreg |rii simple, cu deosebirea c | agregarea a dou | clustere se face
pe baza unei distan Ûe de agregare care este distan Ûa dintre cele mai dep |rtate obiecte din acele clustere. Clusterizarea de acest
tip se mai nume Õte Õi analiz| cluster de distan Û| maxim | sau analiz| cluster de tip MAX.

92
În cazul metodei agreg |rii complete evaluarea distan Ûelor dintre clustere se face cu ajutorul metodei celor mai dep |rta Ûi
vecini. Aceasta înseamn | c | distan Ûa dintre dou | clustere este considerat | a fi în acest caz distan Ûa cea mai mare dintre oricare
dou | puncte apar Ûinând celor dou | clustere.
DefiniÛie: Metoda agreg |rii complete este o metod | de clasificare ierarhic | de tip ascendent, care comaseaz | în fiecare
etap | a clasific |rii acele dou | clustere pentru care distan Ûa dintre cei mai dep |rta Ûi vecini este cea mai mic |, în compara Ûie
cu alte perechi de clustere.

Figura 8.10: Comasarea clusterelor dup | metoda agreg |rii complete

8.8.4.1.1.3 Metoda agreg|rii medii


Metoda agreg |rii medii este o metod | de clusterizare similar | celor dou | metode men Ûionate anterior, cu deosebirea c |
evaluarea distan Ûei dintre dou | clustere este considerat | a fi media distan Ûelor care separ | obiectele apar Ûinând celor dou |
clustere.
Agregarea clusterelor cu ajutorul metodei agreg |rii medii se face pe baza determin |rii unui grad de conectivitate medie
dintre clustere, grad evaluat ca distan Û| medie corespunz |toare unei perechi de obiecte, primul obiect apar Ûinând unui cluster,
iar al doilea obiect apar Ûinând celuilalt cluster.
DefiniÛie: Metoda agreg |rii medii este o metod | de clasificare ierarhic | de tip ascendent, care comaseaz | în fiecare
etap | a clasific |rii acele dou | clustere pentru care distan Ûa medie dintre toate perechile formate cu obiecte din cele dou |
clustere este cea mai mic |, în compara Ûie cu alte perechi de clustere.

8.8.4.1.1.4 Metoda centroidului


Metoda centroidului este o metod | de clasificare ierahic | ascendent|, în care distan Ûele dintre clustere sunt evaluate cu
ajutorul metodei centroidului. Ideea de baz | a metodei centroidului este aceea de ob Ûinere a unui nou cluster prin comasarea
a dou | clustere existente, în func Ûie de distan Ûa cea mai mic | dintre centroizii clusterelor care sunt verificate în scopul comas |rii.
DefiniÛie: Metoda centroidului este o metod | de clasificare ierarhic | de tip ascendent, care comaseaz | în fiecare etap |
a clasific |rii acele dou | clustere pentru care distan Ûa dintre centroizii celor dou | clustere este cea mai mic |, în compara Ûie
cu alte perechi de clustere.
Dou | clustere sunt comasate într-un nou cluster dac | Õi numai dac | distan Ûa dintre centroizii lor este cea mai mic | dintre
toate distan Ûele dintre centroizii oric |ror dou | clustere care apar Ûin configura Ûiei cluster disponibile. În figura urm |toare este
vizualizat modul de comasare a dou | clustere folosind metoda centroidului.

Figura 8.11: Ilustrarea metodei centroidului

93
8.8.4.1.1.5 Metoda lui Ward
Metoda lui W ard, cunoscut| Õi sub numele de metoda minimei varian Ûe intracluster, este una dintre cele mai cunoscute Õi
mai eficiente metode de clasificare ierarhic | prin agragare.
În virtutea acestei metode atribuirea unui obiect la un cluster se face numai dac | aceast| atribuire minimizeaz | varian Ûa
din cadrul clusterului. Pe post de criteriu general de afectare a obiectelor la clustere este considerat | minimizarea sumelor
elementelor de pe diagonala matricii comune de covarian Û| a clusterelor, adic | minimizarea trasei matricii de covarian Û|
intraclase.
Metoda lui Ward este o metod | de evaluare a distan Ûei dintre dou | clustere care se bazeaz | pe maximizarea gradului de
omogenitate a clusterelor.
DefiniÛie: Metoda lui Ward este o metod | de clasificare ierarhic | de tip ascendent, care comaseaz | în fiecare etap | a
clasific |rii acele dou | clustere pentru care suma p |tratelor abaterilor la nivelul clusterului rezultat din comasare este cea
mai mic |, în compara Ûie cu alte perechi de clustere.
Metoda lui W ard nu este o metod | propriu-zis | de calcul a distan Ûelor dintre clustere, ci o metod | de formare a clusterelor
pe baza maximiz |rii gradului de omogenitate a clusterelor.
Ca m |sur | a gradului de omogenitate a clusterelor este utilizat| suma p |tratelor abaterilor, numit | suma p |tratelor
abaterilor intracluster. Gradul de omogenitate a unui cluster se consider | a fi cu atât mai mare cu cât suma abaterilor intracluster
este mai mic |.
Distan Ûa W ard se evalueaz | pentru toate combina Ûiile posibile de comasare într-un singur cluster a oric |ror dou | clustere
din configura Ûia iniÛial|.

8.6.4.1.2 Metode de divizare


Metodele de clasificare prin divizare, numite Õi metode de tip descendent, sunt analoage cu metodele aglomerative, cu
deosebirea c | derularea acestora se desf |Õoar | într-o manier | invers |. Ca Õi în cazul metodelor de agregare, solu Ûiile ob Ûinute
cu ajutorul metodelor divizative sunt ierarhii de clustere, care pot fi reprezentate prin intermediul arborilor cluster sau
dendrogramelor.
Algoritmii de clasificare ierarhic | pe baz | de divizare se caracterizeaz | prin faptul c |, iniÛial, se porne Õte cu un singur
cluster, care con Ûine toate obiectele care trebuie supuse clasific |rii. Ulterior, clusterul iniÛial este divizat succesiv, pân | când
se ob Ûin clustere formate dintr-un singur obiect.
Spre deosebire de metodele de clasificare ierarhic | prin agregare, care sunt, într-un anumit fel mai naturale, metodele de
clasificare ierarhic | prin divizare sunt caracterizate de o complexitate mai ridicat|. O metod | de clasificare ierarhic | prin
divizare produce o structur | cluster în etape, unde T este num |rul de obiecte clasificate.
Datorit | existen Ûei unui num |r suficient de mare de algoritmi de clasificare ierarhic | prin agregare, num |rul de algoritmi
dezvolta Ûi pentru clasificarea ierarhic | prin divizare este extrem de mic. Unul dintre cei mai cunoscu Ûi algoritmi din aceast |
categorie este algoritmul DIANA. Un alt algoritm de acest tip este cel bazat pe metoda clasific |rii monotetice, îns | acesta poate
fi utilizat numai în cazul în care variabilele care descriu obiectele sunt de tip binar. Vom prezenta în cele ce urmeaz | fiecare
dintre cei doi algoritmi de divizare men Ûiona Ûi.

8.6.4.2 Algoritmi de partiÛionare


Algoritmii de parti Ûionare includ o serie de metode de analiz | cluster, cu mult mai performante decât metodele de clasificare
ierarhic |. Dintre cei mai importan Ûi algoritmi de parti Ûionare, men Ûin |m: algoritmul celor K-medii Õi algoritmul celor K-medoizi.

8.7. RecunoaÕterea formelor cu ajutorul tehnicilor de analiz| discriminant|


În mod frecvent, în analiza datelor apare necesitatea studierii unor popula Ûii care sunt eterogene din punct de vedere al
caracteristicilor analizate, fapt care complic | procesul de cunoa Õtere a acestor popula Ûii Õi impune efectuarea unui demers
Õtiin Ûific specific. Expresia cea mai semnificativ | a popula Ûilor de tip eterogen este întâlnit| în special în domeniul statisticii,
econometriei Õi analizei datelor, fiind reprezentat| chiar de cantit|Ûile foarte mari de informa Ûie care trebuie prelucrat |,
sintetizat| Õi interpretat|.
În cazul cercet|rii unor popula Ûii de acest tip, pentru ca rezultatele investig |rii s | capete consisten Û| Õi relevan Û|, este
necesar | o împ |r Ûire, o divizare a acestor popula Ûii în subpopula Ûii cu un anumit grad de omogenitate, urmând ca analizele Õi
procesul de modelare implicate în studierea respectivei popula Ûii s | se fac | în mod diferen Ûiat, pentru fiecare subpopula Ûie în
parte.
Formularea unor concluzii corecte Õi robuste cu privire la manifestarea popula Ûiilor caracterizate de un grad mai mare sau
mai mic de eterogenitate nu este posibil| decât dac | analiza ia în considerare structurarea acestor popula Ûii pe categorii.
În alte situa Ûii, cum sunt cele în care sunt analizate diverse entit|Ûi economico-sociale, considerate a proveni din popula Ûii
cu caracteristici foarte diferite, exist| interesul de a identifica, de a recunoa Õte, originea acestor entit|Ûi, Õi de a ob Ûine o încadrare
corect | a acestora în anumite clase reprezentative pentru popula Ûia de origine. Situa Ûiile acest fel dep |Õesc sfera economico-
financiar |, ele întâlnindu-se în mod frecvent într-o mare varietate de alte domenii importante ale Õtiin Ûei, cum ar fi: informatica,
biologia, antropologia, medicina, sociologia, geologia, meteorologia etc.

94
În domeniul economico-financiar, entit|Ûile care fac obiectul problemelor legate de stabilirea apartenen Ûei la o anumit|
grup | sau clas | pot fi firme, clien Ûi ai unei b |nci, cump |r |tori ai unui produs, unit|Ûi administrativ-teritoriale, pie Ûe de bunuri
sau servicii etc.
Procedura general| de stabilire, pe baza unor caracteristici definitorii Õi utilizând metode Õi tehnici specifice, a apartenen Ûei
unor obiecte la anumite grupe sau clase dinainte cunoscute poart| numele de analiza discrim inant|.
Analiza discrim inant| reprezint| procesul de utilizare a unei game variate de metode, tehnici Õi algoritmi în scopul de a
determina care dintre caracteristicile unor anumite obiecte au cea mai mare relevan Û| din punct de vedere al recunoa Õterii
apartenen Ûei acestor obiecte la anumite clase aprioric definite Õi de a stabili apartenen Ûa cea mai probabil| a obiectelor la diferite
clase.
Stabilirea apartenen Ûei obiectelor unei popula Ûii la anumite clase are la baz | propriet|Ûile sau caracteristicile obiectelor
respective, care sunt reprezentate la nivel formal prin intermediul unor variabile, notate cu .
În general, se poate spune c | analiza discriminant | se ocup | cu rezolvarea urm |toarelor trei categorii de probleme:
• determinarea acelui set optimal de caracteristici ale unor obiecte, care s | permit| cea mai bun | discriminare
între dou | sau mai multe tipuri de obiecte;
• utilizarea variabilelor din setul optimal de caracteristici pentru deducerea unor criterii sau reguli pe baza c |rora
se poate face separarea popula Ûiei studiate pe clase sau grupe distincte;
• utilizarea setului de caracteristici cu cea mai mare putere discriminatorie Õi a criteriilor de separare identificate
pentru clasificarea unor obiecte, a c |ror apartenen Û| nu este cunoscut|, în clasele grupele sau clasele popula Ûiei
studiate; clasificarea de noi obiecte, pe baza variabilelor discriminant Õi a criteriilor de separare, este cunoscut| sub
numele de predic Ûie.
Variabilele din setul optimal de caracteristici se numesc variabile descriptor Õi pot fi reprezentate fie de întreaga mulÛime
de variabile care descriu obiectele, fie doar de o submul Ûime a acesteia. Aceasta înseamn | c | mulÛimea variabilelor descriptor
este o mulÛime de forma:
.
Variabilele descriptor nu sunt folosite în procesul de clasificare în mod direct, ca atare, ci sub o form | transformat|,
reprezentat| de variabilele discriminant.
Criteriile care trebuie deduse în vederea separ |rii claselor din popula Ûia analizat| sunt utilizate pentru construirea unor
ecua Ûii sau func Ûii, care definesc puncte, curbe sau suprafe Ûe de separare a acestor clase. Ecua Ûiile sau func Ûiile utilizate pentru
separarea claselor sunt cunoscute Õi sub numele de clasificatori.
Func Ûiile pe baza c |rora se face separarea claselor se numesc func Ûii discriminant, func Ûii de clasificare sau func Ûii scor,
sunt definite în raport cu variabilele descriptor ale obiectelor Õi servesc la determinarea unor noi variabile, numite variabile
discriminant sau variabile scor.
Leg |tura dintre cele trei categorii de elemente informa Ûionale ale analizei discriminante, respectiv variabilele descriptor,
variabilele discriminat Õi func Ûia discriminat este dat| de rela Ûia:
,
unde reprezint| variabilele descriptor, este variabila discriminant, iar este func Ûia discriminant.
Dup | cum o s | vedem în continuare, în majoritatea covâr Õitoare a cazurilor de folosire a analizei discriminante, func Ûiile
discriminant sunt func Ûii liniare de forma:
.
Num |rul de func Ûii discriminant, adic | p, este determinat de num |rul variabilelor descriptor Õi de num |rul claselor existente
la nivelul popula Ûiei studiate.
Variabilele discriminant determin | un nou spa Ûiu p-dimensional, numit spa Ûiu discriminant, ale c |rui axe sunt
reprezentate de vectorii Õi în contextul c |ruia se va face clasificarea efectiv | obiectelor. Valorile variabilelor discriminant
sunt rezultatul evalu |rii func Ûiilor discriminat pentru un anumit obiect fixat Õi se numesc scoruri discriminat. Scorurile
discriminant sunt utilizate ca indicatori în clasificarea propriu-zis | a obiectelor.
Func Ûiile discriminant se identific | pe baza unor criterii specifice de discriminare, iar parametrii acestor func Ûii se estimeaz |
pe baza informa Ûiilor con Ûinute de un e Õantion particular de observa Ûii (obiecte, forme etc.), extras din popula Ûia analizat|.
Dup | ce au fost selectate variabilele discriminant Õi au fost construite func Ûiile discriminant, acestea pot s| fie utilizate în
efectuarea de predic Ûii cu privire la apartenen Ûa la o clas | sau alta a unor noi obiecte.
Din formularea acestor trei categorii de probleme, rezult| c | analiza discriminant | poate fi folosit| atât în scopul descrierii
Õi studierii unor popula Ûii eterogene, prin intermediul unor variabile relevante, cât Õi în scopul realiz|rii de predic Ûii cu privire
la apartenen Ûa unor obiecte la clasele acestor popula Ûii.
Prin con Ûinutul s |u Õi prin natura procedurilor Õi tehnicilor pe care le utilizeaz |, analiza discriminant | este echivalent | cu
rezolvarea unei probleme de predic Ûie, rezultatul predic Ûiei constând din identificarea apartenen Ûei unui obiect la o anumit| clas |
dintr-o mulÛime cunoscut| de clase posibile.
Facilit|Ûile deosebite pe care le ofer | analiza discriminant|, ca instrument de investigare Õtiin Ûific |, au o importan Û| special|
pentru problematica domeniului economico-financiar, domeniu în care utilizarea acestui instrument prevaleaz | în raport cu alte
instrumente similare.

95
De la domeniul financiar-bancar, în care analiza discriminant| este utilizat|, cu prec |dere, pentru clasificarea firmelor
solicitatoare de credite, Õi pân | la domeniul marketingului, în care analiza discriminant | este utilizat|, printre altele, în probleme
de segmentare a pie Ûii, analiza discriminant | ofer | multiple Õi interesante posibilit |Ûi de analiz | Õi cunoa Õtere.
În domeniul economic, cele mai multe, mai utile Õi mai interesante aplica Ûii ale analizei discriminate sunt cele legate de
evaluarea Õanselor de viabilitate pe care le au diferite activit|Ûi sau firme în care se pot face investiÛii sau c |rora b |ncile le pot
acorda credite. În acest sens, analiza discriminant | poate fi folosit| pentru fundamentarea unor decizii cum ar fi: vânzarea sau
cump |rarea de ac Ûiuni, acordare de credite, cump |rarea sau vânzarea de firme etc.

8.7.1. Definirea problemei analizei discriminante


Privit| într-un mod foarte general, rezolvarea unei probleme de clasificare cu ajutorul analizei discriminate presupune
deducerea unor reguli sau criterii astfel încât, dup | cunoa Õterea vectorului x de propriet|Ûi ale unui obiect care apar Ûine unei
popula Ûii , s | se poat | lua o decizie cu privire la clasificarea respectivului obiect într-una din cele K clase posibile sub care
poate fi structurat| popula Ûia .
Ipoteza fundamental| a analizei discriminate este aceea c | mulÛimea este format| din elemente eterogene Õi c |, în mod
implicit, în cadrul mulÛimii exist| un num |r de K clase, notate cu Õi numite clase reale sau clase iniÛiale, a c |ror
alc |tuire nu este cunoscut| complet Õi care au urm |toarele propriet|Ûi:

Reamintim faptul c |, în general, clasele ini Ûiale ale mulÛimii sunt considerate a fi nedisjuncte, adic | exist| posibilitatea
ca:
.
Distribu Ûia statistic | a obiectelor în cadrul fiec |rei clase reale este descris | cu ajutorul densit|Ûilor multidimensionale
de probabilitate condiÛionat| ale claselor, adic | cu ajutorul func Ûiilor , a c |ror form | se presupune a fi cunoscut|.
În cadrul analizei discriminate, cea mai mare importan Û|, atât din punct de vedere teoretic, cât Õi din punct de vedere
practic, o au nu clasele reale, ci clasele de predic Ûie, pe care le vom defini în continuare.
Vom considera mul Ûimea Õi clasele reale din care aceasta este format| iniÛial. Scopul principal al analizei
discriminate este acela de a identifica o modalitate eficient | de structurare a mulÛimii sub forma unui num |r de K regiuni sau
clase. Regiunile sub forma c |rora trebuie partajat| mulÛimea în cazul problemei analizei discriminante, pe care le vom nota
cu se numesc clase de predic Ûie sau clase de clasificare Õi au urm |toarele propriet|Ûi:

Cea de-a doua proprietate se refer | la faptul c | orice obiect din mul Ûimea trebuie s | fie clasificat. Proprietatea a treia
impune necesitatea ca oricare dintre obiectele mulÛimii s | fie clasificat numai într-o singur | clas |.
O clasificare poate fi considerat| ca fiind perfect |, adic | neafectat| de erori, dac | Õi numai dac | exist| o coinciden Û|
perfect| între orice clas | de predic Ûie Õi clasa real| omoloag | . Acest lucru nu este totdeauna posibil din cauza
consecin Ûelor pe care le implic | proprietatea de disjunc Ûie a claselor de predic Ûie. Dup | cum se poate observa, spre deosebire
de clasele reale , care pot avea anumite suprapuneri, clasele de predic Ûie trebuie s | fie disjuncte dou |
câte dou |, adic | s | nu aibe obiecte comune.
Deoarece clasele de predic Ûie sunt disjuncte dou | câte dou |, ele apar ca fiind niÕte trunchieri ale claselor reale
, ceea ce înseamn | c | ele pot fi privite ca fiind definite sub forma unor restric Ûii impuse asupra claselor reale. Ca
rezultat al trunchierii claselor reale omoloage, clasele de predic Ûie vor diferi, mai mult sau mai pu Ûin, de clasele reale, astfel încât
între o clas | de predic Ûie Õi o clas | real| omoloag | vom avea rela Ûia:
.
Diferen Ûele care exist| între clasele de predic Ûie Õi clasele reale, rezultate din faptul o clas | de predic Ûie este ob Ûinut| prin
trunchierea unei clase reale, reprezint| expresia posibilit|Ûi ca anumite obiecte s | fie clasificate incorect.
O consecin Û| imediat| a modului în care sunt definite clasele de predic Ûie este aceea c | fiecare clas | de predic Ûie reprezint|,
de fapt, o submulÛime a clasei reale omoloage, adic |:
.
Pe de alt| parte, deoarece clasele de predic Ûie trebuie s | includ | toate obiectele mulÛimii , se verific | rela Ûia:
.
În aceste condiÛii, este evident c |, atâta timp cât fiecare clas | real| reprezint| un câmp complet de evenimente, orice clas |
de predic Ûie, care este o submulÛime a clasei reale omoloage, apare ca fiind un câmp incomplet de evenimente.

96
8.7.2 Separarea claselor în spaÛiul formelor
Prima Õi cea mai dificil| problem | care trebuie rezolvat| în analiza discriminat| este aceea a separ |rii claselor de predic Ûie
în cadrul mulÛimii . Modalitatea cea mai direct| de separare a claselor mul Ûimii este reprezentat| de definirea în spa Ûiul
a unor suprafe Ûe de separare sau suprafe Ûe de decizie. Aceste suprafe Ûe de separare sunt cele care determin | trunchierea claselor
de predic Ûie Õi ele trec, cu necesitate, prin mulÛimea de obiecte care apar Ûin intersec Ûiei claselor pe care le separ |.
Din considerente legate de simplificarea proceselor de clasificare, sunt utilizate, de regul|, suprafe Ûele de separare de tip
liniar, cum ar fi dreptele, planele sau hiperplanele. Suprafe Ûele de separare sunt definite prin intermediul unor func Ûii cunoscute
sub numele de func Ûii discriminant.
Informa Ûiile necesare construirii suprafe Ûelor de separare a claselor de predic Ûie sunt reprezentate de un e Õantion de volum
T de obiecte extrase din popula Ûia , obiecte a c |ror apartenen Û| la clasele este cunoscut| aprioric Õi cu exactitate.
G |sirea unei modalit|Ûi eficiente de separare pe clase disjuncte a elementelor mul Ûimii constituie o problem | dificil|,
mai ales din cauza existen Ûei în mulÛimea a unor obiecte care apar Ûin simultan la dou | clase reale diferite. Afectarea obiectelor
de acest tip la o clas | sau alta se poate face numai sub rezerva calculului probabilistic.
Dup | identificarea unei modalit |Ûi corespunz |toare de separare a elementelor mul Ûimii pe clasele de predic Ûie
, sarcina principal | a analizei discriminante este aceea de a decide cu privire la apartenen Ûa la cele K clase a unor
noi obiecte din mulÛimea sau de a face predic Ûii privind apartenen Ûa acestor obiecte. Aceasta înseamn | c | problema de
clasificare cu ajutorul analizei discriminante poate fi formultat| astfel: dându-se un obiect pentru care se cunoa Õte vectorul x
de valori ale caracteristicilor acestuia, se cere s | se determine apartenen Ûa acestui obiect la una dintre cele K clase posibile,
, ale mulÛimii .
Principala problem | care trebuie rezolvat| în cadrul analizei discriminate este aceea a construirii criteriilor sau regulilor
de clasificare, pe baza c |rora se pot face predic Ûii privind apartenen Ûa unor forme noi, cu apartenen Û| iniÛial| necunoscut|.Crite-
riile de clasificare mai sunt cunoscute Õi sub numele de clasificatori, iar deducerea acestor criterii se nume Õte formare a clasi-
ficatorului.
Clasificatorul este, de fapt, un algoritm cu ajutorul c |ruia se stabile Õte apartenen Ûa cea mai probabil| a unei forme la o
anumit| clas | de predic Ûie. Formarea clasificatorului se face pe baza informa Ûiilor con Ûinute într-un e Õantion de forme a c |ror
apartenen Û| este cunoscut| aprioric Õi care se mai nume Õte set de formare.
E Õantionul care reprezint| setul de formare este extras din popula Ûia analizat| Õi con Ûine datele primare utilizate în orice
analiz | discriminat |. În anumite situa Ûii, pentru formarea clasificatorului poate fi folosit|, în mod efectiv, numai o parte a
e Õantionului disponibil, cealalt| parte urmând s | fie utilizat | pentru testarea Õi validarea abilit|Ûii pe care o are clasificatorul
ob Ûinut pe baza setului de formare de a clasifica în mod corect forme a c |ror apartenen Û| este cunoscut|. În acest fel, setul de
formare poate s | reprezinte doar o parte a e Õantionului disponibil. Partea e Õantionului utilizat| pentru testarea Õi validarea puterii
de discriminare a clasificatorului se nume Õte set de predic Ûie. De multe ori, întregul e Õantion disponibil poate fi folosit atât ca
set de formare, cât Õi ca set de predic Ûie, ceea ce înseamn | c | cele dou | seturi pot s| coincid |.
Exist| mai multe modalit|Ûi de abordare care pot fi utilizate pentru formarea clasificatorului. Printre acestea men Ûion |m:
criteriul minimiz |rii costului clasific |rii, criteriul lui Bayes sau criteriul probabilit|Ûilor aposteriorice, criteriul func Ûiilor
discriminant liniare ale lui Fisher, criteriul metric sau criteriul distan Ûei M ahalanobis, criteriul raportului de verosimilitate etc.
Utilizarea fiec |ruia dintre criteriile men Ûionate conduce la ob Ûinerea unui clasificator, a c |rui esen Û| este în principiu aceea Õi
pentru majoritatea criteriilor men Ûionate.

8.7.3 Clasificatorii de tip liniar


Prima modalitate de abordare a problemelor de clasificare cu ajutorul tehnicilor de analiz | discriminant | dateaz | din anul
1933 Õi a fost propus | de Fisher. Ulterior abord |rile de acest tip s-au dezvoltat în mod constant, iar aplica Ûiile bazate pe analiza
discriminant | s-au extins la din ce în ce mai multe domenii de activitate Õi s-au diversificat din ce în ce mai mult.
Cele mai multe Õi cele mai utile aplica Ûii ale analizei discriminant bazat| pe criteriul lui Fisher sunt întâlnite în domeniul
financiar-bancar, domeniu în care tehnicile de tip se numesc tehnici de credit-scoring Õi constituie cele mai importante
instrumente pentru fundamentarea deciziilor privind acordarea de credite.
Metoda de analiz | discriminant | propus | de Fisher este o metod | parametric |, caracterizat| prin simplitate Õi robuste Ûe,
Õi care ofer | posibilit|Ûi de interpretare foarte utile pentru analiz |. Simplitatea acestei metode decurge din faptul c | utilizarea
sa nu necesit| decât evaluarea unor estima Ûii pentru parametrii popula Ûiei Õi claselor acesteia, parametri reprezenta Ûi de medii,
varian Ûe sau covarian Ûe. Aceasta reprezint| un avantaj foarte important al analizei discriminante de tip Fisher, în compara Ûie,
de exemplu, cu tehnicile de analiz | discriminant | bazate pe criteriul Bayes-ian, tehnici a c |ror utilizare presupune cunoa Õterea
probabilit|Ûilor apriorice.
Fundamentul teoretic al analizei discriminante de tip Fisher este reprezentat de analiza varian Ûei. Criteriul lui Fisher
define Õte o modalitate de deducere a func Ûiilor discriminant pe baza analizei comparative dintre variabilitatea intragrupal| Õi
variabilitatea intergrupal|, la nivelul claselor sau grupelor popula Ûiei analizate. Func Ûiile discriminant deduse pe baza criteriului
lui Fisher se mai numesc Õi func Ûii scor Õi sunt func Ûii liniare.
Dup | cum am mai men Ûionat, criteriul fundamental care st| la baza împ |r Ûirii mulÛimii de obiecte în submulÛimile
este un criteriu mixt, care urm |re Õte minimizarea variabilit|Ûii intragrupale Õi maximizarea variabilit|Ûii

97
intergrupale. Utilizarea acestui criteriu combinat asigur | cea mai bun | diferen Ûiere a claselor sau grupelor popula Ûiei .
Ideea care st| la baza criteriului lui Fisher este aceea a determin |rii unor direc Ûii sau axe, astfel încât, de-a lungul acestora,
clasele mulÛimii s | se diferen Ûieze cât mai mult între ele Õi, în acela Õi timp, fiecare clas | s | aib | un grad de omogenitate cât
mai mare. Cu alte cuvinte, criteriul lui Fisher are ca scop determinarea unor direc Ûii de-a lungul c |rora variabilitatea intergrupal|
s | fie cât mai mare, iar variabilitatea intragrupal| s | fie cât mai mic |. Proiec Ûiile obiectelor pe axele definite de aceste direc Ûii
reprezint| sunt noi coordonate ale obiectelor Õi se numesc scoruri discriminant.
Dintr-un anumit punct de vedere, analiza discriminant | poate fi considerat| ca fiind asem |n |toare cu analiza componentelor
principale, care are ca scop general identificarea unor axe în raport cu care variabilitatea obiectelor s| fie maxim |. Deosebirea
principal | dintre analiza discriminant | Õi analiza componentelor principale este legat | de faptul c | în cadrul analizei
componentelor principale spa Ûiul cauzal este considerat în integralitatea sa, f|r | a se face nici o diferen Ûiere între elementele
acestuia din punct de vedere al unui anumit criteriu.
În cazul analizei componentelor principale variabilitatea este privit| ca o caracteristic | general| a popula Ûiei analizate, f|r |
a se Ûine seama de existen Ûa unei eventuale structur |ri a acestei popula Ûii pe grupe sau clase. În consecin Û|, variabilitatea care
face obiectul analizei componentelor principale este considerat | ca un tot unitar, f|r | a exista posibilitatea descompunerii
acesteia în raport cu o anumit| structur | a spa Ûiului cauzal analizat.
Spre deosebire de aceasta, în cazul analizei discriminante se consider | c | popula Ûia analizat| este structurat| pe grupe sau
clase, iar variabilitatea acestei popula Ûii poate fi descompus | sub forma a dou | componente importante: variabilitatea
intergrupal| Õi variabilitatea intragrupal|.
În plus, fa Û| de diferen Ûa men Ûionat|, în analiza discriminant| noile direc Ûii care trebuie identificate nu trebuie s | fie în mod
obligatoriu ortogonale, spre deosebire de analiza componentelor principale în care direc Ûiile de variabilitate maxim | trebuie s |
verifice proprietatea de ortogonalitate.
Cea mai important | problem | a criteriului lui Fisher de discriminare între clasele unei popula Ûii este legat| de
descompunerea variabilit|Ûii acestei popula Ûii. Vom detalia modul în care poate fi descompus | variabilitatea popula Ûiei în raport
cu cele dou | sensuri ale acesteia: variabilitatea simpl| - exprimat | prin intermediul sumei totale a p |tratelor abaterilor Õi
variabilitatea mixt| sau compus | - m |surat| prin intermediul matricii produselor mixte ale abaterilor. Este evident c |
variabilitatea mixt| poate fi definit| numai pentru cazul obiectelor multidimensionale.
A Õa cum am precizat mai înainte, determinarea func Ûiilor discriminant este echivalent | cu g |sirea unor direc Ûii, sau vectori,
în raport cu care variabilitatea intragrupal| s | fie minim |, iar variabilitatea intergrupal| s | fie maxim |. Aceste direc Ûii vor defini
axele spa Ûiului discriminat Õi pot fi identificate sub forma unor combina Ûii liniare de variabilele descriptor selectate în analiz |.
Pentru determinarea acestor direc Ûii, vom considera c | variabilele descriptor implicate în analiz | sunt
variabilele , ale c |ror medii sunt . Vom nota cu variabilele centrate corespunz |toare
variabilelor descriptor, adic |:
,
ceea ce înseamn | c |:
.

Vom nota matricea de covarian Û| a vectorului aleator centrat cu , iar matricea produselor mixte ale
abaterilor, corespunz |toare realiz |rilor vectorului aleator , cu .
Problema care se pune în cadrul analizei discriminate este aceea de a determina o nou | variabil| , ca o combina Ûie liniar |
de forma:
,
unde ponderile se determin | în a Õa fel încât pentru noua variabil| suma p |tratelor abaterilor intraclas | s | fie
minim |, iar suma p |tratelor abaterilor interclas | s | fie maxim |. Acest| variabil| se nume Õte variabil| discriminant (centrat|).
Dac | vom nota cu vectorul ponderilor , atunci variabila poate fi scris | sub forma:
.
Privit| ca o func Ûie de vectorul , aceast| combina Ûie liniar | define Õte, de fapt, o func Ûie discriminant sau o func Ûie scor,
de forma:
.
Prin urmare, procedura de construire a unei func Ûii discriminant se reduce la determinarea vectorului , adic | a ponderilor
.
Trebuie s | facem precizarea c | natura liniar | a func Ûiei discriminant este impus | ca ipotez | ini Ûial | Õi ea nu trebuie
considerat| ca rezultând din impunerea unui anumit criteriu de performan Û| privind separabilitatea claselor.
Deoarece variabila este definit| ca o combina Ûie liniar| de variabile care au media nul|, rezult| c | Õi media acesteia este
nul|, adic |:
.

98
În aceste condiÛii, suma total| a p |tratelor abaterilor pentru noua variabil| discriminant este definit| de rela Ûia:

unde reprezint| varian Ûa variabilei la nivel de popula Ûie.

Considerând popula Ûia structurat| pe clase, suma total| a p |tratelor abaterilor variabilei poate fi descompus | sub
forma sumei dintre suma p |tratelor abaterilor intragrupale Õi suma p |tratelor abaterilor intergrupale, respectiv:
.

În mod similar, varian Ûa variabilei discriminant poate fi descompus | ca sum | dintre varian Ûa intragrupal| Õi varian Ûa
intergrupal|, adic |:
.

Pe de alt| parte, având în vedere rela Ûia care define Õte variabila discriminant , rezult| c | varian Ûa acesteia poate fi scris |
sub forma:
.
Úinând seama de rela Ûia de descompunere a matricii de covarian Û| , respectiv de rela Ûia:
,
varian Ûa variabilei scor devine:
.
Luând în considerare descompunerea de mai sus a varian Ûei variabilei scor , rezult| c | m |rimile scalare
reprezint| varian Ûa intragrupal|, respectiv varian Ûa intergrupal|, corespunz |toare variabilei .
În aceste condiÛii, coeficien Ûii combina Ûiei liniare care define Õte variabila discriminant se determin | astfel încât
variabila s | aib | o varian Ûa intragrupal| minim | Õi o varian Û| intergrupal| maxim |, adic | astfel încât raportul:

s | fie maxim.
Rezult| c | determinarea coeficien Ûilor func Ûiei discriminant poate fi formulat| sub forma urm |toarei probleme de
extrem:

CondiÛiile necesare de extrem pentru aceast | problem | sunt date de anularea derivatelor par Ûiale ale func Ûiei în raport
cu componentele vectorului , ceea ce în exprimare vectorial| înseamn |:

Înmul Ûind condiÛia ob Ûinut| cu Õi Ûinând seama de definirea lui , rezult| urm |toarea form | a condiÛiei de extrem:

În concluzie, se poate spune c | vectorul asigur | maximizarea raportului dac | el este solu Ûie a ecua Ûiei:
,
sau a ecua Ûiei:
.

Aceast | ultim | form | a condiÛiei necesare de extrem arat| c | este un vector propriu al matricii , asociat valorii
proprii a aceleia Õi matrici. Pentru ca vectorul , ca solu Ûie a unui sistem omogen, s | fie diferit de vectorul nul, este necesar
ca valoarea proprie s | verifice condiÛia:
.

Deoarece, ca matrici de covarian Û|, matricile sunt simetrice, rezult| c | Õi matricea este simetric |, ceea
ce înseamn | c | valorile proprii ale acesteia sunt reale.
În aceste condiÛii, a maximiza raportul de mai sus echivaleaz | cu a alege cea mai mare valoare proprie a matricii
Õi vectorul propriu corespunz |tor.

99
Dac | este cea mai mare valoare proprie a matricii Õi este vectorul propriu asociat acesteia, adic |:

atunci raportul este maxim, iar valoarea de maxim | a acestuia este , adic |:

Componentele vectorului reprezint| coeficien Ûii func Ûiei discriminant liniare , ceea ce înseamn | c | func Ûia
discriminant are forma:
.

Înlocuind variabilele centrate cu , vom ob Ûine exprimarea func Ûiei discriminat în func Ûie de variabilele
discriminant originale, respectiv:
.
Izolând termenii care con Ûin mediile variabilelor descriptor, func Ûia discriminant poate fi scris | sub forma:
.
În concluzie, putem spune c | func Ûiile discriminant ale lui Fisher sunt func Ûii liniare de forma urm |toare:
,
unde reprezint| termenul liber, iar coeficien Ûii sunt componente ale unui vector

propriu al matricii .
În consecin Û|, variabila discriminant corespunz |toare func Ûiei discriminant este definit| astfel:
,
iar valoarea acesteia pentru o anumit| form | , adic | scorurul discriminant, reprezint| evaluarea func Ûiei discriminat în
punctul respectiv. Media Õi varian Ûa variabilei discriminant (necentrat|) sunt definite de urm |toarele rela Ûii:

Din modul în care este definit| func Ûia discriminant de tip Fisher, rezult| c | num |rul posibil de func Ûii discriminant este
egal, în principiu, cu num |rul de vectori proprii ai matricii . Teoretic, se poate defini câte o variabil| Õi o func Ûie

discriminant pentru fiecare vector propriu relevant al acestei matrici. Vectorii proprii ai matricii vor defini axele
spa Ûiului discriminant.
O problem | important| legat| de definirea variabilelor discriminant Õi a func Ûiilor discriminat este aceea c | matricea
nu este o matrice simetric |, ceea ce înseamn | c | este posibil ca nu toate valorile ei proprii s | fie reale. Mai mult decât atât,
vectorii proprii ai acestei matrici nu mai au proprietatea de ortogonalitate, ceea ce înseamn | c | axele spa Ûiului discriminat nu
sunt ortogonale.

8.7.4 Definirea funcÛiilor discriminant ale lui Fisher


Am prezentat mai înainte modul în care poate fi dedus | o func Ûie discriminant de tip Fisher. Criteriul pe baza c |ruia a fost
dedus | o func Ûie discriminant de acest tip este un criteriu mixt, care vizeaz | în mod simultan dou | aspecte: minimizarea
variabilit|Ûii intragrupale Õi maximizarea variabilit|Ûii intergrupale.
O func Ûie discriminat de tip Fisher se determin | ca o combina Ûie liniar | de variabilele discriminant, combina Ûie ai c |rei
coeficien Ûi sunt componente ale unui vector propriu al matricii . Din aceast | modalitate de definire rezult|, în mod
implicit, c | pot fi identificate mai multe func Ûii discriminant.
Num |rul maxim posibil de func Ûii discriminant care pot fi identificate pe baza criteriului lui Fisher este egal cu num |rul
de valori proprii distincte Õi strict pozitive ale matricii . Deoarece aceast| matrice este de dimeniune , în situa Ûia în
care ea este strict pozitiv definit| Õi are rangul maxim, rezult| c | num |rul total de func Ûii discriminant care pot fi determinate
este egal cu n.
Vom prezenta în continuare modul în care pot fi determinate toate func Ûiile discriminant posibile. Pentru aceasta vom nota
cele n valori proprii ale matricii cu Õi vom presupune c | ele sunt ordonate din punct de vedere al valorilor
pe care le au astfel:
.

100
Vom nota cu cei n vectori proprii ai matricii , asocia Ûi, în ordine, cu valorile proprii .
Prima func Ûie discriminat se define Õte cu ajutorul vectorului propriu , care corespunde celei mai mari valori proprii,
Õi are forma urm |toare:
.
Deoarece aceast| func Ûie corespunde celei mai mari valori posibile a raportului dintre varian Ûa intergrupal| Õi varian Ûa
intragrupal|, ea asigur | cea mai bun | separabilitate a claselor, din punct de vedere al criteriului mixt men Ûionat mai sus. Aceasta
înseamn | c | proiec Ûiile obiectelor pe noua ax | determinat | de vectorul de coeficien Ûi pot fi separate pe clase care se
diferen Ûiaz | în cel mai mare grad posibil Õi care au cel mai mare grad posibil de omogenitate.
În mod similar, cea de-a doua func Ûie discriminat se define Õte cu ajutorul vectorului propriu care corespunde celei de-a doua
valori proprii, respectiv:
.

Fiind determinat| pe baza celei de-a doua valori proprii a matricii , aceast| func Ûie discriminat corespunde unei
valori mai reduse a raportului dintre varian Ûa intergrupal| Õi varian Ûa intragrupal|. În consecin Û|, ea asigur | o rezolu Ûie mai mic |
din punct de vedere al separabilit|Ûii claselor mul Ûimii . Din acest punct de vedere, este posibil ca proiec Ûiilor obiectelor pe
noua ax | care are ca suport vectorul de s | le corespund | clase care sunt Õi mai pu Ûin omogene Õi se diferen Ûiaz | Õi mai pu Ûin
între ele.
În sfâr Õit, cu ajutorul vectorului propriu asociat cu cea mai mic | valoare proprie, adic | vectorul , se determin | ultima
func Ûie discriminant, respectiv:
.
Prin compara Ûie cu celelalte func Ûii discriminant, aceast| ultim | func Ûie discriminat asigur | cea mai proast | separabilitate
între clasele mulÛimii .
Puterea de separabilitate din ce în ce mai mic | pe care o au func Ûiile discriminant , conduce la ideea necesit|Ûii
de a selecta în analiz | numai un anumit num |r de func Ûii discriminant, în ordinea puterii lor de discriminare.
Num |rul efectiv al func Ûiilor discriminant care trebuie re Ûinute în analiz |, depinde în mod direct de num |rul de clase Õi de
num |rul de variabile discriminant.
În concluzie la cele ar |tate mai înainte, putem defini func Ûiile discriminant liniare Õi variabilele discriminant sub forma
urm |toare:
Func Ûiile discrim inant (Fisher) sunt combina Ûii liniare de variabilele descriptor, de forma:
,

unde este vectorul variabilelor descriptor, iar este vector propriu al matricii . Valorile func Ûiilor discriminant se
numesc scoruri discriminant.
Variabilele discrim inant sunt combina Ûii liniare de variabilele descriptor, de forma:
,
unde Õi au semnifica Ûia din definiÛia precedent |. Media Õi varian Ûa variabilelor discriminant sunt:

Odat | ce func Ûiile discriminat au fost estimate, ele pot fi utilizate pentru efectuarea de predic Ûii cu privire la apartenen Ûa unor
noi obiecte la clasele de predic Ûie.

Exem plul 8.1


În scopul evidenÛierii modului clasificare cu ajutorul clasificatorilor liniari, vom considera cazul unei populaÛii de firme comerciale care
se grupeaz| în dou| clase: firme performante Õi firme neperformante. Vom presupune c| performanÛele firmelor sunt apreciate pe baza a
doi indicatori economico-financiari: rata profitului Õi rata profitului investit. De asemenea, vom mai presupune c| dispunem de un eÕantion
de 10 firme din populaÛia de firme analizate, dintre care 6 sunt firme performante, iar 4 sunt firme neperformante. Valorile convenÛionale
ale celor doi indicatori de performanÛ| pentru firmele din cele dou| categorii se g|sesc în tabelul urm|tor.

Firme performante Firme neperformante


Rata profitului Rata profitului
Firma Rata profitului Firma Rata profitului
investit investit
13,0 43,0 4,0 31,0

19,0 28,0 7,0 36,0

12,0 35,0 2,0 11,0

101
9,0 38,0 11,0 17,0

9,0 56,0

17,0 39,0
Media 13,17 39,83 Media 6,00 23,75
VarianÛa 16,9667 87,7667 VarianÛa 15,33 136,917

Vom mai presupune c| densit|Ûile de probabilitate ale claselor sunt de tip normal, adic| sunt de forma urm|toare:

În graficul din figura urm|toare sunt reprezentate densit|Ûile de probabilitate bidimensionale ale celor dou| clase de predicÛie, în ipoteza
de normalitate, Õi planul de decizie care asigur| separarea acestor clase.

Figura 8.12: Separarea claselor de predicÛie cu ajutorul planului de decizie


Planul de decizie care separ| cele dou| clase a fost determinat cu ajutorul funcÛiilor discriminant pe care le vom calcula în continuare.
Pentru a calcula valorile proprii ale matricii , va trebui s| calcul|m, mai întâi, inversa matricii de covarianÛ| intragrupal| . Vom
avea:

Õi deci:

Vectorii proprii Õi valorile proprii pentru matricea sunt:

iar termenii liberi ai funcÛiilor discriminant sunt:

Pe baza termenilor liberi Õi a celor doi vectori proprii vom putea defini cele dou| funcÛii discriminant liniare astfel:

.
Deoarece cea de-a doua funcÛie discriminant corespunde unei valori aproape neglijabile, relevanÛa sa este minim| Õi se poate renunÛa la
ea. EcuaÛiile discriminat care definesc planele de separare a celor dou| clase sunt:

.
Dup| cum se poate observa, centroidul populaÛiei de obiecte aparÛine primului plan de separare, deoarece el verific| prima ecuaÛie
discriminat:
.

102
În figura urm|toare sunt reprezentate grafic elementele esenÛiale legate de separarea claselor cu ajutorul primei funcÛii discriminant.

Figura 8.13: Graficul separ|rii claselor de predicÛie Õi

Prima ax| a spaÛiului discriminat, respectiv , are ca suport vectorul propriu Õi este ortogonal| cu dreapta de decizie . În
raport cu acest| ax| se determin| scorurile obiectelor, ca proiecÛii ale obiectelor pe aceast| ax|. Aceste scoruri sunt valori ale variabilei
disciminant . Scorurile celor 10 obiecte în spaÛiul discriminat, calculate cu ajutorul funcÛiilor discriminant , sunt pezentate
în tabelul urm|tor.

Firme performante Firme neperformante


Scoruri
Scor discriminant
Firma discriminant Firma

5,851 1,443 -6,741 4,777

6,298 -10,145 -2,198 4,073

2,148 -0,901 -15,530 -1,542

0,370 3,060 -5,011 -7,318

6,590 10,391

8,222 -3,838
Media 4,913 0,002 Media -7,370 -0,003
VarianÛa 8,970 47,579 VarianÛa 33,097 31,778

Mediile scorurilor pentru toate cele 10 obiecte sunt nule, iar varianÛele sunt egale cu cu 56,250, în cazul variabilei discriminant ,
respectiv cu 37,025, în cazul variabilei discriminant . EstimaÛiile pentru matricile de covarianÛ| ale variabilelor discriminant Õi ,
calculate pe baza scorurilor, la nivel de ansamblu Õi pe clase, sunt urm|toarele:

EstimaÛiile pentru matricile de covarianÛ| intraclas| Õi interclas| ale variabilelor discriminat sunt urm|toarele:

Figura urm|toare conÛine reprezentarea grafic| a obiectelor în spaÛiul discriminant, ale c|rui axe sunt Õi . În cadrul figurii sunt
reprezentate Õi curbele de nivel ale densit|Ûilor de probabilitate ale celor dou| clase.

103
Figura 8.14: Reprezentarea obiectelor în spaÛiul discriminant

Pentru variabila discriminat , care este cea mai semnificativ|, varianÛele intragrupal| Õi intergrupal| sunt:

Ca m|rime care aproximeaz| calitatea separ|rii claselor, raportul dintre varianÛa intergrupal| Õi varianÛa intragrupal| este:

Pentru a evidenÛia avantajele pe care le are utilizarea scorurilor discriminant în raport cu observaÛiile originale, vom compara raportul
în care se afl| varianÛa intergrupal| Õi varianÛa intragrupal| la nivelul observaÛiilor originale, pe de o parte, cu raportul în care se afl| varianÛa
intergrupal| Õi varianÛa intragrupal| la nivelul scorurilor discriminant, pe de alt| parte.
Deoarece în varianta spaÛiul iniÛial obiectele sunt reprezentate exprimate prin intermediul a dou| variabile descriptor, iar în spaÛiul
discriminat prin intermediul unei singure variabile, pentru a putea face comparaÛia va trebui s| exprim|m variabilitatea din spaÛiul iniÛial în
mod unic, prin intermediul varianÛei totale. În cazul spaÛiului cauzal iniÛial, varianÛa total| intergrupal| este reprezentat| de suma elementelor
de pe diagonala principal| a matricii de covarianÛ| intergrupal| , respectiv:
,
iar varianÛa total| intragrupal| este reprezentat| de suma elementelor de pe diagonala principal| a matricii de covarianÛ| intragrupal| ,
respectiv:
.
Este evident c| suma celor dou| varianÛe este egal| cu varianÛa total| din spaÛiul iniÛial, adic| suma elementelor de pe diagonala principal|
a matricii de covarianÛ| , respectiv:
.
Raportul dintre varianÛa total| intergrupal| Õi varianÛa total| intragrupal|, corespunz|toare spaÛiului iniÛial, este:

Deoarece , putem spune c| în spaÛiul discriminant se obÛine o mai mare omogenitate intraclas| Õi o mai mare
eterogenitate interclas|, ceea ce corespunde cu criteriul dee optimalitate a clasific|rii.
În concluzie, se poate spune c| în spaÛiul discriminant, atât omogenitatea intraclas|, cât Õi eterogenitatea interclas|, sunt sensibil mai mari,
în comparaÛie cu spaÛiul iniÛial.
Evaluarea scorurilor pentru noi obiecte, pe baza funcÛiilor discriminat, poate permite stabilirea clasei de apartenenÛ| a acestor obiecte.
Dac| scorurile obiectelor vor fi negative, obiectele vor aparÛine clasei situate la stânga în raport cu centroidul populaÛiei, iar dac| vor fi
pozitive, obiectele vor fi atribuite clasei situate la dreapta faÛ| de centroidul populaÛiei.

104
Tema 9: Modelarea cu ajutorul reþelelor neuronale

Reþelele neoronale constituie o modalitate, relativ nouã, de abordare cantitativã a problemelor de analizã ºi, mai ales,
de predicþie din domeniul economico-financiar, abordare care se caracterizeazã, în principal, prin simplitate, robusteþe ºi
eficienþã.
Odatã cu apariþia primelor calculatoare electronice, s-au conturat douã modalitaþi diferite de abordare în soluþionarea
problemelor de naturã ºtiinþificã. Prima dintre acestea, a avut la bazã ideea achiziþionãrii de cunoºtiinþe dintr-un anumit
domeniu, a constituirii acestora sub forma unor obiecte semantice sau simboluri ºi a utilizãrii acestora pentru rezolvarea unor
probleme complexe, pe baza definirii unui set de reguli formale. Aceastã modalitate de abordare este cunoscutã sub numele
generic de paradigmã simbolicã ºi este circumscrisã domeniului cunoscut sub numele de Inteligenþã Artificialã.
Cea de-a doua modalitate de abordare, se bazeazã pe dezvoltarea unor proceduri de soluþionare a problemelor ºtiinþifice,
într-o manierã similarã cu procesele care au loc la nivelul creierului uman. Aceastã abordare este cunoscutã sub numele
generic paradigma conexionistã, iar domeniul în care se înscrie poartã numele de Calcul Neuronal sau Reþele Neuronale.

9.1 Apariþia ºi dezvoltarea calculului neuronal


Începuturile abordãrii bazate pe modelul neuronal dateazã din anul 1943, odatã apariþia primului model al neuronului,
model propus de neurofiziologul W . S. McCulloch ºi de matematicianul W . Pitts.
Un interes deosebit pentru modelul neuronal s-a manifestat dupã apariþia primelor lucrãri privind modelarea matematicã
a proceselor de învãþare. O primã apariþie de acest fel a avut loc în anul 1947, fiind reprezentatã de modelul de învãþare al
lui D. O. Hebb, care a deschis direcþii de nebãnuit în domeniul calculului neuronal.
Un alt pas important pe drumul dezvoltãrii abordãrilor de tip neuronal a fost fãcut în 1957, o datã cu apariþia lucrãrii
lui Frank Rosenblatt, dedicatã unui modelul neuronal simplificat, de naturã probabilisticã, cunoscut sub numele de
perceptron. În aceeaºi direcþie de dezvoltare, se încadreazã ºi apariþia modelului neuronal ADALINE (ADAptive Linear
Neuron), model dezvoltat la începutul anilor 60' de cãtre B. W idrow.
Relele neuronale artificiale au fost create pentru a încerca reproducerea mecanismelor neurofiziologice care au loc la
nivelul creierului uman. Prin combinarea unui numãr foarte mare de unitãþi de calcul, numite neuroni, sub forma unor sisteme
cu grad foarte ridicate de interconectare, se încearcã reproducerea unor fenomene complexe, specifice creierului uman, cum
ar fi memorarea ºi inteligenþa.
Indiferent de faptul cã reþelele neuronale pot sau nu pot fi caracterizate în mod efectiv prin inteligenþã, ele sunt foarte
utile pentru activitãþile de analizã ºi predicþie, ca modele de naturã statisticã.
Reþelele neuronale pot fi privite ca reprezentând clase de modele de regresie, de analizã discriminantã sau de reducere
a dimensionalitãþii. Deoarece cu ajutorul reþelelor neuronale pot fi detectate relaþii ºi structuri complexe conþinute în date,
ele pot fi utilizate ºi ca instrumente de predicþie pentru numeroase categorii de fenomene reale.
Utilitatea reþelelor neuronale pentru problemele de predicþie rezultã, în primul rând, din faptul cã utilizarea acestora
nu presupune necesitatea formulãrii unui model matematic explicit, care sã descrie legãturile dintre o mulþime de input-uri
ºi o mulþime de output-uri. Pe de altã parte, abordarea bazatã pe reþele neuronale este indicatã în numeroase situaþii, ca
urmare a faptului cã, de cele mai multe ori, activitatea de predicþie este o activitate mai importantã din punct de vedere
ºtiinþific, decât explicarea legãturilor dintre fenomene. Deºi în principiu, activitatea de predicþie presupune cunoaºterea ºi
formalizarea legãturilor de cauzalitate, în contextul modelãrii neuronale efectuarea de predicþii poate fi realizatã fãrã o
cunoaºtere prealabilã a legãturilor de cauzalitate.
Cea mai importantã categorie de reþele neuronale este cea reprezentatã de reþelele de tip “reacþie directã”, sau
“feedforward”. În rândul acestora, categoria cea mai importantã este aceea a reþelelor de reþele de tip “propagare inversã”
sau “backpropagation”. Aceastã propagare inversã se referã la modul în care se calculeazã gradientul funcþiei eroare, pe
baza cãruia are loc ajustarea ponderilor sinaptice ale reþelei neuronale. “Back-propagarea” se referã ºi la diferitele metode
de învãþare, de instruire sau de antrenare a reþelelor neuronale.
Back-propagarea standard este de fapt o denumire alternativã pentru regula cunoscutã în teoria reþelelor neuronale sub
numele de “regula Delta Generalizatã”, care este o tehnicã de învãþare propusã de Rumelhart, Hinton ºi W illiams în anul
1986, ºi care este cea mai rãspânditã tehnicã de învãþare supervizatã a reþelelor neuronale.
Existã douã variante ale back-propagãrii standard: propagarea inversã de tip batch ºi propagarea inversã de tip punctual
sau incremental.
Propagarea inversã de tip batch este o tehnicã de optimizare în care actualizarea ponderilor este bazatã pe utilizarea
ciclicã a întregului set de învãþare. Spre deosebire de propagarea inversã de tip batch, propagarea inversã de tip punctual
sau incremental se bazeazã pe actualizarea ponderilor dupã utilizarea fiecãrei forme din setul de învãþare.

105
9.2 Analogia dintre modelele neuronale ºi creierul uman
Majoritatea preocupãrilor ºi abordãrile ºtiinþifice din domeniul inteligenþei artificiale au avut ca premizã încercarea de
a reproduce procesele informaþionale ºi decizionale care au loc în creierul uman.
Capacitatea creierului uman de a abstractiza, de a face generalizãri ºi de a deduce principii ºi legitãþi, de a cunoaºte,
ierarhiza ºi clasifica pe bazã asociere, de a face identificãri informaþionale exacte ºi corecte pe baza unor criterii
aproximative ºi vagi, în condiþiile existenþei unor informaþii parþiale ºi cu naturã incertã, de a învãþa atât în plan teoretic, cât
ºi prin experienþã practicã, de a stoca o cantitate uriaºã de informaþie extrem de variatã a inspirat ºi a influenþat totdeauna
atât modalitãþile generale de abordare, dezvoltate de umanitate în scopul cunoaºterii materiale ºi spirituale, cât ºi crearea,
dezvoltarea ºi perfecþionarea procedurilor, instrumentelor, metodelor ºi tehnicilor din domeniul cunoaºterii ºtiinþifice.
Una dintre caracteristicile cele mai interesante ale raþionamentului uman este aceea a stabilitãþii ºi robusteþii pe care
o au activitãþile cerebrale, chiar în condiþii de distorsionare puternicã a informaþiilor sau de accentuatã penurie
informaþionalã. Mecanismele neuronale au posibilitatea extraordinarã de a reconstitui in integralitatea sa un anumit context
informaþional, doar pe baza unor informaþii parþiale, distorsionate, colaterale sau indirecte.
Ca rezultat al încercãrilor de a dezvolta metode ºi tehnici de cunoaºtere care sã reproducã mecanismele informaþionale
si decizionale care au loc la nivelul creierului uman, s-a dezvoltat, începând cu anii 60, un nou domeniu important ºi vast
al cunoºterii umane, inteligenþa artificialã.
Un prim rezultat al preocupãrilor iniþiate în domeniul inteligenþei artificiale a fost concretizat sub forma sistemelor
expert.
Sistemele expert sunt modele logico-simbolistice care încearcã sã simuleze succesiunea de raþionamente pe care creierul
uman o desfãºoarã atunci când ia o anumitã decizie sau când soluþioneazã o anumitã problemã. Încorporând o mulþime de
elemente, cunoºtinþe, proceduri, reguli ºi principii analoage raþionamentului uman, sistemele expert au ca scop luarea unor
decizii sau deducerea de rãspunsuri.
Luarea deciziilor sau formularea rãspunsurilor de cãtre un sistem expert este bazatã pe o succesiune de analogii, asocieri
ºi deducþii ºi presupune derularea unor complexe proceduri inferenþiale ºi efectuarea unor laborioase calcule de tip simbolic.
Deºi dezvoltarea de sisteme expert a înregistrat o serie de succese în anumite domenii cum ar fi, de exemplu, medicina,
în timp s-a vãzut cã sistemele expert reprezintã o aproximare prea vagã ºi prea sãracã a complexelor ºi subtilelor procese
ºi mecanisme care caracterizeazã raþionamentul uman.
Cu toate avantajele care decurg din faptul cã un sistem expert se referã doar la un segment strict limitat de realitate,
sistemul expert rãmâne doar o replicã mai puþin decât mult decât parþialã a mecanismelor gândirii umane.
O altã direcþie de abordare în domeniul inteligenþei artificiale este aceea bazatã pe reþelele neuronale. Cel puþin pânã
în prezent, aceastã modalitate de abordare s-a dovedit a fi mai eficientã ºi mai apropiatã de modul în care lucreazã creierul
uman, în comparaþie cu direcþia reprezentatã de sistemele expert.
Analogia mai mare dintre reþelele neuronale ºi mecanismul gândirii umane, precum mãsura mai mare în care reþelele
neuronale reuºesc sã reproducã inteligenþa umanã rezultã din faptul cã reþeua neuronalã are o structurã mult mai apropiatã
de arhitectura biologicã a creierului uman.

9.2.1 Structura ºi funcþionalitatea neuronului biologic


Creierul uman este alcãtuit din peste 10 miliarde de celule sau unitãþi elementare, cunoscute sub numele de neuroni.
Aceste unitãþi elementare sunt puternic interconectate între ele, numãrul de conexiuni ale fiecãrui neuron cu alþi neuroni fiind
de ordionul zecilor de mii.
Un neuron poate fi privit ca fiind o unitate de prelucrare informaþionalã, care genereazã o serie de informaþii de ieºire,
pe baza unor informaþii specifice de intrare. Din punct de vedere fizic, atât informaþiile de intrare, primite de un neuron, cât
ºi informaþiile de ieºire, transmise de un neuron, sunt reprezentate de semnale electro-chimice.
Structura de intrare a unui neuron este formatã dintr-o mulþime de ramuri de conectare numite dendrite, iar structura
sa de ieºire este formatã dintr-o mulþime de ramuri de conectare numite axoni. Dendritele unui anumit neuron sunt conectate
cu axoni neuronilor de la care acesta primeºte semnale, dupã cum axonii neuronului sunt conectaþi cu dendritele neuronilor
cãtre care el transmite semnale.
Punctele în care axonii unor neuroni se conecteazã cu dendritele altor neoroni se numesc sinapse neuronale. Sinapsele
sunt localizate pe dendritele unui neuron ºi sunt de fapt terminale la care ajung impulsurile pe care neuronul le primeºte de
la alþi neuroni.
Fiecare impuls care ajunge la o sinapsã a unui neuron determinã degajarea unei mici cantitãþi de substanþã electro-
chimicã, numitã neurotransmiþãtor. Aceastã substanþã electro-chimicã este transmisã în continuare, prin canalele sinaptice,
cãtre un receptor post-sinaptic, care, în funcþie de cantitatea de substanþã primitã, determinã o schimbare a potenþialului
suprafeþei sau membranei dendritice, numit potenþial post-sinaptic.
Aceastã schimbare de potenþial post-sinaptic poate sã determine, la rândul sãu, o creºtere sau o scãdere a polarizãrii

106
membranei dendritice. Creºterea polarizãrii membranei dendritice va contribui, împreunã cu modificãrile de polarizare ale
celorlalte dendrite ale neuronului, la o inhibare a generãrii de semnale de cãtre neuron. Similar, scãderea polarizãrii
membranei dendritice va determina stimularea neuronului de a genera semnale. Mãrimea ºi tipul potenþialului post sinaptic
depinde atât de cantitatea ºi tipul substanþei neurotransmiþãtoare, cât ºi de natura ºi structura sinapsei.
Funcþionalitatea unui neuron poate fi privitã ca reprezentând o transformare a semnalelor de intrare în semnale de ieºire.
De fapt, activitatea internã a neuronului constã dintr-o sumare sau integrare specificã a semnalelor de intrare, reprezentate
de miile de potenþiale post-sinaptice, ºi crearea, pe aceastã bazã, a unui potenþial electro-chimic, numit stare internã a
neuronului.
În funcþie de mãrimea acestui potenþial, neuronul genereazã sau nu genereazã un anumit semnal electrochimic, pe care
îl transmite, în continuare, neuronilor ale cãror dendrite sunt conectate la axonii sãi. Generarea de cãtre neuron a semnalului
de ieºire, are loc dacã ºi numai dacã potenþialul sãu, rezultat din sumarea intrãrilor, depãºeºte o anumitã valoare specificã,
numitã prag de excitaþie.
Spre deosebire de logica von Neumann, pe care se bazeazã arhitectura ºi funcþionalitatea calculatoarele convenþionale
actuale, în contextul cãreia informaþia disponibilã este memoratã la nivelul unor structuri de stocare bine determinate, în
cadrul reþelelor neuronale informaþia disponibilã este reprezentatã sub o formã funcþionalã, prin intermediul aºa-numitelor
ponderilor sinaptice, asociate conexiunilor reþelei neuronale, fiind distribuitã peste întreaga mulþime de conexiuni ale reþelei.
O altã caracteristicã importantã a reþelelor neuronale o reprezintã activitatea de adaptabilitate continuã a acestora, în
raport cu exemple reale, adaptabilitate cunoscutã sub numele de învãþare sau instruire. Din acest punct de vedere, reþelele
neuronale reprezintã mecanisme de modelare bazate pe “învãþarea prin exemple”.
În abordarea tradiþionalã, rezolvarea unei anumite probleme presupune parcurgerea unor etape specifice, cum ar fi:
identificarea modelului, estimarea parametrilor acestuia, validarea modelului ºi utilizarea modelului pentru analizã ºi
predicþie. În cadrul unei astfel de abordãri, rezolvarea problemelor specifice fiecãrei etape ºi parcurgerea succesivã a acestor
etape au o naturã pur algoritmicã ºi se bazeazã pe o cunoaºtere cât mai bunã a structurilor cauzale ce caracterizeazã
fenomenele modelate. Din aceste motive, în cazul unor probleme complexe sau în cazul în care nu este posibilã cunoaºterea
sensului ºi structurilor relaþiilor dintre fenomenele modelate, abordarea tradiþionalã devine ineficientã sau imposibil de
utilizat.
Din punct de vedere calculatoriu, în contextul abordãrii tradiþionale este presupusã cunoaºterea aprioricã ºi exactã a
paºilor algoritmului utilizat, cunoaºtere concretizatã sub forma programului de calcul.
Abordarea bazatã pe reþele neuronale permite soluþionarea unor probleme extrem de complexe, fãrã a necesita
cunoaºterea cu precizie a structurii cauzalitãþii fenomenelor implicate în respectiva problemã. Pe baza unei mulþimi de
observaþii empirice referitoare la fenomenele studiate, reþelele neuronale reuºesc sã reproducã comportamentul real al feno-
menelor, fãrã a mai fi nevoie sã se formuleze un model specific pentru aceste fenomene, algoritmul de rezolvare a problemei
fiind construit în mod treptat, pe mãsura avansãrii procesului de învãþare.
În cadrul reþelelor neuronale, modelul problemei ºi algoritmul de soluþionare a modelului sunt aproximate ºi reproduse
într-o manierã simplificatã, pe baza definirii unui ansamblu de legãturi de tip artificial, între o mulþime de unitãþi abstracte,
care sunt neuronii reþelei. Din acest punct de vedere, structura ºi funcþionalitea unei reþele neuronale sunt relativ
independente în raport cu structura problemei ce trebuie sã fie rezolvatã ºi cu algoritmul specific acestei rezolvãri.
Dacã în cazul abordãrii tradiþionale modelele diferã de la o categorie de probleme la alta, în cazul reþelelor neuronale
putem vorbi de o anumitã universalitate a acestora. Din acest punct de vedere, ºi pãstrând rezervele necesare, putem spune
cã modelul neuronal are natura unui adevarat panaceu.
Spre deosebire de abordarea de tip algoritmic, în contextul cãreia pot sã aparã o serie de dificultãþi de naturã numericã,
reþeua neuronalã se caracterizeazã printr-o robusteþe mai ridicatã, senzitivitatea rezultatelor produse cu ajutorul unei reþele
neuronale, în raport cu acurateþea informaþiilor de intrare, fiind mult mai redusã
Exceptând complexitatea reþelelor neuronale, complexitate datã de numãrul de neuroni, de numãrul de straturi ºi de
numãrul de conexiuni, modelul neuronal are aproximativ aceeaºi structurã generalã, indiferent de natura problemei studiate.
Cu alte cuvinte, modelul neuronal este relativ independent în raport cu natura fenomenelor pe care le vizeazã.
Compatibilitatea dintre un model neuronal ºi realitate este realizatã prin definirea unui numãr mai mic sau mai mare de
neuroni ºi de straturi neuronale, fãrã a fi necesar sã se schimbe natura modelului în funcþie de schimbarea realitãþii modelate.
Având în vedere flexibilitatea abordãrii neuronale, se poate spune cã aplicaþiile posibile ale reþelelor neuronale sunt
practic nelimitate, întinzându-se de la domeniul recunoaºterii formlor ºi pânã la efectuarea de predicþii pentru cele mai
diferite fenomene ºi procese.
Construirea unei reþele neuronale presupune definirea unei configuraþii de neuroni, organizaþi sub forma unor straturi
sau plane de neuroni, ºi a unor moduri de conectare a acestora, în funcþie de structura intrãrilor ºi ieºirilor, de natura ºi de
complexitatea problemei care trebuie rezolvate. Ponderile sinaptice asociate conexiunilor reþelei neuronale sunt actualizate
în mod iterativ, pe baza unei analize secvenþiale a informaþiilor reprezentate de formele care alcãtuiesc setul de învãþare.
Regula de actualizare a ponderilor sinaptice sau regula de învãþare, este dedusã din compararea valorilor efective de ieºire
ale reþelei neuronale cu o serie de valori de prestabilite, numite valori de referinþã. Deducerea regulii de învãþare are loc în
aºa manierã, încât valorile efective de ieºire ale reþelei neuronale, sã conveargã cãtre valorile de referinþã.

107
Regula de învãþare se utilizeazã în mod secvenþial, repetat, pe mãsura analizãrii fiecãrui exemplu disponibil, iar procesul
de învãþare se terminã atunci când valorile efective de ieºire ale reþelei neuronale aproximeazã suficient de bine valorile de
referinþã. Dupã aceasta, reþeaua neuronalã poate sã fie utilizatã pentru efectuarea de calcule, analize sau predicþii specifice
clasei de probleme pentru care ea a fost construiã ºi instruitã.

9.3 Avantaje ale modelãrii cu ajutorul reþelelor neuronale


În ultimele decenii modelarea bazatã pe conceptul de reþea neuronalã a cunoscut o foarte mare dezvoltare. Numeroase
probleme din domeniul clasificãrii, controlului sau predicþiei au început sã fie soluþionate cu ajutorul tehnicilor bazate pe
calculul neuronal.
Aplicaþiile reþelelor neuronale sunt întâlnite în domenii de o maximã varietate, cum ar fi economia, finanþele,
informatica, medicina ingineria, biologia etc., iar rezultatele obþinute în cazul abordãrilor bazate pe calculul neuronal sunt
cu adevãrat spectaculoase.
Atât dezvoltarea în sine a tehnicilor de calcul neuronal, cât ºi extinderea utilizãrii lor în domenii din ce în ce mai variate
ºi mai numeroase se datoreazã, în cea mai mare parte, simplitãþii acestor instrumente ºi eficienþei care se obþine în urma
utilizãrii lor.
Reþelele neuronale sunt instrumente puternice ºi eficiente de modelare, cu ajutorul cãrora pot fi soluþionate probleme
de o mare complexitate, probleme care, de cele mai multe ori, nu pot fi rezolvate satisfãcãtor, facil ºi eficient, cu ajutorul
altor metode ºi tehnici.
Cu toatã puterea ºi eficienþa pe care le au, reþelele neuronale se caracterizeazã printr-o extraordinarã simplitate
algoritmicã ºi prin uºurinþa cu care pot fi folosite. Reþelele neuronale sunt, probabil, singurele instrumente de modelare care,
în acelaºi context logic, pot fi configurate de la cea mai simplã ºi pânã la cea mai complexã formã, în funcþie de natura ºi
de complexitatea problemei abordate.
Capacitatea pe care o au reþelele neuronale de fi configurate în funcþie de natura problemei abordate oferã posibilitãþi
de soluþionare pentru cele mai variate tipuri de probleme ºi face din acestea instrumente de modelare cu caracter aproape
universal.
Puterea pe care o au tehnicilor neuronale este ºi rezultatul faptului cã, prin structura ºi funcþionalitatea lor, reþelele
neuronale pot fi echivalate cu modele de tip neliniar.
Ca o consecinþã a acestui fapt, în modelarea neuronalã nu mai apare necesitatea formulãrii ipoteze simplificatoare ºi
a acceptãrii unor aproximãri mai mult sau mai puþin realiste, cum se întâmplã în cazul modelãrii de tip liniar.
În modelarea de tip neliniar din abordãrile tradiþionale modelele sunt reprezentate prin intermediul unui mare numãr
de ecuaþii de tip algebric sau diferenþial, a cãror construcþie presupune un laborios proces analizã ºi formalizare ºi care ridicã
numeroase dificultãþi privind soluþionarea analiticã sau numerice.
Spre deosebire de modelarea neliniarã tradiþionalã, modelarea neuronalã este caracterizatã prin supleþe ºi naturaleþe,
construirea modelului neuronal este foarte simplã ºi presupune un efort minimal, iar soluþionarea problemelor pe aceastã
cale se reduce la efectuarea unor calcule numerice de tip elementar.
Datoritã simplitãþii reþelelor neuronale ºi uºurinþei cu care acestea pot fi utilizate, dificultãþile mari ºi inerente pe care
le ridicã problema complexitãþii în cadrul modelãrii neliniare tradiþionale sunt puternic estompate sau chiar eliminate în cazul
modelãrii cu ajutorul reþelelor neuronale.
Un alt avantaj important care rezultã din simplitatea modelelor de tip neuronal constã în faptul cã modelarea cu ajutorul
reþelelor neuronale nu presupune un nivel foarte ridicat de pregãtire ºtiinþificã a utilizatorului în domeniul modelãrii
matematice. Din acest punct de vedere, se poate spune cã accesul la utilizarea tehnicilor neuronale este cu mult mai facil
în comparaþie cu oricare alte metode ºi tehnici de modelare statistico-matematicã.
Poate cã cea mai importantã caracteristicã a reþelelor neuronale, care, de asemenea, le deosebeºte în mod fundamental
de alte instrumente de modelare, este aceea a adaptabilitãþii dinamice, a capacitãþii acestora de a învãþa, de a se autoinstrui.
Reþelele neuronale au capacitatea de a învãþa din informaþia conþinutã în datele primare care definesc intrãrile acestor reþele.
Procesele de învãþare din cadrul reþelelor neuronale sunt definite prin intermediul unor algoritmi specifici, numiþi
algoritmi de învãþare, ºi care permit reþelelor neuronale sã înveþe sã recunoascã, din ce în ce mai bine, structurile
informaþionale conþinute într-o formã invizibilã în datele de intrare.

9.4 Definirea si structura unei reþelei neuronale generale


În general, reþeaua neuronalã reprezintã un model cu ajutorul cãruia poate fi rezolvatã o anumitã problemã particularã.
Definiþie: Reþeaua neuronalã reprezintã un ansamblu de unitãþi elementare de
procesare, numite neuroni sau noduri, a cãrui capabilitate de procesare este memoratã
la nivelul conexiunilor neuronale, sub forma unor ponderi sinaptice, ºi rezultã în urma
unui proces iterativ de adaptare pe baza informaþiilor dintr-un set de învãþare.

108
O reþea neuronalã este alcãtuitã din douã elemente fundamentale: o mulþime de unitãþi funcþionale, numite neuroni;
o mulþime de legãturi între neuroni, numite conexiuni. În cadrul paragrafelor urmãtoare, vom defni ºi vom analiza fiecare
dintre cele douã elemente fundamentale ale unei reþele neuronale.
Cea mai simplã reþea neuronalã este reþeua care include: un singur neuron de intrare, un singur neuron de ieºire ºi o
singurã mãrime de referinþã. Reprezentarea graficã a unei reþele neuronale de tip elementar este cea din figura urmãtoare.

Figura 9.1: Structura unei reþele neuronale elementare

În termenii modelãrii econometrice, neuronul de intrare poate fi asociat cu o variabilã independentã, valoarea de
referinþã poate fi asociatã cu variabila dependentã, iar neuronul de ieºire poate fi asociat cu valoarea predictatã.

9.4.1 Unitãþile reþelei neuronale


Elementul fundamental al oricãrei reþele neuronale, este neuronul artificial. Neuronii care intrã în componenþa unei
reþele neuronale, au funcþii diferite, ei fiind specializaþi în efectuarea anumitor tipuri de activitãþi. Din acest punct de vedere,
o reþea neuronalã conþine trei tipuri fundamentale de neuroni:
• neuroni de intrare, care achiziþioneazã valorile variabilelor de intrare sau valorile standardizate ale variabilelor
de intrare; aceasta înseamnã cã neuronii de intrare nu au o funcþionalitate calculatorie propriu-zisã, ci doar un rol
de interfaþare, de receptare a valorilor din mediul extern; de regulã, numãrul de neuroni de intrare ai unei reþele
neuronale, este egal cu numãrul de caracteristici ale formelor de intrare analizate; ansamblul neuronilor de intrare
formeazã aºa-numitul stratul de intrare sau nivelul de intrare;
• neuroni intermediari sau neuroni ascunºi, sunt neuroni sunt dispuºi între stratul de intrare ºi stratul de ieºire, care
au o funcþionalitate pur calculatorie; funcþionalitatea neuronilor ascunºi asigurã caracterul de neliniaritate al unei
reþele neuronale, ceea ce înseamnã cã determinã puterea modelatorie a unei reþele; neuronii ascunºi pot fi dispuºi
pe straturi sau nivele, numite straturi ascunse; în funcþie de complexitatea unei reþele neuronale, pot exista unul
sau mai multe straturi ascunse;
• neuroni de ieºire, care calculeazã valorile predictate cu ajutorul reþelei neuronale ºi care comparã aceste valori
cu anumite valori þintã sau valori de referinþã; în funcþie de rezultatul comparaþiei, ponderile conexiunilor sunt sau
nu actualizate.
Fiecare unitate elementarã a unei reþelei neuronale, respectiv fiecare neuron, are una sau mai multe, o stare internã ºi
o ieºire. Funcþionalitatea unui neuron constã în aceea cã el produce o singurã ieºire, reprezentatã printr-o singurã valoare
numericã, în funcþie de natura sau de starea respectivei unitãþi, stare determinatã pe baza informaþiilor de intrare ale
neuronului respectiv.
Comportamentul neuronilor unei reþele poate fi caracterizat cu ajutorul unui model de activare a output-ului, de forma
generalã:

109
Figura 9.2: Structura ºi orientarea unei reþele neuronale generale

Funcþia g(.) este numitã funcþie de compunere ºi defineºte modalitatea de sumare a input-urilor, sub forma unei mãrimi
a cãrei valoare poate determina activarea output-ului, adicã producerea de cãtre neuron a unui output. În compunerea input-
urilor intervin o serie de parametri, notaþi cu , care se numesc ponderi sinaptice. Deoarece funcþia de compune
a unui neuron are, în cele mai multe cazuri, o formã liniarã, partea de activitate a unui neuron, legatã de modalitatea de
receptare a intrãrilor, este cunoscutã sub numele de componentã liniarã.
Funcþia f(.) este numitã funcþie de activare ºi defineºte modul de formare a output-ului neuronului, în funcþie de nivelul
obþinut prin compunerea intrãrilor.

9.4.2 Conexiunile reþelei neuronale


Circulaþia informaþiei între neuronii unei reþele neuronale, are loc prin intermediul unor legãturi, cunoscute sub numele
de conexiuni.
În general, conexiunile unei reþele neuronale sunt de tip orientat sau direcþional, ceea ce înseamnã cã informaþia circulã
de la un neuron la altul, numai într-un anumit sens, care indicã direcþia fluxul calculelor într-o reþea. În cadrul reþelelor de
tip “înainte”, conexiunile nu pot forma cicluri sau bucle.
Din punct de vedere topologic, sensul în care informaþia dintr-o reþea neuronalã circulã ºi este prelucratã, este de tip
“înainte” sau “de la stânga la dreapta”. Aceste reþele se numesc reþele neuronale de tip “feedforward”.
Conectarea elementelor unei reþele neuronale se face într-o manierã bine determinatã, respectând anumite condiþii,
dintre care menþionãm:
• neuronii de intrare sunt pot fi conectaþi cu neuronii ascunºi sau cu neuronii de ieºire ai reþelei;
• neuronii ascunºi pot fi conectaþi cu alþi neuroni ascunºi sau, direct, cu neuronii de ieºire;
• neuronii de ieºire nu pot fi conectaþi cu alþi neuroni ai reþelei, cu excepþia neuronilor din straturile ascunse
anterioare;
• numãrul de conexiuni dintr-o reþea este teoretic nelimitat, eventualele limitãri ale numãrului maxim de conexiuni
fiind determinate doar de capacitatea de memorare ºi de viteza de prelucrare a sistemelor de calcul pe care reþelele
neuronale sunt implementate.
În cazul unitãþilor sau neuronilor de intrare, valoarea produsã este chiar valoarea achiziþionatã din mediul extern, fãrã
nici o altã transformare, iar în cazul neuronilor ascunºi ºi neuronilor de ieºire, valoarea produsã este rezultatul unui calcul,
unei transformãri a intrãrilor acestore unitãþi, în funcþie de potenþialul de activare al acestora. Valorile produse de cãtre
neuronii de ieºire se numesc valori predictate.
În cazul unitãþilor de intrare, valoare de ieºire este reprezentatã chiar de valoarea variabilei cu care unitatea este
asociatã, aceste unitãþi având doar rolul de a transfera respectiva valoare cãtre alte unitãþi ale reþelei, unitãþi care pot fi
reprezentate de neuroni ascunºi sau de neuroni de ieºire.
Valorile neuronilor de ieºire, adicã valorile predictate, sunt comparate cu anumite valori de referinþã, comparaþii care
sunt definite sub forma normelor. Valoarea diferenþei totale dintre valorile predictate ºi valorile de referinþã pentru ieºiri,
este descrisã prin intermediul unei funcþii reale, cunoscutã sub numele de funcþie eroare, funcþie care defineºte performanþa
unei reþele neuronale.
Cu cât valorile funcþiei eroare sunt mai mici, cu atât performanþa reþelei neuronale este mai mare. Funcþia eroare
reprezintã criteriul în funcþie de minimizarea cãruia sunt dezvoltate activitãþile de învãþare sau de antrenare a reþelei
neuronale, adicã sunt actualizate ponderile sinaptice ale reþelei neuronale.
Conexiunile unei reþele neuronale sunt asociate cu anumite valori reale, cunoscute sub numele de ponderi sau parametri.
Pentru ca reþeaua neuronalã sã poatã fi utilizatã pentru soluþionarea unor probleme concrete, este necesar sã se facã o
estimare corespunzãtoare a ponderilor sau parametrilor, astfel încât sã se realizeze o minimizare a funcþiei eroare asociatã
cu ieºirile reþelei neuronale. Aceastã estimare este cunoscutã sub numele de înstruire, învãþare sau antrenare a reþelei

110
neuronale.
Deºi existã mai multe modalitãþi de învãþare a reþelei neuronale, principial toate meodele au ca scop minimizarea a
funcþiei eroare, printr-o modificare sau ajustare iterativã a ponderilor sinaptice.
În afara intrãrilor pe care le primeºte de la alþi neuroni, anumite unitãþi ale reþelei sunt asociate ºi cu alte douã intrãri
speciale, numite deplasare (prag, zgomot, bruiaj, perturbaþie) ºi altitudine, care sunt estimate tot prin intermediul tehnicilor
de învãþare, în mod similar cu estimarea ponderilor sinaptice. Din punct de vedere al funcþiilor analitice, deplasarea are o
naturã similarã cu cea pe care o are termenul liber sau interceptul, în cazul modelelor econometrice.
Mecanismul de funcþionare a neuronilor din straturile ascunse ºi din stratul de ieºire, sunt descrise prin intermediul a
douã funcþii specifice, implicate în producerea ieºirilor acestor neuroni, cunoscute sub numele de funcþie de compunere,
respectiv funcþie de activare.

9.4.3 Funcþia de compunere


Prima funcþie a unui neuron calculatoriu este funcþia de agregare, numitã ºi funcþie de compunere sau funcþie de
combinare. Aceastã funcþie are ca scop combinarea tuturor valorilor de intrare ale unui neuron de acest tip într-o singurã
valoare ºi este definitã sub forma urmãtoare:

Argumentele funcþiei de combinare sunt reprezentate de ieºirile altor neuroni, de ponderile sinaptice asociate cu aceste
ieºiri, de deplasare (prag) ºi de altitudine.
Existã douã modalitãþi de combinare a intrãrilor unui neuron calculatoriu pentru a forma valoarea de activare a acestui
neuron: combinrea de tip liniar ºi combinarea de tip radial.
Cele douã modalitãþi de combinare a input-urilor sunt definite prin intermediul a douã clase de funcþii de compunere:
funcþii de compunere liniarã ºi funcþii de compunere radialã.

9.4.3.1 Funcþii de compunere liniarã


Funcþiile de compunere liniarã calculeazã valoarea de activare sub forma unei combinaþii liniare de intrãrile neuronului
(semnale de la alþi neuroni, ponderi sinaptice etc.).
Dintre cele mai utilizate funcþii de compunere în reþelele neuronale menþionãm urmãtoarele tipuri:
a. funcþii aditive:

b. funcþii liniare:

9.4.3.2 Funcþii de compunere radialã


Funcþiile de compunere radialã au natura unor distanþe Euclidiene pãtrate, calculate între vectorul ponderilor sinaptice
ºi vectorul de valori de intrare în neuron, multiplicate prin pãtratul deplasãrii sau pragului. În cadrul acestor funcþii,
deplasarea sau pragul acþioneazã ca un factor de scalare sau de lãþime inversã.
Dintre clasele de funcþii cele mai frecvent utilizate ca funcþii de compunere radialã, menþionãm:
a. funcþii X-radiale:

b. funcþii EH-radiale:

c. funcþii EV-radiale:

d. funcþii EW-radiale:

e. funcþii EQ-radiale:

111
Existã de asemenea o funcþie de combinare aditivã, care nu utilizeazã ponderi sau deplasãri sau praguri.

9.4.4 Funcþia de activare


Funcþia de activare este o funcþie definitã pe mulþimea valorilor funcþiei de compunere ºi are ca scop transformarea
valorii rezultate din compunere, adicã a nivelului de activare, într-o valoare numitã activare. Dupã cum se poate înþelege,
funcþia de activare este definitã pe o mulþime de scalari, care sunt nu depinde de ponderile sinaptice sau de alþi parametri.
Funcþia de activare descrie un mecanism de declanºare a neuronului, declanºare care are loc atunci când nivelul de
activare depãºeºte un anumit prag critic. Rezutatul acestei declanºãri este reprezentat de producerea de cãtre neuron a unui
semnal de ieºire netrivial.
Existã mai multe clase de funcþii de activare:

a. Funcþia identitate
Funcþia identitate este o funcþie liniarã, care nu schimbã valoarea intrãrii ºi ale cãrei valori sunt nemãrginite atât inferior,
cât ºi superior; forma generalã a funcþiei identitate este:

b. funcþii sigmoide
Funcþiile “sigmoide” sunt funcþii cu graficul de forma “S”, ca de exemplu funcþia logisticã ºi funcþia tangentã
hiperbolicã; funcþiile sigmoide au valorile în intervale de forma sau de forma ; printre cele mai utilizate funcþ
de activare de tip sigmoid, se numãrã funcþia logisticã, a cãrei formã este:

c. funcþii “softmax”
Funcþiile “softmax” sunt funcþii logistice multidimensionale, adicã generalizãri ale funcþiei logistice, care afecteazã
simultan mai multe unitãþi sau neuroni, forþând ca suma valorilor de ieºire ale acestora sã fie egalã cu unitatea; forma
generalã a unei funcþii “softmax” este:

d. funcþii “valoare”
Funcþiile “valoare” sunt funcþii care au graficul în formã de “clopot”, cum ar fi, de exemplu, funcþia lui Gauss; forma
generalã a funcþiei lui Gauss este urmãtoarea:

Figura 10.35: Graficul funcþiei “tanh”

e. funcþii exponenþiale:
Funcþiile exponenþiale sunt funcþii mãrginite inferior de zero, dar nemãrginite superior; funcþiile
exponenþiale au forma generalã:

f. funcþii reciproce:
Funcþiile reciproce sunt funcþii mãrginite inferior de zero ºi nemãrginite superior, de forma urmãtoare:

112
g. funcþia pãtraticã:

h. funcþia sinus:

i. funcþia cosinus:

j. funcþia Elliot:

k. funcþia tangentã hiperbolicã:

l. funcþia arctangentã:

9.4.5 Tipuri de straturi ale unei reþele neuronale


Pentru a simplifica procedurile de construcþie a reþelelor neuronale ºi pentru a stãpâni mai uºor funcþionalitatea acestora,
neuronii unei reþele sunt priviþi ca fiind organizaþi sub forma unor straturi, a cãror naturã este determinatã de natura
neuronilor pe care îi includ.
Din acest punct de vedere, existã trei tipuri de straturi neuronale: straturi de intrare, straturi ascunse ºi straturi de ieºire.
Din punct de vedere topologic, aceste staturi sunt dispuse de la stânga la dreapta, în ordinea: straturi de intrare, straturi
ascunse, straturi de ieºire.

Figura 9.3: Structura ºi orientarea unei reþele neuronale generale

Din punct de vedere al conectãrii neuronilor, trebuie precizat cã fiecare neuron dintr-un strat anterior este conectat
cu fiecare neuron din stratul care îl succede.
Caracteristica fundamentalã a straturilor unei reþele neuronale constã în faptul cã toate unitãþile sau neuronii unui anumit
strat au aceleaºi caracteristici. În cazul stratului de intrare, aceasta înseamnã cã toþi neuronii acestui strat au acelaºi nivel de
mãsurare ºi aceeaºi metodã de standardizare. În cazul straturilor ascunse, comunalitatea caracteristicilor se referã la fatul
cã toþi neuronii unui strat au aceeaºi funcþie de combinare ºi aceeaºi funcþie de activare. De asemenea, în cazul stratului de
ieºire, toþi neuronii care aparþin acestui strat au aceeaºi funcþie de combinare, aceeaºi funcþie de activare ºi aceeaºi funcþie
de eroare.

9.4.6 Funcþia eroare


Evaluarea în cadrul unei reþele neuronale a gradului de depãrtare dintre valorile predictate, pe de o parte, ºi valorile de
referinþã, pe de altã parte, se face cu ajutorul unei funcþii numite funcþie eroare.
Funcþia eroare totala defineºte o sumare peste toate formele din setul de învãþare ºi peste toate variabilele de referinþã

113
ale unei funcþii individuale eroare, care se aplicã la fiecare valoare de referinþã ºi la output-ul corespunzãtor.
Funcþia de penalizare este definitã ca fiind produsul dintre constanta de atenuare (decãdere, îmbãtrânire) a ponderii ºi
suma tuturor ponderilor reþelei, exceptând deplasarea.
Funcþia de eroare individualã este evaluatã pentru o singurã valoare a variabilei de referinþã ºi poate avea douã tipuri:
verosimilitate ºi abatere.
Forme ale funcþiei eroare:
a. Normalã:

b. Gama:

c. Poisson:

d. Bernoulli:

e. Bernoulli multiplã:

f. binomialã:

g. multinomialã:

h. entropie:

i. entropie multiplã:

j. Cauchy:

k. Logisticã:

114
l. M-estimator:

unde funcþia poate sã aibã una dintree urmãtoarele forme:


• în cazul M-estimatorului Hubert:

• în cazul M-estimatorului dublu-ponderat:

• în cazul M-estimatorului de tip “undã”:

9.5 Modelul general al unei retele neuronale


Reþeua neuronalã poate fi definitã ca fiind un ansamblu de unitãþi elementare de prelucrare, a cãror funcþionalitate este
similarã cu aceea a neuronilor care aparþin creierului uman, unitãþi care se numesc ºi neuroni artificiali. Ea constituie o
modalitate specificã de memorare a informaþiei, modalitate bazatã pe o memorare distribuitã a informaþiei, la nivel de
conexiuni neuronale.

Figura 9.4: Structura funcþionalã a unui neuron

În cadrul figurii precedente, simbolul “¼” defineºte un operator de multiplicare, simbolul “Ó” defineºte un operator
de sumare, iar simbolul “ ” defineºte un operator de tip integrator sau de tip limitator hardware.
Capacitatea de prelucrare a unei reþele neuronale este reprezentatã de informaþia conþinutã la nivelul multiplelor
conexiuni dintre unitãþile care alcãtuiesc respectiva reþea.
Caracteristica principalã a unei conexiuni o reprezintã intensitatea acesteia ºi se exprimã prin intermediul unor mãrimi
numerice numite ponderi. Aceste ponderi sunt rezultatul unui proces de adaptare, de instruire sau de învãþare, proces în
care este utilizatã informaþia dintr-un aºanumit set de instruire sau set de învãþare, care este un eºantion de forme cu aparte-
nenþã cunoscutã..
În principiu, un neuron are un numãr de n intrãri, notate cu , ºi o singurã ieºire, notatã cu . Intrãrile unu

115
neuron sunt informaþii primite din mediul extern sau de la alþi neuroni, numite ºi semnale de intrare, iar ieºirea unui neuron
este o informaþie pe care o genereazã neuronul în urma prelucrãrii informaþiilor de intrare, un semnal de ieºire.
Prin acumularea informaþiilor de intrare, la nivelul unui neuron se formeazã un potenþial numit stare internã a
neuronului, excitaþie sau activare totalã a neuronului.
Fiecare intrare a unui neuron corespunde unui anumit tip de informaþie ºi are o importanþã mai mare sau mai micã în
transmiterea de informaþie cãtre neuron, în funcþie de frecvenþa cu care informaþia de acest tip a contribuit anterior la
excitarea neuronului, adicã la formarea stãrii sale interne.
Intrãrile neuronului sunt de aºa naturã încât pot amplifica sau pot atenua informaþiile pe care ele le transmit cãtre
neuron. M odelarea acestui proces de amplificare sau de atenuare a informaþiilor care circulã de-a lungul sinapselor, se face
prin intermediul definirii aºanumitelor ponderi sinaptice, care sunt mãrimi numerice reale, fiecare intrare a neuronului fiind
ponderatã cu o astfel de mãrime.
Starea internã a unui neuron este definitã sub forma unei combinaþii liniare de intrãrile neuronului, coeficienþii
combinaþiei liniare fiind chiar ponderile sinaptice. Aceasta înseamnã cã starea internã a unui neuron este o sumã ponderatã
a informaþiilor de intrare ale neuronului, adicã o sumã ponderatã a semnalelor de intrare.
Dacã sunt cele n intrãri ale unui neuron, iar sunt ponderile sinaptice asociate ac
atunci starea unui neuron poate fi definitã prin intermediul unei mãrimi scalare s, definitã sub forma urmãtoare:

unde este un prag de activare sau un prag de excitaþie a neuronului.


Ieºirea unui neuron este o entitate informaþionalã generatã de neuron, în funcþie de mãrimea potenþialului format la
nivelul neuronului, pe baza informaþiilor primite de cãtre neuron prin intermediul conexiunilor sinaptice. În acest fel, ieºirea
unui neuron poate fi descrisã cu ajutorul unei funcþii speciale, a cãrei valoare depinde de starea internã a neuronului ºi care
se numeºte funcþie de transfer, funcþie de activare sau funcþie de rãspuns.
Funcþia de activare, este definitã pe mulþimea intrãrilor posibile ale unui neuron ºi are valori reale, adicã este definitã
sub forma:

unde X defineºte mulþimea intrãrilor neuronale ºi este o submulþime a spaþiului real n-dimensional, respectiv .
Dacã f(.) este funcþia de activare a neuronului, atunci ieºirea unui neuron poate fi definitã sub forma urmãtoare:

Având în vedere cele menþionate anterior, funcþionalitatea unui neuron poate fi ilustratã din punct de vedere sinoptic
sub forma urmãtoare:

Figura 9.5: Arhitectura reþelei de tip perceptron, cu un singur strat

Pentru a asigura o scriere mai condensatã a relaþiilor care definesc funcþionalitea unui neuron, vom asimila pragul de
excitaþie unei intrãri virtuale, ale cãrei valori sunt egale totdeauna cu 1 ºi care are ca pondere chiar valoarea a
pragului. Aceasta înseamnã cã starea internã a neuronului poate fi scrisã sub forma:

iar output-ul neuronului devine:

116
.

Considerând pragul de excitaþie ca fiind încorporat în mulþimea intrãrilor, schema funcþionalitãþii neuronlui capãtã
urmãtoarea formã:

Figura 9.6: Schema funcþionalã a unui neuron cu prag de excitaþie


încorporat în intrãri

Având în vedere natura ieºirii unui neuron, funcþia de rãspuns, adicã funcþia care defineºte output-ul neuronului poate
avea mai multe forme. De regulã, funcþia de rãspuns este neliniarã în raport cu variabila care descrie starea internã a
neuronului.

9.6 Modelul general al unei retele neuronale cu n neuroni


Vom considera o reþea neuronalã alcãtuitã din n neuroni. Funcþionalitatea unei astfel de reþele poate fi reprezentatã ca
în figura urmãtoare.

Figura 9.7: Schema funcþionalã a unei reþele cu n neuroni

Starea internã a unui neuron notat cu j va fi datã de sumarea intrãrilor ponderate ale acestui neuron, respectiv:

În cazul în care pragul este încorporat în mãrimile de intrare, starea internã sau potenþialul unui neuron este:

unde este o intrare fictivã.


Dacã vom nota cu x vectorul ieºirilor posibile ale celor n neuroni, inclusiv ieºirea fictivã , ºi cu vectorul extins

117
al celor n+1 ponderi ale intrãrilor neuronului j, adicã:

atunci starea internã a neuronului j va putea fi scrisã sub forma produsului scalar:

Starea internã a tuturor celor n neuroni ai reþelei poate fi scrisã sub urmãtoarea formã matricialã:

Dacã vom considera cã cei n vectori de ponderi, , j=1,2,...,n, sunt coloanele unei matrici W , de forma:

atunci starea internã a tuturor celor n neuroni ai reþelei poate fi scrisã sub forma condensatã:

unde s este vectorul stãrilor interne ale celor n neuroni ai reþelei.


În continuare, vom nota cu funcþia de transfer a celui de-al j-lea neuron, astfel încât ieºirea acestuia va fi:

Presupunând cã procesul de prelucrare a intrãrilor unui neuron ºi de generare a ieºirii acestui neuron implicã trecerea
unei anumite perioade de timp, vom obþine o decalare în timp, o defazare a ieºirii unui neuron în raport cu intrãrile acestuia.
Luând în considerare aceastã decalare, output-ul celui de-al j-lea neuron poate fi scris sub forma:

Aceastã relaþie este cunoscutã sub numele de ecuaþie de evoluþie a celui de-al j-lea neuron al reþelei.
Pentru a deduce ecuaþia de evoluþie a întregii reþele neuronale, vom nota cu f(s) vectorul de funcþii de transfer definit
astfel:

În aceste condiþii, ecuaþia de evoluþie a reþelei neuronale, adicã ecuaþia care descrie modificarea stãrilor unei reþele
neuronale poate fi scrisã sub forma:

În cadrul cursului urmator, vom analiza procesele specifice de învãþare, de antrenare sau de instruire ale unei retele
neuronale.

118
9.7 Instruirea sau antrenarea unei reþele neuronale
Vom presupune cã eºantionul care reprezintã setul de învãþare sau de instruire a unei reþele neuronale de tip perceptron
simplu, include un numãr de T forme, fiind reprezentat de mulþimea de vectori n-dimensionali:
.
Instruirea unei reþele neuronale presupune efectuarea unor succesiuni de operaþii, succesiune cunoscutã sub numele de
algoritm de învãþare, care are ca scop configurarea reþelei în vederea efectuãrii unor anumite operaþii specifice.
În mod concret, învãþarea unei reþele neuronale este echivalentã cu un proces iterativ de ajustare a ponderilor sinaptice
ale acesteia, astfel încât reþeaua neuronalã sã poatã realiza o anumitã funcþie, pornind de la o serie de valori cunoscute
aprioric, numite exemple, valori care sunt cunoscute sub numele de set de formare, set de instruire sau set de învãþare.
Un element al setului de instruire, notat în mod generic cu x, se numeºte formã sau configuraþie ºi se reprezintã prin
intermediul unui vector n-dimensional, ale cãrui elemente sunt caracteristicile sau atributele formei respective. În acest fel,
orice formã x apare ca fiind un punct dintr-un spaþiu vectorial real n-dimensional ºi numit spaþiul formelor.
Din punct de vedere strict formal, o reþea neuronalã poate fi privitã ca fiind o transformare a unui spaþiu de intrare ,
într-un spaþiu de ieºire .

9.8 Instruirea retelei neuronale de tip perceptron


Perceptronul este o reþea neuronalã formatã dintr-un singur strat ºi care are ca intrãri variabile ale caror valori sunt de
tip binar sau numere reale. Dacã vom considera cã intrãrile perceptronului sunt elemente ale vectorului n-dimensional x,
adicã:

iar cele n ponderi sinaptice sunt elemente ale vectorului n-dimensional w, respectiv:

atunci activarea neuronului poate sã fie scrisã sub forma:

unde este mãrimea scalarã care reprezintã pragul de activare.

Figura 9.8: Schema perceptronului cu un singur strat

Utilizarea reþelei neuronale de tip perceptron pentru rezolvarea problemei privind predicþia apartenenþei unor forme
la anumite clase, este echivalentã cu determinarea în spaþiul formelor , a unei suprafeþe liniare, definitã de mulþimea:
,
unde w este vectorul de ponderi, iar reprezintã pragul de activare a neuronului, suprafaþã care sã permitã o separare cât
mai bunã a formelor din spaþiul formelor , sub forma a douã regiuni distincte. Suprafaþa definitã de ecuaþia:

119
,
se numeºte hiperplan de dimensiune n-1.
Din punct de vedere geometric, hiperplanul reprezintã o suprafaþã liniarã în spaþiul n-dimensional al formelor,
suprafaþã care, în general, nu trece însã prin originea acestui spaþiu, deoarece vectorul nul 0 nu verificã ecuaþia hiperplanului.
Spre deosebire de un hiperplan dintr-un spaþiu vectorial n-dimensional, un subspaþiu de dimensiune n-1 al respectivului
spaþiu vectorial, este reprezentat de mulþimea:
.
Din punct de vedere geometric, subspaþiul reprezintã tot o suprafaþã liniarã în spaþiul n-dimensional al formelor.
Deoarece vectorul nul 0, verificã ecuaþia care defineºte subspaþiul , aceastã suprafaþã trece însã prin originea spaþiului.
Având în vedere definirea hiperplanului, putem spune cã subspaþiul este un hiperplan care trece prin originea spaþiului
vectorial.
Mai mult decât atât, orice hiperplan poate fi privit ca reprezentând o translaþie a unui subspaþiu, translaþie efectuatã dupã
un anumit vector. În acest fel, hiperplanul apare ca fiind definit de o mulþime de forma:

unde vectorul , diferit de vectorul nul 0, se numeºte vector de translaþie a subspaþiului .


Se poate arãta cã, fiind dat un hiperplan , existã un unic subspaþiu , prin a cãrui translaþie se obþine
hiperplanul . Cu toate acestea, pentru orice hiperplan , care este o translaþie a unui subspaþiu unic , vectorul de
translaþie nu este unic, existând o infinitate de vectori de translaþie.
Aºa cum o sã arãtãm ulterior, unul dintre vectorii de translaþie a subspaþiului , definit de ecuaþia:
,
în vederea obþinerii hiperplanului , definit de ecuaþia:
,
este de forma:

Utilizarea unui vector de aceastã formã pentru a exprima legãtura dintre subspaþiul ºi hiperplanul , este mult mai
convenabilã pentru descrierea reþelelor neuronale, deoarece acest vector depinde doar de un element al vectorului de ponderi
w ºi de pragul de excitare .
Din modul în care este definit hiperplanul , este evident cã extremitatea vectorului de translaþie , aparþine
hiperplanului . Într-adevãr, deoarece vectorul nul aparþine subspaþiului , adicã , vom avea:
.
În mod similar, dacã este un hiperplan care reprezintã o translaþie a subspaþiului , cu vectorul , atunci
subspaþiul poate fi definit sub forma:

În cadrul figurii urmãtoare, este reprezentat grafic subspaþiul , asociat cu vectorul w, precum ºi hiperplanul ,
rezultat din translaþia subspaþiului cu vectorul , pentru cazul particular bidimensional.

120
Figura 9.9: Obþinerea unui hiperplan printr-o translaþie a unui subspaþiu

Din modul în care este definit subspaþiul , rezultã cã vectorul w este ortogonal cu orice vector x din acest subspaþiu,
situaþie în care se spune cã vectorul w este ortogonal cu întregul subspaþiu ºi se scrie:
.
Având în vedere faptul cã doi vectori sunt ortogonali, dacã produsul lor scalar este egal cu zero, condiþia de
ortogonalitate a vectorului w cu subspaþiul , poate fi scrisã sub forma:

Din punct de vedere geometric, aceasta înseamnã cã vectorul w este perpendicular pe suprafaþa liniarã care trece prin
extremitãþile vectorilor care aparþin subspaþiului .
În mod similar, ortogonalitatea în raport cu un vector w, poate fi definitã ºi în cazul hiperplanului . În acest context
însã, spunem cã vectorul w este ortogonal cu hiperplanul ºi scriem:
,
dacã ºi numai dacã vectorul w este ortogonal cu subspaþiul , prin a cãrui translaþie este obþinut hiperplanul .
Din punct de vedere geometric, ortogonalitatea dintre vectorul w ºi hiperplanul , este reprezentatã de situaþia în care
vectorul w este perpendicular pe suprafaþa care trece prin extremitãþile vectorilor care aparþin hiperplanului , fãrã însã
ca aceasta sã însemne cã vectorul w este ortogonal cu oricare dintre vectorii care aparþin hiperplanului .
În aceastã situaþie, condiþia de ortogonalitate dintre vectorul w ºi hiperplanul , poate fi scrisã sub forma:

unde este vectorul de translaþie a subspaþiului , translaþie prin care se obþine hiperplanul .
Dupã cum se poate observa, din condiþia de ortogonalitate dintre vectorul w ºi hiperplanul , rezultã cã:
,
ceea ce înseamnã cã vectorul w nu este ortogonal cu nici un vector care aparþine hiperplanului .
În contextul prezentat anterior, ecuaþia:

poate fi consideratã ca fiind ecuaþia unui hiperplan , care este ortogonal cu vectorul w.
În general, pentru un spaþiu n-dimensional al formelor , subspaþiul , care este ortogonal cu vectorul n-dimensional
de ponderi w, are dimensiunea n-1, ºi este definit de mulþimea tuturor vectorilor , care verificã ecuaþia:
.
Aceasta înseamnã cã subspaþiul este format din toþi vectorii , ale cãror coordonate verificã ecuaþia:

121
,
respectiv relaþia:

Aceastã relaþie defineºte în spaþiul o suprafaþã liniarã (n-1)-dimensionalã, suprafaþã care trece prin originea
spaþiului .
O problemã foarte importantã, care apare frecvent în contextul instruirii reþelelor neuronale, este aceea a exprimãrii
distanþei dintre o formã ºi hiperplanul care separã clasele de forme, respectiv a distanþei dintre un punct x din spaþiul
formelor ºi un hiperplan . O astfel de distanþã, este utilizatã în construire criteriilor de performanþã utilizate în procesul
de instruire a reþelelor neuronale. De exemplu, unul dintre aceste criterii este cel bazat pe minimizarea sumei tuturor
distanþelor de la formele clasificate incorect, la hiperplanul care asigurã separarea claselor.
În condiþiile în care o astfel de distanþã poate fi exprimatã în funcþie de ponderile sinaptice ale reþelei neuronale, se poate
construi un algoritm de ajustare a acestor ponderi, în aºa fel încât suma distanþelor de la formele clasificate incorect, la
hiperplanul asociat cu vectorul ponderilor, sã fie minimã.
Pentru a ilustra modul în care poate fi construitã o astfel de distanþã, vom consdidera situaþia ilustratã în cadrul figurii
urmãtoare.

Figura 9.10: Ortogonalitatea dintre vectorul w ºi hiperplanul H

Dupã cum se poate observa din aceastã figurã, distanþa de la punctul z la hiperplanul , poate fi exprimatã ca diferenþã
între coordonatele ºi , care reprezentã punctele ce definesc proiecþiile ortogonale ale vectorilor z ºi , pe vectorul
w, respectiv:
,
unde ºi reprezintã vectorii de proiecþie ai vectorilor z ºi , pe vectorul w. Aceasta înseamnã cã distanþa de la
punctul z la hiperplanul , este egalã cu lungimea vectorului care are originea în extremitatea vectorului ºi extremitatea
în punctul reprezentat de vectorul . În acest fel, deoarece vectorii z ºi sunt coliniari, distanþa precedentã poate fi scrisã
ºi sub forma urmãtoare:
.
În orice problemã de clasificare, este recomandat sã se utilizeze suprafeþe liniare de tip hiperplan, ºi nu suprafeþe liniare
de tip subspaþiu, deoarece hiperplanele pot conduce la o separare mai bunã a claselor. În cadrul figurii urmãtoare, este
ilustratã grafic abilitatea pe care o poate avea utilizarea într-o problemã de clasificare a unei suprafeþe de tip hiperplan, în
comparaþie cu o suprafaþã de tip subspaþiu.

122
Figura 9.11: Separarea cu ajutorul unui subspaþiu L ºi a unui hiperplan H

Natura suprafeþei de separare utilizatã în procesul de clasificare cu ajutorul reþelelor neuronale, este determinatã în mod
direct de maniera in care este definit pragul de activare al neuronilor. Astfel, considerarea unui prag de separare egal cu zero,
conduce la o suprafaþã de separare de tip subspaþiu, în timp ce considerarea unui prag de separare diferit de zero, conduce
la obþinerea unei suprafeþe de separare de tip hiperplan.
Pentru fiecare vector de ponderi , existã un subspaþiu unic , în raport cu care vectorul de ponderi
w este ortogonal. De asemenea, pentru fiecare vector de ponderi w ºi prag de excitaþie , hiperplanul asociat împarte
întregul spaþiu al formelor în douã regiuni disjuncte, notate în cadrul figurii cu , respectiv cu . O a treia regiune a
spaþiului formelor, este reprezentatã de mulþimea formelor care aparþin hiperplanului . În condiþiile în care ecuaþia
hiperplanului este de forma:
,
formele care aparþin regiunilor menþionate verificã urmãtoarele condiþii:

Cu alte cuvinte, dacã vectorul de ponderi w a fost determinat astfel încât acestuia îi corespunde acel hiperplan , care
asigurã cea mai bunã separare a formelor din setul de învãþare, atunci regula privind predicþia apartenenþei unei noi forme
x, la una dintre clasele , poate fi formulatã sub forma urmãtoare:

Dacã setul de învãþare include forme ce aparþin în mod exclusiv claselor , iar vectorul de ponderi ºi pragul
de excitaþie , sunt astfel încât acestora le corespunde un hiperplan , care asigurã separarea perfectã a celor douã clase,
atunci clasele se numesc clase liniar separabile.

Definiþie: Douã clase de forme , se numesc liniar separabile, dacã


existã un vector de ponderi ºi un prag de excitaþie , astfel încât:

În condiþiile în care clasele sunt liniar separabile, vectorul de ponderi ºi pragul de activare determinã
hiperplan unic , a cãrui ecuaþie este:

123
,
se numeºte hiperplan de separare a claselor , iar funcþia , de forma:

se numeºte funcþie discrim inant a claselor .


Pe baza funcþiei discriminant , regula de stabilire a apatenenþei unei noi forme , la una dintre cele douã
clase , poate fi formulatã astfel:

• dacã
• dacã

În cazul în care noua formã , este astfel încât , adicã aceastã formã aparþine zonei reprezentate de
hiperplanul , numitã ºi zonã criticã, atunci apartenenþa formei nu poate fi stabilitã. În aceastã situaþie, se poate considera
cã forma respective poate sã aparþinã oricãreia dintre cele douã clase.

9.9 Utilizarea perceptronului pentru clasificarea formelor


Cea mai importantã problemã a utilizãrii unei reþele neuronale de tip perceptron, pentru efectuarea de predicþii privind
apartenenþa unor noi forme la una dintre clasele , constã în determinarea vectorului de ponderi ºi a pragului
de excitaþie , astfel încât reþeua neuronalã sã recunoascã într-o mãsurã cât mai mare, apartenenþa formelor din setul de
învãþare. Altfel spus, determinarea vectorului de ponderi ºi a pragului de excitaþie , trebuie sã se facã în aºa fel încât
hiperplanul , asociat acestora, sã asigure o separare cât mai bunã a formelor din setul de învãþare.
Vom presupune în continuare cã cele douã clase sunt liniar separabile, iar ºi reprezintã vectorul de
ponderi optimale, respectiv pragul de excitaþie optimal, care asigurã o separabilitatea perfectã a formelor din setul de
învãþare, pe cele douã clase.
În aceste condiþii, pentru orice alt vector de ponderi ºi orice alt prag de excitaþie , alese în mod arbitrar,
este evident cã regula de clasificare menþionatã anterior va conduce la situaþia cã doar unele dintre formele din setul de
învãþare vor fi clasificate în mod corect, în timp ce celelalte forme vor fi clasificate în mod incorect.

Figura 9.12: Separarea a douã clase cu ajutorul unui vector de ponderi ºi a


unui prag de excitaþie arbitrare

În cadrul figurii precedente, poziþia particularã a hiperplanului , determinat de vectorul de ponderi w ºi de pragul
de excitaþie , este astfel încât 11 dintre forme, 5 forme aparþinând clasei ºi 6 forme aparþinând clasei , respectiv
formele a cãror reprezentare este haºuratã mai intens, sunt clasificate în mod incorect, în clasa , respectiv în clasa .
Pornind de la numãrul de forme clasificate în mod corect, respectiv incorect, de cãtre o reþea neuronalã, pentru care
vectorul de ponderi este w, iar pragul de excitaþie al neuronului de ieºire este , se poate stabili o mãsurã a performanþei

124
respectivei reþele neuronale, exprimatã, de exemplu, sub forma unei rate a corectitudinii clasificãrii.
Este evident însã cã, atâta timp cât valorile curente ale vectorului de ponderi w ºi pragului de excitaþie , sunt diferite
de valorile optimale ºi , performanþa reþelei neuronale poate fi încã îmbunãtãþitã, prin modificãri succesive adecvate
ale vectorului ponderilor w ºi ale pragului de excitaþie .
Procedura iterativã de determinare a vectorului de ponderi optimale ºi a pragului de excitaþie optimal , pe baza
informaþiilor din setul de învãþare ºi a unor valori arbitrare ale celor douã entitãþi informaþionale, este cunoscutã sub numele
de algoritm de instruire sau algoritm de învãþare a reþelei neuronale de tip perceptron.
În principiu, algoritmul de instruire a unei reþele neuronale de tip perceptron, constã în urmãtoarele: iniþial se porneºte
cu un vector de ponderi w ºi un prag de excitaþie , alese în mod arbitrar; valorile acestor mãrimi sunt modificate în mod
iterativ ºi dupã reguli adecvate, astfel încât sã aibã loc o creºtere continuã a ratei corectitudinii clasificãrii cu ajutorul reþelei
neuronale; procesul iterativ de modificare a vectorului de ponderi w ºi a pragului de excitaþie , se opreºte atunci când
performanþa reþelei neuronale nu mai poate fi îmbunãtãþitã în mod semnificativ.
Cea mai importantã problemã legatã de algoritmul de instruire a perceptronului, este aceea a definirii regulilor de
modificare a vectorului de ponderi w ºi a pragului de excitaþie , astfel încât aceastã modificare sã conducã la o
îmbunãtãþire a performaþei reþelei neuronale. Dupã cum se poate intui, definirea oricãrei reguli de modificare a vectorului
de ponderi w ºi a pragului de excitaþie , presupune necesitatea de a formula criteriul de performanþã al reþelei neuronale,
astfel încât acesta sã fie exprimat în funcþie de vectorul de ponderi w ºi de pragul de excitaþie .
Aºa cum am arãtat anterior, distanþa de la orice punct x din spaþiul formelor, la hiperplanul , care este asociat cu
vectorul de ponderi normalizat w ºi cu pragul de excitaþie , poate fi exprimatã în funcþie de vectorul de ponderi w, astfel:
,
unde este vectorul de translaþie din definirea hiperplanului, vector pe care, în acest context, este convenabil sã îl
considerãm a fi de forma:

În aceste condiþii, cea mai elegantã modalitate de a formula criteriul de performanþã a reþelei neuronale, astfel încât
acesta sã depindã în mod direct de vectorul de ponderi w ºi de pragul de excitaþie , este aceea de a considera cã acest
criteriu este reprezentat de suma distanþelor de la toate formele clasificate incorect, la hiperplanul asociat cu vectorul de
ponderi w ºi cu pragul de excitaþie .
Astfel, dacã vom nota cu , mulþimea tuturor formelor din setul de învãþare, care sunt clasificate
incorect, atunci criteriul de performanþã al reþelei neuronale poate fi exprimat sub forma urmãtoare:
,

unde vectorul este de forma:

Este evident cã, exprimatã sub aceastã formã, performanþa reþelei neuronale va fi cu atât mai mare, cu cât vectorul de
ponderi normalizat w ºi pragul de excitaþie sunt astfel încât, valoarea funcþiei este cât mai micã.
Rezultã cã problema determinãrii vectorului de ponderi w ºi a pragului de excitaþie , astfel încât performanþa reþelei
neuronale sã fie maximã, poate fi formulatã ca o problemã de extrem, de forma urmãtoare:

unde este mulþimea tuturor formelor din setul de instruire, care sunt clasificate incorect de cãtre reþeaua neuronalã
care are vectorul de ponderi w ºi pragul de excitaþie a neuronului de ieºire egal cu .

125
Relaþiile care definesc perceptronul, adicã relaþiile care definesc starea neuronului ºi output-ul acestuia sunt urmãtoarele:

Din modul în care este definitã ieºirea neuronului, rezultã cã pragul de activare sau de excitare a neuronului este egal
cu .
Pentru simplificare, vom considera, pentru început, cã pragul de activare este egal cu zero, respectiv , ºi cã
ponderile sunt date. Atunci, din felul în care este definitã funcþia de activare f(.), rezultã urmãtoarele trei mulþimi
posibile de forme, cãrora pot sã le aparþinã formele de intrare:
• mulþimea formelor , pentru care:
;
• mulþimea formelor , pentru care:
;
• mulþimea formelor , pentru care:
.
Cele trei mulþimi sunt cunoscute sub numele de regiuni de decizie, iar determinarea lor presupune rezolvarea ecuaþiei:
,
care este ecuaþia unui subspaþiu cu dimensiunea egalã cu n-1. Din punct de vedere geometric, subspaþiul definit de ecuaþia
precedentã este o suprafaþã liniarã care trece prin origine.
Mulþimea soluþiilor acestei ecuaþii, adicã mulþimea tuturor formelor x, care verificã aceastã ecuaþie, formeazã un
subspaþiu al spaþiului formelor , respectiv:
,
subspaþiu care separã spaþiul formelor în trei regiuni distincte:
• prima regiune, pe care o vom nota cu , este formatã din acele forme din spaþiul formelor , pentru care
mãrimea s, care defineºte starea internã a neuronului, este strict pozitivã, adicã:
;
• cea de-a doua regiune, pe care o vom nota cu , este formatã din din acele forme din spaþiul formelor ,
pentru mãrimea ce defineºte starea internã este egalã cu zero, adicã:
;
• cea de-a treia regiune, pe care o vom nota cu , este formatã din din acele forme din spaþiul formelor , pentru
mãrimea ce defineºte starea internã este strict negativã, adicã:
.
În condiþiile în care setul de învãþare este format din clasele exclusive , cele trei regiuni din spaþiul
formelor , delimitate cu ajutorul reþelei neuronale, pot fi considerate a fi perfect corecte, dacã ºi numai aceste regiuni sunt
astfel încât regiunea include absolut toate formele din clasa , iar regiunea include absolut toate formele din
clasa , adicã:

Aceastã situaþie idealã, corespunde cazului în care reþeaua neuronalã stabileºte în mod perfect corect apartenenþa pentru
toate formele din setul de învãþare. O astfel de situaþie idealã nu poate sã aparã însã, decât în cazul în care clasele din setul
de învãþare sunt liniar separabile.
Dupã cum se poate observa, orice vector x aparþinând subspaþiului , este ortogonal cu vectorul ponderilor w, ceea
ce înseamnã cã vectorul de ponderi w este ortogonal cu întregul subspaþiu . Mai mult decât atât, fiecãrui vector de ponderi
w, i se asociazã un anumit subspaþiu unic , în raport cu care vectorul w este ortogonal. Aºa cum o sã vedem în continuare,
problema care se pune este aceea de a determina acel vector de ponderi , cãruia sã i se asocieze acel subspaþiu, care are
proprietatea cã asigurã cea mai bunã separare a formelor pe cele douã clase.
Dacã vom considera cazul vectorilor bidimensionali, subspaþiul , care asigurã separarea corectã a formelor, se reduce
la o dreaptã în planul , dreaptã care trece prin origine, iar vectorul ponderilor w este ortogonal pe aceastã dreaptã, aºa

126
cum se poate vedea în figura urmãtoare.

Figura 9.13: Ortogonalitatea vectorului ponderilor w ºi hiperplanului H

Vom presupune acum cã vectorul de ponderi w este la un moment dat, astfel încât acestuia îi corespunde acel
subspaþiu , în raport cu care o formã care aparþine în mod real clasei , este plasatã în mod incorect în regiunea ,
aºa cum este ilustrat în cadrul figurii urmãtoare.

Figura 9.14: Ortogonalitatea vectorului ponderilor w ºi hiperplanului H

Doarece în raport cu subspaþiul , forma este situatã în mod incorect în regiunea , adicã ea satisface
inegalitatea:
,
este necesar ca vectorul de ponderi w, sã fie modificat în aºa fel încât noului vector de ponderi , sã i se asocieze acel
subspaþiu , care aduce forma în regiunea corectã .
Dupã cum se poate observa, acestã modificare poate fi obþinutã, definind noul vector de ponderi , sub forma sumei
dintre vectorul de ponderi iniþial w ºi un vector , unde , respectiv sub forma:
,
unde constanta scalarã se numeºte ratã de învãþare. În aceste condiþii, vom avea:
ºi ,
ceea ce înseamnã clasificarea corectã a celor douã forme.
În mod similar, vom presupune cã vectorul de ponderi w este la un moment dat, astfel încât acestuia îi corespunde acel
subspaþiu , în raport cu care o formã care aparþine în mod real clasei , este plasatã în mod incorect în regiunea ,
aºa cum este ilustrat în cadrul figurii urmãtoare.

127
Figura 9.15: Ortogonalitatea vectorului ponderilor w ºi hiperplanului H

Doarece în raport cu subspaþiul , forma este situatã în mod incorect în regiunea , adicã ea satisface
inegalitatea:
,
este necesar ca vectorul de ponderi w, sã fie modificat în aºa fel încât noului vector de ponderi , sã i se asocieze acel
subspaþiu , care aduce forma în regiunea corectã .
Dupã cum se poate observa, acestã modificare poate fi obþinutã, definind noul vector de ponderi , sub forma sumei
dintre vectorul de ponderi iniþial w ºi un vector , unde , respectiv sub forma:
,
unde constanta scalarã reprezintã rata de învãþare. În aceste condiþii, vom avea:
ºi ,
ceea ce înseamnã clasificarea corectã a celor douã forme.
Pe baza celor menþionate anterior, poate fi dedusã urmãtoarea regulã genericã de determinare a vectorului de ponderi w,
numitã ºi regulã de învãþare: dacã x este forma prezentatã la intrarea reþelei neuronale, formã care aparþine fie clasei ,
fie clasei , iar este vectorul de ponderi corespunzãtor pasului k de instruire a reþelei neuronale, atunci vectorul de
ponderi de la pasul k+1 se determinã dupã urmãtoarea regulã:
• , dacã ;
• , dacã .

Prima situaþie, corespunde unei predicþii incorecte, în sensul cã o formã care aparþine în mod real clasei , este
predictatã ca aparþinând clasei . Cea de-a doua situaþie, corespunde tot unei predicþii incorecte, însã în sensul cã o formã
care aparþine în mod real clasei , este predictatã ca aparþinând clasei .
În toate celelalte situaþii, care corespund unor predicþii corecte, respectiv în situaþiile în care avem:
sau ,
vectorul ponderilor rãmâne neschimbat, respectiv:
.
Dupã cum se poate observa, condiþia de modificare ce corespunde primei situaþii, poate fi scrisã ºi sub forma
echivalentã:
, dacã .
Aceastã observaþie este foarte utilã, deoarece oferã posibilitatea gãsirii unei exprimãri mai condensate a regulii de
decizie anteriorare, exprimare bazatã pe aºa-numita normalizare a semnului formelor de intrare.
Normalizarea semnului formelor de intrare, presupune definirea unui forme generice z, sub forma urmãtoare:

Pe baza acestei normalizãri, indiferent care este forma , aceasta este clasificatã în mod corect dacã:

128
,
respectiv clasificatã în mod incorect, dacã:
.
În aceste condiþii, regula de instruire a reþelei neuronale, menþionatã anterior, poate fi reformulatã sub forma urmãtoare:

Vom considera cã procesul de învãþare începe cu un vector iniþial de ponderi , ales în mod arbitrar, eventual pe calea
generãrii aleatoare.
Deoarece vectorul iniþial de ponderi este ales în mod arbitrar, este evident cã, în raport cu acest vector, unele dintre
cele T forme din setul de învãþare, unele vor fi clasificate în mod corect, în timp ce altele vor fi clasificate incorect.
Deoarece formele clasificate corect nu determinã modificarea vectorului de ponderi, vom presupune cã în procesul
iterativ de învãþare sunt luate în considerare doar acele forme din setul de învãþare, care sunt clasificate în mod incorect de
cãtre vectorul de ponderi , adicã formele pentru care:
,
ºi vom presupune cã formele care verificã aceastã condiþie sunt elemente ale mulþimii:
.
În acest context, procesul de învãþare va fi reprezentat de urmãtoarea succesiune a vectorilor de ponderi:

Din analiza procesului iterativ anterior, desfãºurat peste mulþimea de forme clasificate incorect , se desprind o
serie de concluzii foarte importante pentru rafinarea procesului de instruire a reþelei neuronale.
În primul rând, ca urmare a faptului cã rata de învãþare c este aleasã în mod arbitrar în intervalul , modificarea
la care este supus vectorul de ponderi , la cel de-al k-lea pas al schemei iterative, modificare datã de relaþia:
,
nu asigurã certitudinea cã noul vector de ponderi , va clasifica, dintr-o datã ºi în mod corect forma , deoarece
clasificarea corectã a formei este asiguratã numai pentru o valoare optimalã a ratei de învãþare c. Cu toate aceastea,
problema poate fi însã rezolvatã, determinând de la început chiar valoarea optimalã a constantei de învãþare c, astfel încât
vectorul de ponderi sã asigure în mod direct clasificarea corectã a formei . Determinarea directã a constantei de
învãþare , ar putea fi privitã ca fiind asociatã cu un proces de învãþarea rapidã, în contextul cãreia reþeaua neuronalã este
instruitã într-un numãr mai mic de iteraþii, respectiv cu o vitezã mai mare.
În al doilea rând, chiar dacã o formã este clasificatã în mod corect de cãtre vectorul de ponderi , este posibil
ca anumite forme care au fost clasificate anterior în mod corect, prin succesiunea de vectori , sã aparã ca
forme clasificate în mod incorect prin intermediul noului vector de ponderi , care asigurã clasificarea corectã a
formei .
O soluþie rezonabilã pentru rezolvarea acestei probleme, poate fi aceea a sortãrii formelor din mulþimea , în
ordinea descrescãtoare a distanþelor faþã de subspaþiul asociat cu vectorul de ponderi , ºi modificarea succesivã a
vectorului , în funcþie de formele ordonate din acest punct de vedere.
O modalitate elegantã de rezolvare simultanã a celor douã categorii de probleme menþionate anterior, este aceea în care
modificarea succesivã a vectorului de ponderi , se face peste un ºir infinit de forme, ºir format dintr-o succesiune infinitã
de subºiruri identice, în care fiecare subºir este reprezentat de succesiunea de forme normalizate din setul de instruire,
respectiv de mulþimea , unde:

În acest context, eºantionul de forme este utilizat pentru instruirea reþelei neuronale într-o manierã ciclicã, repetatã
indefinit, în care ºirul de forme normalizate utilizate pentru instruirea reþelei neuronale este de forma:
.

129
Formele din acest ºir de forme normalizate, vor fi utilizate în mod succesiv, începând cu prima formã din ºir, pentru
a determina modificãrile vectorului de ponderi v, astfel încât reþeaua neuronalã sã fie configuratã astfel încât sã recunoascã
în mod corect apartenenþa tuturor formelor din setul de învãþare.
Vom considera cã modificarea vectorului de ponderi , de la o formã la alta, în cadrul aceluiaºi subºir, defineºte o
subiteraþie, iar modificarea vectorului de ponderi odatã cu trecerea de la un subºir la altul, defineºte o iteraþie. Cu alte
cuvinte, o iteraþie este formatã dintr-un numãr de T subiteraþii, motiv pentru care o astfel de iteraþie, este cunoscutã în
literatura de specialitate a domeniului sub numele de epocã.
În aceste condiþii, regula de instruire a reþelei neuronale poate fi formulatã sub forma urmãtoare:

unde , iar este valoarea lui “k modulo T” sau restul împãrþirii


întregi a lui k prin T, respectiv:
.
Cu alte cuvinte, dacã vectorul de ponderi , obþinut la cea de-a k-a iteraþie, rãmâne neschimbat numai dacã al clasificã
în mod corect forma . În caz contrar, vectorul de ponderi este modificat conform relaþiei menþionate.
În ceea ce priveºte criteriul de oprire a algoritmului perceptronului, facem precizarea cã acesta se referã la acea
iteraþie , pentru care s-a obþinut acel vector de ponderi , care asigurã clasificarea corectã a tuturor celor T forme din
setul de instruire. Cu alte cuvinte, iteraþia , la care algoritmul se opreºte, nu poate fi decât un multiplu de numãrul de
forme T, respectiv:
,
adicã iteraþia pentru care are loc egalitatea:
.
Vom numi procesul de instruire descris de schema iterativã precedentã, proces de instruire formã cu formã. Acest
proces este similar proceselor de memorare bazate pe repetarea cunoºtinþelor, cunoºtinþe reprezentate, în acest caz, de
formele din setul de instruire, forme a cãror apartenenþã este cunosacutã.
În sfârºit, în al treilea rând, din analiza schemei iterative precedente, rezultã cã modificarea vectorului de ponderi ,
se poate face de fiecare datã când este consideratã o formã , clasificatã în mod incorect de cãtre vectorul de ponderi ,
ci global, dintr-o datã, pentru toate formele clasificate în mod incorect. În acest fel, toate cele T iteraþii care vizeazã
modificarea succesivã a vectorului de ponderi , pentru fiecare formã clasificatã în mod incorect, pot fi reduse la o singurã
iteraþie, efectuatã peste mulþimea tuturor formelor clasificate incorect la pasul respectiv.
Având în vedere cele menþionate anterior, rezultã cã pentru fiecare epocã p, putem defini putem defini un vector de
ponderi , sub forma:

unde:
,
reprezintã mulþimea formelor clasificate incorect prin intermediul vectorului de ponderi , iar reprezintã numãrul de
forme clasificate incorect prin intermdiul acestui vector.
În aceste condiþii, dacã vectorul de ponderi , corespunzãtor iteraþiei p, nu asigurã clasificarea corectã a tuturor
formelor din setul de instruire, adicã , atunci el trebuie modificat încontinuare, dupã schema iterativã:
.

În ceea ce priveºte criteriul de oprire specific acestei scheme iterative, este evident cã dacã, la sfârºitul unei epoci ,

130
toate formele din eºantionul de învãþare sunt clasificate în mod corect, adicã vectorul de ponderi verificã relaþia:
,
oricare ar fi forma normalizatã z, atunci procesul de învãþare se opreºte, iar vectorul de ponderi care asigurã separabilitatea
claselor este:
.
Dupã cum se poate constata, criteriul de oprire menþionat anterior este satisfãcut, în mod implicit, la iteraþia , în cazul
în care:
.
Indiferent de tipul sãu particular, respectiv formã cu formã sau epocã cu epocã, în condiþiile în care clasele considerate
sunt liniar separabile, procesul de învãþare este un proces convergent.
Penrtru a descrie ºi justifica procesul de convergenþa al algoritmului perceptronului, vom considera mai întâi cazul
particular al învãþãrii formã cu formã. În acest context, vom presupune cã ºirul de învãþare este reprezentat de urmãtoarea
succesiune infinitã de forme normalizate:
,
iar schema iterativã a procesului de instruire este de forma:

Vom presupune cã ºi sunt douã clase de forme liniar separabile, astfel încât existã vectorul de ponderi , care
verificã relaþia:
,
ceea ce înseamnã cã hiperplanul , care este ortogonal cu vectorul de ponderi , asigurã separarea liniarã a celor douã
clase.
Teorema urmãtoare, justificã convergenþa ºirului de vectori , ºir corespunzãtor procesului de instruire
formã cu formã, cãtre vectorul de ponderi , care asigurã separabilitatea liniarã a celor douã clase considerate.
Teoremã: Dacã este vectorul de ponderi care asigurã separabilitatea liniarã a
claselor ºi , iar este un vector de ponderi arbitrar, atunci ºirul de vectori
, definit de recurenþa urmãtoare:

converge cãtre vectorul , adicã:


.

Vom considera acum cazul particular al celui de-al doilea proces de instruire, respectiv procesul de instruire epocã cu
epocã, pentru care schema iterativã este de forma:
.

Teorema urmãtoare, justificã convergenþa ºirului de vectori , ºir corespunzãtor procesului de instruire
epocã cu epocã, cãtre vectorul de ponderi , care asigurã separabilitatea liniarã a celor douã clase considerate.
Teoremã: Dacã este vectorul de ponderi care asigurã separabilitatea liniarã
a claselor ºi , iar este un vector de ponderi arbitrar, atunci ºirul de vectori
, definit de recurenþa urmãtoare:
,

unde este mulþimea formelor clasificate incorect de cãtre vectorul de ponderi


, converge cãtre vectorul , adicã:
.

Deoarece vectorul de ponderi , obþinut dupã parcurgerea întregii mulþimi de forme clasificate incorect, poate sã
nu conducã la situaþia în care toate formele din setul de învãþare sã fie clasificate în mod corect, procesul de învãþare este
reluat, cu luarea în considerare a formelor clasificate incorect dupã parcurgerea întregii mulþimi de forme clasificate
incorect.

131
Facem observaþia cã normalizarea de semn a formelor din clasele , nu modificã vectorul de ponderi w, deci
nu modificã nici subspaþiul , asociat acestuia.
Pentru a ilustra efectul normalizãrii de semn a formelor, vom considera situaþia din figura urmãtoare.

Figura 9.16: Efectul normalizãrii de semn a formelor

Dupã cum se poate observa, singura formã normalizatã ca semn, care nu verificã inegalitatea:
,
adicã este clasificatã incorect cu vectorul de ponderi w, este forma . Pentru toate celelalte forme, are loc verificarea
inegalitãþii precedente, ceea ce înseamnã cã sunt clasificate în mod corect cu vectorul de ponderi w.
Considerând situaþia în care formele sunt normalizate ca semn, mulþimea formelor clasificate incorect cu vectorul de
ponderi w, poate fi scrisã sub forma:
,
unde u este o formã normalizatã. În acest caz, suma distanþelor de la formele clasificate incorect, la subspaþiul , ortogonal
cu vectorul w, capãtã forma urmãtoare:
.

Având în vedere cã sumarea se face dupã toate formele clasificate incorect, adicã dupã formele z, pentru care ,
rezultã cã suma distanþelor de la formele clasificate incorect, la subspaþiul , poate fi scrisã sub forma:
,

iar performanþa reþelei neuronale poate fi scrisã sub forma:


.

Deoarece, în general, , performanþa reþelei neuronale poate fi rescrisã sub forma:

Având în vedere cã gradientul funcþiei , notat cu , este un vector care defineºte direcþia în care trebuie sã se
avanseze, astfel încât sã se obþinã o creºtere a funcþiei , orice schema iterativã bazatã pe evaluarea gradientului, care
asigurã maximizarea funcþiei , este de forma:

unde punctul de start, reprezentat de vectorul normalizat , este dat, este o constantã scalarã pozitivã, aleasã în mod
convenabil, care determinã lungimea pasului care se face la iteraþia k, iar reprezintã evaluarea gradientului
funcþiei în punctul , respectiv:

132
.

Având în vedere cã derivarea unui produs scalar de forma , în raport cu vectorul , se face dupã regula:

rezultã cã gradientul funcþiei este de forma:

iar schema iterativã care produce maximul funcþiei, are forma:

Având în vedere cele menþionate anterior, algoritmul perceptronului poate fi descris prin intermediul urmãtoarei
succesiuni de paºi:
Se considerã existenþa Se considerã eºantionul de forme n-dimensionale , formã a cã
Datoritã faptului cã pentru orice formã este verificatã, prin definiþia clasei , condiþia:
,
vom defini o formã genericã z, numitã formã normalizatã ca semn, ºi definitã sub forma urmãtoare:

Cu aceastã notaþie, separabilitatea linniarã a celor douã clase poate fi definitã sub o formã mai sinteticã, respectiv sub
forma urmãtoare:
Definiþie: Douã clase se numesc liniar separabile, dacã ºi numai dacã
are loc inegalitatea:
,
unde z este o formã normalizatã ca semn.
În concluzie, se poate spune cã, în cazul în care clasele sunt liniar separabile, existã un hiperplan care delimiteazã cele
douã clase, hiperplan care poate fi determinat prin metode matematice specifice.

133

S-ar putea să vă placă și