Sunteți pe pagina 1din 81

Universitatea Constantin Brancoveanu - Pitesti

Analiza performantelor
întreprinderii prin modele
informatice de asistare a deciziei
Studiu de caz
- Piata imobiliara

Coordonator Stiintific: Student:

Conf. univ. dr. Radut Carmen Serban Ion Cristian

2010
Cuprins

INTRODUCERE..............................................................................................................................................4

CAPITOL 1

ANALIZA PERFORMANŢELOR FINANCIARE....................................................................................5


1.1ANALIZA DE ANSAMBLU A PERFORMANŢELOR FINANCIARE........................................................................5
Definiţii ale elementelor de performanţă financiară....................................................................5
Prezentarea în contul de profit şi pierdere a elementelor de performanţă financiară...6
Analiza pe nivele a performanţelor financiare...............................................................................7
Analiza evoluţiei performanţelor financiare..................................................................................20
Analiza structurală a performanţelor financiare.........................................................................21
Analiza structurală a contului de profit şi pierdere pe baza rezultatului brut al exerciţiului. .21
Analiza structurală a contului de profit şi pierdere pe baza veniturilor totale.............................21
1.2ANALIZA PERFORMANŢELOR PE BAZA RATELOR DE RENTABILITATE.......................................................22
Analiza rentabilităţii financiare..........................................................................................................23
Analiza ratelor rentabilităţii economice..........................................................................................24
Analiza rentabilităţii investiţiilor de capital...................................................................................26

CAPITOL 2
ASISTAREA DECIZIEI ECONOMICE...................................................................................................32
2.1DEFINIREA, ROLUL ŞI LOCUL SISTEMELOR INFORMATICE PENTRU ASISTAREA DECIZIEI.....................32
2.2DECIZIA: LOC, ROL, CLASIFICARE;DECIDENŢII.......................................................................................35
2.3CLASIFICAREA SISTEMELOR INFORMATICE PENTRU ASISTAREA DECIZIEI.............................................46
2.4SISTEME SUPORT PENTRU ASISTAREA DECIZIEI.......................................................................................48
Subsistemul de gestiune a datelor...................................................................................................48
Subsistemul de gestiune a modelelor.............................................................................................49
Subsistemul de gestiune a cunoştinţelor.......................................................................................49
Interfaţa cu utilizatorul.........................................................................................................................49

CAPITOL 3
DATA MINING - TEHNOLOGII DEDICATE EXTRAGERII CUNOŞTINŢELOR DIN DATE
.................................................................................................................................................................................51
3.1PROBLEMATICA GENERALĂ.......................................................................................................................51
3.2DEFINIREA CONCEPTULUI DATA MINING..................................................................................................54
3.3CATEGORII DE DATE CARE POT FI „MINERITE”........................................................................................58
3.4SISTEMUL DATA MINING............................................................................................................................62
Structura sistemului Data Mining.....................................................................................................63
Intrările sistemului Data Mining........................................................................................................63
Arhitectura sistemului Data Mining..................................................................................................65
Clasificarea sistemelor Data Mining.................................................................................................67
Explorarea datelor - conţinut şi etape............................................................................................69
Raţionamentul bazat pe cazuri..........................................................................................................71

CAPITOL 4
STUDIU DE CAZ: DATA MINING ÎN PIAŢA IMOBILIARĂ......................................................73

BIBLIOGRAFIE...............................................................................................................................................80

2
Introducere
Analiza performanţei in afaceri (BPM - Business performance management) constă
dintr-un set de procese care ajută organizaţiile sa optimizeze performanţa lor in afaceri.
Acesta oferă un cadru pentru organizarea, automatizarea şi analiza metodologiilor afacerilor,
măsurarea, proceselor şi sistemelor care conduc la performanţă in afaceri.
Colin White descrie legătură dintre business intelligence (BI) şi analiza performanţei:
„Cea mai mare zonă de dezvoltare în analiză operaţională BI este zona de analiza a
performanţei in afaceri (BPM). BPM nu analizează numai performanta, dar şi, compara
performanţa cu obiectivele afacerii şi alertează atunci când performanţa reală este aflată în
linie cu obiectivele de afaceri impuse.”
BPM ajută întreprinderile utilizarea eficientă a materialelor lor financiare, umane, şi a
altor resurse.
BPM implică colectarea datelor din diferite surse, interogari, şi analiză a datelor,
precum şi punerea în practică a rezultatelor.
BPM poate ajuta în analiza de risc şi în prezicerea rezultatelor de fuziune şi scenariilor
de achiziţie şi în planificarea afacerii pentru a depăşi problemele potenţiale.
BPM produce indicatori cheie de performanţă (KPI - Key Performance Indicators) care
ajuta companiile la monitorizarea eficientei a proiectelor şi a angajatilor conform unor
obiective impuse.
Personalul de specialitate care lucrează în business intelligence, au dezvoltat unelte
software ce facilitează munca in domeniul analizei performantei, mai ales atunci când
sarcina strangerii si colectarea informaţiilor implică cantităţi mari de date nestructurate.
Instrumentele cele mai des utilizate in domeniul analizei performantei in domeniul
afacerilor includ:

1 OLAP (online analytical processing, sau in traducere libera procesare analitica


online)
2 Data Warehouses (in traducere libera depozite de date)
3 Text mining
4 DM (Data Mining)
5 BPO (Business Performance Optimisation – optimizarea performanţelor afacerii)
6 DSS (Decision Support Systems - sisteme suport de decizie)

3
Capitol 1
Analiza performanţelor financiare
Prin performanţe financiare se înţeleg veniturile, cheltuielile şi rezultatele financiare
ale unei întreprinderi. Informaţii despre aceste structuri financiare sunt oferite în principal de
Contul de Profit şi Pierdere însă o parte din notele explicative vin să completeze informaţiile
privind performanţele întreprinderii.
Ne referim aici cel puţin la notele obligatorii de întocmit şi anume: „Analiza
rezultatului din exploatare”, „Exemple de calcul şi analiză a principalilor indicatori
economico-financiari”. Analiza performanţelor financiare se poate defalca astfel:
1 În funcţie de obiectivele urmărite în cadrul analizei performanţei financiare regăsim:
1. Analiza de ansamblu a performanţei financiare
2. Analiza performanţelor financiare pe baza indicatorilor de rentabilitate
financiară şi economică
3. Analiza rentabilităţii investiţiilor de capital
2 În funcţie de sursele de provenienţă ale informaţiilor privind performanţele financiare
avem:
1. Analiza performanţelor financiare în contextul valorificării informaţiilor din
Contul de Profit şi Pierdere (vom numi o astfel de analiză drept o analiză simplă a
performanţelor financiare);
2. Analiza performanţelor financiare în contextul valorificării informaţiilor altele
decât cele din Contul de Profit şi Pierdere. Este vorba aici despre cel puţin următoarele
categorii de informaţii:
o Informaţii privind rezultatul exploatării, în cadrul cărora să se realizeze o
clasificare a cheltuielilor după funcţie. Aceste informaţii se regăsesc în cadrul
notei nr. 4 „Analiza rezultatului din exploatare”.
o Informaţii privind reconcilierea între profitul contabil şi cel fiscal impusă legal a
se realiza de unităţile mari care aplică O.M.F.P. nr.1752/2005.

1.1 Analiza de ansamblu a performanţelor financiare

Definiţii ale elementelor de performanţă financiară

Cheltuielile reprezintă potrivit IAS diminuări ale beneficiilor economice înregistrate pe


parcursul perioadei contabile sub formă de ieşiri sau scăderi ale valorii activelor sau creşteri

4
ale datoriilor, care se concretizează în reduceri ale capitalurilor proprii, altele decât cele
rezultate din distribuirea acestora către acţionari. În principiu o cheltuială semnifică o
„sărăcire” a întreprinderii, generată fie de o micşorare a unor elemente de active
patrimoniale, fie de o creştere a unor elemente de pasive patrimoniale (capitaluri proprii sau
datorii).
Veniturile reprezintă potrivit IAS creşteri ale beneficiilor economice înregistrate pe
parcursul perioadei contabile sub formă de intrări sau creşteri ale valorii activelor sau
descreşteri ale datoriilor, care se concretizează în creşteri ale capitalurilor proprii, altele
decât cele rezultate din contribuţia acţionarilor. Veniturile în principiu, semnifică o
„îmbogăţire” a întreprinderii, generată fie de o creştere a unor elemente de active
patrimoniale, fie de o scădere a unor elemente de pasive patrimoniale (capitaluri proprii sau
datorii).
Rezultatele financiare pot fi sub formă de :
3 profit, dacă într-o perioadă de timp determinată, de regulă un exerciţiu financiar,
veniturile sunt mai mari decât cheltuielile.
4 pierdere, dacă într-o perioadă de timp determinată, de regulă un exerciţiu financiar,
veniturile sunt mai mici decât cheltuielile.

Prezentarea în contul de profit şi pierdere a elementelor de


performanţă financiară

Modul de formare al rezultatelor poate fi diferit în funcţie de criteriul de clasare al


cheltuielilor care au stat la baza obţinerii acestora. După modul de formare rezultatele pot fi
grupate în două categorii principale:
1 rezultate obţinute prin clasarea cheltuielilor după natura lor;
2 rezultate obţinute prin clasarea cheltuielilor după funcţie.
Potrivit reglementărilor legale contabile armonizate la IAS (în prezent în vigoare,
MO.M.F.P. nr. 1752/2005 , Contul de Profit şi Pierdere va avea o structură aproximativ
similară cu cea anglo-saxonă în care cheltuielile sunt ierarhizate după natura acestora
(exploatare, financiare, excepţionale) şi sunt prezentate în format vertical. Referenţialul
utilizat pentru compararea cheltuielilor este producţia exerciţiului.
Cu ajutorul unei astfel de forme a Contului de Profit şi Pierdere se va explica modul
de constituire a rezultatului exerciţiului în diferite etape permiţând desprinderea unor
concluzii legate de nivelul performanţelor economice ale celor trei activităţii desfăşurate de o
firmă într-o perioadă de gestiune şi anume:
1 activitatea de exploatare;

5
2 activitatea financiară;
3 activitatea extraordinară.
Corespunzător fiecărei activităţi îi apare un flux de venituri, cheltuieli, rezultat astfel:
a) Fluxuri de exploatare, care cuprind operaţiuni economice cu caracter specific, obişnuit şi
repetitiv, care vizează activitatea normală şi curentă a unei întreprinderi, excluzând prin
influenţă cu caracter financiar sau extraordinar. Operaţiunile de exploatare permit
determinarea rezultatului din exploatare, rezultat real, generat de activitatea de bază a
întreprinderii.
b) Fluxurile financiare sunt acele operaţiuni economice care se referă la activitatea
financiară şi care au un caracter obişnuit, repetitiv şi specific. Fluxurile financiare permit
determinarea rezultatului financiar. Fluxurile de exploatare şi financiare formează fluxurile
curente care generează rezultatul curent.
c) Fluxurile extraordinare cuprind operaţiuni economice care nu au legătură directă cu
obiectul normal de activitate al societăţii. Operaţiunile din această categorie au un caracter
accidental. Potrivit definiţie prezentate în Cadrul general IAS, elementele extraordinare sunt
venituri sau cheltuieli ce rezultă din evenimente şi tranzacţii care sunt în mod clar diferite de
activităţile curente ale unei întreprinderi şi care, prin urmare, nu se aşteaptă să se repete
într-un mod frecvent sau regulat. Fluxurile extraordinare permit determinarea rezultatului
extraordinar. Prin însumarea acestor rezultate se obţine rezultatul brut al exerciţiului.
Spre deosebire de modelul anterior în cazul rapoartelor financiare obţinute prin
clasarea cheltuielilor după destinaţie (exploatare, desfacere, administrare) este posibilă
formarea unui rezultat confirmat de piaţă deoarece rezultă din compararea costului
vânzărilor cu producţia vândută. Spre deosebire de modelul anterior referenţialul utilizat
pentru compararea cheltuielilor va fi producţia vândută şi nu producţia exerciţiului. Un astfel
de model este precizat de O.M.F.P. nr. 1752/2005 a se întocmi în cadrul notelor explicative
dar numai vizând rezultatul din exploatare (Nota 4 „Analiza rezultatului din exploatare”).

Analiza pe nivele a performanţelor financiare

În acest sens, analiza se adânceşte pe patru niveluri, şi anume:


1 nivelul de exploatare;
2 nivelul financiar;
3 nivelul extraordinar;
4 nivelul global.

6
Nivelul de exploatare

În cadrul acestei analize a performanţelor se pune în evidenţă volumul activităţii


principale (de bază), adică a activităţii de exploatare utilizând un sistem de indicatori
specifici calculaţi pe baza Contului de Profit şi Pierdere pe de-o parte şi pe baza notelor
explicative pe de altă parte.

Indicatori calculaţi pe baza Contului de Profit şi Pierdere (cu structurarea


cheltuielilor după natură).

Cifra de afaceri netă evidenţiază dimensiunea portofoliului de afaceri realizate de o


societate comercială în relaţie cu diferiţi parteneri. Fiind un indicator de volum, cifra de
afaceri netă reflectă atât latura comercială a unei firme producătoare (prin producţia
vândută) (Qv), cât şi volumul activităţii desfăşurate de o firmă axată pe vânzări (prin
vânzările de mărfuri - VM) şi subvenţiile din exploatare aferente cifrei de afaceri netă (SE).

CAN  VM  Qv  SE

1 VM reprezintă volumul mărfurilor vândute care se preia din rulajul creditor al contului 707;
Qv reprezintă producţia vândută, indicator ce va fi calculat în cele ce urmează;
2 SE reprezintă subvenţiile de exploatare care se preiau din rulajul creditor al contului 7411.
Notă !
Pentru entităţile economice al căror obiect principal de activitate îl reprezintă
leasingul, se vor include în cifra de afaceri netă şi dobânzile aferente leasingului financiar,
conform modificărilor aduse reglementărilor contabile româneşti prin OMFP.nr. 1752/2005.
În acest fel se realizează un pas important în direcţia îmbunătăţirii legislaţiei contabile,
deoarece, pentru astfel de entităţi, principala activitate producătoare de profit – leasingul -
rămânea în afara sferei de cuprindere a cifrei de afaceri, care denatura în mod substanţial
indicatorii de performanţă ai acestor tipuri de entităţi.
Cifra de afaceri netă aferentă vânzărilor poate fi majorată fie printr-un volum sporit
al bunurilor vândute, fie prin creşterea preţurile practicate, fie prin ambele metode.
Capacitatea întreprinderii de a schimba unul sau ambii factori va depinde de cererea pentru
produsele întreprinderii, de poziţia firmei în competiţia în care s-a angajat precum şi de
condiţiile oferite întreprinzătorului de mediul economic.
Indicatorul cifra de afaceri netă este determinat explicit în cadrul rubricilor solicitate

7
pentru prezentarea Contului de Profit şi Pierdere.

Producţia exerciţiului (QE) evidenţiază dimensiunea activităţii comerciale a unei


firme productive atât în relaţia cu terţii (clienţii) prin producţia vândută şi variaţia producţiei
stocate (Qs), pe de-o parte, cât şi în relaţia cu sine însăşi prin producţia de imobilizări (Qi),
pe de altă parte.

QE = QV + QS + Qi

1 Producţia vândută se calculează din rulajul creditor al conturilor din grupa 70 mai puţin
contul 707
2 Variaţia producţiei stocate (Qs) cuprinde atât variaţia stocului de produse finite (SPF) cât
şi variaţia producţiei în curs de execuţie (SPCE) de la sfârşitul şi începutul exerciţiului
financiar analizat.

QS =  SPCE +  SPF

1 Producţia stocată este dată de soldul contului 711, dacă are sold creditor se adună iar
dacă are sold debitor se scade;
2 Producţia de imobilizări cuprinde totalitatea cheltuielilor efectuate pentru obţinerea
activelor corporale şi necorporale necesare investiţiilor proprii. Producţia imobilizată se
calculează din rulajul creditor al contului 711
Din punct de vedere al analizei, indicatorul „producţia exerciţiului” are un caracter
eterogen ca urmare a bazelor de evaluare diferite utilizate. Astfel, întrucât producţia
vândută este evaluată în preţuri de vânzare, iar producţia stocată şi producţia de imobilizări
sunt evaluate în costuri de producţie. În consecinţă şi factorii care modifică starea acestor
componente se grupează în:
1 volumul fizic;
2 structura de producţie şi de vânzare;
3 preţul de vânzare;
4 costul de producţie.

Vechile reglementări contabile de orientare franceză precizau prezentarea explicită a


indicatorului Producţia exerciţiului în cadrul schemei Contului de Profit şi Pierdere. Actualele

8
reglementări contabile care realizează armonizarea la IAS (în prezent în vigoare O.M.F.P.
nr.1752/2005 nu mai prezintă explicit acest indicator probabil tocmai din cauza faptului că
valoarea sa informaţională era limitată de caracterul său eterogen.. Cu toate acestea
apreciem că acest indicator este util fiind baza de pornire a indicatorilor tabloului soldurilor
intermediare de gestiune. Extracontabil, calculul său se poate realiza însă pe baza rubricilor
prezentate în actuala schemă.

Marja comercială (MC) reprezintă valoarea nou creată în sfera comerţului, de


societăţile de profil, cât şi de societăţile comerciale care desfăşoară activitate de comerţ prin
magazinele proprii. Indicatorul se determină ca diferenţă între veniturile rezultate din
vânzarea mărfurilor (VM) şi cheltuielile privind mărfurile (CD) adică:

MC = VM – CD

Relaţia dintre marja comercială şi vânzările de mărfuri poate fi pusă în evidenţă cu


ajutorul Ratei marjei comerciale (RMC) exprimă în fapt procentul de adaos comercial
MC
x100
practicat de întreprindere după relaţia: RMC = VM .
Indicatorul se poate determina pe baza rubricilor distincte existente în formularul de
Cont de Profit şi Pierdere.
Marja industrială (MI) reprezintă valoarea nou creată în activitatea productivă
desfăşurată de o societate comercială într-o perioadă determinată de timp respectiv durata
exerciţiului financiar. Marja industrială se determină ca diferenţă între producţia exerciţiului
(QE) pe de-o parte, şi cheltuielile cu materiile prime, materiale, energie (CM) şi lucrările
executate de terţi (Lt) pe de altă parte, astfel:
MI = QE – [ CM + Lt ]
Cheltuielile cu materialele prime şi materialele consumabile se calculează din rulajul
debitor al conturilor din grupa 60 mai puţin contul 607;
Lucrările şi serviciile executate de terţi se calculează din rulajelor debitoare ale
conturilor din grupele 61 şi 62.
Valoarea adăugată (VA) reprezintă valoarea nou creată de o societate comercială
în decursul unei perioade de timp determinate, de obicei durata exerciţiului financiar.
Valoarea adăugată se determină prin însumarea marjei comerciale şi a marjei industriale:

VA = MC + MI

9
Valoarea adăugată este cel mai sintetic indicator de rezultate care exprimă volumul
activităţii unei întreprinderi şi spre deosebire de ceilalţi indicatori de volum prezentaţi mai
sus prezintă avantajul de a reflecta doar volumul a ceea ce s-a produs efectiv în
întreprindere, făcând abstracţie de intrările din afară. Importanţa analizei valorii adăugate
rezultă din următoarele considerente:
1 valoarea adăugată reprezintă sursa principală de autofinanţare a rezultatului din
exploatare şi a rezultatului net al exerciţiului;
2 valoarea adăugată reprezintă sursa principală de autofinanţare a activităţii agenţilor
economici;
3 valoarea adăugată exprimă gradul de integrare economică a unei societăţi comerciale;
4 valoarea adăugată reprezintă sursa de remunerare a personalului;
5 valoarea adăugată constituie sursa de finanţare a obligaţiilor bugetare;
6 valoarea adăugată reprezintă sursa de sporire a rezervelor societăţii comerciale;
7 valoarea adăugată măsoară contribuţia firmei la obţinerea produsului intern brut al unei
ţări.
Având în vedere însă că baza de pornire la calculul valorii adăugate este producţia
exerciţiului, se preiau influenţele negative generate de evaluarea în mod diferit a
elementelor ce formează acest indicator.
Valoarea adăugată obţinută de o întreprindere se repartizează în general între cele
cinci părţi participante astfel:
1 personalul salariat care este retribuit prin salarii şi protecţia socială aferentă
(inclusiv impozitul pe salarii)
2 statul care percepe impozite şi taxe (inclusiv impozitul pe profit)
3 împrumutătorii care percep dobânzi
4 proprietarii şi conducătorii întreprinderii care au dreptul la o remunerare sperată
(dividende, participări la profit)
5 care poate beneficia de surse de autofinanţare (profit nerepartizat şi amortizări).
Analiza modului de repartizare a valorii adăugate este importantă pentru a pune în
evidenţă gradul de participare a fiecărei categorii la generarea valorii adăugate şi de
asemenea pentru a aprecia nivelul de retribuire în raport cu efortul depus. Pentru
aprecierea modului de distribuire a valorii adăugate se pot utiliza următoarele
rate/rapoarte :

Personal Cheltuieli cu personalul/Valoarea adăugată

10
Stat Impozite şi taxe/ Valoarea adăugată
Grup şi asociaţi Dividende şi repartizări/ Valoarea adăugată
Împrumutători Cheltuieli cu dobânzile/ Valoarea adăugată
Întreprindere Autofinanţare/ Valoarea adăugată

Agregarea valorii adăugate de la nivel de întreprindere până la nivelul economiei


naţionale formează indicatorul macroeconomic Produsul intern brut.

Rezultatul brut din exploatare (RBEXP) reprezintă rezultatul obţinut de o


societate comercială din activitatea de exploatare, rezultat neinfluenţat de volumul altor
venituri din exploatare respectiv de volumul amortizărilor şi provizioanelor. Acest indicator
relevă în formă brută capacitatea activităţii de exploatare de a genera profit.
Rezultatul brut din exploatare se poate determina prin 2 metode:
a) Pe baza valorii adăugate:

RBEXP = VA+SE – [ It + CP ]

 0 rezulta excedent brut din exp loatare


  0 rezulta deficit brut din exp loatare

 VA reprezintă valoarea adăugată calculată


 SE reprezintă subvenţiile de exploatare care se preiau din rulajul creditor al
contului 741
 It reprezintă cheltuielile cu alte impozite, taxe şi vărsăminte asimilate şi se
calculează din rulajul debitor al contului 635
 CP reprezintă cheltuielile cu personalul şi protecţia socială şi se preiau din rulajul
debitor al conturilor din grupa 64.
b) Directă:

RBEX Venituri din – Cheltuieli din  0 rezulta excedent brut din exp loatare
  0 rezulta deficit brut din exp loatare
P= exploatare exploatare (numai 
(numai din din grupele 60-64)
grupele 70-74)

Rezultatul din exploatare (RE) diferă de rezultatul brut al exploatării prin faptul că

11
ţine cont de politica de amortizări şi provizioane promovată de întreprindere deci este un
rezultat net de amortizări şi provizioane. Se calculează prin 2 metode:
a) Pe baza rezultatului brut din exploatare:

RE = RBE + Alte venituri din exploatare +Venituri de exploatare din


amortizări şi provizioane - Alte cheltuieli de exploatare - Cheltuieli de exploatare
din amortizări şi provizioane

 Alte venituri din exploatare se determină din rulajul creditor al conturilor din grupa
75
 Venituri de exploatare din amortizări şi provizioane se determină din rulajul
creditor al contului 781
 Alte cheltuieli de exploatare se determină din rulajul creditor al conturilor din grupa
65
 Cheltuieli de exploatare din amortizări şi provizioane se determină din rulajul
creditor al conturilor din grupa 68.

b) Ca diferenţă între veniturile din exploatare (VE) şi cheltuielile de exploatare (CE), adică:

RE = VE - CE
RE poate fi

  0 rezulta profit din activitatea de exp loatare


 0 rezulta pierdere din activitatea de exp loatare

Rezultatul de exploatare evidenţiază rentabilitatea economică a unei întreprinderi,


corespunzătoare activităţii normale, curente a acesteia.
Analiza indicatorilor prezentaţi care exprimă performanţele activităţii de exploatare se
poate adânci utilizând procedeele deterministe punând astfel în evidenţă cauzele ce au
determinat pe de-o parte sporirea/diminuarea veniturilor iar pe de altă parte
sporirea/diminuarea cheltuielilor.
Indicatori calculaţi pe baza Notei 4 „Analiza rezultatului din exploatare” (unde
este valabilă o structurare a cheltuielilor după funcţie).
Costul bunurilor vândute şi al serviciilor prestate (Cbs) care cuprinde costurile
directe şi indirecte componente ale costului total al bunurilor şi serviciilor efectuate de
întreprindere.

12
Cbs= Cab + Caaux + Ci, unde
1 Cab reprezintă cheltuielile activităţii de bază;
2 Caaux reprezintă cheltuielile activităţii auxiliare;
3 Ci reprezintă cheltuielile indirecte de producţie.

Rezultatul brut aferent cifrei de afaceri nete (RBCAN) pune în evidenţă


rezultatul brut aferent activităţii de producţie.

RBCAN = CAN – Cbs

Rezultatul din exploatare va reflecta performanţa activităţii de exploatare iar în


ipoteza unei clasificări a cheltuielilor după destinaţie, acesta va fi format astfel:

RE = RBCAN – Cd – Cga + Avex, unde


1 Cd reprezintă cheltuielile de desfacere
2 Cga reprezintă cheltuielile generale de administraţie
3 Avea reprezintă alte venituri din exploatare

Rezultatul din exploatare determinat prin cele două modalităţi bineînţeles că va fi


acelaşi diferenţa constând doar în modul de obţinere al său.

13
Nivelul financiar

Evidenţiază, prin indicatorii „rezultatul brut financiar” şi „rezultatul financiar”, fluxurile


financiare ale unei societăţi comerciale.
Rezultatul brut financiar (RBF) reprezintă rezultatul intermediar, obţinut de o
societate comercială, neinfluenţat de provizioane şi amortizări financiare:
RBF = VFB – CFB
1 VFB reprezintã venituri financiare (mai puţin venituri din provizioane) şi se
determină din rulajul creditor al conturilor din grupa 76
2 CFB reprezintã cheltuieli financiare (mai puţin amortizãrile şi provizioanele) şi se
determină din rulajul creditor al conturilor din grupa 66.

Rezultatul financiar (RF) se determină ca diferenţă între veniturile financiare (VF)


şi cheltuielile financiare (CF), adică:

RF = VF - CF

  0 rezulta profit din activitate a financiara


 0 rezulta pierdere din activitate a financiara

a) Veniturile financiare (VF) se obţin din rulajele creditoare ale conturilor din grupele
76 şi 786
b) Cheltuielile financiare (CF) se obţin din rulajele debitoare ale conturilor din
grupele 66 şi 686
Atât profitul cât şi pierderea din activitatea financiară pot fi interpretate favorabil
respectiv nefavorabil, după caz, în funcţie de oportunităţile de investire de care beneficiază
întreprinderea la un moment dat şi modul de a accepta sau nu finanţarea lor prin credit,
astfel:

a) Dacă rezultatul financiar (RF) reprezintă un profit situaţia poate fi:


1 Favorabilă, deoarece sursele băneşti disponibile au fost plasate eficient în
activităţi de natură financiară obţinând venituri care depăşesc costurile de finanţare a
exploatării.
2 Nefavorabilă atunci când rezultatul pozitiv se datorează neangajării în
operaţiuni de creditare pierzându-se astfel diverse oportunităţi de investiţii.
b) Dacă rezultatul financiar (RF) reprezintă o pierdere situaţia poate fi:

14
1 Favorabilă atunci când rezultatul negativ de natură financiară este compensat
de surplusul de efecte pe care l-a generat creditarea pentru activitatea de exploatare.
2 Nefavorabilă atunci când rentabilitatea investiţiilor procurate prin creditare este
sub nivelul costurilor ocazionate de creditare. Cu alte cuvinte se obţine în această situaţie un
efect de levier negativ iar creditarea a prejudiciat practic rezultatele exploatării.

Rezultatul financiar este un indicator care măsoară rentabilitatea unei întreprinderi la


nivelul fluxurilor financiare. Printr-o analiză detaliată, în dinamică se pot explica modificările
de rezultate financiare prin prisma modificărilor diferitelor categorii de venituri şi cheltuieli.

Nivelul extraordinar

Pune în evidenţă prin indicatorii săi specifici fluxurile financiare din operaţiuni
extraordinare. Aceste tip de operaţiuni are un caracter întâmplător, el neputând fi luat în
calcul pentru aprecierea performanţelor viitoare ale unei întreprinderi, atât datorită lipsei de
regularitate în apariţii cât şi datorită sensului foarte alternant (profit/pierdere).
Conceptul de „extraordinar” a fost introdus odată cu începuturile procesului de
armonizare contabilă la Standardele Internaţionale de Contabilitate (prin O.M.F.P. nr.
403/1999 el înlocuind vechiul concept de „excepţional”. Cele două noţiuni diferă între ele
atât ca formă respectiv titulatură dar mai ales ca fond, diferenţele referindu-se la:
Activitatea excepţională, deşi caracteriza operaţiuni întâmplătoare cum ar fi: cedarea
de active, amenzi şi penalităţi, donaţii primite sau oferite, aceste activităţi erau în strânsă
legătură cu activitatea de exploatare a întreprinderii motiv pentru care noile reglementări le
includ în apanajul activităţii extraordinare.
Activitatea extraordinară cuprinde veniturile şi cheltuielile prilejuite de evenimente
extraodinare de genul calamităţilor sau a altor evenimente extraodinare.
Rezultatul brut extraordinar (RBEX) este un indicator parţial care arată volumul
rezultatelor obţinute din activitatea extraordinară neinfluenţate de amortizările şi
provizioanele specifice acestor fluxuri financiare:
RBEX = VBEX – CBEX
în care:

1 VBEX reprezintã venituri extraordinare (mai puţin venituri din provizioane) şi se


determină din rulajul creditor al conturilor din grupa 77
2 CBEX reprezintã cheltuieli extraordinare (mai puţin amortizările şi provizioanele) şi

15
se determină din rulajul creditor al conturilor din grupa 76.

Rezultatul extraordinar (REX) se calculează ca diferenţă între veniturile


excepţionale (VEX) şi cheltuielile excepţionale (CEX), şi anume:

REX = VEX - CEX

  0 rezulta profit din activitatea extraordinara


 0 rezulta pierdere din activitatea extraordinara

1 Veniturile extraordinare (VEX) se obţin din rulajele creditoare ale conturilor din
grupele 77 şi 787
2 Cheltuielile extraordinare (CEX) se obţin din rulajele debitoare ale conturilor din
grupele 67 şi 687
Rezultatul extraordinar este un indicator care evidenţiază rentabilitatea unei
întreprinderi la nivelul fluxurilor extraordinare. În mod analog se poate realiza o analiză
detaliată în dinamică şi pentru această categorie de rezultate.

Nivelul global

Evidenţiază cu ajutorul unui sistem de indicatori rezultatele intermediare şi finale ale


activităţii agenţilor economici. În acest sens distingem:
1 rezultatul curent
2 rezultatul brut total;
3 rezultatul brut înainte de deducerea dobânzilor şi impozitului pe profit;
4 rezultatul net al exerciţiului;
5 capacitatea de autofinanţare;
6 capacitatea de autofinanţare netă.

Rezultatul curent (RC) indică rezultatul aferent activităţilor cu caracter repetitiv şi


normal care exprimă sintetic performanţele economice şi financiare ale întreprinderii. El nu
include rezultatele extraordinare care au o natură neobişnuit, normale, repetitive.

RC = REXP + RF

Rezultatul brut total (RBT) este un indicator intermediar care pune în evidenţă

16
fluxurile financiare aferente rezultatelor neinfluenţate de alţi factori decât cei proprii
activităţii desfăşurate de firmă. Indicatorul se determină prin însumarea valorii indicatorilor
aferenţi celor trei niveluri precedente şi anume:

RBT = RBEXP + RBF + RBEX

Rezultatul brut al exerciţiului însumează nivelul general de performanţă al celor


trei paliere ale activităţii întreprinderii.

RBE = RE + RF + REX = RC + REX, unde

1 RBE reprezintă rezultatul exploatării


2 RF reprezintă rezultatul financiar
3 REX reprezintă rezultatul extraordinar
4 RC reprezintă rezultatul curent (format din rezultatul exploatării la care se adaugă
rezultatul financiar)

Rezultatul brut înainte de deducerea dobânzilor şi impozitului pe profit este


un indicator intermediar care măsoară volumul rezultatului obţinut de o firmă şi neinfluenţat
de cheltuielile cu plata dobânzilor:
RBDI = RE + CHD

1 CHD reprezintă cheltuielile privind dobânzile care se preiau din rulajele debitoare
ale contului 666

Rezultatul net al exerciţiului (RNE) este un indicator care evidenţiază rezultatul


final al activităţii unei firme după plata impozitului pe profit:

RNE = RBE – IP

2 IP reprezintă impozitul pe profit.

Capacitatea de autofinanţare (CAF) a unei societăţi comerciale reflectă potenţialul


financiar de creştere economică a întreprinderii, respectiv sursa internă de finanţare
generată de activitatea industrială şi comercială a acesteia destinată să asigure:

17
3 finanţarea unor nevoi ale gestiunii curente
4 creşterea fondului de rulment
5 finanţarea totală sau parţială a noilor investiţii
6 rambursarea împrumuturilor contractate
7 remunerarea capitalurilor investite.

Capacitatea de autofinanţate se poate determina cel mai uşor astfel:

CAF = RNE + Amp - Vpv, unde

1 RNE reprezintă rezultatul net al exerciţiului;


2 Amp reprezintă cheltuieli cu amortizarea şi provizioanele calculate, elemente care
se preiau din rulajul debitor al conturilor din grupa 68.
3 Vpv reprezintă venituri din provizioane care se preiau din rulajul creditor al
conturilor din grupa 78.

Schema Contului de Profit şi Pierdere armonizat la IAS (conform reglementărilor


actuale, aprobate prin O.M.F.P. nr. 1752/2005) nu pune în evidenţă distinct veniturile şi
cheltuielile calculate privind amortizările şi provizioanele ci ele apar sub formă netă, ca
ajustări ale elementelor de cheltuieli (cu semnul „+” dacă valoarea cheltuielilor calculate din
amortizări şi provizioane este mai mare decât veniturile din provizioane şi cu semnul „-” în
situaţia inversă).
În consecinţă pentru calculul capacităţii de autofinanţare se va apela la informaţiile
din note.
Autofinanţarea (AF) are un caracter mai sintetic şi exprimă doar volumul potenţial
de resurse financiare proprii care rămâne efectiv în întreprindere după retribuirea tuturor
categoriilor de participanţi la activitatea acesteia.
Autofinanţarea se măsoară pornind de la capacitatea de autofinanţare din care se
deduc dividendele plătite în timpul exerciţiului.

Autofinanţarea = CAF – Div, unde

Div reprezintă dividendele vărsate se preiau din Nota 3 „Repartizarea profitului”.

Politica de autofinanţare se măsoară prin ratio-uri rate şi anume:

18
Rata de autofinanţare Autofinanţarea
 .100
a imobilizărilor corporale Imobilizări corporale

Indicatorul măsoară partea finanţării proprii în investiţiile corporale ale perioadei.

Rata de autofinanţ are a Autofinanţ area


investiţii lor corporale  .1000
şi financiare Imobilizăr i corporale şi
financiare achiziţion ate

Indicatorul măsoară gradul de acoperire şi investiţiile directe (corporale) şi indirecte


(participaţii) din finanţarea proprie.

Rata de autofinanţ are a Autofinanţ area


 .100
nevoilor globale de finanţare Nevoi de finantare globală

Nevoia de finanţare globală este dată de totalitatea investiţiilor în imobilizări


corporale şi financiare şi nevoile legate de activitatea de exploatare (variaţia NFR) şi
financiară (rambursarea datoriilor).
După părerea noastră, autofinanţarea este o componentă a strategiei financiare care
se adoptă în cadrul politicii financiare generale a unei firmei.
Autofinanţarea permite atât menţinerea în afaceri a firmei (prin consolidarea
structurii sale financiare) cât şi expansiunea afacerilor (prin extinderea portofoliului de
afaceri).
Autofinanţarea îmbracă două forme şi anume:
1 autofinanţarea afacerilor curente;
2 autofinanţarea afacerilor viitoare.
Autofinanţarea afacerilor curente reprezintă operaţiunea de alocare a resurselor
financiare pentru derularea activităţii curente (circuitul financiar curent).
Autofinanţarea afacerilor viitoare presupune alocarea resurselor financiare pentru
lucrări de investiţii, care în viitor, vor permite o dezvoltare generală a firmei.
În termeni absoluţi, mărimea resurselor de autofinanţare este evidenţiată de
capacitatea de autofinanţare netă şi se calculează ca diferenţă între capacitatea de
autofinanţare (CAF) şi dividendele repartizate acţionarilor (DIV), adică:
CAFN = CAF - DIV

19
  0 rezulta excedent de resurse

 0 resursele au fost distribuite int egral actionarilor sub forma de dividende

  0 rezulta resurse distribuite nejustificat

În mărime relativă, autofinanţarea se exprimă cu ajutorul următorilor indicatori:


rata autofinanţării generale (RAF):

CAFN
R AF  .100
AI  NFR

rata autofinanţării afacerilor curente (RAC):

CAFN
R AC  .100
NFR

rata autofinanţării afacerilor viitoare (RAV):

CAFN
R AV  .100
AI

Analiza evoluţiei performanţelor financiare

Şi în cazul analizei performanţelor financiare furnizate în cea mai mare parte de


Contul de Profit şi Pierdere se utilizează tehnici şi instrumente a căror procedură se bazează
pe faptul că rezultatul şi celelalte componente ale Contului de Contului de profit şi Pierdere
sunt comparabile în timp şi spaţiu.
În acest sens se vor calcula indicii cu baza în lanţ ai valorilor aferente posturilor din
Contul de Profit şi Pierdere punându-se astfel în evidenţă creşterile sau scăderile de
performanţe de la un an la altul. De asemenea pentru informaţii suplimentare se poate
proceda la determinarea unei astfel de evoluţii luând de această dată o clasificare a
cheltuielilor după funcţii aşa cum este redată ea în cadrul Notei 4 „Analiza rezultatului din
exploatare”
Utilizând procedeele specifice analizei economico-financiare se poate pune în evidenţă
măsura în care factorii de intercondiţionare ai performanţelor financiare de la diferite nivele
au influenţat valoarea respectivei performanţe financiare.
Pentru realizarea unei comparabilităţi a performanţelor financiare pertinente trebuie
să se ţină seama de efectele inflaţiei. În acest sens IAS 29 „Ajustarea la inflaţie” precizează

20
că situaţiile financiare bazate fie pe modelul costului istoric, fie pe cel al costului curent sunt
utile doar dacă sunt exprimate în raport cu unitatea de măsură curentă, de la data bilanţului.
Această operaţiune vizează de fapt evaluarea tuturor datelor din situaţiile financiare la
preţurile curente la data întocmirii situaţiilor financiare. Atunci când nu se aplică însă
prevederile IAS 29 se impune eliminarea din rezultate a inflaţiei astfel încât analiza să se
facă pe baza unor valori comparabile.
Pentru deflatarea performanţelor pot fi utilizate o serie de mărimi ce aproximează
inflaţia cum ar fi:
1 indicele de creştere a preţurilor la unitatea analizată (ip);
2 rata medie a inflaţiei din sectorul de activitate al unităţii analizate (rsi);
3 rata medie a inflaţiei în economie (ri).
Utilizând de exemplu indicele de creştere a preţurilor la unitatea analizată (ip) ca
indice pentru deflatarea performanţelor, modalitatea concretă de deflatare ar consta în:
R
Rc 
1  ip , unde
1 Rc reprezintă rezultatele întreprinderii exprimate în preţuri comparabile;
2 R reprezintă rezultatele întreprinderii exprimate în preţuri constante;
3 ip reprezintă indicele de creştere a preţurilor la unitatea analizată.

În acest mod performanţele întreprinderii vor reflecta într-adevăr efortul propriu al


întreprinderii iar compararea acestora pentru a evidenţia evoluţia de la un exerciţi la altul
este astfel posibilă.

Analiza structurală a performanţelor financiare

Pentru o interpretare pertinentă însă a mutaţiilor produse în cadrul performanţelor


financiare furnizate prin situaţiile financiare se impune de asemenea o analiză în dinamică a
structurii performanţelor financiare.
Prin analiza structurii valorii posturilor din contul de profit şi pierdere se pun în
evidenţă mutaţiile structurale privind performanţele financiare pe de-o parte luând ca bază
de comparaţie rezultatul brut al exerciţiului ca indicator sintetic global ce reflectă
performanţa întregii activităţi iar pe de altă parte nivelul veniturilor totale, ca indicator
sintetic ce exprimă volumul întregii activităţi.

21
Analiza structurală a contului de profit şi pierdere pe baza rezultatului brut
al exerciţiului
În acest sens se va determina ponderea fiecărei categorii de rezultate în rezultatul
brut al exerciţiului (RE), şi anume:
1 ponderea rezultatului exploatării (GE):

RE
GE  .100
RBE

2 ponderea rezultatului financiar (GF):

RF
GF  .100
RBE

3 ponderea rezultatului extraordinar (GEX):

REX
GEX  .100
RBE

Din evaluarea acestor indicatori rezultă contribuţia subactivităţii la eficienţa (sau


ineficienţa) generală a societăţii comerciale, pe de-o parte, respectiv importanţa fiecărei
subactivităţi în totalul activităţii desfăşurate într-un exerciţiu financiar de către societatea
comercială, pe de altă parte.

Analiza structurală a contului de profit şi pierdere pe baza veniturilor totale

Un aspect esenţial al analizei Contului de Profit şi Pierdere îl constituie analiza pe


verticală a profitului pe o perioadă de 3-5 ani, care pune în evidenţă raporturile în care se
află diferitele componente faţă de veniturile totale ale exerciţiului financiar. O modalitate de
evidenţiere a acestor raporturi este prezentată în tabelul de mai jos.

Indicatori Structura contului de profit şi pierdere


Venituri totale 100 %
Cheltuieli totale ( %)
Rezultatul brut al exerciţiului +( - ) %
Venituri din exploatare +%

22
Cheltuieli de exploatare (%)
Rezultatul financiar +( -) %
Rezultatul curent al exerciţiului +( - ) %
Venituri extraordinare +%
Cheltuieli extraordinare ( %)
Rezultat extraordinar +( ) %
Impozit pe profit ( )%
Rezultatul net +( ) %

Fig. 1. Analiza pe verticală a contului de profit şi pierdere

Analiza structurală a fiecărui rezultat parţial (intermediar) va evidenţia contribuţia


fiecărei componente la obţinerea rezultatului economic respectiv.

1.2 Analiza performanţelor pe baza ratelor de rentabilitate

Ratele de rentabilitate semnifică în mărime relativă contribuţia indicatorilor de


rezultate la exprimarea performanţelor financiare ale unei întreprinderi. În acest sens în
calculul ratelor de rentabilitate trebuie să se pornească de la motivaţia pe care investitorul a
avut-o în momentul plasării capitalului şi anume aceea de a recupera după o anumită
perioadă de timp acest capital împreună cu un surplus care să-i justifice decizia de investire.
În consecinţă se poate vorbi despre rentabilitate doar atunci când se compară surplusul
obţinut de investitor cu capitalul investit adică se compară „un efect” cu „un efort”.

23
Analiza rentabilităţii financiare

Rentabilitatea financiară reflectă gradul de remunerare a capitalului investit într-o


întreprindere de către proprietari. Se poate exprima atât ca formă absolută, ca mărime a
profitului net cât şi sub formă relativă, ca rată de rentabilitate.
Rentabilitatea financiară exprimată ca mărime a profitului net, reprezintă
partea din profitul brut al exerciţiului ce rămâne întreprinderii după plata impozitului pe
profit.

RNE = RBE - Ip
Ip = PI x 25 %
PI= RBE – VNI + CHND, unde
4 RNE reprezintă rezultatul net (contabil) al exerciţiului
5 RBE reprezintă rezultatul brut al exerciţiului
6 Ip reprezintă impozitul pe profit calculat
7 PI reprezintă profitul impozabil
8 VNI reprezintă veniturile neimpozabile
9 CHND reprezintă cheltuielile nedeductibile

Rentabilitatea financiară exprimată ca Rată a rentabilităţii capitalului


propriu sau Rata rentabilităţii financiare (ROE – din engleză „return on common equity”)
determinată ca raport între profitul net obţinut de întreprindere (PN) şi capitalul propriu
(CPR) astfel:

RNE
x100
ROE rezulta din urmatoarea formula CPR , unde

Importanţa analizării acestui indicator rezultă cel puţin din următoarele considerente:
1 indicatorul arată gradul de alocare a fondurilor acţionarilor în activitatea curentă,
pe de-o parte, precum şi eficienţa cu care firma angajează capitalul acţionarilor în afaceri, pe
de altă parte.
2 Indicatorul reflectă totodată rentabilitatea capitalului acţionarilor constituind o
măsură a capacităţii întreprinderii de a plăti dividendele cuvenite acestora;
3 indicatorul permite estimarea câştigurilor pe o unitate de capital investit în acţiuni

24
sau profitul care revine proprietarilor pentru investiţiile făcute în firmă.
Rentabilitatea capitalului propriu este o măsură combinată a trei factori şi anume: a
profitabilităţii (marja profitului MP), a vitezei de rotaţie a activelor (KAB) şi a levier-ului
financiar (LF). Ca urmare fluctuaţiile ratei capitalului propriu pot fi explicate printr-o analiză
factorială pe cei trei factori menţionaţi în cadrul modelului de analiză:

RNE CAN AB
ROE  MP x K AB x LF  x x
CAN AB CPR

Marja profitului (MP)


Un indicator specific performanţei financiare este marja profitului care constituie o
funcţie atât a levierului de exploatare cât şi a valorii adăugate de-a lungul ciclului de
producţie, sintetizând câştigurile obţinute din fiecare unitate monetară rezultată din vânzări.
Viteza de rotaţie a activelor (KAB).
Ratele de performanţă a activelor pun în evidenţă veniturile şi cheltuielile firmei fie
pentru a analiza structura costurilor, fie pentru a corela performanţa vânzărilor cu volumul
activelor utilizate în realizarea vânzărilor. În general, viteza de rotaţie a activelor se
focalizează asupra următoarele ţinte:
1 în primul rând, indicatorul pune în evidenţă eficienţa cu care sunt utilizate activele;
2 în al doilea rând, indicatorul reflectă vânzările realizate de fiecare unitate monetară
a activelor utilizate;
3 în al treilea rând, indicatorul prezintă în mod sintetic activele întreprinderii.
Levierul financiar
În literatura de specialitate indicatorul mai este denumit şi „Factorul de multiplicare a
capitalului propriu”. O întreprindere utilizează atât fonduri atrase şi împrumutate de diverse
tipuri cât şi fondurile acţionarilor. Utilizarea acestor două categorii de resurse va depinde de
atitudinea companiei faţă de risc şi faţă de rentabilitate. În acest sens levierul financiar
evidenţiază următoarele aspecte:
1 în primul rând reflectă dimensiunea fondurilor utilizate de întreprindere pentru
finanţarea activelor;
2 în al doilea rând indicatorul prezintă în mod sintetic datoriile întreprinderii;
3 în al treilea rând levierul financiar constituie o funcţie a structurii activelor;
4 în al patrulea rând levierul financiar reprezintă o măsură a încrederii creditorilor în
capacitatea întreprinderii de a genera suficient numerar şi echivalente ale numerarului
necesar pentru rambursarea împrumuturilor.

25
Analiza ratelor rentabilităţii economice

Ratele rentabilităţii economice pun în evidenţă contribuţia resurselor controlate de


întreprindere la generarea de rezultate. Se pot determina în forme variate astfel:
Rata rentabilităţii economice (RRE) pune în evidenţă contribuţia elementelor
patrimoniale la obţinerea de rezultate şi se determină ca raport între rezultatul brut al
exerciţiului (RBE) şi totalul activului bilanţier (AB):

RBE
RRE  x100
AB

Rata rentabilităţii activelor (ROA-din engleză „return on assets”) măsoară


gradul de rentabilitate al întregului capital investit în firmă. Se determină ca raport între
rezultatul net al exerciţiului (RNE) şi totalul activelor întreprinderii (AB).

RNE
ROA  x100
AB

Rata profitabilităţii activelor (BEP – din engleză „basic earnings power”) se


determină ca raport între rezultatele obţinute de întreprindere înainte de deducerea
dobânzilor şi a impozitului pe profit (RBDI) şi totalul activelor întreprinderii.

RBDI
BEP  x100
AB

Rata profitabilităţii vânzărilor (ROS- din engleză „return on sales”) numită şi


marja profitului arată profitul net obţinut la 100 de lei cifră de afaceri netă reflectând astfel
contribuţia veniturilor la întărirea capacităţii de autofinanţare a întreprinderii.

RNE
ROS  x100
CAN

Notă !

26
O.M.F.P. nr.1752/2005, în cadrul Notei 9 denumeşte acest indicator „ Marja brută din
vânzări” cu următoarea relaţie de calcul:

Profit brut din vanzari


Marja bruta din vanzari  x100
Cifra de afaceri neta

Precizăm faptul ca pentru compararea întreprinderilor aparţinând aceluiaşi sector


analiştii financiari utilizează pentru calculul acestui indicator, la numărător Profitul brut din
vânzări pentru a elimina efectul cotelor de impozitare diferite. Din aceste motive şi O.M.F.P.
nr.1752/2005 se raliază aceleiaşi abordări.
Rata rentabilităţii generale (RRG) pune în evidenţă eficienţa consumului total de
resurse prin raportarea rezultatului net obţinut la cheltuielile totale ale întreprinderii.

RNE
RRG  x100
CT

Analiza rentabilităţii investiţiilor de capital

Ratele rentabilităţii investiţiilor de capital sunt cele mai cuprinzătoare măsuri ale
performanţei unei firme deoarece ele reflectă influenţa coroborată a ratelor financiare de risc
şi rentabilitate. Dintre aceste rate menţionăm:
Rezultatul pe acţiune (EPS - din englezul „earning per share”) arată cât
rezultat net produce o acţiune în decursul unui exerciţiu financiar.
Se determină sub două forme: câştigul pe acţiune de bază şi câştigul pe acţiune
diluat. Datorită importanţei acestui indicator în cadrul situaţiilor financiare, I.A.S.C. a
elaborat un standard în acest sens şi anume IAS 33 „Rezultatul pe acţiune”.
Rezultatul pe acţiune – de bază (BEPS - din englezul „basic earning per
share”) se determină ca raport între rezultatul net al exerciţiului corespunzător acţionarilor
comuni (RNE) şi numărul de acţiuni comune emise şi aflate în circulaţie în exerciţiul
respectiv.

RNE
BEPS 
NA

Acţiunea comună este un instrument de capital subordonat celorlalte clase de capital.

27
În scopul determinării rezultatului pe acţiune de bază, rezultatul net al exerciţiului
corespunzător acţionarilor comuni se determină astfel:

Profit net corespunzător acţionarilor = Profit net al exerciţiului – Dividende


comuni = preferenţiale

Pierderea netă corespunzătoare = Pierderea netă a exerciţiului + Dividende


acţionarilor comuni = preferenţiale

Acţiunile preferenţiale se deosebesc de acţiunile comune prin faptul că , în timp ce


acţiunilor comune le sunt acordate dividende fluctuante în funcţie de rezultatul exerciţiului,
acţiunilor preferenţiale le sunt aferente dividende fixe, indiferent de rezultatul obţinut de
societate.
Pentru calcularea rezultatului pe acţiune de bază, numărul acţiunilor comune este
egal cu media ponderată a acţiunilor comune, în circulaţie în exerciţiul respectiv.
Media ponderată a acţiunilor comune în circulaţie în exerciţiul respectiv reflectă
posibilitatea ca valoarea capitalului social să fi variat în acel exerciţiu, ca urmare a fluctuaţiei
numărului de acţiuni aflate în circulaţie la un moment dat. Această medie reflectă numărul
de acţiuni comune aflate în circulaţie la începutul exerciţiului, ajustat cu numărul de acţiuni
răscumpărate sau emise în perioada respectiv, înmulţit cu un factor de ponderare a timpului.
Factorul de ponderare a timpului este egal cu numărul de zile în care acţiunile respective s-
au aflat în circulaţie, ca o cotă din numărul total de zile ale perioadei.
Pentru exemplificare vom considera următoarele date:
Societatea comercială Alfa obţine la sfârşitul exerciţiului N un profit de 10.000.000
mii lei. Nu există acţiuni preferenţiale şi implicit dividende preferenţiale acordate. În cursul
exerciţiului N au loc următoarele fluctuaţii ale numărului acţiunilor aflate în circulaţie.

Data Explicaţii Acţiuni Acţiuni Acţiuni în


emise răscumpărate circulaţie
1.01.N Sold iniţial 8.000.000 - 8.000.000
1.05. N Rascumpărare - 500.000 7. 500.000
acţiuni
1.08. N Emisiune acţiuni 1.000.000 - 8.500.000
31.12. Sold final 9.000.000 500.000 8.500.000
N

28
Calculul mediei ponderate:

 4  3  7
 8.000.000 x    7.500.000 x    8.500.000 x '  9.500.000actiuni
 12   12   12 

Câştigul pe acţiune comune de bază va fi:

10.000.000.000
BEPS   1052,63 lei/actiun e
9.500.000

Rezultatul pe acţiune – diluat (DEPS - din englezul „diluate earning per


share”) presupune ajustarea profitului net corespunzător acţionarilor comuni (obţinând
rezultatul net ajustat - (RNEa) şi a mediei ponderate a acţiunilor în circulaţie (obţinând
media ponderată ajustată – NAa) cu influenţele tuturor acţiunilor comune potenţiale
diluante.

RNEa
DEPS 
NAa

Ajustările se realizează astfel:


1 profitul net aferent exerciţiului corespunzător acţiunilor comune se măreşte cu
valoarea după impozitare a dividendelor şi a dobânzii recunoscute în acel exerciţiu, aferentă
acţiunilor comune diluante şi ajustată în funcţie de orice alte modificări ale veniturilor sau
cheltuielilor determinate de conversia acţiunilor comune potenţiale diluante;
2 media ponderată a acţiunilor comune în circulaţie se măreşte cu media ponderată a
acţiunilor comune suplimentare care s-ar afla în circulaţie în cazul conversiei tuturor
acţiunilor comune potenţiale diluante.
Necesitatea calculării unui astfel de indicator rezidă din faptul că societăţile întră
uneori în angajamente de emisiune de acţiuni în viitor, care modifică rezultatul pe acţiune de
bază. Acţiunile comune potenţiale diluante se consideră a fi convertite în acţiuni comune la
începutul perioadei sau la data emisiunii acţiunilor comune potenţiale. Acţiunile comune
potenţiale trebuie tratate ca diluante numai atunci când conversia lor în acţiuni comune va
duce la o scădere a profitului net pe acţiune rezultat din activităţile întreprinderii.
Pentru exemplificare vom considera următoarele date:

29
Presupunem acelaşi exemplu prezentat anterior cu următoarele completări:
Societatea are emise obligaţiuni convertibile cu o dobândă de 10 %, plătibile în 10
ani, cu o valoare a principalului de 50.000.000 lei. Acestea au fost vândute în anul N pentru
1000 lei/obligaţiune. Dobânda este plătibilă la sfârşit de an. Fiecare acţiune este convertibilă
la dispoziţia acţionarului în 20 de acţiuni comune. În anul N-1 nu a fost convertită nici o
obligaţiune. Întreaga emisiune a fost convertită la 1.04.N. Rata impozitului pe profit este de
25 %.
Rezultatul pe acţiune de bază – BEPS în anul N este
10.000.000.000
BEPS   1052,63 lei/actiun e
9.500.000
Cheltuielile cu dobânzile în anul N aferente componentei de îndatorare a obligaţiunilor
convertibile: 50.000.000 x 10 % x 3/12 = 1.250.000 lei
Impozit pe profit aferent cheltuielilor cu dobânzile: 1.250.000 x 25 %= 312.500 lei.
Rezultatul net al exerciţiului ajustat luat în calculul rezultatului net pe acţiune diluat
(RNEa) se determină astfel:
RNEa = RNE + Cheltuieli cu dobânzile aferente obligaţiunilor - Impozitul pe profit
aferent
= 10.000.000.000 + 1.250.000 -312.500 = 10.000.937.500 mii lei.
50.000.000
 50.000
Obligaţiunile convertibile 1000 obligaţiuni.
Numărul acţiunilor comune rezultate din conversia obligaţiunilor: 50.0000 x 20 =
1.000.000 acţiuni
Numărul acţiunilor comune utilizate în calculul rezultatului pe acţiune diluat (NAa):
9.500.000 +1.000.000 = 10.500.000 acţiuni
Rezultatul pe acţiune diluat se obţine astfel:
RNEa 10.000.937.500
DEPS    952,47
NAa 10.500.000 lei/acţiune.
Reglementările contabile româneşti valabile pentru unităţile mari care aplică O. M.F.P.
nr.94/2001 solicită prezentarea unui astfel de indicator în schema generală a contului de
profit şi pierdere.
Dacă profitul net se reinvesteşte trendul indicatorului trebuie să fie crescător.
Coeficientul de capitalizare bursieră (P/E - din englezul „price-to-earnings-
ratio”) arată cât de mult sunt dispuşi investitorii să plătească pentru o unitate monetară de
profit raportat. Se determină ca raport între preţul de piaţă al unei acţiuni (PPA) şi profitul
pe acţiune (EPS).

30
PPA
P/E 
EPS

Ratele P/E sunt mari pentru firmele care au perspective mai bune de dezvoltare (în
condiţii economice şi de risc constante) şi sunt mici pentru firmele a căror activitate este
riscantă. Cu alte cuvinte indicatorul exprimă încrederea investitorilor în viitorul întreprinderii
respective.
Raportul dintre valoarea de piaţă şi valoarea contabilă a unei acţiuni (MTBR -
din englezul „market-to-book-ratio”). Reprezintă o altă rată importantă deoarece indică
valoarea pe care pieţele financiare o conferă conducerii unei întreprinderi.

PPA
MTBR 
VCA

Valoarea contabilă reprezintă costul istoric al acţiunilor ordinare reprezentând părţi


din capitalul social al întreprinderii. Preţul de piaţă al unei acţiuni este afişat la bursă. O
întreprindere bine condusă şi cu suficiente posibilităţi de creştere ar trebui să aibă o valoare
de piaţă mai mare sau cel puţin egală cu valoarea contabilă a capitalului său social. Dacă
economia este în recesiune raportul este subunitar chiar dacă echipa managerială este bună.
În concluzie valorile acestei rate depind atât de factorii economici generali (sau
valabili pentru sectorul respectiv) cât şi de factori care aparţin numai de firma respectivă, ca
entitate distinctă.
Randamentul dividendelor (RDIV) măsoară câştigul încasat de acţionari în urma
investiţiilor în acţiunile întreprinderii. Se determină ca raport între dividendul pe acţiune
(DIVA) şi preţul de piaţă al unei acţiuni (PPA).
DIVA
RDIV  x100
PPA , unde

DIV
DIVA 
NA
1 DIV reprezintă valoarea dividendelor repartizate acţionarilor într-un exerciţiu
financiar.
2 NA reprezintă numărul de acţiuni comune emise aflate în circulaţie
Randamentul dividendelor reprezintă o măsură a câştigului încasat de acţionari în
urma investiţiilor în acţiunile întreprinderii. Dacă nu se acordă dividende atunci trendul

31
trebuie să fie descendent.
Rata de acoperire a dividendelor (RADIV) măsoară proporţia în care profitul net
(RNE) este distribuit acţionarilor sub formă de dividende (DIV).

RNE
RADIV  x100
DIV

Indicatorul „β” sau riscul de piaţă ( β ) reprezintă volatilitatea (oscilaţiile în plus


sau minus) a preţului acţiunilor unei firme (a) faţă de volatilitatea acţiunilor altor firme (n).
În mod practic indicatorul β se poate determina sub următoarele forme:
1 Prin comparaţia abaterii medii procentuale a preţului acţiunilor unei firme „a” cu
cea similară pentru altă firmă („b”) rezultatul fiind interpretat astfel:
ΔPPAa ΔPPAb

dacă PPAa0 PPAb0 înseamnă că riscul de a investi în firma „a” este mai mare
decât o investiţie în acţiuni ale firmei „b”.
ΔPPAa ΔPPAb

dacă PPAa0 PPAb0 înseamnă că riscul de a investi în firma „b” este mai mare
decât cel aferent firmei „a”.
2 Prin comparaţia abaterii medii procentuale a preţului acţiunilor unei firme „a” cu
media abaterilor procentuale ale preţului acţiunilor pentru cele două firme.
ΔPPAa
a  PPAa0 x100
ΔPPAa ΔPPAb

PPAa0 PPAn0
2
şi
ΔPPAb
b  PPAa0 x100
ΔPPAa ΔPPAb

PPAa0 PPAn0
2
unde
Riscul de piaţă mai mare îl va avea întreprinderea cu un coeficient β mai mare. În
mod practic determinarea riscului de piaţă cu ajutorul coeficientului β este mult mai
complexă şi se bazează pe mai mulţi ani utilizându-se implicit proceduri de calcul
statistice şi de asemenea computerizate.

32
Capitol 2
ASISTAREA DECIZIEI ECONOMICE

2.1 Definirea, rolul şi locul sistemelor informatice pentru


asistarea deciziei

Sistemul este o colecţie de părţi (elemente) organizate şi interconectate pentru


îndeplinirea unui anumit scop. Sistemul, în plan conceptual, este expresia abstractizării unor
fapte, fenomene, procese, obiecte din universul real pe baza unei structuri logice predefinite.
Concepţia sistemică oferă avantajul unei abordări integrale şi integrate a fenomenelor şi
proceselor specifice domeniilor abordate, evidenţiind latura calitativă corespunzătoare
elementelor sistemului. Subsistemul este o parte componentă a unui sistem, în funcţie de un
punct de vedere şi de scopul urmărit. După domeniul de aplicare, sistemele sunt politice,
economice, sociale, tehnice etc.
Sistemele economice sunt sisteme deschise (open systems), puternic ancorate în
mediul socio-economic (piaţa este o parte a acestui mediu) în care acestea funcţionează.
Sistemele economice, ca sisteme deschise, sunt sisteme cibernetice adică prezintă legătura
de reacţie (feedback) ce le permite o funcţionare normală. Sistemele economice prezintă un
comportament dinamic care asigură adaptarea la fluctuaţiile mediului socio-economic. Orice
sistem economic poate fi împărţit în mai multe subsisteme în funcţie de criterii specifice.
Societatea comercială (organizaţia economică) reprezintă un sistem economic care
poate fi divizat a) funcţional sau pe domenii de gestiune (producţie/servicii, comercial,
cercetare-dezvoltare, financiar-contabil, resurse umane) sau b) structural (organizatoric,
decizional, informaţional, tehnologic, relaţional pe resurse umane). Potrivit concepţiei
holonice asupra sistemelor, două sau mai multe sisteme autonome pot fi integrate (cu
criterii şi obiective precise) şi se poate obţine astfel un sistem holonic. În limba greacă, holos
semnifică un întreg dedus din părţi. Sistemul holonic (holonul) economic permite optimizarea
atât pe sisteme componente cât şi pe ansamblul sistemului integrator devenit sistem de
referinţă, pe cele două planuri: real şi conceptual.
Orice sistem economic modern performant este un sistem integrat funcţional şi
structural.
Sistemele economice integrate pot fi abordate din perspectiva diferitelor şcoli de
gândire în management (tehnico-raţională, comportamentală, cognitivă). Acestor sisteme
economice integrate le sunt asociate sisteme informaţionale integrate, respectiv sisteme
informatice integrate. Sistemele informatice integrate economice au în compunere, în funcţie
de nivelurile de management ale organizaţiei economice (fig. 2), sisteme informatice

33
dedicate (integrate pe orizontală), astfel: 1) nivelul de management strategic: sisteme
informatice de sprijin al executivului, ESS (Executive Support Systems) sau EIS (Executive
Information System); 2) nivelul de management mediu: sisteme informatice pentru
management, MIS (Management Information Systems) sau sisteme informatice pentru
rapoarte de management, MRS (Management Reporting Systems) şi sisteme informatice
pentru asistarea deciziei, DSS (Decision Support Systems); 3) nivelul lucrătorilor cu date,
informaţii şi cunoştinţe: sisteme de automatozare a lucrărilor de birou sau birotică, OAS
(Office Automation Systems) şi sisteme de lucru cu cunoştinţe, KWS (Knowledge Work
Systems); 4) nivelul de management operaţional: sisteme informatice pentru procesarea
tranzacţiilor, TPS (Transaction Processing Systems). Cele mai cunoscute implementări ale
unor componente de integrare pe verticală ale sistemelor informatice integrate economice
sunt denumite: planificarea resurselor întreprinderii, ERP (Enterprise Resource Planning),
fabricaţie asistată de calculator, CAM (Computer-Aided Manufacturing), planificarea
resurselor de fabricaţie, MRP (Manufacturing Resource Planning), sistem informatic de
resurse umane, HRIS (Human Resources Information System), sistem informatic contabil,
AIS (Accounting Information System), sistem informatic financiar, FIS (Financiar Information
System), sistem informatic pentru marketing, MKIS (Marketing Information System), sistem
informatic de resurse informatice, IRIS (Information Resources Information System), sistem
informatic pentru managementul relaţiilor cu clienţii, CRM (Customer Relationship
Management), sistem de management al lanţului de distribuţie, SCM (Supply Chain
Management) etc.
Pentru studentul de la specializarea Contabilitate şi informatică de gestiune, elemente
ale OAS au reprezentat obiectul cursului de birotică, elemente ale TPS - al cursului de
sisteme de gestiune a bazelor de date, în timp ce elemente ale KWS au fost lămurite la
cursul de sisteme expert. DSS reprezintă obiectul de studiu al disciplinei Sisteme informatice
pentru asistarea deciziei (SIAD) economice. MIS reprezintă o disciplină de informatică pentru
specializarea Management. Este discutabilă separarea SIAD (DSS) de MIS, indiferent de
modul de abordare, având în vedere că luarea deciziei reprezintă scopul fundamental al
oricărui sistem de management. ESS sunt în curs de clarificare, conceptualizare şi realizare.

Steven Alter consideră că sistemele informatice pentru asistarea deciziei (SIAD) sunt
destinate managerilor şi prezintă ca obiectiv fundamental eficientizarea deciziilor, spre
deosebire de TPS-uri care se ocupă de eficientizarea şi consistenţa datelor. Moore şi Chang
arată că un SIAD este extensibil şi capabil să suporte analize ad-hoc, precum şi modelarea
deciziei manageriale, folosit pe un interval de timp nedeterminat şi neregulat şi cu orientare
principală pe procese şi fenomene viitoare.

34
Fig. 2. Sistemele informaţionale/informatice în funcţie de nivelurile de
management ale organizaţiei economice

În lucrarea Decision Support Systems: A Knowledge-Based Approach (1996),


Holsapple şi Whiston evidenţiau caracteristicile unui SIAD astfel:
1. are în compunere o bază de cunoştinţe referitoare la domeniul abordat de
procesul decisional;
2. permite achiziţia cunoştinţelor descriptive sau de natura procedurilor şi regulilor;
3. asigură posibilităţi de prezentare a unor cunoştinţe ad-hoc sau de realizare a unor
rapoarte periodice;
4. facilitează selectarea unor mulţimi de cunoştinţe pentru informare sau pentru
asistarea procesului decizional;
5. realizează interactivitatea sistem-decident.
Sistemele informatice pentru asistarea deciziei, SIAD - implică folosirea elementelor
aplicative din discipline diverse cum sunt statistica, economia, cercetările operaţionale,
tehnologiile informaţiei şi ale comunicaţiilor - IT&C, inteligenţa artificială, psihologia
cognitivă etc.
Sistemul informaţional economic reprezintă un cumul de resurse umane şi capital
investit într-o organizaţie economică pentru colectarea şi prelucrarea datelor necesare
obţinerii informaţiilor care vor fi utilizate la toate nivelurile de decizie ale conducerii şi
controlului activităţii acelei organizaţii.
Informaţie devine în felul acesta centrul în jurul căruia basculează întreaga activitate
a unei organizaţii economice.
Informaţia este văzută de DeMarco (1982) ca fiind abordabilă din trei perspective
specifice sistemelor informaţionale şi anume:
1. Datele care sunt văzute sub formă de atribute şi care reflectă structura statică a
sistemului informaţional.
2. Funcţiile scot în evidenţă ceea ce face sistemul. Ele pot fi văzute şi ca procese,
deoarece elementele sistemului care stochează datele sunt supuse transformărilor
funcţionale prin intermediul proceselor.
3. Comportamentul reflectă de fapt stările prin care trece sistemul la apariţia
diverselor evenimente care au impact asupra lui şi care îi conferă un statut dinamic.
Reenginering-ul organizaţiei economice semnifică regândirea din temelii şi
reproiectarea radicală a proceselor de afaceri cu scopul de a obţine o îmbunătăţire
semnificativă a indicatorilor critici de performanţă ai acestei organizaţii economice (costuri,

35
calitate, viteză, service etc). În reingineria proceselor de afaceri, BPR (Business Process
Reengineering), IT&C joacă un rol determinant.

2.2 Decizia: loc, rol, clasificare; decidentii

Evoluţia tehnologiilor informaţiei şi ale comunicaţiilor, IT&C influenţează evoluţia


procesului managerial prin oferta de mijloace şi instrumente din ce în ce mai performante
pentru rezolvarea sarcinilor managerilor, sintetizate în ESS, MIS, DSS, KWS, OAS. Sistemele
informatice oferă un nivel rapid de obţinere, analiză şi interpretare a unei mari cantităţi de
date şi informaţie, ajutând la o adaptare rapidă a decidenţilor într-un mediu economic în
permanenţă dinamică. Tot ele asigură un înalt nivel de responsabilitate şi putere de decizie
spre nivelele inferioare. În acelaşi timp, procesul managerial are impact asupra modului în
care se face proiectarea şi realizarea sistemelor informatice care deservesc acest proces.
În principal, managerii utilizează sistemele informatice pentru planificarea,
organizarea, coordonarea, controlul şi previziunea activităţilor lor, dar şi pentru comunicarea
dintre persoane, stabilirea reţelelor în interiorul organizaţiei cât şi la rezolvarea problemelor
curente. La baza structurării sistemelor informatice se află sistemele informaţionale.
Sistemul informaţional al unei organizaţii conţine două subsisteme componente: subsistemul
de conducere şi subsistemul condus. În fluxul informaţional descendent se găseşte decizia,
ca rezultat al procesului decizional desfăşurat în cadrul subsistemului de conducere.
Diverşi autori definesc decizia în moduri aproximativ asemănătoare ca de exemplu:
alegerea unei căi sau direcţii de acţiune (Simon, 1960), alegerea unei strategii de acţiune
(Fishburn, 1964), o alocare a resurselor (Spradlin, 1997), hotărârea luată ca urmare a
examinării unei probleme, situaţii etc., soluţia adoptată din mai multe posibile (DEX, 1998)
etc. Decizia se poate defini şi ca fiind rezultatul unor activităţi conştiente de alegere a unei
căi de acţiune, alegere care presupune alocarea unor resurse. Decizia reprezintă rezultatul
prelucrării unor informaţii şi cunoştinţe şi aparţine unei persoane sau grup de persoane
(decidentul) care dispun de autoritatea necesară şi care au responsabilitatea pentru
utilizarea eficace a resurselor în anumite situaţii date. Decizia este o activitate a omului ce
urmăreşte, în mod conştient, anumite obiective. Pentru rezolvarea unei probleme decizionale
se aleg obiectivele relevante pentru problema respectivă. Aceste obiective relevante pot fi
multiple şi, deseori, contradictorii. Ele sunt funcţie de mai mulţi factori, dintre care se
amintesc sistemul de valori (ansamblul subiectelor de analiză adoptate sau impuse
decidentului) şi orizontul decizional de timp (specific problemei de decizie).
O primă clasificare a deciziilor, legată nemijlocit de decident, este realizată în funcţie
de domeniul de activitate al omului:

36
3 decizii personale, când deciziile se referă la viaţa personală a unui om, iar resursele
sunt timpul, energia, banii, renumele, cunoştinţele profesionale;
4 decizii manageriale, când deciziile se referă la organizaţia economică, iar resursele
alocate sunt umane, materiale, financiare şi informaţionale (dintre cele informaţionale, cele
mai importante fiind cunoştinţele tezaurizate în organizaţie).
După gradul de complexitate, deciziile pot fi simple sau complexe. Decizia simplă este
acea decizie care priveşte alegerea unei singure direcţii de acţiune sau acea decizie ce se
dovedeşte suficientă (la o primă analiză) pentru îndeplinirea obiectivelor. Decizia complexă
reprezintă un ansamblu de decizii simple care se adoptă pentru îndeplinirea unui obiectiv sau
grup de obiective.
După numărul de participanţi, deciziile sunt:
a) cu decident individual;
b) decizii cu mai mulţi participanţi (multiparticipant) sau cu echipe decizionale.
Clasificarea deciziilor în funcţie de nivelul decizional asociat cu orizontul decizional de
timp este:
a) decizii strategice care se referă la obiectivele, resursele şi politicile organizaţiei,
pe termen mediu şi lung (ani de zile); sunt specifice nivelului de managemement strategic
(fig. 2); la elaborarea şi adoptarea acestor decizii participă un număr redus de decidenţi ce
lucrează, de regulă, într-o manieră creativă şi nerepetitivă; se folosesc date şi informaţii
puternic agregate provenite, în principal, din surse externe organizaţiei economice
respective;
b) decizii tactice sau de conducere (control) managerială ce determină cât de
eficiente au fost folosite resursele; sunt specifice nivelului de management mediu şi au ca
orizont de timp lunile anului; interacţiunile personale sunt puternic prezente, adică controlul
managerial presupune o continuă interacţiune între persoanele care îndeplinesc obiectivele
organizaţiei (stabilite de nivelul de management strategic), în mod curent şi pe termen
scurt; se folosesc date şi informaţii mediu agregate provenite atât din surse interne cât şi
din surse externe organizaţiei;
c) decizii de conducere (control) operaţională care determină modul în care sunt
duse la îndeplinire sarcinile primite de la nivelele de management superioare; orizontul de
timp este de săptămâni şi zile; se folosesc date şi informaţii provenite, în principal, din surse
interne organizaţiei;
În unele lucrări de specialitate, la acest criteriu de clasificare a deciziilor sunt cuprinse
si:
d) decizii în ceea ce priveşte cunoştinţele, acestea fiind indisolubil legate de ideile
care se referă la noi produse şi servicii, metode de răspândire a acestor cunoştinţe şi de

37
difuzare a datelor şi informaţiior în cadrul organizaţiei. Sunt satisfăcute astfel toate nivelurile
de management ale organizaţiei economice prezentate în fig. 1.1.
Clasificarea deciziilor în funcţie de gradul de structurare este:
a) decizii structurate sau programabile adică decizii uzuale pentru care există
proceduri realizate. Acest tip de decizii intervin în momentul în care apare un proces
cunoscut. Dacă decizia este supusă procesului de informatizare, ea este descrisă printr-un
program a cărui execuţie este fixă, deci nu pot exista reveniri, iar calea raţionamentelor nu
este schimbată nici prin program şi nici de utilizatori.
b) decizii nestructurate (neprogramabile) sunt cele care se bazează pe flerul şi
modul de judecată al decidentului care analizează problema. Acest tip de decizie se referă la
tipuri de probleme atipice pentru organizaţie, pentru care nu există proceduri prestabilite. O
decizie este considerată nestructurată atunci când elementele sale sunt de tip calitativ,
obiectivele şi finalitatea nu sunt precise şi nu există un algoritm cunoscut pentru rezolvarea
lor;
c) decizii semistructurate sunt cunoscute ca decizii care pot fi rezolvate parţial cu
proceduri cunoscute, întrucât acestea au elemente predominant cantitative, scopurile nu
sunt precise, iar procedura de rezolvare nu asigură ansamblul elementelor problemei. Gradul
de structurabilitate a deciziei depinde de experienţa acumulată de decident precum şi de
nivelul şi importanţa ei. Conform terminologiei lui H. Simon, în cazul proceselor
semistructurate apare nevoia unui „asistent”, de fapt de „asistare a deciziei”. Acest termen
de „asistare a deciziei” trebuie definit la modul general ca fiind o serie de operaţii cum sunt
sortarea clasificarea, selectarea, evaluarea ce au ca scop final organizarea informaţiei,
reducerea incertitudinii şi obţinerea de variante de rezolvare. Dacă se consideră evoluţia în
timp a acestui termen, atunci se poate constata că acesta s-a dezvoltat prin folosirea
metodelor cercetării operaţionale, dar sunt greu de aplicat. De aceea a apărut un alt nivel de
abordare a asistării deciziei şi anume „asistarea interactivă”. Pe baza acesteia au apărut
sistemele informatice de asistare a deciziei sau Decision Support Systems (DSS), situate
generic pe nivelul de management mediu.
O altă clasificare a deciziilor poate fi făcută în funcţie de cunoştinţele de care dispune
decidentul referitoare la evoluţia problemei pe care o are de rezolvat. În funcţie de acest
criteriu, deciziile sunt:
a) decizii în condiţii de certitudine ce presupun o cunoaştere a evoluţiei fenomenelor
viitoare, ceea ce se petrece mai rar în realitatea economică. O astfel de decizie se bazează
pe criteriul costului minim de funcţionare;
b) decizii în condiţii de incertitudine ce presupun cunoaşterea evoluţiei anterioare a
fenomenului economic. Acest mod de cunoaştere va permite o previziune şi o alegere cât de

38
cât corectă a variantei de decizie. Acest tip de decizie face parte din clasa generală a
deciziilor deorientare în care alegerea unei variante se face în funcţie de previziunile viitoare
ale decidentului precum şi de criterii obiective care presupun raţionament logic;
c) decizii în condiţii de risc ce presupun că decidentul cunoaşte aproximativ evoluţia
viitoare a fenomenului, posibilul trend al variabilelor necontrolabile şi chiar ce rezultate are
fiecare strategie analizată pe baza criteriului speranţei matematice. În acest caz procesul de
decizie va avea o multitudine de consecinţe, iar fiecăreia i se va asocia o probabilitate. Se
obţine o distribuţie a probabilităţilor din care se va alege varianta cu speranţa matematică
cea mai bună. Dacă există variante de decizie care au aceeaşi speranţă matematică, atunci
se va calcula intervalul de variaţie şi abaterea standard. Ca variantă optimă se va alege
aceea care are cea mai mică abatere standard.
După modul de abordare, deciziile se clasifică astfel:
a) decizii rezultate ale activităţilor de management desfăşurate la întâmplare;
b) decizii rezultate ale activităţilor de management bazate pe rutină; se folosesc
şabloane ale activităţilor din trecut;
c) decizii rezultate ale activităţilor de management bazate pe instruire (iînvăţare);
modelele de decizii din trecut sunt modificate în funcţie de dobândirea de cunoştinţe,
experienţe şi tehnici noi;
d) decizii rezultate ale activităţilor de management paradigmatice; modelele de
decizii de succes din trecut sunt preluate ca exemple pentru situaţia actuală;
e) decizii bazate pe analiza deciziilor (analiza şi modelarea sistemică şi previzională);
analiza deciziilor, ca abordare prescriptivă, asistă decidentul în înţelegerea problemelor
decizionale şi în pregătirea acestuia pentru a face faţă situaţiilor neaşteptate şi nefavorabile;
analiza deciziilor nu poate influenţa hazardul şi nu poate provoca manifestarea norocului.
Deciziile rezultate ale activităţilor de management bazate pe instruire, precum şi cele
paradigmatice fac obiectul tehnicilor de inteligenţă artificială (sisteme expert, reţele
neuronale artificiale, sisteme bazate pe cazuri etc.).
După gradul de urgenţă, deciziile sunt:
a) decizii luate strict în timp real; sunt adoptate pentru managementul situaţiilor de
criză (de exemplu, pentru conducerea unor instalaţii industriale, pentru gestionarea efectelor
unor calamităţi naturale - inundaţii, cutremure, incendii etc.); acest tip de decizii pot fi
asistate de tehnici de inteligenţă artificială;
b) decizii luate aproape în timp real; sunt adoptate pentru gestionarea unor situaţii
decizionale importante pentru organizaţie cum sunt, de exemplu, oportunităţile de afaceri,
lansarea unui produs nou, prefalimentul firmei etc;
c) decizii care nu sunt urgente; timpul la dispoziţia decidentului este suficient pentru

39
asiguraarea desfăşurării unei analize detaliate şi obţinerea unei rezolvări optime a problemei
decizionale.
După criteriul de secvenţialitate a deciziilor, se deosebesc:
a) decizii independente, în situaţia în care decidentul ia o decizie complet
implementabilă;
b) decizii dependent-secvenţiale sau în cascadă (o decizie după alta);
c) decizii interdependente, adică decizii independente (în prima fază) sunt agregate
(în faza a doua).

Decidenţii

Modelul managementului clasic care descrie ce trebuie să facă un manager a fost


indiscutabil un model de top, aproape 70 de ani, începând cu anii 1920. Henri Fayol şi alţi
specialişti au prezentat, pentru prima dată, cele cinci funcţiuni clasice ale managerilor:
planificarea, organizarea, coordonarea, luarea hotărârilor şi controlul. La o analiză mai
atentă, s-a observat că descrierea funcţiunilor manageriale în aceşti termeni este
neconcludentă deoarece nu corespunde cu ceea ce managerii execută în activitatea de zi cu
zi. Prin modele comportamentale, s-a definit comportarea managerilor care pare să fie mai
puţin sistematizată, mai informală, mai puţin organizată şi chiar mai neimportantă decât s-
ar crede la prima vedere.
S-a constatat că activitatea managerială, în realitate, are cinci caracteristici care
diferă de modelul managementului clasic. Astfel:
a) activitatea managerială este foarte intensă, adică managerii trebuie să desfăşoare
foarte multe activităţi zilnice, într-un ritm destul de ridicat (unele studii indică 600 de
activităţi pe zi);
b) activitatea managerială este fragmentată, ceea ce înseamnă că majoritatea
activităţilor durează mai puţin de 9 minute, numai 10% dintre activităţi depăşesc o oră;
c) este preferată comunicarea orală în detrimentul comunicării scrise deoarece oferă
mai multă flexibilitate, necesită mai puţin efort şi aduce un răspuns mai rapid;
d) managerii preferă informaţiile ad-hoc şi speculaţiile (informaţiile scrise uneori
sunt vechi sau aceasta este percepţia managerilor despre documentele scrise);
e) managerii lucrează pe baza unei reţele de contacte care funcţionează ca un
sistem informaţional informal.
Pe baza observaţiilor din lumea reală, Kotter susţine că managerii de fapt sunt
implicaţi în trei activităţi critice:
1 petrec mult timp pentru stabilirea agendei personale şi a obiectivelor atât pe

40
termen scurt cât şi lung;
2 consumă foarte mult timp pentru construirea unei reţele interpersonale formată din
angajaţii de la cât mai multe nivele, de la personalul care deserveşte depozitele de mărfuri şi
funcţionarii organizaţiei până la manageri şi managerii generali;
3 folosesc întreaga lor pricepere şi desfăşoară activităţi de bază pentru a realiza ceea
ce au stabilit în agenda personală şi pentru a-şi atinge propriile scopuri.
Analizând comportamentul de zi cu zi al managerilor, Mintzberg a constatat că acest
comportament ar putea fi clasificat în funcţie de zece roluri manageriale ce pot fi împărţite în
trei categorii: interpersonale, informaţionale şi decizionale.
Prin rol managerial se înţeleg activităţile şi rezultatele acestora pe are managerii ar
trebui să le realizeze într-o organizaţie.
În cazul rolurilor interpersonale, managerii funcţionează ca reprezentanţi ai
organizaţiei economice în relaţiile cu lumea exterioară şi îndeplinesc sarcini simbolice, cum
ar fi, de exemplu, primirea delegaţiilor străine. Managerii acţionează ca lideri prin motivarea,
consilierea şi sprijinul angajaţilor. De asemenea, aceşti manageri realizează legătura dintre
diferitele nivele ale organizaţiei economice, iar în interiorul fiecărui nivel asigură legătura
dintre membrii echipei de management. Managerii acordă timp şi favoruri pe care se
aşteaptă să le primească înapoi. Pentru eficientizarea acestor roluri interpersonale,
managerii utilizează cele mai avansate tehnici şi tehnologii de comunicare şi de comunicaţii.
Cât priveşte rolurile informaţionale, managerii acţionează în calitate de „servere’” de
informaţii pentru organizaţia economică, primind informaţiile actualizate şi redistribuindu-le
celor care au nevoie de ele. Aceste roluri informaţionale sunt de monitor şi acumulator
(centralizarea şi stocarea tuturor datelor şi informaţiilor esenţiale despre organizaţie), de
diseminator al datelor şi informaţiilor ce trebuie supuse acestui proces (informaţii în formă
brută sau prelucrată), de generator sau creator de informaţie nouă (având la bază
informaţia acumulată şi interacţiunile ce se produc în decursul desfăşurării activităţilor),
precum şi de purtător de cuvânt sau reprezentant autorizat al organizaţiei. Un rol
determinant în susţinerea acestor roluri informaţionale îl au sistemele informatice dedicate şi
sistemul informatic integrat al organizaţiei economice în ansamblul său.
În situaţia rolurilor decizionale, managerii iau decizii. Ei funcţionează ca antreprenori
prin iniţierea diferitelor tipuri de activităţi, ei descoperă nefuncţionalităţile care apar în
organizaţie, alocă resursele personalului care are nevoie de ele, negociază conflictele şi
mediază neînţelegerile dintre diferite grupuri. În esenţă, rolurile decizionale sunt de
întreprinzător sau planificator (depistarea de oportunităţi de afaceri, focalizarea tuturor
activităţilor pentru îndeplinirea obiectivelor stabilite de managementul strategic,
supervizarea proiectelor de importanţă deosebită pentru organizaţia economică etc.),

41
coordonator sau rezolvitor de probleme perturbatorii care afectează cursul normal al
evoluţiei strategice a organizaţiei economice, organizator sau distribuitor al resurselor
organizaţiei, precum şi de negociator.
Aşa cum s-a arătat mai sus, rolurile managerilor se clasifică în interpersonale,
informaţionale şi de decizie (sau decizionale). Tuturor acestor roluri manageriale li se
asociază sisteme informatice dedicate care întregesc sistemul informatic integrat al
organizaţiei economice.
Luarea deciziilor rămâne una dintre activităţile de bază ale managerilor - o persoană
sau un grup de persoane ce prezintă autoritatea necesară şi care au responsabilitatea
folosirii resurselor la dispoziţie în situaţii date.
La nivelul de exploatare se iau decizii puternic structurate, în timp ce la nivelul
managementului strategic se iau decizii nestructurate. Multe dintre problemele întâlnite de
lucrătorii cu date, informaţii şi cunoştinţe necesită, de asemenea, decizii nestructurate. Se
apreciază că la fiecare nivel de management organizaţional se iau atât decizii structurate cât
şi decizii nestructurate.

Consideraţii asupra asistării deciziilor

Situaţia decizională reprezintă momentul în care este necesară o decizie. Situaţiile


decizionale pot fi forţate şi neforţate.
Situaţiile decizionale forţate (obiective sau provocate) sunt situaţiile decizionale
determinate de obţinerea unor informaţii ce conduc la observarea apariţiei unor manifestări
externe sistemului, cum sunt abaterile intolerabile ale stării subsistemului condus faţă de o
stare prestabilită, stările noi ale sistemului, precum şi modificările sistemului economic
observate în mediul socioeconomic extern. De exemplu, contul de profit şi pierdere al unei
firme semnalează celorlalţi actori de pe piaţă starea de profitabilitate sau de faliment pentru
acea firmă, iar bilanţul firmei indică modificări intervenite în anul curent faţă de anul
precedent. Achiziţionarea de către o societate comercială de producţie unui utilaj performant
în locul muncii manuale asigură creşterea productivităţii muncii, determinând astfel o stare
nouă a sistemului economic. O abatere intolerabilă la o bancă comercială este depăşirea
limitei de creditare impusă şi supravegheată de Banca Centrală. Situaţiile decizionale forţate
determină decizii corective şi reactive în raport cu abaterile intolerabile, stările noi sau
modificările intervenite în sistemul economic. Un stimulent pentru o situaţie decizională
forţată şi o decizie reactivă poate fi observarea existenţei unei oportunităţi de afaceri pentru
firmă.
Situaţiile decizionale neforţate (subiective sau neprovocate) reprezintă situaţiile

42
decizionale, determinate de voinţa decidentului, care se referă la luarea din timp a unor
măsuri preventive pentru situaţii ca producerea unor accidente de muncă sau boli
profesionale la angajaţii firmei, producerea unui incendiu, pierderea avansului competiţional
al societăţii etc. Situaţiile decizionale neforţate determină decizii proactive ca rezolvări ale
problemelor de explorare şi exploatare a oportunităţilor.
Procesul decizional este ansamblul de activităţi executat de o persoană sau grup de
persoane (decident) care sunt puse în faţa unui fenomen care poate genera mai multe
variante de acţiune şi având drept obiectiv alegerea uneia dintre ele care să răspundă cel
mai bine sistemului de valori ale persoanei, grupului de persoane sau organizaţiei în
ansamblul său.
Decidentul uman, ca element fundamental al procesului decizional, prezintă mai
multe limite care determină necesitatea şi oportunitatea asistării informatizate a deciziilor.
Astfel, se deosebesc limite cognitive (se referă la capacitatea limitată a omului de a memora
şi prelucra date, informaţii şi cunoştinţe), limite de timp (multe decizii trebuiesc adoptate de
decidentul uman sub presiunea timpului la dispoziţie extrem de mic; ca urmare, aceste
decizii pot fi eronate în raport cu problema decizională) şi limite economice (sunt
determinate de costurile obţinerii, stocării, prelucrării, transmiterii şi diseminării datelor,
informaţiilor şi cunoştinţelor către toţi membrii echipelor manageriale).
Procesul de adoptare a deciziilor este constituit din următoarele etape sau faze ale
procesului decizional (cu caracter generic):
a) Informarea generală (sau „intelligence”, după H.Simon), etapă în care sunt analizate
evenimentele apărute în organizaţia economică şi depistate cauzele lor de apariţie. Această
etapă conţine subetapele de stabilire a obiectivelor, de identificare a problemei, de
descompunerea a ei, de stabilire a responsabilităţilor şi are ca rezultat descrierea formală a
problemei decizionale, a categoriei din care aceasta face parte şi a tuturor responsabilităţilor
care decurg de aici.
b) Design-ul (proiectarea) sau modul de concepere al procesului de asistare a deciziei -
presupune alegerea sau construcţia unui model pentru asistarea deciziei precum şi
subetapele de testare şi validare. Una din subetapele design-ului este modelarea ce implică
modul de concepere a problemei precum şi abstractizarea ei cantitativă şi/sau calitativă.
Experienţa decidentului îşi pune amprenta pe modul de alegere a modelului dintr-o
multitudine existentă, dezvoltă proceduri mentale care ajută la încadrarea problemei de
rezolvat într-o anume clasă de modele existente.
c) Alegerea (sau „choice”) este etapa de bază pentru adoptarea deciziei deoarece în cadrul
ei se concretizează rezultatele obţinute în celelalte etape. Decidentul alege o singură acţiune
din multitudinea existentă în funcţie de criteriul de selecţie propus şi de modelul decizional

43
pe care l-a ales (din clasa de modele la dispoziţie). Decidentul alege între posibilităţile în
funcţie de soluţionarea definitivă a modelului, de selectarea celei mai adecvate alternative şi
tot el selectează planul pentru implementare. Pentru alegere sunt evidenţiate mai multe
metode de căutare ca de exemplu: tehnici analitice, metode de căutare exhaustive prin care
rezultatele obţinute de fiecare alternativă sunt comparate, metode euristice care sunt
aplicabile în metodele descriptive.
Metodele analitice sunt utilizate datorită utilizării formulelor matematice pentru a găsi
soluţia optimă. Utilizarea lor este restricţionată de natura problemelor, iar acestea trebuie să
fie structurate. Se pot aplica astfel de metode pentru probleme de gestiune a stocurilor sau
de alocare a resurselor. Algoritmii stau la baza acestor metode şi conduc la obţinerea unor
soluţii viabile pentru modelul ales.
Metodele de căutare exhaustivă sunt utilizate în genere la luarea în considerare a
tuturor căilor de acţiune pentru a ajunge la scopul propus. Aceste metode au la bază un
proces neghidat, proces în urma căruia se alege soluţia optimă. Căutarea de obicei este
incompletă întrucât posibilităţile de căutare sunt limitate de timp, spaţiu de memorie şi el se
va opri când se va găsi o soluţie apropiată de cea optimă (numită suboptim).
Metodele de căutare euristice se bazează pe o riguroasă analiză a problemei sau
printr-o căutare prin încercări succesive a spaţiului soluţiilor. Raţionamentul făcut prin
parcurgerea spaţiului de căutare a soluţiri permite trecerea prin toate stadiile intermediare
către o stare finală care poate fi un rezultat satisfăcător sau o nereuşită (eşec). Se
precizează că metoda de căutare care este implementată de un sistem de asistare a
deciziilor este o metodă euristică.
Ca ultimă etapă în adoptarea deciziei este evaluarea rezultatelor soluţiei.
d) Implementarea (sau „review”) este etapa în care se face declanşarea acţiunii alese
(propuse) de decident.
De obicei, această etapă este o mare consumatoare de timp, resurse şi în cursul ei
pot apare diverse probleme de rezolvat, ca de exemplu gradul de suport al nivelurilor
superioare decizionale.
Analiza deciziilor asigură un cadru sistematic de abordare, structurare, descompunere
şi rezolvare a problemelor decizionale, ajutându-l şi stimulându-l pe decident să gândească
şi să preia critic alternativele propuse de echipa managerială sau de către un sistem
informatic de asistare a deciziei. Analiza deciziilor este sprijinită de metode, tehnici şi
instrumente informatice specifice sau preluate din alte discipline (cercetări operaţionale,
statistică, probabilităţi, simulare etc.).
Pentru procesul decizional structurat şi pentru cel semistructurat se pot folosi
modelele cantitative bazate pe metode şi modele ale cercetării operaţionale. Această

44
abordare presupune automatizarea totală sau parţială a procesului de adoptare a deciziei şi
constă în următorii paşi:
1 descrierea şi definirea problemei;
2 găsirea categoriei din care face parte problema;
3 elaborarea unui model matematic care să se plieze cel mai bine pe descrierea
problemei;
4 alegerea soluţiei.
Modelele cercetării operaţionale se obţin prin metodele acestei cercetări. Metodele
cercetării operaţionale, utilizate la fundamentarea procesului decizional, sunt programarea
matematică (liniară, neliniară, pătratică), teoria stocurilor, teoria jocurilor, teoria grafurilor,
teria echipamentelor etc. Se obţin astfel soluţii optimale pentru problema decizională de
rezolvat.
Procesul decizional care poate fi modelat presupune că situaţia reală se poate
configura pe un model. S-au implementat o serie de metodologii automate care permit
obţinerea soluţiilor pentru un model cunoscut.
Calculatorul electronic poate primi modelul pentru decizii structurate şi tot el poate fi
decidentul. Spre exemplu, el poate decide când să se facă reaprovizionarea stocului cu
materii prime şi materiale al societăţii comerciale şi, în acest caz, libertatea de a alege în
afara soluţiei optime, dispare.
În cazul în care există decizii mai puţin structurate se va utiliza un gen de modelare
locală sau personalizată care presupune utilizarea mai multor modele sau chiar construirea
altora proprii. Modelarea personalizată este un proces interactiv şi a dat şi numele primelor
sisteme: sisteme interactive de asistare a deciziei. Acestea reprezintă, în esenţă, sisteme
informatice de asistare a deciziei orientate pe modele.
Sistemele de asistare a deciziei orientate pe date prelucrează date ce se găsesc în
depozitul de date al organizaţiei. Aceste sisteme funcţionează pe baza analizei şi agregării
datelor şi au ca funcţii accesul imediat la date, dispun de un mecanism pentru analiza
imediată a datelor, creează statistici. Acest tip de sisteme este rezultatul creării unor
tehnologii speciale cum sunt:
1 depozitarea unor volume enorme de date istorice ale organizaţiei (Data
Warehousing);
2 exploatarea acestor depozite prin procesare analitică on-line (OLAP, OnLine
Analytical Processing).
Adoptarea deciziilor constituie un proces care pe lângă suportul tehnic are nevoie de
un suport cognitiv care este asigurat de partea umană componentă integrantă a sistemului
decizional. Suportul cognitiv înglobează cunoştinţele şi experienţa decidentului precum şi

45
capacitatea acestuia de raţionament. Suportul cognitiv este sprijinit şi marcat în ultimele
decenii de apariţia sistemelor informatice de lucru cu cunoştinţe, KWS (Knowledge Work
System) care se ocupă de probleme de stocare, clasificare, menţinere şi calitate a
cunoştinţelor.
Dacă în sistemele informatice de asistare a deciziei se includ şi bazele de cunoştinţe,
se definesc astfel sisteme informatice de asistare a deciziei orientate pe cunoştinţe sau aşa
numitele sisteme informatice de asistare inteligentă a deciziei.
După clasificarea lui Schneider (1994), există patru categorii de probleme
decizionale:
a) decizia de tip alegere (se porneşte de la o mulţime de alternative din care se alege o
singură alternativă);
b) decizia simplă (se porneşte cu problema bine formulată şi cu o mulţime de activităţi
de rezolvare a problemei şi se finalizează cu soluţionarea problemei prin realizarea unui plan
de acţiune);
c) decizia complexă (problema de rezolvat se descompune în mai multe probleme
simple sau subprobleme care se soluţionează cu decizii simple);
d) decizia de tip proces (este o decizie de tip secvenţial).
Procesul decizional este puternic influenţat de caracteristicile mediului socio-economic
în care-şi desfăşoară activitatea organizaţia economică, cum sunt:
a) existenţa competiţiei pe piaţă, din ce în ce mai acerbă şi mai evoluată; produsele şi
serviciile oferite pieţii sunt apreciate în conformitate cu un ansamblu de criterii (preţ,
calitate, nivel tehnologic încorporat, termen de livrare, durata de viaţă sau existenţă pe
piaţă);
b) ritmul schimbărilor tehnologice (se reaminteşte aici, deja celebra lege a lui Moll,
conform căreia, în domeniul tehnologiilor informaţiei şi ale comunicaţiilor, IT&C, fiecare
generaţie tehnologică asociată, de regulă, cu microprocesorul structurii de calcul, se modifică
la fiecare 18 luni) şi de alte tipuri (politice, legislative, sociale) care determină creşterea
numărului de alternative ce constituie input-uri ale procesului decizional;
c) modificarea modului de organizare şi de funcţionare a organizaţiei economice (ca, de
exemplu, apariţia şi dezvoltarea organizaţiei virtuale) ce determină mărirea ponderii
decidenţilor de tip multiparticipant asociaţi în echipe virtuale; prin reingineria proceselor de
afaceri, BPR (Business Process Reengineering) sunt gestionate toate aceste modificări
organizaţionale;
d) creşterea continuă şi diversificarea surselor externe de date, informaţii şi cunoştinţe;
e) creşterea continuă a pretenţiilor acţionarilor faţă de performanţele organizaţiei
economice, dar şi a aspiraţiilor personale ale angajaţilor acesteia şi ale candidaţilor la

46
angajare proveniţi din mediul socioeconomic.

2.3 Clasificarea sistemelor informatice pentru asistarea


deciziei

Semantic, un sistem informatic de asistare a deciziei este o arhitectură abordată


unitar, care presupune un dialog permanent cu utilizatorul, dar decizia finală este adoptată
de utilizator şi nu de sistem. Toate posibilele definiţii date SIAD-ului au ca punct de pornire
obiectivele şi modul lor de îndeplinire sau pornesc de la compararea specificităţii acestora cu
alte sisteme informatice. De regulă, se face comparaţia între sistemele informatice de
asistare a deciziei (SIAD-uri) sau sistemele suport pentru decizii manageriale, DSS (Decision
Support Systems) şi celelelte sisteme informatice din imediata lor vecinătate (fig. 2), cum
sunt: sistemele informatice pentru management (MIS), sistemele informatice pentru
sprijinul conducerii executive (ESS) sau sistemele de lucru cu cunoştinţe (KWS). MIS, de
obicei, pun la dispoziţia utilizatorului rapoarte de sinteză sau probleme de excepţie în funcţie
de criterii predefinite, referindu-se cu prioritate la un anumit domeniu (contabilitate,
marketing etc.). Diferenţa dintre MIS şi SIAD (DSS) constă în aceea că MIS pleacă de la
date şi relaţiile dintre acestea pe când SIAD-ul porneşte de la decident şi de la decizie. ESS
(EIS) sunt sisteme destinate asistării deciziilor pe cel mai înalt nivel al managementului
organizaţional, ajută la identificarea şi rezolvarea problemelor prin sesizarea de noi
oportunităţi. De asemenea, acest tip de sisteme au posibilitatea de a oferi decidentului
tendinţe, analize pentru activitatea concurenţială.
Caracteristicile principale ale SIAD (DSS) sunt: rezolvarea acelor probleme care nu se
pot rezolva cu sisteme destinate cuantificării cantitative; rol de asistare a decidenţilor
(managerilor) la nivel individual sau de grup în toate etapele procesului decizional; soluţiile
sunt obţinute prin manipulări de date, căutări de informaţii, modele, calcule; timpul de
răspuns pentru obţinerea unei soluţii acceptabile este limitat.
Clasificarea SIAD-urilor se face după mai multe criterii, cel mai des utilizat fiind
componenta tehnologică dominantă (în unele lucrări, gradul de analiză a datelor pe care se
bazează soluţia):
a) SIAD-uri orientate pe modele. Modelul cantitativ este sprijinit de o interfaţă care
facilitează utilizarea. Aceste SIAD-uri realizează analize de tipul „what...if” . Activităţile
implicate sunt de tipul modelare-simulare, previziune, optimizare.
b) SIAD-uri orientate pe date care se referă la un volum apreciabil de date (date istorice)
stocate în sistemul informatic al organizaţiei şi oferă posibilitatea de a extrage informaţii
utile din multitudinea de date de care dispune. Aceste tipuri de SIAD-uri au la bază

47
depozitele de date (Data Warehouse), iar prelucrarea este asigurată de tehnologiile
informaţionale OLAP (procesarea analitică online) şi Data Mining (explorarea şi căutarea
datelor).
c) SIAD-uri bazate pe cunoştinţe care utilizează tehnologiile inteligenţei artificiale şi de
aceea se mai numesc şi SIIAD (sisteme informatice inteligente de asistare a deciziei).
d) SIAD-uri orientate pe comunicaţii la care componenta tehnologică dominantă este
reprezentată de comunicaţiile bazate pe calculatoare şi reţele de calculatoare;
e) SIAD-uri orientate pe documente (sau sisteme de management al documentelor, DMS,
Document Management Systems) care asigură stocarea şi regăsirea documentelor (inclusiv
a paginilor Web) şi informaţiilor prin tehnici (motoare) speciale de căutare (Search).
Primele trei categorii de SIAD-uri fac obiectul abordării detaliate în capitolele
următoare ale lucrării de faţă.
O a doua clasificare, oferită de Holsapple şi Whinston, grupează sistemele SIAD în
cinci tipuri:
a) SIAD bazate pe analiza textelor; toate informaţiile de care are nevoie decidentul le
găseşte sub formă de text care trebuie analizat; documentele sunt create, revizuite şi
vizualizate automat; de asemenea, documentele sunt grupate, fuzionate şi expediate sub
diferite formate şi cu diferite tehnologii (de exemplu, hypertext şi agenţi inteligenţi); sunt
identificate locaţiile corespunzătoare colecţiilor mari de date;
b) SIAD baze de date au drept componentă principală baza de date a organizaţiei; sistemul
de gestiune al bazelor de date (SGBD) asigură structurile de date, modurile de acces la date,
specificarea volumului corespunzător colecţiilor de date, asistarea interogărilor asupra
bazelor de date.
c) SIAD procesoare de tabele au ca principală componentă procesoarele de tabele care
ajută utilizatorul să descrie modele pentru analiză. Cel mai utilizat procesor de tabele este
Excel care include modele statistice, financiare, de previziune, de simulare. Modelul folosit se
generează prin selectarea obiectelor (conceptelor) şi a relaţiilor (ecuaţiilor) dintre obiecte.
d) SIAD bazate pe funcţii; funcţia care de fapt este o procedură sau un algoritm scris într-
un limbaj de programare şi destinată a fi utilizată pentru rezolvarea unui anumit tip de
probleme;
e) SIAD bazate pe reguli; regulile sunt prevăzute în KWS, specifice inteligenţei artificiale.
Dacă se consideră drept criteriu de clasificare - frecvenţa folosirii SIAD-urilor, acestea se
împart în:
f) SIAD-uri organizaţionale, adică acele SIAD-uri integrate în sistemul informatic total
(integrat) al organizaţiei economice care prezintă obiective precise pentru asistarea deciziilor
ce posedă caracter de repetabilitate; sunt puse la punct şi utilizate pe perioade mari de

48
timp;
g) SIAD-uri ad-hoc, adică acele SIAD-uri care rezolvă probleme unicat de asistare a
deciziei; prezintă costuri ridicate de dezvoltare.
În ultimii ani au apărut SIAD de grup (Groupware) ca tip de suport al deciziilor pentru
un grup de decidenţi ale căror decizii au o pondere însemnată în luarea deciziilor într-o
organizaţie. Scopul utilizării unor astfel SIAD-uri este creşterea calităţii procesului decizional
datorită lucrului în echipă precum şi creşterea gradului de creativitate al grupului.
La realizarea SIAD-urilor (şi nu numai), este avut în vedere un ansamblu de
caracteristici. Dintre aceste caracteristici, cele mai importante sunt:
1 să fie flexibile şi să furnizeze mai multe opţiuni pentru gestionarea datelor şi
evaluarea lor intermediară şi finală;
2 să fie capabile să suporte o mare varietate de stiluri, calificări şi clasificări;
3 să se bazeze pe mai multe modele analitice şi intuitive pentru evaluarea datelor şi
să dispună de capacitatea de a urmări mai multe alternative şi consecinţe;
4 să reflecte înţelegerea grupurilor şi proceselor organizaţionale de luare a deciziilor;
5 să fie sensibile la birocraţia şi cerinţele politicilor organizaţionale;
6 să reflecte şi să conştientizeze limitele sistemelor informatice.
Aşa cum s-a arătat deja, SIAD-urile sunt încorporate în cadrul sistemelor informatice
integrate (la nivelul organizaţiei economice), asimilate după unele lucrări, cu sistemele de
planificare a resurselor întreprinderii, ERP (Enterprise Resource Planning).

2.4 Sisteme suport pentru asistarea deciziei

Ca şi alte tipuri de sisteme informatice, SIAD-urile au ca bază un suport soft care le


oferă un mediu de întreţinere, dezvoltare şi funcţionalitate, ele funcţionând într-un mediu
creat de sisteme suport de asistare a deciziei (SSAD).
Funcţiile unui SIAD sunt: gestiunea datelor, gestiunea modelelor, gestiunea
cunoştinţelor şi gestiunea comunicării între utilizator şi sistem şi între date şi modele,
cunoştinţe.
Un sistem suport pentru SIAD (SSAD) prezintă în arhitectura sa următoarele
subsisteme: subsistemul de gestiune a datelor; subsistemul de gestiune a modelelor;
subsistemul de gestiune a cunoştinţelor; subsistemul de gestiune a dialogului (sau interfaţa
cu utilizatorul).

49
Subsistemul de gestiune a datelor

Subsistemul de gestiune a datelor are următoarele componente:


a) baza de date ce poate fi proprie SIAD sau se poate crea prin extragere de date
din alte baze de date sau dintr-un depozit de date. Ea poate fi utilizată de unul sau mai mulţi
decidenţi pentru diverse aplicaţii. Datele pot proveni din mai multe surse interne organizaţiei
sau chiar din afara ei, ele putând fi incluse în baza de date proprie sau pot fi accesate direct
doar în momentul în care se utilizează sistemul.
b) sistemul de gestiune a bazelor de date, SGBD, ce este de obicei încorporat în
SIAD şi de cele mai multe ori el este de tip relaţional.
c) dicţionarul de date (Data Dictionary) ce conţine un catalog al datelor bazei de
date împreună cu definiţia lor şi care este utilizat în prima fază a procesului decizional - faza
de identificare a problemelor.
d) facilităţile de integrare a datelor ce se referă la existenţa limbajelor declarative de
interogare.
Factorii de diferenţiere a datelor, pe diferitele niveluri de management organizaţional,
sunt structurile de date, existenţa posibilităţii de agregare a datelor, dimensiunea datelor
(unidimensionalitatea sau multidimensionalitatea), orizontul de timp, metadatele.
Metadatele sunt date despre date. Este realizat, în acest scop, un dicţionar al
metadatelor ce poate conţine inclusiv metadate partajate. Dacă se prevede un server comun
de metadate, atunci orice aplicaţie se poate folosi de aceste metadate.

Subsistemul de gestiune a modelelor

Subsistemul de gestiune a modelelor prezintă următoarele componente:


1 modelele - sunt reprezentate de modelele financiare, statistice, de previziune şi
stau la baza analizei obţinerii soluţiilor pentru sistemul decizional;
2 sistemul de gestiune al modelelor (similar SGBD), destinat pentru crearea de noi
modele cu ajutorul limbajelor de programare, subrutine, sau de actualizare a modelelor deja
existente;
3 dicţionarul (catalogul) de modele;
4 procesul de execuţie şi integrare a modelelor, ce este utilizat pentru a interpreta
instrucţiuni create de utilizator pentru un anumit model utilizator şi pentru transmiterea
acestora către sistemul de gestiune a modelelor.

50
Subsistemul de gestiune a cunoştinţelor

Subsistemul de gestiune a cunoştinţelor înglobează sisteme expert ce oferă pentru


SIAD soluţii pentru aspectele calitative nestructurate. Sistemele expert utilizate în acest
context se vor axa pe analiza problemei şi selecţia modelelor care pot oferi soluţii pentru
problema respectivă şi realizarea modelelor.

Interfaţa cu utilizatorul

Subsistemul de dialog cu utilizatorul sau interfaţa este o componentă care asigură


interactivitatea SIAD. SSAD este gestionat de un produs soft denumit sistemul de gestiune
al interfeţei cu utilizatorul (SGIU), format din programe speciale cum sunt: interfaţă grafică
(Graphic User Interface, GUI), prezentarea datelor sub diverse forme (grafice, figuri,
tabele), dialog cu utilizatorul în diverse moduri şi altele. Datorită rolului pe care îl are în
SIAD utilizatorul este considerat o parte componentă a acestuia. Pentru SIAD, utilizatorul
devine manager sau decident.

Capitol 3
DATA MINING - TEHNOLOGII DEDICATE
EXTRAGERII CUNOŞTINŢELOR DIN DATE

3.1 Problematica generală


Data Mining este rezultatul firesc al evoluţiei tehnologiilor informaţiei şi ale
comunicaţiilor (IT&C) determinat de creşterea volumului de date produs de societatea
umană pentru desfăşurarea activităţilor sale, urmată de nevoia iminentă de transformare a
datelor respective în informaţii şi cunoştinţe utile în aplicaţii din gama analizei şi controlului
producţiei, analizei de piaţă, detectării fraudei, explorărilor ştiinţifice etc. În acest context,
industria sistemelor informatice cu baze de date a evoluat în direcţia dezvoltării următoarelor
funcţionalităţi1: sisteme cu baze de date avansate, analiza avansată a datelor (Data

51
Warehousing şi Data Mining) şi baze de date bazate pe Web.
Condiţia esenţială pentru dezvoltarea mecanismelor profesionale de stocare, de
regăsire şi de tranzacţionare a datelor o reprezintă dezvoltarea colecţiilor de date şi a
mecanismelor de creare a bazelor de date, fără de care analiza avansată a datelor este
practic imposibilă. Bazele de date şi tehnologia informaţiei au evoluat sistematic, de la
sisteme simple de procesare a colecţiilor de date la sisteme cu baze de date puternice şi
sofisticate, care oferă utilizatorilor accesul direct la datele stocate, lucru convenabil şi foarte
avantajos. Metodele eficiente utilizate pentru procesarea on-line a tranzacţiilor de date,
OLTP (On-Line Transaction Processing) au contribuit semnificativ la evoluţia şi acceptarea
tehnologiei bazelor de date relaţionale ca instrument de stocare eficientă, de regăsire şi de
management al cantităţilor mari de date.
Începând din 1990 tehnologia bazelor de date relaţionale a fost unanim acceptată, iar
activităţile de cercetare în domeniu au fost canalizate către sisteme cu bază de date mai
puternice şi mai eficiente, dezvoltate în jurul unor modele avansate de date care au creat
posibilitatea de realizare a aplicaţiilor orientate pe rezolvarea problemelor. Totodată, s-au
obţinut rezultate spectaculoase legate de distribuţia, diversificarea şi partajarea datelor, care
au contribuit la dezvoltarea sistemelor de informaţii globale, bazate pe Internet, ca de
exemplu WWW.
Pe de altă parte, progresul în domeniul tehnologiei digitale a condus la apariţia unor
calculatoare puternice, a echipamentelor de colectare a datelor şi a mediilor de stocare în
masă care reprezintă suportul fizic, atât pentru bazele de date de informaţii şi de cunoştinţe,
cât şi pentru aplicaţiile care le gestionează. Şi împreună, ansamblul hardware- software şi de
comunicaţii, cunoscut sub denumirea generică de tehnologiile informaţiei şi ale
comunicaţiilor, IT&C (Information Technology and Communications), face posibilă analiza
cantităţilor uriaşe de informaţii şi de date, stocate în diferitele tipuri de baze de date şi în
depozite de informaţii, în vederea regăsiri cunoştinţelor şi informaţiilor utile.
O arhitectură de depozit de date a condus la data warehouse, un depozit de surse
multiple de date heterogene organizat unitar, cu scopul de a uşura asistarea informatizată a
deciziei. Tehnologia data warehouse include ştergerea datelor, integrarea datelor şi
procesarea analitică on- line (On- Line Analytical Processing- OLAP), precum şi posibilitatea
de vizualizare a datelor şi informaţiilor. Deşi instrumentele OLAP suportă analiza
multidimensională şi formularea deciziilor, volumele imense de date crează nevoia unor
instrumente de analiză efectivă şi eficientă a datelor respective mai în detaliu, ca de
exemplu clasificarea, gruparea şi caracterizarea datelor care variază în timp.
Creşterea rapidă şi continuă a volumelor de date, care a depăşit capacitatea umană
de a le interpreta, a impus apariţia şi utilizarea instrumentelor data mining pentru

52
extragerea informaţiilor şi cunoştinţelor utile din cantităţile enorme de date colectate şi
stocate în depozite de date de dimensiuni mari şi foarte mari.
În esenţa lor, instrumentele data mining realizează analiza datelor şi pun în evidenţă
modele de date importante pentru stabilirea direcţiilor de evoluţie a diferitelor domenii de
activitate (economic, ştiinţific, medical, educaţional etc.) pe care le desfăşoară organismele
economice pentru a-şi atinge obiecticele specificate în documentele de constituire.
Existenţa unor volume imense de date a pus problema reorientării utilizării lor de la
un proces de exploatare retrospectiv către unul prospectiv. Data Mining poate avea mai
multe definiţii, însă toate converg în esenţă către miezul problemei şi anume că acest
concept reprezintă un proces de extragere de informaţii noi din colecţiile de date existente.
Termenul de dată are semnificaţia de descriere a unui eveniment bine determinat care se
produce în lumea reală şi este perfect verificabil. Prin tehnologia Data Mining se prelucrează
date care referă perioade anterioare (date istorice), care sunt examinate şi sunt deja
cunoscute, pe baza lor constituindu-se un model sau şablon. Acest model sau şablon va
putea fi aplicat situaţiilor noi de acelaşi tip cu cele deja cunoscute. Informaţiile care se pot
obţine prin Data Mining sunt predictive sau descriptive. De exemplu direcţionarea acţiunilor
de marketing pot constitui o problemă tipică predictivă.1 Detectarea fraudelor produse cu
carduri bancare reprezintă o problemă tipică de aplicaţie descriptivă.
Dezvoltarea tehnicilor de Data Mining se explică prin acumularea de volume imense
de date pe care organizaţiile economice le-au derulat de-a lungul anilor. De asemenea,
concurenţa tot mai acerbă precum şi creşterea exigenţelor pieţei au determinat firmele să ia
tot mai mult în considerare potenţialul uriaş pe care îl oferă arhivele de date. Alături de
arhivele de date memorate pe suporturi informatice mai există încă doi factori care au dus la
necesitatea Data Mining: existenţa şi perfecţionarea algoritmilor şi a produselor-program
dedicate precum şi creşterea capacităţii de memorare şi prelucrare a calculatoarelor
electronice care permit tratarea corelativă a volumelor mari de date.
Este de remarcat că depozitele de date pot fi surse pentru Data Mining, iar rezultatele
obţinute pot completa câmpurile înregistrărilor din depozitele de date, care apoi pot fi
valorificate prin proiecţiile multidimensionale specifice OLAP.
Potenţialul oferit de Data Mining se încorporează în procesele comerciale ale firmelor,
iar căutarea informaţiilor şi cunoştinţelor nu devine un scop în sine ci este utilă doar dacă
este transformată ca acţiune. Astfel firmele pot alege să reacţioneze sau nu la situaţiile
diverse create de realitate (diminuarea numărului de clienţi, scăderea vânzărilor, pierderea
unor pieţe de desfacere etc.). Pasul următor după această alegere este exploatarea propriu-
zisă a datelor utilizând diverşi algoritmi. De multe ori, acţiunea de Data Mining poate fi un
eşec şi nu o reuşită, fiind posibil ca măsurile luate să nu fie adecvate informaţiilor obţinute.

53
Prin Data Mining, oamenii de afaceri reuşesc să se focalizeze mai bine pe cei mai buni
clienţi ai lor, să depisteze şi să prevină fraudele, să descopere caracteristicile de influenţă
care afectează cel mai mult indicatorii-cheie de performanţă, KPI (Key Performance
Indicators) ai afacerii, respectiv ai societăţii, să găsească informaţia ascunsă în baza de
date/depozitul de date. Cu ajutorul tehnicilor Data Mining, orice proces sau fenomen
reflectat în bazele de date, respectiv depozitele de date, constituie temă de analiză şi
raportare în cadrul unei platforme dedicate pentru cercetarea afacerilor, BI (Business
Intelligence), impropriu dar sugestiv tradusă în unele lucrări româneşti sub denumirea de
„inteligenţa afacerilor”.
Spre deosebire de tehnicile OLAP (abordate în capitolul anterior) care abordau
interogări şi raportări standard (care sunt clienţii cei mai valoroşi, care produse s-au vândut
cel mai mult sau care sunt zonele de costuri cele mai ridicate), tehnicile Data Mining
explorează volumele foarte mari de date heterogene cu scopul de a previziona, a înţelege şi
de a dezvolta noi abordări asupra problematicii supuse soluţionării. Pe piaţa actuală extrem
de competitivă, companiile trebuie să-şi administreze şi să exploateze cu eficienţă cele mai
valoroase active (assets) şi depozite de date (Data Warehouse), cu precădere informaţia
valoroasă ascunsă în aceste depozite.
Instrumentele tradiţionale de cercetare a afacerilor - rapoarte, interogări şi raportări
interactive - permiteau sintetizarea a ceea ce s-a întâmplat în trecut, aspecte reflectate de
datele istorice ale companiei şi de unele date curente. Prin tehnica OLAP se obţin analize
asupra unor tendinţe, bazate în special pe rezumate, comparări, analize şi previziuni ce au la
bază valori medii, sume şi grupări de date prin agregare. Prin Data Mining se adânceşte
explorarea depozitelor de date prin descoperirea informaţiei ascunse cu ajutorul şabloanelor
(patterns), factorilor de influenţă, clusterelor, profilelor şi predicţiilor aplicate volumului mare
de date. De exemplu, prin analiza profilurilor celor mai buni clienţi actuali, prin Data Mining
se pot construi modele şi aplicaţii integratoare destinate identificării clienţilor care au cele
mai mari şanse să devină performanţi în viitor, cu toate că, în prezent, nu fac parte din
portofoliul cu cei mai buni clienţi ai companiei. Managerii organizaţiilor economice lucrează
astfel, în deciziile lor, cu „valoarea strategică” a clienţilor actuali prin care se previzionează
însăşi viitorul afacerii.
Toate elementele considerate anterior conduc spre ideea de ciclu în utilizarea Data
Mining în cursul căruia sunt patru etape:
1 definirea oportunităţilor comerciale şi a datelor pe care se face exploatarea;
2 obţinerea de informaţi şi cunoştinţe din colecţiile de date existente prin tehnici Data
Mining;
3 adoptarea deciziilor şi acţiunilor în urma informaţiilor rezultate;

54
4 cuantificarea cât mai corectă a rezultatelor concrete pentru a identifica şi alte căi
de exploatare a datelor.

3.2 Definirea conceptului Data Mining


Aşa cum s-a arătat deja în paragraful precedent, conceptul Data Mining („mineritul
datelor”) defineşte procesul de descoperire a modelelor de cunoştinţe şi/sau informaţii utile
dintr-o cantitate mare de date, colectate şi stocate în diferite tipuri de depozite de date
(baze de date, Data Warehouses, WWW etc.), în vederea folosirii lor pentru fundamentarea
deciziilor manageriale pe toate nivelele de competenţă din cadrul unei organizaţii economice.
În literatura de specialitate modelele de cunoştinţe şi/sau de informaţii obţinute ca rezultat
al desfăşurării unui proces Data Mining sunt denumite, mai simplu, modele de cunoştinţe,
pornind de la definiţiile conceptelor informaţie (care exprimă elementele din realitatea
înconjurătoare în momentul în care sunt percepute pentru prima dată de utilizator, adică
atunci când au caracter de noutate, de ştire), cunoştinţă (care desemnează informaţia
relevantă, informaţie cu înţeles şi informaţie care acţionează, pentru un domeniu de interes,
după momentul aflării acestei informaţii) şi dată (care desemnează informaţia sau cunoştinţa
înregistrată în vederea evidenţei, prelucrării şi/sau analizei).
Data Mining este o expresie improprie care asociază într-un mod foarte sugestiv
procesul de descoperire (căutare şi găsire) a cunoştinţelor dintr-o cantitate mare de date cu
procesul de extragere a mineralelor din roci, spre a-l face mai uşor de înţeles. Această
asociere se bazează pe faptul că ambele procese, în realitate foarte diferite deoarece
materia primă folosită este de natură diferită (dată-cunoştinţă şi rocă-mineral), sunt procese
de extracţie care constau primul în extragerea cunoştinţelor utile din cantităţi mari de date,
iar al doilea în extragerea de minerale din cantităţi mari de roci (procesul clasic de
exploatare minieră, denumit pe scurt minerit). Practic, cantităţile enorme de date
disponibile, care conţin cunoştinţe utile în procesul decizional, sunt asemănate cu rocile
scoarţei terestre, care conţin substanţe minerale necesare în procesul industrial, în timp ce
cunoştinţele necesare procesului decizional, care se extrag din depozitele de date, sunt
asemănate cu mineralele care se extrag din rocile respective. Ca urmare a acestei
similitudini, denumirea cea mai adecvată pentru procesul de descoperire a cunoştinţelor
dintr-o cantitate mare de date este exploatarea cunoştinţelor din date (Knowledge Mining
from Data), o expresie mai lungă şi mai puţin sugestivă. Pentru desemnarea procesului
respectiv se pot folosi şi alte expresii, cu semnificaţie similară sau uşor diferită de Data
Mining, ca de exemplu extragerea cunoştinţelor (knowledge extraction), analiza
datelor/modelelor (data/ pattern analysis) sau arheologia datelor (data archaeology). Dintre

55
toate acestea, cea mai uzuală expresie este Data Mining, fiind cea mai scurtă şi cea mai
sugestivă datorită asocierii implicite cu procesul clasic de minerit, vechi de sute de ani,
înţeles în esenţa sa chiar şi de către nespecialiştii în domeniu minier.
Expresia Data Mining este sinonimă cu expresia descoperirea cunoştinţelor din date,
KDD (Knowledge Discovery from Data) ce este uzual folosită în literatura de specialitate prin
abrevierea sa KDD, care face să-şi piardă semnificaţia implicită, motiv pentru care se preferă
utilizarea primei expresii (Data Mining) pentru a desemna procesul de descoperire a
cunoştinţelor din cantităţile mari de date stocate în depozitele de date disponibile.
În realitate, procesul de descoperite a cunoştinţelor din cantităţi mari de date este un
proces complex format, în principal, din următoarele procese mai simple, care se succed din
punct de vedere cronologic (fig. 3):

1 curăţirea datelor (data cleaning): înlăturarea datelor inutile şi a celor inconsistente;


2 integrarea datelor (data integration): combinerea datelor provenite de la mai multe
surse de date diferite;
3 selectarea datelor (data selection): extragerea datelor relevante pentru analiză din
depozitele de date disponibile (baze de date, data warehouses, WWW etc.);
4 transformarea datelor (data transformation): punerea datelor în formate unitare,
corespunzătoare pentru mining (analiza în vederea descoperirii de cunoştinţe) prin realizarea
unor operaţii rezumative şi/sau de agregare (de unificare);
5 „mineritul datelor” (Data Mining): extragerea unor modele de date aplicând asupra
datelor rezultate după parcurgerea etapelor anterioare metode inteligente, denumite generic
metode Data Mining; acest proces este esenţial pentru descoperirea cunoştinţelor utile
„ascunse” în depozitele de date;
6 evaluarea modelelor (pattern evaluation): evaluarea modelelor de date extrase
pentru identificarea celor care reprezintă cunoştinţele care interesează în mod real;
7 prezentarea cunoştinţelor (knowledge presentation): prezentarea cunoştinţelor
astfel obţinute utilizatorilor lor, prin folosirea unor tehnici de vizualizare şi de reprezentare
adecvate.

Fig. 3. Data Mining - parte a procesului de descoperire a cunoştinţelor

În mod uzual, datele rezultate din procesele de curăţire şi integrare sunt stocate în
Data Warehouses, caz în care transformarea şi unificarea lor se realizează înainte de
procesul de selecţie. Pentru a obţine o reprezentare mai „mică” a datelor originale poate fi

56
realizată şi reducerea datelor (data reduction), fără a le afecta integritatea datelor.
Procesul Data Mining interacţionează cu utilizatorul prin baza de cunoştinţe destinată
acestuia, dintre modelele de date descoperite, cele cu importanţă pentru utilizator
reprezentând, de fapt, cunoştinţe noi care se stochează în baza de cunoştinţe spre a-i fi
prezentate.
Procesul Data Mining este o parte esenţială a procesului de descoperire a
cunoştinţelor din date deoarece descoperă modelele de date „ascunse „ pentru a fi evaluate,
în conformitate cu cerinţele utilizatorilor.
Din punctul de vedere al funcţionalităţii sale, Data Mining este procesul de
descoperire a cunoştinţelor care interesează dintr-o cantitate mare de date stocată în baze
de date, Data Warehouses sau în alte tipuri de depozite de date.
Privit din perspectiva depozitului de date - Data Warehouse, procesul Data Mining
reprezintă un stadiu avansat de procesare analitică on-line (OLAP). Data Mining depăşeşte
însă procesul analitic limitat, de tip rezumativ, al sistemelor Data Warehouse prin tehnicile
specifice de analiză a datelor, mult mai avansate.
Data Mining implică o integrare de tehnici din mai multe domenii. Practic, Data Mining
reprezintă un domeniu interdisciplinar, principalele discipline cu care se intersectează fiind
cele cuprinse generic sub denumirea de Tehnologia Bazelor de Date - Databases (DB),
Tehnologia depozitelor de date - Data Warehouse (DW), Tehnologia Digitală, Tehnologiile
Informaţiei şi ale Comunicaţiilor (IT&C) şi Statistică (fig. 4).

Fig. 4. Principalele domenii (discipline) care se intersectează cu domeniul Data


Mining

Cunoştinţele şi informaţiile descoperite în procesul data mining se folosesc în


formularea deciziilor, în controlul unui proces economic sau industrial, în managementul
informaţiei etc.
Tehnicile de Data Mining se pot aplica atât ascendent cât şi descendent. Pentru
abordarea descendentă se iau în considerare ipotezele formulate în prealabil prin alte
mijloace. Abordarea ascendentă urmăreşte extragerea de cunoştinţe sau informaţii noi din
date disponibile, această căutare putând fi dirijată sau nedirijată. Căutarea dirijată
presupune că se ia în considerare un atribut sau un câmp, ale cărui valori se explică prin
celelalte câmpuri. Căutarea nedirijată identifică relaţiile sau structurile din datele examinate
fără a asigura prioritate unui câmp sau a altuia. Ceea ce se exploatează prin Data Mining

57
sunt colecţii de date constituite pentru alte scopuri (exemplu tranzacţii derulate pe o
perioadă de timp). Deseori la acest tip de date se adaugă şi cele provenite din alte surse
cum statistici oficiale care privesc evoluţia în ansamblu a economiei, date privind concurenţa
sau măsuri legislative. De aceea se foloseşte tot mai des noţiunea de informaţie ascunsă în
sensul că este aproape imposibilă detectarea corelaţiilor sau raporturile pe care datele le
încorporează în mod intrinsec. Rezultatea obţinute sunt cu atât mai relevante cu cât ele se
bazează pe un volum mare de date. Datele pot fi exploatate pentru a obţine informaţii prin
diverse tehnici cum sunt: reţele neuronale, arbori de decizie, algoritmi genetici, analiza
grupurilor, raţionamente bazate pe cazuri, analiza legăturilor. Aceste tehnici pot fi asociate
cu tehnici statistice cum sunt regresiile sau analiza factorială.
Data Mining nu este capabilă, ca tehnică, să rezolve orice problemă de gestiune. De
fapt ceea ce poate oferi se rezumă la câteva acţiuni cum sunt: clasificarea, estimarea,
predicţia,gruparea, analiza grupărilor, care folosite la locul potrivit pot deveni utile pentru o
mulţime de probleme din domeniul decizional.
Herb Edelstein de la Two Crows Corporation defineşte Data Mining ca un ansamblu de
tehnici de descoperire a şabloanelor ascunse (hidden patterns) şi a relaţiilor existente între
date cu scopul de a asista luarea celor mai bune decizii în afaceri.
Clasificarea are ca scop plasarea obiectelor prelucrate într-un grup limitat de clase
predefinite. De exemplu, vânzarea unui produs nou se poate încadra într-una din
următoarele categorii de risc: scăzut, mediu, ridicat. Obţinute în mod clasificat vor fi
reprezentate sub formă de înregistrări care la rândul lor sunt compuse din atribute sau
câmpuri. Ca tehnici de Data Mining pentru clasificare sunt arborii de decizie şi raţionamentul
bazat pe cazuri.
Estimarea va atribui o valoare unei variabile pe baza celorlalte date de intrare.
Rezultatele obţinute în urma estimării sunt valori continue. Pentru acest tip de prelucrări se
pot utiliza reţelele neuronale.
Predicţia poate clasa înregistrările luate în considerare în funcţie de un anumit
comportament sau o valoare viitoare estimată. De aceea se va recurge la o colecţie de
exemple care vizează date din trecut, în care valorile variabilei de previzionat sunt deja
cunoscute. Cu ajutorul lor se va construi un model care va putea explica comportamentul
observat. Aplicând acest model înregistrărilor care fac obiectul prelucrării, se va obţine o
predicţie a comportamentului sau a valorilor acestora în viitor.
Gruparea poate duce la determinarea acelor obiecte care apar cel mai fecvent
împreună. Un exemplu este „analiza coşului gospodăriei” în evaluările statistice.
Analiza grupului urmăreşte o divizare a populaţiei eterogene în grupuri mai omogene
care poartă numele de clustere.

58
În această tehnică nu se pleacă de la un set predeterminat de clase şi nici din
exemple din trecut. Segmentarea pe grupuri se face în funcţie de similitudinile obiectelor.

3.3 Categorii de date si modele care pot fi „minerite”


În principiu, procesul Data Mining poate fi aplicat asupra oricărui tip de depozit de
date, precum şi asupra fluxurilor de date („trecătoare”). Dintre acestea cele mai uzuale
sunt:
1 bazele de date relaţionale;
2 bazele de date tranzacţionale;
3 depozitele de date - Data Warehouses;
4 bazele de date obiecturale;
5 bazele de date în tehnologii avansate.
Tehnicile Data Mining pot fi comune sau diferite de la o categorie la altă categorie de
date, fiind determinate de caracteristicile specifice fiecăreia dintre aceste categorii.

Categorii de modele de date care pot fi „minerite”

În termeni generali, modelul reprezintă o simplificare a realităţii. Practic, descrierea


elementelor şi fenomenelor din realitatea înconjurătoare, reduse la caracteristicile lor
esenţiale pentru un anumit domeniu de activitate, defineşte un model.
Modelarea este o tehnică general acceptată de specialiştii din toate domeniile de
activitate. Se construiesc modele arhitecturale pentru a ajuta utilizatorii lor să vizualizeze
clădirile. Se construiesc modele matematice pentru a analiza traiectoria navetelor spaţiale în
cosmos sau tendinţele de evoluţie a pieţei. În era comunicaţiilor digitale şi a internet- ului,
se construiesc modele software care conduc la realizarea unor sisteme informatice flexibile,
uşor adaptabile la schimbările rapide de tehnologice şi la cerinţele utilizatorilor, mereu în
creştere. După cum, se construiesc modele de date pentru a descoperi cunoştinţele
„ascunse” în depozitele de date, utile în fundamentarea deciziilor manageriale strategice şi
de perspectivă.
Extragerea modelelor de date, aplicând asupra datelor stocate în baze de date, data
warehouse sau în orice alt tip de depozit de date tehnici inteligente (avansate) de analiză,
denumite generic tehnici data mining, este un proces laborios denumit, în mod uzual, proces
data mining sau, pe româneşte, proces de „minerit”, prin similitudine cu procesul clasic de
minerit care urmăreşte extragerea minereurilor din roci. În acest context, se spune, în mod
uzual, că modelele de date care pot fi extrase printr-un proces de „minerit” sunt „minate”,

59
adică sunt căutate şi extrase din datele stocate în depozitele de date ale utilizatorului, aşa
cum sunt căutate şi extrase minereurile din roci.
Modelele de date care pot fi „minerite „ sunt grupate pe categorii determinate de
funcţiile sistemului Data Mining, denumite pe scurt funcţii Data Mining, care urmăresc
extragerea modelelor de date din datele utilizatorului stocate în depozite de date. Pentru
îndeplinirea (realizarea) funcţiilor sale, sistemul Data Mining execută sarcini specifice,
denumite în mod uzual sarcini Data Mining, care au ca rezultat modele de date care pot fi
„minerite” de utilizator.
O sarcină Data Mining se defineşte ca fiind o activitate sau un set de activităţi care se
execută pentru îndeplinirea sau realizarea unei funcţii a sistemului Data Mining. Practic,
sarcina Data Mining reprezintă partea procesului Data Mining care se desfăşoară pentru
îndeplinirea unei funcţii Data Mining. La modul general, sarcinile Data Mining pot fi clasificate
în două mari categorii:
sarcini descriptive, cele care descriu caracteristicile generale ale datelor stocate în
baza de date, Data Warehouse sau în orce alt tip de deposit de date;
sarcini predictive, cele care realizează deduceri de date din datele curente cu
scopul de a face previziuni, determinând tendinţele de evoluţie ale acestora.
Principalele funcţii Data Mining, sarcinile Data Mining care trebuie executate pentru
realizarea lor şi categoriile de modele Data Mining care se pot obţine ca rezultat, sunt
următoarele:
1 descriere clasă/concept este funcţia sistemului Data Mining realizată prin
executarea sarcinilor Data Mining - caracterizare date şi discriminare date care au ca rezultat
un model Data Mining de tip descriere, denumit în mod uzual descriere;
2 „mineritul” modelelor frecvente este funcţia sistemului Data Mining realizată prin
executarea sarcinilor Data Mining asociaţie date şi corelaţie date care au ca rezultat modele
Data Mining frecvente;
3 clasificarea şi predicţia, este funcţia sistemului Data Mining realizată prin
executarea sarcinilor Data Mining de clasificare date şi predicţie care au ca rezultat modele
Data Mining de clasificare (clasificator) şi predicţie (predictor);
4 analiza grupurilor, este funcţia sistemului Data Mining realizată prin executarea
sarcinii Data Mining de grupare a datelor cu caracteristici representative commune, care are
ca rezultat un model Data Mining de grupare;
5 analiza excepţiilor, este funcţia sistemului data mining realizată prin executarea
sarcinii Data Mining de analiză a excepţiilor care are ca rezultat un model Data Mining al
excepţiilor (date atipice);
6 analiza evoluţiei, este funcţia sistemului Data Mining realizată prin executarea

60
sarcinii Data Mining de analiză a evoluţiei datelor care are ca rezultat un model Data Mining
tendinţelor de evoluţie (a datelor).
De cele mai multe ori, utilizatorii nu ştiu ce modele de date prezintă interes pentru ei
şi doresc să extragă mai multe categorii diferite de modele din datele stocate în depozitlele
de date la dispoziţia lor (baze de date, Data Warehouse etc.). De aceea, este important ca
un sistem Data Mining să poată „mineri” categorii variate de modele de date pentru a
răspunde diverselor aplicaţii şi/sau aşteptărilor diferiţilor utilizatori. Este important ca un
sistem Data Mining să permită extragerea de modele de date pe diferite nivele de abstracţie,
corespunzătoare nivelelor de detaliu solicitate de utilizatori. Şi este important ca un sistem
Data Mining să accepte sugestiile utilizatorilor pentru a direcţiona căutările către modelele de
date care îi interesează.

Descriere clasă/concept

Într-un sistem Data Mining datele stocate în baze de date, Data Warehouse sau în
orice alt tip de depozit de date sunt grupate în clase sau asociate la concepte. Spre exemplu,
datele stocate în baza de date de evidenţă a producţiei organismului economic definit
generic pot fi grupate în două clase care conţin produse de categoria a I-a şi produse de
categoria a Il-a, iar datele stocate în baza de date de evidenţă a clienţilor pot fi asociate
conceptelor mariClienţi şi bugetClienţi. După cum, datele stocate în baza de date de evidenţă
a articolelor unui magazin de tehnică de calcul pot fi grupate în şase clase care conţin
calculatoare, imprimante, scannere, camere video şi produse software, şi pot fi asociate
conceptelor articolePentruCasa, articoleProfesionale, articoleScumpe şi articoleCuPreţRedus.
Descrierea clasă/concept este funcţionalitatea sistemului Data Mining care se
realizează prin executarea următoarelor sarcini Data Mining:
1 caracterizarea datelor, este sarcina Data Mining care constă în rezumarea datelor
din clasa analizată, denumită în mod uzual clasă-ţintă;
2 discriminarea datelor, este sarcina Data Mining care constă în compararea datelor
din clasa ţintă cu datele dintr-una sau din mai multe clase de comparat;
3 caracterizarea şi discriminarea datelor, este sarcina Data Mining care constă atât în
rezumarea datelor din clasa ţintă, cât şi în compararea acestora cu cu datele dintr-una sau
din mai multe clase de comparat.
Caracterizarea datelor este rezumarea, în termeni cât mai concişi şi mai precişi cu
putinţă, a caracteristicilor sau trăsăturilor generale, esenţiale, aferente datelor din clasa
ţintă. Datele din clasa ţintă, specificate de utilizator, se pot colecta, în mod tipic, printr-o
interogare a bazei de date (database query) în care sunt stocate. Spre exemplu, pentru

61
caracterizarea produselor fabricate de un organism economic ale căror vânzări au crescut cu
mai mult 20% în ultimul an, utilizatorul colectează datele de analizat prin executarea unei
interogări (query) SQL asupra bazei de date de evidenţă a vânzărilor.
Caracterizarea efectivă a datelor stocate într-o bază de date, Data Warehouse sau în
orice alt tip de depozit de date se realizează prin aplicarea următoarelor metode de analiză a
datelor:
1 rezumarea simplă a datelor, bazată pe măsurători statistice şi pe eşantionare;
2 cubul de date, bazat pe operaţiile OLAP roll- up şi drill- down, care poate fi utilizat
pentru rezumarea datelor, proces controlat de utilizator, de-a lungul dimensiunilor
specificate de acesta;
3 tehnica de inducţie orientată pe atribut, care poate fi utilizată pentru a realiza
caracterizarea şi generalizarea datelor fără interacţiunea directă a utilizatorului cu sistemul
Data Mining.
Caracterizarea datelor, ca sarcină Data Mining descriptivă, are ca rezultat
descoperirea unui model Data Mining de tip descriere (denumit în mod uzual descriere), care
poate fi prezentat utilizatorului sub diferite forme denumite în mod uzual forme de
caracterizare, cele mai uzuale fiind diagramele, graficele, tabelele, cuburile de date, relaţiile
generalizate sau regulile de caracterizare.
Discriminarea datelor este comparaţia caracteristicilor generale, esenţiale, aferente
datelor din clasa ţintă cu caracteristicile generale, esenţiale, aferente datelor dintr-una sau
mai multe clase de comparat. Datele din clasele ţintă şi de comparat, specificate de
utilizator, se pot colecta, în mod tipic, prin interogarea bazei de date (database query) în
care sunt stocate. De exemplu, pentru compararea trăsăturilor generale ale studenţilor cu
medie de promovare în anul universitar anterior, cu trăsăturile generale ale studenţilor cu
medie sub media de promovare în aceeaşi perioadă de timp, utilizatorul poate colecta datele
de analizat prin executarea unei interogări (query) SQL asupra bazei de date de evidenţă a
studenţilor.
Metodele de analiză a datelor, utilizate pentru discriminarea datelor stocate într-o
bază de date, Data Warehouse sau în orice alt tip de depozit de date, sunt similare celor
utilizate pentru caracterizarea datelor, şi anume:
1 compararea simplă a datelor, bazată pe rezumarea acestora, obţinută prin
măsurători statistice şi de eşantionare efectuate asupra datelor din clasele ţintă şi de
comparat;
2 cubul de date, bazat pe operaţiile OLAP roll- up şi drill- down, care poate fi utilizat
pentru rezumarea şi compararea datelor prin controlul utilizatorului, de-a lungul
dimensiunilor specificate de acesta;

62
3 tehnica de inducţie orientată pe atribut, care poate fi utilizată pentru a realiza
discriminarea şi generalizarea datelor fără interacţiunea directă a utilizatorului cu sistemul
Data Mining.
Discriminarea datelor, ca sarcină Data Mining descriptivă, are ca rezultat
descoperirea unui
model Data Mining de tip descriere (denumit în mod uzual descriere), care poate fi
prezentat utilizatorului sub aceleaşi forme ca şi modelul data mining rezultat prin
caracterizarea datelor, cu deosebirea că formele de prezentare obţinute în acest caz sunt
denumite, în mod uzual, forme de discriminare (grafice de discriminare, reguli de
discriminare etc.) şi descrierile discriminărilor pot conţine măsuri de comparaţie care ajută la
deosebirea clasei ţintă de clasele de comparat.

3.4 Sistemul Data Mining

Sistemul Data Mining este sistemul informatic format din ansamblul componentelor
hardware şi software care interacţionează şi comunică între ele pentru descoperirea
(extragerea) modelelor de date care reprezintă cunoştinţele ce interesează dintr-o cantitate
mare de date stocată în baze de date, Data Warehouses sau în alte tipuri de depozite de
date. Altfel spus, este sistemul informatic în cadrul căruia se desfăşoară procesul Data
Mining.

Structura sistemului Data Mining

Structura sistemului Data Mining (model de principiu) reprezintă, prin definiţie, modul
de organizare internă a acestuia pentru îndeplinirea funcţiei sale: aplicarea tehnicilor Data
Mining asupra datelor stocate în baze de date, Data Warehouses sau în alte tipuri de
depozite de date, cu scopul de a descoperi modele de date care interesează în
fundamentarea deciziilor manageriale, proces denumit generic proces Data Mining (fig. 5).

Fig. 5. Structura sistemului Data Mining

Setul de date care trebuie „minerit”, tehnicile Data Mining şi modelele de date
descoperite în procesul Data Mining reprezintă componentele structurale ale sistemului Data

63
Mining.

Intrările sistemului Data Mining

Intrările sistemului Data Mining specifică sarcinile Data Mining care se execută pentru
îndeplinirea sau realizarea funcţiilor sistemului Data Mining de descoperire (extragere) a
modelelor de date ascunse în datele utilizatorului stocate în depozite de date, cel mai adesea
de tip bază de date sau depozit de date.
Intrările sistemului Data Mining sunt, prin definiţie, interogări Data Mining (Data
Mining query) deoarece se formulează sub formă de întrebări, fie folosind un limbaj de
interogare adecvat, fie cu asistenţa unei interfeţe grafice dedicate. Practic, fiecare întrebare
(query) se transformă pe durata procesului Data Mining într-un set de operaţii care definesc
o sarcină Data Mining ce se execută pentru îndeplinirea sau realizarea unei funcţii a
sistemului Data Mining.
O interogare Data Mining este formată din aşa numitele primitive Data Mining care,
prin definiţie, reprezintă elementele fundamentale (de bază) necesare pentru specificarea
unei sarcini Data Mining sub formă de interogare Data Mining. Acestea sunt:
1 setul de date relevante pe sarcină Data Mining, care cuprinde specificaţiile datelor
„minerite” prin execuţia sarcinii Data Mining de către sistemul Data Mining; cuprinde:
o denumirea depozitului de date (bază de date, data warehouse etc.)
care stochează datele care se „mineresc”;
o tabele bază de date sau cuburi data warehouse;
o atribute bază de date sau dimensiuni data warehouse de interes pentru
utilizator denumite, în mod curent, atribute sau dimensiuni relevante;
o condiţii de selecţie a datelor;
o criterii de grupare a datelor;
2 categoria de cunoştinţe care trebuie „minerită”; reprezintă categoria de modele de
date de interes pentru utilizator care se extrag prin execuţia sarcinii Data Mining de către
sistemul Data Mining (caracterizare/discriminare, asociere/corelare, clasificare/predicţie,
grupare etc);
3 cunoştinţele de bază - sunt cunoştinţe despre domeniul care trebuie „minerit”
necesare pentru direcţionarea procesului Data Mining şi pentru evaluarea modelelor de date;
cea mai uzuală formă a cunoştinţelor de bază este ierarhia, care permite „mineritul” datelor
pe mai multe nivele de abstracţie, corespunzătoare nivelelor de detaliu specificate de
utilizator;

64
4 măsurile interesului pe care îl reprezintă un model de date pentru utilizator; se
utilizează pentru direcţionarea procesului Data Mining către extragerea modelelor de date
care prezintă interes pentru utilizator, precum şi pentru evaluarea modelelor de date
extrase; spre exemplu, regulile de asociere cu suport şi încredere sub limitele specificate de
utilizator sunt considerate neinteresante;
5 reprezentarea modelului extras pentru vizualizare; specifică forma în care sunt
prezentate utilizatorului modelele de date extrase; poate cuprinde reguli, tabele, hărţi,
grafice, arbori decizionali şi cuburi de date.
Formularea interogărilor Data Mining formate din primitive Data Mining se face cu
ajutorul unui limbaj de interogare Data Mining (Data Mining Query Language- DMQL)
orientat pe interacţiunea utilizatorilor cu aplicaţiile Data Mining. Practic, limbajul de
interogare Data Mining permite utilizatorului să formuleze cereri (Data Mining) sub formă de
întrebări (interogări) pentru executarea sarcinilor Data Mining specificate prin primitivele
Data Mining. Un asemenea limbaj trebuie să furnizeze comenzi pentru specificarea fiecăreia
dintre primitivele Data Mining.
Limbajul de interogare Data Mining, cu editorul corespunzător, permit utilizatorului
uman şi aplicaţiilor - utilizator din cadrul altor sisteme informatice să interogheze sistemul
Data Mining în mod compilativ şi/sau interactiv. Comunicarea interactivă a utilizatorului cu
sistemul Data Mining se poate face fie direct, prin formularea de interogari Data Mining, fie
prin intermediul unei interfeţe grafice dedicate, construită pe baza unui limbaj de interogare
Data Mining. Practic, se poate construi o interfaţă grafică prietenoasă pentru fiecare tip de
limbaj de interogare Data Mining definit.

Arhitectura sistemului Data Mining

Sistemul Data Mining este, în esenţa sa, un produs software cu funcţii Data Mining
denumit generic aplicaţie Data Mining care cuprinde:
1 interfaţa Data Mining, modulul software care asigură interacţiunea (comunicarea)
cu utilizatorii care formulează cereri Data Mining (solicitări de execuţie a sarcinilor Data
Mining pentru extragerea de modele de date);
2 serverul Data Mining, modulul software care gestiunează cererile Data Mining
efectuate de utilizator;
3 tehnicile Data Mining, module software care fac analiza datelor stocate în
depozitele de date pentru descoperirea modelelor de date şi evluarea acestora, atât ca
interes pentru utilizator, cât şi ca bază de cunoştinţe, răspunzând astfel cererilor data mining
efectuate de utilizator
Aplicaţia Data Mining este singura componentă a sistemului Data Mining care

65
integrează tehnici de analiză avansată a datelor pentru extragerea modelelor de date
„ascunse” în datele utilizatorului şi pentru evaluarea acestora, motiv pentru care, din punctul
de vedere al utilizatorului, sistemul Data Mining se reduce la acest produs software. Altfel
spus, aplicaţia Data Mining reprezintă pentru utilizatorul final sistemul Data Mining şi este
referită ca atare.
Sistemul Data Mining este, în ansamblul său, o interfaţă software între utilizator şi
depozitul de date „minerit” pentru extragerea modelelor de date care reprezintă cunoştinţe
cu importanţă în managementul decizional, fie că este vorba de o aplicaţie utilizator sau de
utilizatorul uman.
Arhitectura sistemului Data Mining (model constructiv) cuprinde, în principal,
următoarele componente (fig. 6):
1 DataBase, Data Warehouse, World Wide Web sau alt tip deposit de informaţii; este
vorba de una sau mai multe baze de date, data warehouses, spreadsheets sau alte categorii
de depozite de date;
2 Serverul Database sau Data Warehouse; este sistemul de calcul responsabil pentru
extragerea datelor relevante (semnificative), în funcţie de cererea Data Mining efectuată de
utilizator;
3 Knowledge Database (baza de date de cunoştinţe); reprezintă domeniul de
cunoştinţe utilizat pentru direcţionarea căutării modelelor de date sau pentru evaluarea
importanţei acestora în raport cu solicitările utilizatorului;
4 Data Mining engine: set de module funcţionale necesare pentru analiza sarcinilor
specifice procesului Data Mining: asocierea, corelarea, caracterizarea, clasificarea, predicţia,
analiza grupurilor (cluster analysis), analiza excepţiilor (outlier analysis), analiza evoluţiei
etc.;
5 Modul de evaluare a modelului (atât ca interes cât şi ca bază de cunoştinţe): este
componenta care interacţionează cu modulele Data Mining pentru a focaliza căutarea către
modelele de date care interesează; poate utiliza limite de importanţă pentru a filtra modelele
de date descoperite la iesire; pentru eficienţa procesului Data Mining este recomandat să se
„împingă” analiza importanţei modelului de date cât mai adânc posibil (mai în detaliu), astfel
încât să se limiteze căutarea numai la modelele care interesează;
6 Interfaţa utilizator (grafică): este componenta care asigură comunicarea sistemului
Data Mining cu utilizatorii săi, cărora le permite:
o să furnizeze informaţiile necesare pentru direcţionarea căutării şi
realizarea explorării datelor, prin intermediul unei interogări sau unei
sarcini Data Mining;

66
o să baleieze schemele bazelor de date, data warehouses sau altor
structuri de date, pentru extragerea setului de date care prezintă
înteres în procesul Data Mining;
o să evalueze modelele de date extrase („minerite”) şi să le vizualizeze în
diferite forme, cât mai prietenoase pentru utilizator.
O arhitectură bine stabilită (model constructiv), încă din faza de proiectare, conduce
la un sistem Data Mining capabil să utilizeze optim performanţele mediului informatic
implicat pentru desfăşurarea eficientă a procesului Data Mining, ceea ce impune:
o asigurarea eficientă a schimbului de date cu alte sisteme informatice
(spre exemplu, bază de date sau data warehouse);
o dezvoltarea şi utilizarea tehnicilor Data Mining impuse de specificul
datelor aspupra cărora se aplică procesul Data Mining;
o adaptarea funcţionalităţii la cerinţele de „minerit” solicitate de
utilizatori.

Fig. 6. Arhitectura unui sistem Data Mining tipic

Clasificarea sistemelor Data Mining

Clasificarea sistemelor Data Mining se face în funcţie de criterii astfel stabilite încât să
ofere fiecărui utilizator posibilitatea de a identifica cu uşurinţă sistemul Data Mining cel mai
potrivit pentru necesităţile sale manageriale. Principalele criterii de clasificare a sistemelor
Data Mining sunt următoarele:

67
1. categoria de depozit de date care conţine datele asupra cărora se aplică procesul
Data Mining şi care, la rândul lor, se clasifică în funcţie de:
 modelul de date în jurul căruia este construit depozitul de date, caz în care se
deosebesc sisteme Data Mining relaţionale, tranzacţionale, data warehouse,
obiecturale, relaţional- obiecturale sau heterogene;
 tipul datelor manipulate, caz în care se deosebesc, în principal, sisteme Data
Mining temporale, secvenţiale sau time-series, text sau multimedia, pentru fluxuri
şi secvenţe de date, precum şi pentru Web;
2. categoria de tehnici Data Mining integrate pentru îndeplinirea funcţiilor Data
Mining, care caz în care se deosebesc sisteme Data Mining care:
 integrează o singură categorie de tehnici Data Mining care realizează funcţiile
Data Mining pentru descoperirea unei singure categorii de modele de date, ca de
exemplu tehnici pentru caracterizarea şi discriminarea datelor, pentru asociaerea
şi corelaţia datelor, pentru clasificare şi predicţie, pentru grupare şi analiză
excepţii sau pentru analiza evoluţiei datelor;
 integrează tehnici Data Mining multiple care realizează funcţiile Data Mining
pentru descoperirea unor categorii variate de modele de date necesare în diverse
aplicaţii şi/sau pentru a răspunde aşteptărilor diferiţilor utilizatori (sisteme Data
Mining complexe);
3. nivelul de abstracţie la care se „mineresc” datele, caz în care se deosebesc sisteme
Data Mining care asigură extragerea modelelor de date:
1 pe un singur nivel de abstractie, corespunzător unui singur nivel de detaliu care
este specificat de utilizator, caz în care se obţin cunoştinţe generalizate- la un nivel ridicat de
abstracţie sau cunoştinţe primare- la cel mai de jos nivel de abstracţie;
2 pe mai multe nivele de abstractie, corespunzătoare nivelelor de detaliu solicitate de
utilizatori (sisteme Data Mining avansate);
4. frecvenţa de apicare a procesului Data Mining, caz în care se deosebesc sisteme
Data Mining care „mineresc” datele:
1 regulat (frecvent sau ritmic), pentru extragerea modelelor de date respectate de
majoritatea datelor din setul de date selectat de utilizator pentru analiză; în general,
tehnicile Data Mining de tip caracterizare şi discriminare, asociaţie şi corelaţie, clasificare şi
predicţie, precum şi grupare „mineresc” datele cu regularitate, rejectând excepţiile;
2 neregulat (la nevoie), pentru extragerea datelor aflate în afara modelelor de date
respectate de majoritatea datelor din setul de date selectat de utilizator pentru analiză,
considerate excepţii; în acest caz în care se folosesc, în mod uzual, tehnicile Data Mining de
analiză a excepţiilor;

68
5. modul de interacţiune cu utilizatorul implicat, caz în care se deosebesc sistemele
Data Mining care:
1 nu interacţionează cu utilizatorul implicat pe durata procesului Data Mining
(autonome sau independente);
2 interacţionează cu utilizatorul implicat pe durata procesului Data Mining
(interactive); spre exemplu, interacţiunea bazată pe interogare (query- driven);
6. metoda de analiză a datelor utilizată, caz în care se deosebesc sisteme Data Mining
care folosesc metode de analiză a datelor orientate pe:
1 modelul de date în jurul căruia este construit depozitul de date care conţine datele
asupra cărora se aplică procesul Data Mining, care, la modul general, poate fi bidimenional -
pentru baze de date sau multidimensional- pentru data warehouse;
2 forma de analiză a datelor asupra cărora se aplică procesul Data Mining, caz în care
se deosebesc sisteme Data Mining pentru analiză statistică sau vizuală, pentru reţele neurale
etc.
7. domeniul de aplicabilitate, caz în care se deosebesc sisteme Data Mining adaptate la
specificul domeniilor de activitate care utilizează forme avansate de analiză a datelor pentru
eficientizarea meanagementului decizional, ca de exemplu finanţe, comerţ, telecomunicaţii,
e- mail, pentru Web etc.

Explorarea datelor - conţinut şi etape

Programele care realizează implementarea algoritmilor pentru Data Mining nu sunt


suficiente. Ele trebuie alimentate cu date care provin din diverse surse organizate pentru
alte scopuri. De aceea este necesar un proces de curăţare a acestora şi de uniformizare
pentru a fi explorate aşa cum sunt ele furnizate de programe, conţinutul lor trebuind a fi
analizat de specialişti care vor identifica informaţiile utile pe care acestea (rezultatele) le
conţin. Având în vedere aceste particularităţi, tehnicile de Data Mining se pot utiliza numai în
procese specifice complexe şi de cele mai multe ori neliniare. Se pot astfel distinge etapele:
definirea problemei; identificarea surselor de date; colectarea şi selectarea datelor;
pregătirea datelor; definirea şi construirea modelului; evaluarea modelului; integrarea
modelului.
Definirea problemei constă în sesizarea unei oportunităţi sau necesităţi de afaceri. De
aceea se va delimita ceea ce urmează a fi rezolvat prin Data Mining, obiective urmărire şi
rezultate scontate. Problema ce urmează a fi rezolvată prin Data Mining este o parte
componentă a oportunităţii organizaţiei, dar nu se identifică cu ea. De asemenea problema
trebuie să primească o formă adecvată pentru a putea fi tratată cu această tehnică.

69
Identificarea surselor de date constă în stabilirea structurii generale a datelor
necesare pentru rezolvarea problemei precum şi regulile de constituire a acestora şi
localizarea lor. Fiecare sursă de date va fi exeminată pentru o familiarizare cu conţinutul său
şi pentru identificarea incoerenţelor sau a problemelor de definire.
Colectarea şi selecţia datelor este etapa în care se face extragerea şi depunerea într-
o bază comună a datelor care urmează a fi utilizate ulterior. Această etapă ocupă un timp
mare, cam 80% din timpul total, iar existenţa depozitelor de date constituie un real avantaj.
În funcţie de limitele echipamentelor de calcul folosite, de produsele program aplicate
colecţiilor de date şi nu în ultimul rând de bugetul disponibil se poate prelucra întregul fond
de date disponibil sau un eşantion. Dacă opţiunea aleasă este dirijată spre lucrul cu
eşantionare, atunci trebuie respectate toate regulile şi cerinţele de selectare a acestora.
Pregătirea datelor. Datele sunt de obicei stocate în colecţii de date care au fost
construte pentru alte scopuri. De aceea firesc este să existe o fază preliminară de pregătire
înainte de extragere prin Data Mining. Transformările la care sunt supuse datele pentru Data
Mining se referă la: valori extreme, valori lipsă, valori de tip text, tabele. Traterea valorilor
extreme se poate face prin încadrarea între anumite limite cuprinse între medie şi un număr
de abatere standard prin excludere sau limitare sau prin izolarea vârfurilor.
În cazul valorilor lipsă se pot elimina câmpurile cu valori nule din înregistrări, sau se
pot completa câmpurile cu date de valori medii, deoarece existenţa lor poate duce la o
funcţionare incorectă a algoritmilor de Data Mining.
Valorile de tip text ridică probleme întrucât separarea prin spaţii a cuvintelor duc la
apariţia de valori diferite. Din acest motiv este indicată eliminarea lor, dar dacă prelucrarea
lor nu poate fi eliminată, soluţia cea mai pertinentă este de codificare prin tabele de
corespondenţe, în care să se evidenţieze toate şirurile valide de caractere.
Rezumarea se aplică atunci când datele sunt considerate a reprezenta detalii
nesemnificative pentru rezolvarea problemei, sau când numărul de exemple este insuficient.
Codificarea incoerentă apare în momentul în care obiecte identice sunt reprezentate
diferit în unele din sursele utilizate.
Incompatibilităţile arhitecturale informatice se referă la diferenţele existente între
modul de reprezentare internă a valorilor datorat creării lor cu sisteme din generaţii diverse.
Definirea şi construirea modelului este etapa care se apropie cel mai mult de
noţiunea de Data Mining şi se referă la crearea modelului informatic care va efectua
exploatarea. Etapa de definire şi construire a modelului este însoţită de faza de instruire sau
învăţare, depinzând de tehnicile de Data Mining utilizate. Indiferent de aceste tehnici toate
au de parcurs două etape: învăţarea şi testarea. Invăţarea presupune existenţa unui set
suficient de reprezentativ de exemple complete de la care se porneşte pentru a identifica

70
relaţiile de legătură între valorile câmpurilor sau atributelor. Se consideră ca fiind încheiat
procesul de învăţare, în momentul în care rezultatele obţinute prin model se apropie
suficient de mult de soluţiile conţinute de datele după care s-a învăţat. Nu întotdeauna
rezultatele sunt cele scontate şi atunci modelul va fi supus testării cu date diferite de cele
folosite pentru învăţare, dar care aparţin aceleiaşi colecţii. În această etapă sunt formulate
alte două obiective şi anume: obţinerea de date preclasate şi distribuirea acestora în seturi
de învăţare, testare sau evaluare.
Evaluarea modelului are ca scop de a determina corect valorile în care modelul are
capacitatea de a determina corect valorile pentru cazurile noi. Modelul va fi astfel aplicat
asupra ultimei părţi din datele preclasate care sunt dedicate evaluării. Procentul de eroare ce
se stabileşte acum va fi considerat că va fi acceptat şi pentru datele noi. Performanţele unui
model se vor aprecia cu „matricea de confuzie” care are rolul de a compara situaţia reală cu
cea pe care modelul o furnizează.
Integrarea modelului este etapa în care se finalizează procesul, prin încorporarea
modelului în SIAD ca element de bază, sau prin includerea sa într-un proces decizional
general din organizaţie.

Raţionamentul bazat pe cazuri

Prin această tehnică se caută o rezolvare a problemelor apărute prin analogie cu


experienţa acumulată. Această metodă se poate aplica pentru clasificări şi pentru predicţii.
Cazurile pe care este bazat raţionamentul sunt memorate ca înregistrări compuse din setul
de atribute care descriu fiecare caz. Un caz nou este prezentat tot ca o înregistrare, numai
că în câmpurile în care valoarea trebuie determinată sunt vide. Pentru a determina aceste
valori se caută înregistrările cu care înregistrarea „caz nou” se aseamănă şi conţinutul
acestora se consideră a fi răspunsul. Prin urmare se poate afirma că există două funcţii
fundamentale de prelucrare:
1. măsurarea distanţei dintre membrii fiecărui cuplu de înregistrări, pentru a afla vecinele
cele mai apropiate;
2. combinarea rezultatelor obţinute de la „vecine” în răspunsul propus pentru cazul curent;
Măsurarea distanţei dintre câmpuri. Se numeşte distanţă expresia modului în care se
evaluează similitudinea. Distanţa are ca proprietăţi: poate fi definită şi se prezintă ca un
număr real; distanţa de la un element la el însuşi este totdeauna nulă; sensul de măsurare
este fără semnificaţie în maniera că distanţa de la elementul A la elementul B este egală cu
distanţa de la B la A şi nu există un punct C intermediar lui A şi B prin a cărei parcurgere să
se scurteze drumul de la A la B. Ca moduri de calcul pentru distanţa câmpurilor numerice se

71
enumeră:
1. diferenţa între valoare absolută |A-B|;
2. pătratul diferenţei (A-B)2
3. diferenţa între valoare absolută normalizată |A-B| (diferenţa maximă). Ultima variantă
produce rezultate cu valori cuprinse între 0 şi 1.
Măsurarea distanţei între înregistrări. Când apare necesitatea de a considera simultan
mai multe câmpuri ale înregistrării, se calculează distanţa pentru fiecare câmp în parte, iar
rezultatul se combină într-o valoare mică care reprezintă distanţa înregistrării respective.
Se vor enumera câteva procedee de combinare a distanţei câmpurilor: însumarea,
însumarea normalizată (suma distanţelor/suma maximă), distanţa euclidiană (rădăcina
pătrată din suma pătratelor distanţelor). Distanţa euclidiană evidenţiază cel mai bine
înregistrările pentru care toate câmpurile sunt vecine.
Combinarea rezultatelor presupune aflarea celor mai apropiaţi vecini, iar soluţia
problemei se obţine prin combinarea răspunsurilor obţinute de la aceştia. Fiecare vecin poate
avea diverse variante de răspuns, dar se vor lua în calcul doar cei care sunt mai apropiaţi.
Rezultatul ce obţine majoritatea va fi atribuit cazului curent. Cerinţa minimă este ca numărul
votanţilor să fie impar, pentru a evita situaţiile de nedeterminare.
Metodele care se bazează pe vot dau rezultate satisfăcătoare în situaţiile în care
răspunsurile aşteptate sunt de tip enumerativ. O altă soluţie posibilă este interpolarea
valorilor înregistrărilor vecine care însă introduce o aplatizare a rezultatelor care se înscriu
între cele două limite folosite în calcul. De asemenea, se poate constata că rezultate bune se
obţin prin metode de regresie statistică aplicate asupra valorilor date de vecinii cei mai
apropiaţi. Se obţine ecuaţia unei drepte sau a unei curbe care permite calcularea mai precisă
a valorilor aferente cazului curent.
Se poate concluziona că raţionamentul bazat pe cazuri este o tehnică de Data Mining
suficient de bună şi care se poate aplica unui mare număr de probleme, caz în care conduce
la soluţii acceptabile. Toate acestea sunt valabile dacă volumul de date pe care se bazează
este bine ales şi concludent. Ca avantaje pentru această metodă se pot enumera:
1 aplicarea unui mare număr de tipuri de date, pe structuri de date complexe, iar
câmpurile tip text sunt mai bine tratate decât în alte tehnici;
2 luarea în considerare a oricât de multor câmpuri;
3 rezultatele obţinute sunt explicite;
4 elementele de noutate care apar în procesul de învăţare sunt uşor de înglobat şi de
folosit în raţionamente.
Ca orice metodă prezintă şi unele dezavantaje dintre care se pot menţiona: volumul
mare de memorie şi resursă timp de prelucrare relativ mare, şi de asemenea, timpul de

72
prelucrarea mare pentru aplicarea funcţiilor de distanţă asupra tuturor înregistrărilor şi
câmpurilor necesare pentru obţinerea rezultatelor.

Capitol 4

73
Studiu de caz: Data mining în piaţa imobiliară
Obiective

Conform unui studiu recent condus de revista financiară „Capital”, în oraşul Cluj-Napoca
există aproximativ 200 de agenţii imobiliare, reprezentând cel mai mare număr pe cap de
locuitor din ţară. O explicaţie posibilă a acestui fapt este explozia industriei locale în ultimii
ani, investitorii români cât şi cei străini considerând Clujul a fi una dintre regiunile cu cea
mai rapidă dezvoltare economică.
Fiind date cererea mare de apartamente şi preţurile extrem de ridicate existente în
momentul de faţă pe piaţa imobiliară clujeană, scopul acestui proiect este de a facilita achi-
ziţia unui apartament. Acest obiectiv va fi realizat prin analiza datelor existente pe piaţa de
locuinţe utilizând tehnici de data mining. În cadrul lucrării se vor determina preţul şi
punctajul adecvat fiecărui apartament, care pe o scală de la 1 la 5 va arăta dacă acea lo-
cuinţă merită sau nu să fie cumpărată.

Argumentare

Din cauza numărului foarte mare de agenţii imobiliare existente pe piaţa din Cluj-Napoca,
găsirea unui apartament poate deveni o mare problemă. Mai mult chiar, având atât de multe
variante poate deveni chiar imposibilă vizitarea fiecărui apartament disponibil şi luarea unei
decizii corecte în funcţie de necesităţile personale ce pot sau nu a fi îndeplinite de locaţiile în
cauză. Alte două motive ce au determinat realizarea acestui proiect au fost dinamica foarte
mare a pieţei imobiliare şi cererea în continuă creştere pe această piaţă ce duce la creşteri
nejustificate ale preţurilor, ajungându-se astfel la necesitatea reevaluării continue a
apartamentelor, lucru ce poate fi realizat mult mai uşor utilizând analiza de tip data mining.

Unelte şi metode

În realizarea lucrării s-a utilizat mediul de programare WEKA, iar proiectul a fost
implementat cu ajutorul interfeţei grafice a Explorer-ului. Dintre algoritmii de clasificare puşi
la dispoziţie de sistem în cadrul lucrării s-au utilizat Regresia Liniară şi algoritmul J.48 de
clasificare prin arbori de decizie.

74
Setul de date

Datele sunt fost furnizate de săptămânalul clujean „Piaţa de la A la Z” şi conţin anunţurile de


vânzare de apartamente din Cluj-Napoca publicate în luna ianuarie 2001. Datele au fost
primite în format FoxPro. Pentru a putea analiza această bază de date folosind WEKA în
vederea atingerii obiectivelor propuse, formatul iniţial al datelor a trebuit modificat în paşi
succesivi. În primul rând, anunţurile se regăseau în baza de date în câmpuri de tip memo,
câte unul pentru fiecare anunţ. Prin urmare, primul pas a fost de a extrage datele relevante
(etajul, prezenţa balconului, televiziune cablu, telefon, centrală termică, garaj etc.) din
câmpul memo folosind formule de căutare de text în Excel. După aceasta, pe baza cuvintelor
cheie găsite, o nouă bază de date Excel a fost generată conţinând toate cele 18 atribute
finale pe care le vom folosi ca set de antrenament în WEKA. Câmpurile libere pentru o
instanţă au fost schimbate cu un semn al întrebării, simbolizând informaţie lipsă. A fost
necesară şi efectuarea unor alte modificări înainte de începerea testelor, ţinând cont de
faptul că algoritmii aleşi pentru analiză stabilesc o relaţie între atributele de intrare şi cel de
ieşire (cauză-efect). Din acest motiv, toate instanţele din baza de date trebuiau să conţină
cel puţin două atribute non-vide, unul pentru intrare şi altul pentru ieşire, deoarece este
imposibil să se stabilească o relaţie cu un singur atribut. Ca rezultat, din baza de date au
fost şterse toate instanţele ce aveau un singur atribut. O altă problemă ce trebuia rezolvată
era moneda în care era exprimat preţul, deoarece preţurile din anunţuri erau exprimate atât
în lei cât şi în trei valute diferite. Am decis să convertim toate preţurile folosind Euro ca
monedă de referinţă, făcând conversia cu ratele de schimb oficiale din 7 ianuarie 2001. În
cele din urmă, întrucât WEKA foloseşte ca intrare a datelor formatul ARFF, baza de date din
Excel a fost convertită în format CSV (valori separate de virgule), după care i s-a adăugat
antetul conţinând descrierea atributelor, a tipurilor şi valorilor acestora.

Nr. Atribut Tip


1 camere nominal: 1, 2, 3, 4, 5
2 decomandat nominal: decomandat, semidecomandat
3 confort nominal: sporit, I, II
4 etaj nominal: intermediar, parter/ultimul
5 balcon boolean
6 finisare nominal: superfinisat, finisat, semifinisat, nefinisat
7 parchet boolean
8 faianţă boolean
9 gresie boolean
10 termopan boolean
11 modificări boolean
12 centrală boolean
13 contorizat boolean

75
14 telefon boolean
15 cablu boolean
16 garaj nominal: garaj, parcare
17 cartierul nominal: Gheorgheni, Zorilor, Mărăşti, Grigorescu, Centru, etc.
18 preţ numeric

Fig. 7. Modelul de calcul obţinut în urma algoritmului de regresie liniară

Forma finală a bazei de date conţinea 18 atribute ce descriu informaţiile existente despre
apartamente şi conţine 1981 instanţe. Atributele sunt nominale, booleene şi preţul ca atribut
numeric. În ceea ce priveşte baza de date, mai trebuie făcută o clarificare: pentru a obţine
cele mai bune rezultate folosind algoritmul de clasificare J.48, au fost efectuate modificări în
baza de date prin selecţia a 7 atribute şi adăugarea unui atribut suplimentar reprezentând o
evaluare generală a caracteristicilor fiecărui apartament. Această evaluare a fost efectuată
folosind o funcţie expert aplicată tuturor celor 18 atribute iniţiale, obţinând astfel un scor
personalizat al fiecărui apartament pe baza preferinţelor medii ale cumpărătorilor. Evaluarea
este dată de un număr întreg pe o scală de la 1 la 5, 1 fiind valoarea cea mai mică şi
reprezentând o decizie proastă de cumpărare, iar 5 fiind valoarea cea mai mare, corespon-
dentă unei achiziţii oportune.

Regresia liniară

Relaţia dintre caracteristicile şi preţul apartamentelor poate fi estimată intuitiv ca fiind


liniară. Aceasta înseamnă că modificarea unui atribut are ca rezultat o modificare
proporţională în preţ. Algoritmul corespunzător unei legături liniare între atributele de intrare
şi cel de ieşire este modelul regresiei liniare, ce face parte din setul de algoritmi funcţio nali
din WEKA. Folosind clasificarea statistică, regresia liniară determină coeficientul numeric al
fiecărui atribut prin analiza unui set de date de antrenament şi raportează eroarea statistică
a algoritmului prin calculul coeficientului de corelaţie. Ca o particularitate, algoritmul de
regresie liniară implementat în WEKA nu este limitat la atribute numerice, fiind astfel o
metodă excelentă de analiză a bazei de date de antrenament în care 17 atribute
(caracteristici) determină în mod direct cel de-al 18-lea atribut (preţul). Cel mai important
parametru pentru algoritmul de regresie liniară este metoda de selecţie a atributelor, cu trei
opţiuni posibile. La extreme se află metoda „Fără selecţie” ce conduce la obţinerea rapidă a
unor rezultate, însă fiind mai puţin selectivă, respectiv metoda „Greedy” ce este considerabil
mai lentă însă cu rezultate mai precise. Între ele se află metoda „M5” ce face un compromis
între viteză şi acurateţe. Totuşi, trebuie luată în considerare o restricţie: metoda „Greedy”
determină formula cea mai precisă, însă are nevoie ca relaţia dintre atributele de intrare şi

76
cel de ieşire să fie cât mai apropiată de una liniară pentru a determina corect valorile
maxime locale. Dacă relaţia nu este liniară, metoda „Greedy” va da o formulă eronată.
Prin aplicarea algoritmului de clasificare prin regresie liniară pe baza de date completă (1981
înregistrări), atât metoda „Greedy” cât şi metoda „M5” au găsit exact aceeaşi formulă de
calcul a preţului apartamentului pe baza caracteristicilor acestuia. Coeficientul de corelaţie a
fost de 0,702, ceea ce înseamnă că legătura dintre caracteristicile apartamentelor şi preţ se
poate aproxima bine cu o legătură liniară. Un coeficient de corelaţie cu valoarea 1 ar indica o
legătură liniară perfectă, în timp ce un coeficient de corelaţie cu valoarea 0 ar indica lipsa
unei legături între atributele de intrare şi cel de ieşire. Algoritmul de regresie liniară a
considerat relevante doar 6 atribute de intrare din 17. Folosind formula găsită, putem
calcula uşor preţul unui apartament în funcţie de caracteristicile acestuia. De exemplu, un
apartament cu 3 camere, decomandat, confort sporit, finisat, fără garaj, aflat în cartierul
Zorilor, preţul estimat este calculat prin simpla adăugare a coeficienţilor corespunzători
valorii fiecărui atribut: 4.537,74 + 3.851,08 + 2.015,49 + 5.328,60 + 4.467,44 + 1.201,83
+ 2.520,75 -595,08 + 1.265,03 = 24.592,88 €.

J.48 - Arborele de decizie

J.48 este de fapt implementarea algoritmului C4.5 creat de către J.Ross Quinlan, care
foloseşte metoda inductivă top-down de construire a arborilor de decizie. Aceştia se con-
struiesc pe baza testării fiecărui nod al arborelui, începând cu nodul rădăcină, pentru fiecare
înregistrare. Fiecare nod reprezintă numele unui atribut. Se încearcă introducerea instanţei
într-o clasă existentă, pe baza caracteristicilor comune, evaluându-se atributul
corespunzător nodului la care s-a ajuns. În funcţie de valoarea sa, instanţa va urma o
ramură. Când nu mai există noduri de evaluat, instanţa este clasificată. Dacă o anumită
clasă nu mai diferă într-un mod evident de alta în urma introducerii a tot mai multe înre-
gistrări, cele două se vor uni, proces numit „pruning”.

Locul Atributul Intensitatea legăturii


1 preţ 2.398,843
2 camere 1.760,281
3 cartierul 120,16
4 confort 44,849
5 finisare 10,946
6 etaj 8,646
7 garaj 0,475
8 decomandat 0,296
9 parchet 0

77
10 balcon 0
11 faianţă 0
12 contorizat 0
13 telefon 0
14 cablu 0
15 centrală 0
16 gresie 0
17 termopan 0
18 modificări 0

Fig. 8. Ordonarea atributelor folosind algoritmul „ChiSquaredAttributeEval”

Deoarece algoritmul J.48 realizează o clasificare cu rezultat discret, nu continuu, şi întrucât


preţul apartamentelor este un atribut de tip continuu, s-a impus evaluarea fiecărui
apartament pe baza tuturor atributelor, mai puţin numărul de camere, atribut care am
considerat că nu trebuie sa influenţeze punctajul. Rezultatul evaluării este un scor nominal
pe o scală de la 1 la 5, unde 5 este punctajul cel mai bun şi 1 cel mai slab. Scorul a fost
introdus în baza de date pe ultima poziţie, rezultând 19 atribute.
Pentru a realiza o clasificare de calitate a fost necesară evaluarea atributelor. Instrumentul
WEKA ales pentru a realiza acest lucru a fost „Attribute evaluator”, folosind
„ChiSquaredAttributeEval” prin metoda „Ranker”.
„ChiSquaredAttributeEval” calculează intensitatea legăturii dintre variabile folosind testul HI
pătrat (2). Metoda „Ranker” notează atributele în funcţie de evaluare, ordonându-le. Am
aplicat evaluarea în funcţie de tipul apartamentelor, adică numărul de camere. Din rezultatul
obţinut reiese că atributele clasate pe locurile 9-18 au obţinut punctaj 0, ceea ce ne-a
determinat să renunţăm la folosirea lor în clasificare, relevanţa lor fiind nulă în acest caz însă
adăugând în mod inutil complexitate procesului de clasificare. Excluderea lor din baza de
date folosită pentru aplicarea algoritmului J.48 duce la creşterea vitezei de creare a
modelului şi la o mai bună acurateţe a acestuia. Algoritmul J.48 a fost aplicat întregului set
de date ca set de antrenament, urmând ca testarea să se facă pe un set de test format din
alte date. Atributul în funcţie de care se face clasificarea este scorul. Vom obţine astfel un
arbore de decizie ale cărui frunze reprezintă scorul categoriei respective. În urma rulării
algoritmului s-a obţinut o acurateţe de 87,2%, ceea ce înseamnă că 1728 de instanţe din
1981 au fost clasificate corect în cadrul modelului creat. Arborele de decizie generat are ca
nod rădăcină numărul de camere, acest atribut fiind principalul mijloc de a diferenţia
apartamentele. În cadrul modelului au mai fost găsite ca fiind relevante pentru diferenţiere
atributele preţ, prezent în fiecare ramură principală a arborelui, gradul de finisare, confortul
şi cartierul.
În cazul apartamentelor de 5 camere, modelul nu poate fi aplicat cu succes deoarece în setul

78
de date nu există decât 6 înregistrări pentru apartamentele de 5 camere. Lipsa unui număr
mai mare de înregistrări a dus la imposibilitatea creării unui model viabil pentru această
clasă.
Pentru testarea modelului am utilizat un set de date de test format din 200 de înregistrări,
rezultatul având o acurateţe de 85% , ceea ce demonstrează viabilitatea modelului decizio-
nal creat pe setul de antrenament. Exemplu de interpretare a unei ramuri din arborele
decizional: „Dacă apartamentul are patru camere, preţul său este între 31.864 şi 44.722
Euro şi este situat în Centru, atunci scorul său este 4.”

Concluzii

Rezultatele acestui proiect dovedesc faptul că WEKA este o unealtă potrivită ce oferă me -
todele fundamentate ştiinţific de a extrage cunoştinţe noi privind preţurile apartamentelor în
funcţie de caracteristicile lor şi de a folosi aceste cunoştinţe în luarea deciziei de cumpărare.
Luând în considerare schimbările ce au loc în fiecare zi în activitatea economică şi care pot
conduce la o piaţă şi concurenţă imperfectă, erorile nu pot fi evitate. Deoarece această
aplicaţie se bazează pe informaţii de pe piaţă, şi erorile legate de datele propriu-zise sunt
prezente. Numărul instanţelor din baza de date nu este foarte mare şi baza de date este ra-
ră, lipsind multe valori ale atributelor. Preţurile sunt cele solicitate de către vânzători în
anunţurile din ziar, nereflectând cu precizie valorile apartamentelor ci aproximări, de multe
ori preţurile fiind psihologice, oportunistice, care nu sunt atinse niciodată în urma
negocierilor între vânzători şi cumpărători. O altă posibilă sursă de eroare este convertirea
preţurilor exprimate în patru monede diferite la un numitor comun, deoarece nu toţi
vânzătorii au luat în considerare acelaşi curs de schimb valutar.

Perspective

O aplicaţie practică a acestui proiect este implementarea lui pe un server web pentru a es-
tima instantaneu preţul unui apartament şi a asista cumpărătorii, vânzătorii şi agenţiile
imobiliare în evaluarea şi luarea unei decizii privind o tranzacţie de vânzare-cumpărare, de
asemenea colectând automat date privind noile tranzacţii ce au loc şi generând noi mo dele
de calcul în funcţie de evoluţia pieţei. O asemenea bază de date poate oferi rezultate
excelente în alte studii statistice şi data mining, inclusiv prezicerea schimbărilor în cererea
de apartamente în diferite cartiere, informaţii de mare valoare pentru agenţiile imobiliare,
oficialităţi locale responsabile cu dezvoltarea oraşului, arhitecţi şi firme de construcţii.
Folosind acest proiect putem elabora şi determina modele şi grafice privind fluctuaţiile

79
sezoniere şi anuale ale preţurilor în funcţie de mai mulţi factori, cum ar fi rotaţia populaţiei
studenţeşti a oraşului. O evaluare comparativă a industriei şi pieţei imobiliare din diferite
oraşe ale ţării poate ajuta persoanele fizice şi juridice să aleagă un oraş potrivit intereselor
lor. O altă perspectivă demnă de luat în seamă este cea a unui studiu comparativ în piaţa
imobiliară comunitară pentru a înţelege evoluţia preţurilor apartamentelor înainte şi după
aderarea la Uniunea Europeană, sau posibilităţile cetăţenilor europeni de a cumpăra apar-
tamente.

80
Bibliografie
1. Celina Prodcom SRL, „Piaţa de la A la Z”, Cluj-Napoca: www.piata-az.ro
2. Enciclopedia Wikipedia, www.wikipedia.org/wiki/Data_mining
3. Filip, Fl.Gh. – Decizie asistata de calculator. Decizii, decidenti. Metode si instrumente
de baza, Editura Tehnica si Editura Expert, Bucuresti, 2002.
4. Filip, Fl.Gh. – Sisteme suport pentru decizii, Editura Tehnica, Bucuresti, 2004.
5. Fusaru, D., Cocianu, C.L., Gherasim, Z., Andronie, M. – Sisteme expert si Sisteme
informatice pentru asistarea deciziei, Teste grila, Editura Fundatiei România de Mâine,
Bucuresti, 2006.
6. Gherasim, Z., Fusaru, D., Andronie, M. – Sisteme informatice pentru asistarea
deciziei economice, Editura Fundatiei România de Mâine, Bucuresti, 2008.
7. Gh. Vâlceanu, V. Robu, N. Georgescu (coordonatori) – Analiză economico-financiară,
Ed. Economică, 2005
8. Oancea, M. – Sisteme informatice pentru asistarea deciziei bancare, Editura ASE,
Bucuresti, 2005.
9. OBAE, Petrişor, „Clujul tace şi le face”, Capital nr. 18/2004:
www.capital.ro/index.jsp?page=archive&magazine_id=279&article_id=14048
10. OMFP 1752/30.11.2005
11. PATEL, Nitin, „Data Mining”, Cursul 15.062, Massachusetts Institute of Technology,
MIT OpenCourseWare, Sloan School of Management, 2003: http://ocw.mit.edu
12. QUINLAN, Ross, „C4.5: Programs for Machine Learning”, Morgan Kaufmann
Publishers, San Mateo, CA, 1993
13. V. Robu, Gh. Vâlceanu – Analiză economico-financiară teste grilă, Ed. Economică,
2006
14. Zaharie, D., Albescu, F., Bojan, F., Ivancenco, V., Vasilescu, C. – Sisteme informatice
pentru asistarea deciziei, Editura Dual Tech, Bucuresti, 2001.

81

S-ar putea să vă placă și