Documente Academic
Documente Profesional
Documente Cultură
1
Simon, H.A. The New Science of Management Decision, Harpert & Row, New York, NY, 1960
2
Nicolescu. O., Economia şi conducerea întreprinderii industriale, Ed. Didactică şi Pedagogică, Bucureşti,
1980
c) o stare de incertitudine cu privire la alternativa care va optimiza realizarea
obiectivelor (o serie de factori care influenţează decizia, dar care nu pot fi
modificaţi de decidenţi);
Implicit, în aceste condiţii trebuie avute în vedere şi următoarele două elemente3 :
a) mediul ambiant, care influenţează obiectivele de marketing, ca şi modalităţile prin
care se doreşte atingerea acestora;
b) existenţa unuia sau mai multor decidenţi concurenţiali şi calitatea activităţilor
acestora;
Luarea unor decizii corespunzătoare, prin care să se înfăptuiască conducerea
ştiinţifică a activităţii de marketing, reprezintă rezultatul unui proces complex şi
presupune depăşirea unor dificultăţi care adesea sunt mai mari decât în oricare dintre
domeniile funcţionale ale întreprinderii. Astfel, foarte multe decizii au un caracter de
unicat, decidenţii neavând la dispoziţie date cu caracter istoric pe care să le folosească în
fundamentarea deciziilor cu ajutorul metodelor analitice tradiţionale. În aceste condiţii,
experienţa trecută nu poate asigura decât elemente de cadru general pentru luarea
deciziilor. Situaţii de acest gen apar, de exemplu, ori de câte ori se iau decizii cu privire la
lansarea pe piaţă a unor noi categorii de produse.
Pe de altă parte, interfaţa „interacţiuni de marketing – consumatori (sau
utilizatori)” poate conduce la frecvente scimbări care îi surprind pe decidenţi, la
interacţiuni neprevăzute, la apariţia unor fenomene şi procese neaşteptate, la reacţii în
comportamentul de cumpărare şi de consum care nu pot fi controlate de către
întreprindere. Totodată, fenomenele şi procesele de marketing sunt deosebit de complexe,
găsirea de soluţii find mai dificilă decât în alte domenii decizionale ale întreprinderii.
Complexitatea este amplificată şi de faptul că deciziile de marketing, care exercită o
influenţă importantă asupra realizării obiectivelor organizaţionale, cu mult mai puţină
informaţie decât ar trebui şi cu un control insuficient asupra variabilelor implicate.
Deosebit de relevantă este în această privinţă opinia lui Philip Kotler, care cu trei decenii
în urmă scria că „în mod sigur, decizia de marketing se înscrie printre cele mai dificile
decizii economice”, ea „trebuind să fie luată în contextul existenţei unei informaţii
insuficiente despre procese care sunt dinamice, neliniare, decalate în timp, stohastice,
interactive şi deosebit de complexe”4 .
3
Green, E.P., Tull, S.D., Research for Marketing Decision, Prentice-Hall, Englewood Cliffs, NJ, 1970
4
Kotler, Ph. Marketing Management: Analysis, Planning and Control, Ed. Prentice-Hall, Englewood Cliffs,
NJ, 1967
Deoarece angajează resursele întreprinderii pe un orizont de timp îndelungat, deciziile
strategice sunt luate la cele mai înalte niveluri ale conducerii organizaţiei.
Deciziile tactico-operaţionale au caracter de decizii derivate şi vizează
mijloacele concrete prin care întreprinderea va acţiona pentru realizarea obiectivelor sale
de marketing pe termen mediu şi scurt, subordonate obiectivelor fundamentale. Acestea
au, de obicei, un orizont de timp mai redus, ajungându-se până la nivelul deciziilor
zilnice, iar nivelul lor de competenţă se situează la structurile medii şi inferioare ale
conducerii de marketing.
Deseori, deciziile se grupează şi după componenta mixului de marketing la care
fac referinţă. Astfel, alături de deciziile complexe, care privest toate sau o parte dintre
componentele mixului, se face deseori referire la deciziile specializate, privitoare la
politica de produs, de preţ, de distribuţie sau de promovare a organizaţiei în cauză.
În funcţie de metodologia de elaborare şi adoptare a lor, se disting: decizii
repetitive (ce se reiau cu o anumită frecvenţă, existând o rutină bine definită pentru
realizarea lor) şi decizii nerepetitive (care au un caracter de noutate, de unicat,
realizându-se într-un mod specific, diferit, pentru fiecare situaţia în parte).
Un criteriu de diferenţiere a deciziilor îl constituie şi numărul decidenţilor. După
acest criteriu se disting decizii individuale şi decizii colective. Primele sunt luate, de
obicei, în mod curent şi au un grad relativ ridicat de specializare, fiind subordonate
deciziilor colective, care sunt mai complexe, au o importanţă mai mare şi se iau, în
general, la intervale mai mari de timp, delimitând cadrul general al acţiunilor viitoare.
În ciuda marii lor diversităţi, procesele decizionale au multe elemente comune, ele
prespunând o succesiune de activităţi care se constituie într-un adevărat algoritm al
deciziei de marketing. Astfel, într-un proces tipic de luare a deciziilor de marketing,
decidentul trebuie să ia hotărâri pe următoarele planuri:
· Definirea problemei pentru care trebuie găsită o soluţie într-un timp
determinat şi precizarea obiectivelor ce urmează a fi realizate în legătură cu
problema respectivă;
· Enumerarea variantelor de acţiune posibilă;
· Culegerea informaţiilor cu privire la variantele posibile de acţiune şi estimarea
efectelor acestora;
· Identificarea celei mai favorabile variante pe baza comparării variantelor
considerate prin prisma anumitor criterii şi priorităţi;
· Dezvoltarea şi implementarea variantei adoptate;
· Evaluarea rezultatelor finale şi efectuarea eventualelor corecţii;
Acest model, cunoscut sub denumirea DECIDE (de la iniţialele celor şase etape),
reprezintă una dintre cele mai frecvente abordări teoretice ale procesului decizional,
succesiunea acestor etape nefiind însă extrem de riguroasă în practică. Conţinutul şi
complexitatea procesului decizional diferă de la o situaţie la alta, în funcţie de problemele
care fac obiectul deciziei şi care pot fi de o mare varietate.
După definirea problemei este stabilit tipul deciziei care trebuie adoptată. În acest
caz poate fi vorba despre o decizie care poate fi adoptată imediat, o decizie care necesită
trecerea unui anumit interval de timp, o decizie care necesită o mare varietate de
informaţii, un instrumentar sofisticat şi angajarea unor eforturi material- financiare
importante. Luarea deciziei presupune, după cum sugerează modelul DECIDE, şi
existenţa unuia sau mai multor obiective – indicatori de performanţă, pe o anumită
perioadă de timp. Găsirea celor mai adecvate răspunsuri şi în acest domeniu presupune
utilizarea unui fond de informaţii şi a unui instrumentar ştiinţific de lucru, capabil să ia în
consideraţie numeroasele incidenţe existente. Cu ajutorul acestui instrumentar se impune,
spre exemplu, ca unui obiectiv să i se dea o formulare cantitativă cât mai precisă, iar
performanţele pentru realizarea lui să fie măsurabilă. Totodată, se cere ca un obiectiv
oarecare să fie bine încadrat în structura ierarhică a mulţimii obiectivelor de marketing
ale întreprinderii, găsindu- i-se corespondenţă atât la nivel imediat superior, mai general,
cât şi la nivel imediat inferior.
În cea de a doua etapă a modelului DECIDE atenţia este concentrată spre listarea,
fără nici un fel de evaluare, a posibilelor variante de acţiune, incluzând opţiunile
controlabile, cât şi cele necontrolabile (acestea din urmă se bazează pe considerarea
elementelor de incertitudine).
Procesul decizional de marketing cuprinde şi demersuri pentru alegerea între
alternativele existente în vederea atingerii obiectivelor. De cele mai multe ori numărul
variantelor la care se poate recurge este mare, fiind necesară identificarea şi evaluarea
acestora, precum şi selecţionarea celei mai favorabile variante, pe baza unui număr de
criterii de selecţie. Pentru aceasta, se impune culegerea unui volum semnificativ de
informaţii, analiza atentă a acestora în vederea stabilirii tendinţelor fenomenelor, a
legăturilor funcţionale dintre ele, a implicaţiilor asupra desfăşurării ulterioare a activităţii,
obiectiv pentru realizarea căruia se poate apela la numeroase metode şi tehnici de
cercetare.
După selecţia variantei care corespunde cel mai bine criteriilor de decizie
utilizate, se concepe un program pentru aplicarea ei în cel mai scurt timp şi în cele mai
bune condiţii, evaluându-se în final rezultatele obţinute şi luându-se măsurile de corecţie
necesare.
În alegerea, implementarea, urmărirea executării şi evaluarea deciziilor un rol
deosebit îl joacă informaţia şi instrumentarul metodologic. În acelaşi timp, trebuie
subliniat faptul că atât calitatea muncii factorilor de decizie cât şi influenţa factorilor de
mediu se regăseşte în fiecare etapă a procesului de luare a deciziei.
Luarea deciziei presupune în fapt simpla alegere între două sau mai multe soluţii
de atingere a unui obiectiv dat. În majoritatea cazurilor numărul soluţiilor la care se poate
recurge în acest scop este ridicat, din această cauză fiind necesară, în prealabil,
identificarea tuturor soluţiilor posibile, sau cel puţin a celor mai dezirabile variante.
Stabilirea acestor variante poate rezulta în mod direct din volumul şi conţinutul
informaţiilor culese şi din analiza proceselor economice din perioadele anterioare (date
istorice). Identificarea tendinţelor în evoluţia acestor procese, a legăturilor de
interdependenţă în care se găsesc, determinarea implicaţiilor asupra desfăşurării
ulterioare a activităţii conduc, în fapt, la delimitarea unui anumit număr de variante
privind modul de acţiune în perioada următoare.
Pornind de la variantele posibile, decizia presupune alegerea celei mai bune
variante identificate. Acest proces de alegere implică răspunderea şi, în foarte multe
cazuri, asumarea unor riscuri asociate respectivei decizii. Riscurile pot fi însă sensibil
micşorate prin utilizarea unor metode statistico- matematice în formalizarea procesului
decizional.
Aria cercetărilor operaţionale are un câmp tot mai larg de aplicabilitate în sfera
proceselor economice, îndeosebi în procesul decizional. A. Kaufman apreciază că
cercetarea operaţională reprezintă, în fapt, pregătirea ştiinţifică a deciziilor5 . Totodată, în
sfera din ce în ce mai largă a cercetărilor operaţionale se delimitează o ramură aparte,
intitulată chiar „teoria deciziilor”, sau aşa cum mai este denumită, „disciplina deciziilor
corecte”6 .
Modelarea deciziilor care sunt luate în universuri sigure, când toate elementele
necesare sunt cunoscute cu certitudine, nu ridică probleme deosebite. În această direcţie
aportul programării matematice, al metodei drumului critic, al analizei numerice, etc. este
direct şi uşor de evaluat. Dar cele mai multe decizii de marketing sunt luate în condiţiile
unor universuri aleatoare, nedeterminate, şi mai ales concurenţiale. În aceste cazuri
procesul decizional devine mult mai complex şi mai complicat: decizia optimă se poate
obţine numai apelându-se la diferite metode de natură probabilistică.
Unele metode probabilistice se limitează doar la utilizarea probabilităţilor
obiective, determinate pe baza unui procedeu direct, matematic, sau pe baza unui
procedeu empiric. Deosebit de cunoscute în rândul acestor metode sunt metodele
statistice tradiţionale de estimare şi de testare a ipotezelor, lanţurile Markov, metodele
bazate pe teoria firelor de aşteptare, modelele de simulare, etc.
Evoluţiile recente în domeniul modelării deciziilor de marketing au condus la
dezvoltarea unui grup de metode probabilistice care se bazează pe probabilităţi atât
obiective, cât şi subiective, încercând astfel să încorporeze în luarea deciziilor şi opiniile
decidenţilor. Aceste metode sunt în general cunoscute sub denumirea de metode de
analiză baysiană. Un alt grup de metode utilizat pe scară largă în modelarea procesului
decizional de marketing o constituie modelele bazate pe teoria jocurilor strategice.
5
Kaufman, A. Metode şi modele ale cercetării operaţionale. Ed. Ştiinţifică, Bucureşti, 1967
6
Boldur, Gh. Procese informaţionale şi de decizie. Ed. Ştiinţifică, Bucureşti, 1969
Sisteme informatice de marketing
1
Kotler, Philip, Managementul Marketingului, Ed. Teora, Bucureşti, 1997, pg.177.
2
Marshall,K.P, şi Lamotte, S.W., Marketing Information Systems: A Marriage of Systems Analysis and
Marketing Management, apărut în Journal of Applied Business Research, Vol.8, Nr.3, pp.62
3
Orzan, Gheorghe, Sisteme informatice de Marketing, Ed. Uranus, Bucureşti, 2001
· ansamblul de echipamente (hardware)
· sistemul de programe (software), care cuprinde programele sistemului de
operare şi programele de aplicaţii
· structuri de stocare a datelor, informaţiilor şi cunoştinţelor
· ansamblul de personal şi cadrul organizatoric.
De asemenea, SIMk sunt alcătuite, la fel ca toate celelalte sisteme informatice, din
diverse metode, reguli şi proceduri. Metodele reprezintă căile de determinare şi punere în
funcţiune, de perfecţionare şi optimizare a funcţiilor organismului, pentru obţinerea
obiectivelor sistemelor. Regulile exprimă modalităţile de aplicare asupra unei entităţi a
metodelor utilizate, în timp ce procedurile cuprind totalitatea operaţiunilor necesare
pentru tratarea informaţiilor şi regulilor prin mijloacele sistemului. În sfârşit, prin
mijloacele unui sistem informatic se întelege totalitatea uneltelor şi instrumentelor,
manuale sau electronice, utilizate pentru efectuarea de operaţiuni asupra informaţiei:
adunare, culegere, pregătire, control, regăsire, transmitere, formalizare, concentrare,
stocare, transformare, prelucrare, analiză şi raportare.
Funcţiile oricărui sistem informatic decurg atât din obiectivele organizaţiei căreia
îi este subordonat, cât şi din mijloacele tehnice şi materiale avute în vedere la momentul
implementării sale. Astfel, există câteva funcţii generale4 , care pot fi întâlnite la nivelul
oricărui SIMk, indiferent de obiectivele organizaţionale specifice.
4
Orzan, Gheorghe, Sisteme informatice de Marketing, Ed. Uranus, Bucureşti, 2001
comunicaţie la care un sistem informatic este afiliat, acestea sunt cunoscute sub
denumirile LAN (Local Area Network – reţea locală), care presupune o reţea
relativ redusă şi omogenă din punct de vedere al echipamentelor hardware şi
software, în general implementată la nivel organizaţional. Reţelele PSTN (public
switched telecommunications network – reţele publice care utilizează
infrastructura sistemului de telefonie publică) sunt reţele extinse, care folosesc
echipamente analogice pentru a se interconecta (utilizând un Modem telefonic).
Similar, comunicaţia digitală folosindu-se infrastructura publică este cunoscută
sub denumirea de ISDN (integrated services digital network – reţea digitală
pentru servicii integrate). Ultimele două tipuri de reţele sunt utilizate pentru
realizarea reţelelor de tip MAN (Metropolitan Area Network – reţea
metropolitană), mai extinse şi eterogene din perspectiva echipamentelor utilizate,
sau a reţelelor WAN (Wide Area Network – reţea extinsă), care, în funcţie de
necesităţi, pot fi reţele care să interconecteze echipamente de calcul aflate în
regiuni, ţări sau chiar continente diferite. În sfârşit, Internet-ul, cunoscut şi sub
denumirea de WWW (World Wide Web – reţeaua mondială) reprezintă cel mai
extins WAN existent în acest moment, în această vară aşteptându-se depăşirea
numărului de 2 miliarde de utilizatori. În sfârşit, un caz aparte dezvoltat pe larg în
această lucrare îl constituie reţelele virtuale private (VPN – Virtual Private
Network), reţele care utilizează WWW sau o altă reţea extinsă, însă pentru
utilizatori se crează impresia unei reţele mici şi proprietare (în genul LAN).
4. Funcţia de prelucrare reprezintă probabil cea mai des utilizată funcţie a
sistemelor informatice. Aceasta presupune o serie de subfuncţii precum conversia
informaţiei din forma analogică în formă digitală, necesară memorării şi
procesării ei cu mijloace informatice, precum şi operaţia inversă de conversie din
digital în analogic, pentru a o face compatibilă cu echipamentele electronice de tip
analogic pentru redarea, înregistrarea sau transferul de informaţie audio şi vizuală.
O altă astfel de subfuncţie este dată de conversie de suport prin transferul
informaţiei de pe un tip de suport (magnetic, optic, memorie, grafice etc) pe altul
sau de reproducerea informaţiei şi documentelor prin copierea informaţiei pe
acelaşi tip de suport sau de crearea şi încărcarea bazelor de date, de informaţii şi
de cunoştinţe, ce presupune un ansamblu de proceduri prin care se generează
structura şi modul de organizare a informaţiei pe suportul tehnic, încărcarea
bazelor, astfel create, cu informaţia provenită din memoria externă, introdusă din
reţelele de comunicaţie sau manual, de la terminale. Tot o funcţie de prelucrare
este considerată şi actualizarea înregistrărilor, de tabele şi de cunoştinţe, ce
presupune ştergerea informaţiilor devenite inutile, introducerea de informaţii noi,
modificarea valorilor celor existente pentru apune în acord cu realitatea pe care
trebuie să o reflecte sau cu nevoile utilizatorlului de informaţii. Tratarea propriu-
zisă a informaţiei, constă în efectuarea celor mai variate operaţii care privesc,
forma, conţinutul informaţiilor îndeosebi în cazul prelucrării datelor şi
cunoştinţelor. Au loc o multitudine de operaţii logice (comparaţii, ordonări) sau
semantice de recunoaştere a formelor sau semnificaţiei acestora, în timp ce
consultarea interactivă a informaţiei, se realizează cu ajutorul unor programe care
permit căutarea, selectarea şi transmiterea informaţiei solicitate, la un dispozitiv
periferic de ieşire (monitor, imprimantă, echipament de comunicaţie în reţea etc.).
Consultarea bazei de informaţii nu afectează conţinutul acesteia. În sfârşit,
formalizarea informaţiei solicitate la ieşire, presupune operaţii diferite în raport de
natura informaţiei solicitate. Au loc operaţii pentru obţinerea de rapoarte şi situaţii
complexe, care, vor fi transferate la dispozitivele de ieşire în vederea imprimării
lor, afişării la terminal sau a comunicării locale, ori la distanţă, prin intermediul
reţelelor de date.
5. Funcţie de ieşire (sau de prezentare) a informaţiei din sistem trebuie să satisfacă
mai multe cerinţe, printre care cele legate de natura informaţiei transferate la
ieşire (date, texte, documente, secvenţe sonore, secvenţe vizuale sau diferite
combinaţii ale acestora), de conţinutul efectiv al informaţiilor solicitate la ieşire
(completitudinea), de natura suportului tehnic sau grafic, pe care urmează a fi
transferată informaţia la ieşire, ca şi de forma, digitală sau analogică, a informaţiei
transmise. În sfârşit, ultimul şi cel mai important criteriu este cel care are în
vedere destinatarul şi mijlocul de comunicare adecvat.
6. Funcţia de comandă şi control a sistemului informatic deţine toate atributele
necesare pentru dirijarea şi reglarea funcţionării întregului sistem, a tuturor
funcţiilor sale, alocarea optimă a resurselor sistemului referitoare la echipament,
memoria internă, baza de programe şi baza informaţională, controlul proceselor
de intrare, prelucrare şi ieşire a informaţiei în funcţie de natura lor, de specificul
operaţiilor care se execută, de destinaţia şi modul de transmitere a rezultatelor.
Indiferent de definiţia avută în vedere, toţi specialiştii din domeniu sunt de acord
asupra faptului că rolul unui sistem informatic de marketing (SIMk) este de a furniza
informaţii necesare în procesul de fundamentare al deciziilor de marketing. În principal,
procesul decizional în acest domeniu presupune activităţi în domeniul planificării,
organizării, coordonării, implementării şi controlului activităţilor de marketing.
Astfel, un SIMk eficient trebuie să fie astfel conceput astfel încât să răspundă
nevoilor informaţionale ale conducerii organizaţionale, prin prisma nevoilor specifice ale
acestora. Teoria managerială identifică cel puţin trei roluri importante pe care persoanele
din conducerea unei organizaţii trebuie să le îndeplinească: decizional, informaţional şi
interpersonal. Un SIMk trebuie să ofere suport pentru toate aceste roluri pentru a-şi atinge
obiectivele. În plus, persoanele din conducere apreciază informaţiile în primul rând pe
baza relevanţei lor (faptice şi temporale) şi preferă formele de prezentare verbale5 .
De asemenea, în cadrul unui organizaţii, deciziile de marketing, la fel ca toate
celelalte decizii, sunt luate pe trei niveluri: strategic, tactic (sau de control) şi operaţional.
Din nou, un SIMk trebuie să ofere suport pentru toate aceste trei niveluri.
5
Crawford, I.M., Marketing Research and Information Systems, Ed. FAO, 1997
Un SIMk, pentru a îndeplini toate aceste cerinţe trebuie să conţină un număr de
componente specifice, cele mai comune fiind un sistem de raportare interna specifică, un
sistem dedicat suportului şi prelucrării cercetărilor de marketing, o bază de modele de
marketing, ca şi un eventual sistem inferenţial, din categoria sistemelor expert de
marketing.
Partea de raportare specifică poată să fie în directă legătură cu sistemul
informatic managerial al organizaţiei (SIM), extrăgând de aici informaţii despre
comenzile primite şi procesate, date despre stocuri şi inventar, facturile emise, informaţii
despre clienţi şi furnizori, despre organismele statului cu care întreprinderea se află într-o
legătură directă sau informaţii despre personalul angajat. Aceste informaţii sunt strânse
de către o organizaţie în procesul normal de desfăşurare a activităţii sale, dar în lipsa unui
SIMk performant aceste date nu sunt valorificate la potenţialul lor maxim.
Ca exemplu, pornind de la simpla utilizare a informaţiilor din facturile emisă de
către organizaţie, pot fi obţinute informaţii despre:
· Tipul, dimensiunea şi valoarea vânzărilor pentru o anumită categorie de
produse, pe regiuni.
· Tipul, dimensiunea şi valoarea vânzărilor pentru o anumită categorie de
produse, pe tipuri de clienţi.
· Tipul, dimensiunea şi valoarea vânzărilor pentru o anumită categorie de
produse, în funcţie de producători.
· Tipul, dimensiunea şi valoarea vânzărilor pentru o anumită categorie de
produse, în funcţie de cifra de afaceri a clienţilor.
· Valoarea medie şi volumul vânzărilor, pe regiuni.
· Valoarea medie şi volumul vânzărilor, pe tipuri de clienţi.
· Valoarea medie şi volumul vânzărilor, în funcţie de producători.
· Valoarea medie şi volumul vânzărilor, în funcţie de cifra de afaceri a
clienţilor.
Iar această listă poate continua, în funcţie de necesităţile de analiză ale
departamentului de marketing şi de nivelul de detaliu al surselor utilizate. Un alt exemplu
util ar putea fi compararea cererilor de ofertă cu facturile emise, determinându-se astfel
gradul în care sunt satisfăcuţi clienţii organizaţiei.
6
Lilien, G.L., Kotler, P. şi Moorthy, K.S., Marketing Models, Ed. Prentice Hall, Englewood Cliffs, NJ,
1992.
7
Kotler, Philip, Managementul Marketingului, Ed. Teora, Bucureşti, 1997, pg.179.
Sisteme inteligente pentru asistarea deciziilor
1
Balaure, V. (coord.), Marketing, Ed. Uranus, Bucureşti, 2002.
avantaje competitive semnificative permiţând factorilor de decizie să adopte
diferite cursuri de acţiune rapid, chiar şi în condiţii de incertitudine ridicată.
· Depăşirea unor limite cognitive de procesare şi stocare. Conform experţilor2 ,
mintea umană este limitată în abilitatea sa de procesare şi stocare a
informaţiilor. De asemenea, foarte frecvent oamanii au dificultăţi de
reamintire exactă a informaţiilor la momentul în care acestea sunt necesare în
procesul decizional.
2
Simon, H. The New Science of Management Decision. Ed. Prentice Hall Englewood Cliffs, NJ, 1977
3
Gorry, G.A. şi Morton, S. “A Framework for Management Information Systems”, apărut în Sloan
Management Review, Vol.13, Nr.1, 1971
pentru asistarea deciziilor de marketing, ca şi sisteme cu ajutorul cărora să se realizeze
operaţiile curente ale departamentelor financiare, contabile sau de resurse umane. De
asemenea, pot exista in interiorul acelei organizaţii sisteme expert pentru asistarea
angajaţilor care asigură managementul relaţiilor cu clienţii sau diagnosticarea
problemelor funcţionale ale echipamentelor utilizate în departamentul de producţie. Toate
acestea pot fi considerate ca fiind sisteme informatice pentru asistarea deciziilor, sau ca
fiind parte dintr- un SIAD general, utilizat la nivelul organizaţiei.
Utilizarea sistemelor informatice pentru asistarea deciziilor poate aduce
nenumărate beneficii unei organizaţii, printre acestea numărându-se creşterea calităţii
deciziilor, reducerea costurilor, creşterea productivităţii, reducerea timpului necesar
adoptării deciziilor, îmbunătăţirea comunicaţiei în interiorul organizaţiei, cât şi cu
partenerii, ca şi creşterea satisfacţiei angajaţilor şi a clienţilor. Factori precum gradul de
competitivitate, ramura industrială, dimensiunea companiei, ca şi gradul de uşurinţă în
utilizarea sistemului informatic reprezintă modalităţi care influenţează aprecierea şi
beneficiile pe care o organizaţie le poate avea după implementarea unui sistem informatic
de asistarea deciziilor.
Studii efectuate la sfârşitul anilor nouăzeci4 au scos în evidenţă o serie de motive
pentru care organizaţiile decid implementarea unui sistem informatic de asistarea
deciziilor:
· companiile lucrează într-un mediu economic instabil;
· dificultatea urmăririi numeroaselor procese economice ale organizaţiei;
· intensificarea competiţiei în condiţiile globalizării economiei;
· apariţia comerţului electronic;
· sistemele informatice existente nu oferă date utile în procesul decizional;
· departamentul IT este suprasolicitat, neputând răspunde tuturor cerinţelor
conducerii organizaţiei;
· necesitatea unor informaţii cu o acurateţe ridicată;
· sistemele informatice pentru asistarea deciziilor sunt percepute ca active
importante într-o organizaţie;
· necesitatea accesării unei noi categorii de informaţii;
· informaţiile sunt necesare imediat pentru asistarea deciziilor în care timpul
reprezintă un factor esenţial;
· reducerea costurilor;
4
Davison, R. Decision Support Systems Implementation, Ed. Prentice Hall, Englewood Cliffs, NJ, 2000
· satisfacerea nevoilor informative ale conducerii şi ale altor eşaloane
manageriale;
· realizarea unei interfeţe foarte prietenoase, adecvate cu procesele decizionale
individuale ale membrilor conducerii organizaţiei;
· oferirea unor posibilităţi şi proceduri de control şi urmărire eficiente şi în timp
real asupra operaţiilor specifice organizaţiei;
· oferirea unui acces rapid la informaţii detaliate;
· filtrarea, comprimarea şi urmărirea datelor şi informaţiilor critice pentru
organizaţie;
· identificarea ameninţărilor şi oportunităţilor din mediul extern al organizaţiei;
5
Trippi, R. şi Turban, A., Neural Computing Applications in Investment and Financial Services,
6
Liebowitz, J., Building Organizational Intelligence: A Knowledge Management Primer, CRC Press, Boca
Raton, Fl, 1999.
Managementul relaţiilor de aprovizionare
7
Forgionne, G.A. şi Kohl, R. Integrated MSS Effects: An Empirical Health Care Investigation, apărut în
Information Health Care and Management, Vol.31, Nr.6, 1995
depanarea unui autovehicul: mecanicul diagnostichează problema şi caută cele mai
eficiente unelte pentru a o repara. Un singur instrument poate fi suficient pentru a rezolva
problema respectivă, dar adeseori este necesară utilizarea unui număr mare de unelte
pentru a obţine cele mai bune rezultate, într-un timp rezonabil. Iar uneori nu există unelte
standard, caz în care, mai ales pentru sistemele informatice, acestea trebuie construite.
Diferitele tipuri de sisteme informatice sunt în general complementare. Spre
exemplu, un sistem expert poate avea componente pe baza cărora este modelat mediul
decizional, în timp ce o reţea artificială neuronală sau un sistem de sprijin al activităţilor
distribuite (groupware) pot ajuta la colectarea cunoştinţelor necesare în procesul de
dezvoltare a sistemului expert. Un alt exemplu util ar fi integrarea sistemelor de
management al relaţiilor cu clienţii (CRM) şi al celor de management al relaţiilor de
aprovizionare (SCM), permiţând utilizarea unei singure baze de cunoştinţe care să
conţină informaţii despre produse, clienţi şi furnizori, integrând intrările şi ieşirile
sistemului productiv al organizaţiei.
Factori de decizie
în domeniul D E C I Z I I
marketingului
S EI S AS S E / D E I S
INTERFATÃ UTILIZATOR
Limbaj
Limbaj Limbaj
a c t i v a r eafisare c u n o s t i n t e
Modele de date
pentru BD BD Modele
orientate pe
strategice
BT
obiecte
Modele de date
pentru BD BD Modele
multimedia multimedia tactice
Modele de Modele
cunostinte BC operationale
m u l t i u t i l i z B Fa t o r
I N T E G R A R E
I N T E R A C T I V I T A T E
SISTEMUL
FACTORI DE PRODUCŢIE INFORMAŢIONAL HARDWARE
RESURSE UMANE SOFTWARE
CAPITAL PERSONAL
SISTEMUL DE
TEHNOLOGII DATE
BAZĂ
INFORMAŢII BUNURI-SERVICII
1
I I
N N
Documente T I RESURSE T I Formulare
E N E E
Machete R T REGULI RŞ Rapoarte
F R F I
Suporţi E A PROCEDURI E R Document
R Ţ R E
Reţele de E E METODE E Suporţi
comunicaţii
D D Reţele de
E E calculatoa
re
Sistemele OLTP
Sistemele OLTP numite de unii autori şi sisteme TS – transactions systems, s-au rezumat
doar la culegerea şi prelucrarea datelor în sensul procesării documentelor primare, pentru aplicaţii de
contabilitate, gestiunea stocurilor, salarii, prelucrări statistice simple pentru cercetări de marketing
pe baza chestionarelor de sondaj. Sistemele informaţionale de tip OLTP s-au concentrat pe
disciplinarea sistemului informaţional sub aspect organizatoric în primul rând şi pe asigurarea
consistenţei şi acurateţii datelor în al doilea rând.
Consistenţa se referă la completitudinea şi corelarea datelor, prevenirea pierderilor de date
datorită unor omisiuni mecanice sau logice ce nu sunt semnalate de algoritmi de actualizare a
datelor. Acurateţea datelor se referă la corectitudinea , la precizia datelor prelucrate.
Sistemele MIS
Sistemele MIS se adresează în principal nivelului de conducere operativă a firmei. Pentru
început aceste sisteme erau numite sisteme SCO – sisteme de conducere operativă, pentru că se
opreau la nivelul conducerii compartimentelor funcţionale – aprovizionare, desfacere, marketing,
programarea, lansarea, urmărirea producţiei, resurse umane. Extinderea ariei de probleme ale acestor
sisteme către zona managementului general al firmei prin elaborarea de jurnale de bord, rapoarte
asupra situaţiilor de excepţie, situaţii centralizatoare cu indicatori sintetici de dinamică, transformă
un sisteme SCO într- un real sistem MIS.
Sistemele informatice de tip MIS cuprind în structura lor următoarele componente:
· baza tehnică, componenta hardware;
· sistemul de programe, componenta software;
2
·
baza informaţională, cuprinzând pe lângă baza de date şi fluxurile
informaţionale de intrare şi de ieşire;
· baza ştiinţifico- metodologică care reuneşte normativele, algoritmii, modelele
şi regulile de calcul şi de verificare a indicatorilor incluşi în situaţiile de
ieşire.
· Resursele umane şi cadrul organizatoric necesar pentru funcţionarea şi
managementul sistemului informatic.
Sistemele informatice de tip MIS pun accentul pe fundamentarea informaţională a
proceselor de management bazate pe metode cantitative.
Sistemele SIAD
Sistemele SIAD sunt, ceea ce în literatura de specialitate internaţională au apărut ca sisteme
DSS – decision suport systems, sunt sisteme informatice pentru asistarea deciziei care asigură prin
componentele sale condiţiile pentru desfăşurarea unui management bazat şi pe metode, modele
calitative.
Sistemele SIAD astfel structurate, cu astfel de componente în structura lor funcţională,
adaugă informaţiei valenţa de creativitate, în sensul că asigură nu numai satisfacerea cerinţelor
informaţionale ale conducerii operative de pe diferite trepte ierarhice, dar prin variantele, criteriile
şi soluţiile de alegere a deciziilor îi susţine pe aceştia în ceea ce priveşte managementul tactic şi
strategic.
Decizia este condiţia creativităţii. Prin decizie actul de conducere asigură creativitate
proceselor de management, inventivitate, spirit de anticipaţie, toate acestea fiind condiţii ale
succesului într-o economie concurenţială.
SIAD, tocmai prin legătura directă informaţie – decizie devine un sistem pro-activ, care
transformă informaţiile retroactive în suport pentru descoperirea de noi cunoştinţe necesare
procesului de învăţare.
Preocupări pentru definirea conceptului SIAD au apărut încă din anul 1970. Dorin Zaharie1
citându-ui pe E. Turban şi J. Aronson, consemnează o serie de definiţii care au adăugat fiecare
elemente suplimentare menite să întregească sensul semantic al acestui concept
Astfel, Scot Morton a fost primul care a definit clasa de sisteme SIAD ca „sisteme
informatice interactive care ajută decidentul în utilizarea datelor şi modelelor în scopul rezolvării
problemelor nestructurate”. Această definiţie subliniază doua elemente suplimentare faşă de
sistemele informatice din clasa MIS. Este vorba de interactivitatea utilizator – sistem, un prim
element, cel de-al doilea element fiind integrarea modelelor în structura SIAD.
În aceeaşi lucrare se menţionează definiţia lui J. Little care consideră şi el că SIAD conţine
un „set de proceduri de procesare a datelor şi a raţionamentelor bazate pe modele pentru asistarea
managerilor în procesul de adoptare a deciziilor”.
În anii ’80 moment de vârf al implementărilor de sisteme MIS, dar şi de ascensiune a
sistemelor SIAD, D. Alter punctează caracterul activ al sistemelor care se traduce prin schimbarea
perspectivei asupra abordării timpului, care se modifică în sensul trecerii de la timpul trecut la
timpul viitor. Devin preponderente modelele de decizie care au un orizont de timp plasat în viitorul
imediat, orizontul tactic, dar şi ceva mai îndepărtat, orizontul strategic. Accentul se pune acum nu
1
Dorin Zaharie, şa Sisteme informatice pentru asistarea deciziei, Ed. Dual Tech, Bucureşti, 2001
3
atât pe consistenţa datelor cât mai ales pe flexibilitate şi eficacitate. Dacă flexibilitatea este sugestiv
ca termen, trebuie să spunem că eficacitatea este un concept mai cuprinzător decât eficienţa care se
rezumă la compararea numerică a rezultatelor faţă de cheltuieli. Eficacitatea ia în considerare şi
aspectele calitative, mai greu cuantificabile numeric, a efectelor pozitive ale implementărilor SIAD.
În mod inevitabil sistemele informatice de asistare a deciziilor se apropie de zona prelucrării
cunoştinţelor, asociindu-se cu sistemele expert. Ajungându-se la sisteme inteligente de asistare a
deciziilor.
Sistemele inteligente de asistare a deciziilor, integrează în structura unui SIAD clasic şi
componenta de sistem expert care se dezvoltă în jurul bazei de cunoştinţe a sistemului. Unii autori,
chiar şi case software, folosesc termenul de EES – executive system suport, căruia i-a urmat
termenul de EIS – executive information system. Sitemele informatice executive, sintetic, sunt
sisteme inteligente de asistare a deciziilor care prelucrează datele din sistemele tranzacţionale şi
oferă informaţii sintetice top-managerilor.
Trei factori au fost determinanţi în ceea ce priveşte schimbările calitative înregistrate de
sistemele informatice – EDP, în dinamica ciclului lor evolutiv de la sistemele tranzacţionale la
SIAD. Este vorba de rezultatele cercetărilor în trei domenii , şi anume: ştiinţa conducerii, modelarea
economico- matematică şi tehnologia informaţiei şi comunicaţiilor.
Ştiinţa conducerii a adus îmbunătăţiri semnificative teoriei şi practicii managementului,
permiţând evidenţierea conceptului de „asistare a deciziei”. Asistarea deciziei se bazează pe faptul
că omul în virtutea unei reprezentări mentale îşi elaborează un model al procesului decizional. Acest
model este utilizat în simularea alegerii şi evaluarea soluţiei alese înainte de a se trece la acţiune
Asistarea deciziei este definită drept activitatea celui care bazându-se pe modele obţine
răspunsuri corespunzător întrebărilor adresate persoanelor implicate în procesul decizional,
răspunsuri care confirmă sau infirmă supoziţii, diagnostice, aprecieri, soluţii sau previziuni.
Decizia finală şi responsabilitatea asumării acestei decizi aparţine decidentului uman.
Au existat numeroase încercări de formalizare a procesului de luare a deciziei care s-au
concretizat sub forma unor modele mai mult sau mai puţin structurate, deterministe sau probabiliste.
Modelarea economico-matematică a completat cercetarea din domeniul teoriei economice,
cu realizări notabile în special în segmentul cercetărilor operaţionale. Aceste modele şi-au găsit
rapid implementări prin pachete software.
Tehnologia informaţiei şi comunicaţiilor joacă un rolul major în toate aceste
transformări ale sistemelor informatice. Performanţele sunt remarcabile: în domeniul hardware, al
sistemelor de operare cu interfaţă prietenoasă şi personalizabilă, dezvoltarea comunicaţiilor în reţea,
reţele LAN, MAN şi WAN, apoi produsele software complexe şi performante pentru prelucrarea
volumelor mari de date, baze de date, depozite de date, analiză multidimensională OLAP şi
extragerea cunoştinţelor prin tehnologia Data Minning. Este limpede că tehnologia IT&C adoptată
este definitorie pentru calitatea sistemului informatic.
Sistemele SIAD valorifică valenţele platformelor IT&C prin faptul că sunt concepute pentru
a asigura accesul de oriunde şi oricând la informaţii plasate în baze de date locale sau distribuite,
pentru o comunicare mai rapidă între utilizatori, pentru a asigura diversificarea posibilităţilor de
interogare în funcţie de cerinţele manageriale, unele chiar imprevizibil, furnizând informaţii
relevante, complete şi valide.
Sistemele SIAD valorifică extraordinarele performanţe ale sistemelor expert, şi mai recent al
soluţiilor software de tip „business intelligence” care permit căutarea de soluţii, reţinerea faptelor
4
deci învăţarea şi în consecinţă obţinerea de noi cunoştinţe din datele tranzacţionale existente în
depozitele de date Data Warehouse şi Data Marts, constituie în cadrul sistemului.
INTERFAŢĂ UTILIZATOR
INTEGRARE
INTERACTIV
Se regăsesc în această structură componentele de bază aşa cum au fost ele pentru prima dată
enumerate de E. Turban şi J. Aronson, citaţi şi de D. Zaharie , este vorba despre:
- sistemul de gestiune al datelor – DMS, data management system;
- sistemul de gestiune al bazei de module – MMS, model management system;
- sistemul de management al bazei de cunoştinţe – KMS, knowledge management system;
2
Gheorghe Orzan, Sisteme informatice de marketing, Ed. Uranus, Bucurşti 2001
5
- sistemul de interfaţă prietenoasă cu utilizatorul – FGUI, friendley graphic user interface .
3
Ion Ivan, Adrian Vişoiu, Baza de modele economice, Ed ASE, Bucureşti 2005
6
- după natura soluţiilor avem modele cu soluţii exacte, modele cu soluţii aproximative,
modele fuzzy, modele bazate pe reţele neuronale, algoritmi genetici, etc.,
7
· SIAD bazate pe cunoştinţe dacă predomină ca importanţă componentele sistemului
expert;
· SIAD cu componente pentru asistarea deciziilor de grup în care componenta pentru
gestiunea interfeţei cu utilizatorul este extinsă pentru a asigura facilităţi de partajare de
modele şi/sau date şi o participare colaborativă, interactivă, on – line a diverşilor
utilizatori.
Nevoia de management performant al sistemelor informatice a condus la proiectarea şi
realizarea de soluţii performante care integrează sistemele SIAD în sistemele generalizate de tip
ERP – Eterprise Resource Planning. Soluţiile ERP reprezintă cu certitudine o generaţie nouă de
sisteme informatice care valorifică în planul creativităţii resursele informaţionale ale sistemului şi
abilităţile decizionale ale managerilor.
8
Sisteme informatice pentru asistarea deciziilor bazate pe modele
Sistemele inteligente bazate pe modele constituie prima etapă în evoluţia sistemelor SIAD.
Ele au realizat desprinderea de sistemele ce utilizau modele de calcul direct, modele care sunt de
fapt relaţii de calcul indicate prin metodologii, acte normative, legislaţie. Aici se includ calculele
pentru gestiunea stocurilor, calcule financiar – contabile, în general calcule pentru evidenţa
tehnico-operativă.
Pasul înainte pe care-l realizează aceste sisteme îl constituie utilizarea unor modele care ţin
cont de specificul proceselor decizionale şi criteriile de analiză şi construiesc variante de decizie ce
sunt evaluate şi prezentate decidenţilor. Acest lucru presupune cunoaşterea analitică a mecanismului
decizional, pentru a identifica elementele implicate în actul decizional, legăturile dintre ele şi
intercondiţionările cu mediul decizional, precum şi legităţile, criteriile pe baza cărora se desfăşoară
actul alegerii propriu zise.
Avem nevoie de o astfel de perspectivă cuprinzătoare asupra mecanismului decizional pentru
a înţelege că decizia nu este un act singular al unei simple alegeri dintre două sau mai multe
alternative, este un act cu o temeinică fundamentare informaţională.
Fundamentarea complexă a procesului decizional trebuie să înceapă cu analiza obiectivelor şi
corelarea acestora cu resursele, numai astfel putem ajunge la intuirea şi formularea problemei
decizionale, care este de fapt prima etapă a modelării procesului decizional.
Stabilire
ob.criterii
Variante
Analiza Formu de acţiune Estima Acţiuni Urmă
obiectiv larea rea uti măsuri rire
e şi proble Stare de risc lităţii Deci practic Con
corelare mei incertitudin zie e trol
resurse e
Abateri
potenţiale
Reglaj retrospectiv
Abater
reglaj
ie
prospectiv
1
Actul decizional este precedat de un întreg proces de analiză a problemei care face obiectul
deciziei şi în urma căruia se definesc:
- variantele de acţiune;
- criteriile de decizie;
- stările naturii – starea de certitudine, risc sau incertitudine;
- consecinţele aplicării în practică a diverselor variante de acţiune.
Acest proces duce în final la actul alegerii pe baza evaluării criteriilor şi consecinţelor. El se
încheie cu evaluarea rezultatelor înregistrate ca urmare a transpunerii deciziei în acţiuni, în lumea
reală. Această evaluare deschide un nou ciclu decizional care va urmări corectarea eventualelor
erori, abateri de la rezultatele scontate.
Pentru a ajunge la formularea problemei decizionale este nevoie de culegerea şi analiza
atentă a informaţiilor referitoare la aria de cuprindere li desfăşurarea procesului economic analizat,
referitor la relaţiile cu alte procese şi sisteme economice cu care se intercondiţionează reciproc. Se
are în vedere concentrarea într-o formă sintetică a principalelor caracteristici şi elemente ale
procesului decizional, şi stabilirea variantelor şi alternativelor de acţiune.
Formularea unei probleme decizionale este legată nemijlocit de definirea unor criterii şi
obiective, în baza cărora vor fi analizate, departajate, ordonate, şi selectate variantele sau
alternativele de acţiune ale decidentului.
În activitatea de marketing, cele mai frecvente criterii se materializează prin condiţiile
specifice mix- ului de marketing. Aceste criterii legate de produs, preţ, promovare, distribuţie, pot fi
de natură tehnică, economică şi socială. Ele reprezintă restricţiile şi influenţele care se resimt în
politica de marketing a firmei.
Interacţiunile în dinamica lor, specifică realităţii economice analizate în cadrul procesului
decizional, implică pentru fiecare criteriu de decizie a mai multor nivele, cuantificabile, necesare
pentru caracterizarea cantitativă sau calitativă a fenomenului economic. Diversele variante de
acţiune ale decidentului vor avea drept consecinţe atingerea unui anumit nivel, pentru fiecare dintre
criteriile analizate. Aceste nivele concrete vor reprezenta obiectivele considerate din unghiul de
vedere al criteriilor decizionale în discuţie.
Decizia de alegere a unei variante de acţiune trebuie corelată cu analiza abaterilor potenţiale
determinate de cunoaşterea probabilităţilor de realizare a consecinţelor variantelor de acţiune.
Cunoaşterea acestor probabilităţi definesc particularităţile universului decizional în care se situează
decidentul, situaţii denumite stări ale naturi. Acest univers decizional poate fi caracterizat de:
· condiţii de certitudine;
· condiţii de risc;
· condiţii de incertitudine.
Cunoaşterea sigură a consecinţelor pentru decizia luată, deci a rezultatelor aplicării fiecărei
variante, înseamnă situarea procesului decizional în condiţii de certitudine. Cunoaşterea numai a
probabilităţilor de producere a rezultatelor ne situează în condiţii de risc. Ignoranţa statistică, adică
necunoaşterea probabilităţilor de producere a rezultatelor, ne plasează în condiţii de incertitudine.
Cu această precizare a existenţei şi necesităţii luării în considerare şi a stărilor naturii, avem
imaginea completă a elementelor pe care le va analiza decidentul în cadrul procesului decizional în
vederea alegerii variantei optime, proces care poate fi sintetizat în următorul model analitic.
2
Considerăm:
- mulţimea criteriilor de decizie: X
X={X1 , X2 , ….Xj, …..Xr }
åq j =1
j =1
Fiecărei stări a naturii Nk , i se poate asocia probabilitate de apariţie pe care îi vom nota: pk ,
cu proprietatea:
n
åp k =1
j =1
Atât criteriile de decizie cât şi variantele decizionale pot fi conjugate cu factorul timp.
Modelul prezentat mai sus poate fi analizat şi din punctul de vedere al unui succesiuni de procese
decizionale prin introducerea a „t” momente decizionale. Pentru fiecare astfel de moment sunt
necesare estimările adecvate pentru ansamblu de consecinţe şi stări ale naturii.
Există situaţii când problema decizională se poate defini prin reprezentarea restricţiilor
economice sub forma unui sistem de relaţii liniare:
3
åa * x ³ b ,
ij j i
(i = 1,2, …..m)
x j
³0 , (j = 1,2,……n)
În acest caz pentru „r” criterii de decizie şi „s” stări ale naturii se pot scrie r*s funcţii de
eficienţă:
1, n
opt Fhk = opt åqj
hkj
* xj (h = 1,2,…r) ; (k = 1,2,….n)
unde fiecare din funcţiile Fhk au coeficientul de importanţă qh şi probabilitatea de realizare a stării
naturii corespunzătoare pk..
Fiind definit astfel modelul complex al procesului decizional prin precizarea elementelor
sale: variante, criterii de decizie, stările naturii, următoarea etapă în asistarea procesului decizional o
constituie „alegerea soluţiei optime”.
În condiţii de certitudine se pot folosi în alegerea soluţiei optime metoda estimării şi
însumări utilităţilor în scopul alegerii variantei ce corespunde utilităţii sumă maxime.
1, n
V* = å p *u ij
, (i = 1,2, ….,m)
ij
j
unde: V* - este varianta ce corespunde soluţiei de utilitate maximă dintre variantele Vi;
u ij
- este utilitatea estimată pentru consecinţa x ij
a variantei Vi pentru criteriul Xj
Se pot utiliza pentru rezolvarea modelelor liniare tehnicile de programare simplex, sau
programare liniară cu mai multe funcţii obiectiv, etc.
În condiţii de risc soluţionarea problemei decizionale revine la alegerea alternativei căreia îi
corespunde o utilitate complexă medie maximă.
1, n 1, n
V* = max ( å p * (å p *u ijk
)) , (i = 1,2, ….,m)
ij k
j j
unde: u ijk
, este utilitatea pentru consecinţa x ijk
a variantei Vi criteriul Xj starea naturii Nk
4
Din multitudinea de modele care pot fi construite pe baza orientărilor oferite de modelul
global prezentat, ne vom opri în continuare asupra a trei categorii de modele mai des aplicabile în
domeniul marketingului, şi anume:modele bazate pe analiză bayesiană; modele de regresie; modele
de programare liniară.
Aceste modele se înscriu în categoria modelelor de decizie multicriterială care sunt utile în
cazul problemelor în care intervin puţine variante.
Deciziile de marketing sunt decizii, care de regulă sunt caracterizate de starea de risc sau
incertitudine şi au ca scop final maximizarea profitului sau reducerea costurilor. De aceea o primă
problemă se pune chiar în legătură cu oportunitatea unei cercetări de marketing. Metodele de analiză
bayesiană permit stabilirea valorii economice a informaţiei, într-un anumit context decizional. Cu
ajutorul lor, se poate determina dacă cercetarea de marketing trebuie desfăşurată sau dacă decizia
va fi adoptată pe baza informaţiilor deja existente.
Dacă valoarea anticipată a deciziei este mai mare în condiţiile fundamentării ei pe baza
informaţiilor rezultate din cercetare, decât în absenţa acestora, reaizarea cercetării este justificată.
Totuşi, în cazul în care costul cercetării este mai mare decât contribuţia sa la procesul decizional,
eforturile de cercetare nu sunt eficiente şi cercetarea nu va fi proiectată şi realizată.
Analiza bayesiană pentru estimarea valorii informaţiilor obţinute din cercetare se poate
realiza cu un model multicriterial care se va rezolva, aşa cum o să şi ilustrăm, cu ajutorul
programului de calcul tabelar EXCELL.
Să luăm în discuţie exemplul unei firme care doreşte să sporească profunzimea gamei oferite
utilizatorilor prin lansarea pe piaţă a unui produs nou. Pentru produsul respective, decidenţii trebuie
să aleagă una dintre următoarele variante:
· V1 , lansarea produsului pe baza unei strategii d preţ de “smântânire”;
· V2 , lansarea produsului pe baza unei strategii de preţ mediu;
· V3 , lansarea produsului pe baza unei strategii de preţ de penetrare.
Pentru fiecare variantă, preţul stabilit are drept consecinţe obţinerea unui anumit profit
diferenţiat în funcţie de reacţia pieţei manifestată prin cerere. Cererea pentru acest produs poate
înregistra trei forme:
· cerere mică;
· cerere moderată;
· cerere mare.
Primul pas îl constituie creare tabelului Excel în care se introduce matricea cu valorile
„consecinţelor” pentru fiecare variantă şi criteriu, în cazul nostru pentru fiecare variantă de preţ şi
mărime a cererii. S-au ales ca valori ale consecinţelor, profiturile obtenabile în cazul fiecărei
variante de preţ, în funcţie de cerere
5
Figura 3: Tabelul Excel cu matricea consecinţelor
Pasul doi îl constituie luarea în considerare a probabilităţilor de producere a consecinţelor
asociate fiecărui nivel al cererii. Aceste probabilităţi sunt rezultatul experienţei specialiştilor sau a
unor rezultate ale unor cercetări de marketing anterioare. În tabelul Excell astfel obţinut inserăm
formulele de calcul pentru calculul valorii anticipate a fiecărei variante de decizie.
Construim un nou tabel Excel care să ne permită introducerea probabilităţilor fiecărui
criteriu şi recalcularea matricei consecinţelor ponderate cu vectorul probabilităţilor.
1 – introducem în celulele B3, C3, D3 probabilităţile asociate fiecărui nivel al cererii;
2 – recalculăm matricea consecinţelor ponderate cu valorile probabilităţilor în zona de celule
B9:D12, ca orice produs dintre o matrice şi un vector linie (figura 4);
6
Figura 5: Tabelul Excel pentru analiza bayesiană apriori a valorilor anticipate
Modelul se poate extinde prin includerea formulelor de calcul specifice deciziilor din
categoria criteriilor Wald, Laplace, Savage, Hurwicz, criterii cunoscute drept criteriile: maximin,
maxmax, minmin, minmax, după cum abordează alegerea variantei optime.
Pentru deciziile în condiţiile de certitudine vectorul probabilităţilor se înlocuieşte cu un
vector al coeficienţilor de importanţă , coeficienţi atribuiţi în mod subiectiv de decidenţi pentru
fiecare din criteriile după care se apreciază valoric consecinţelor variantelor decizionale.
7
Elemente fundamentale ale sistemelor expert
1
Năstase P., Zaharie D., Sisteme expert: teorie şi aplicaţii, Dual Tech, Bucureşti, 1999
Modul de abordare pragmatic stă la baza unei alte definiţii a inteligenţei
artificiale: inteligenţa artificială este acea parte a informaticii care are drept scop
executarea pe calculator a unor sarcini pe care omul într-un context dat le poate face
mai bine decât maşina.
Abordarea conexionistă în care raţionamentul natural este privit ca o suită de
stări şi procese neuronale iar raţionamentul artificial încearcă să reproducă mecanic
acestă activitate neurologică a creierului uman. In acest mod de abordare se includ
reţelele neuronale, sisteme care imită organizarea şi funcţionarea materiei cenuşii.
In timp ce informatica clasică este definită ca fiind ştiinţa prelucrării automate a
datelor, informatica inteligentă este ştiinţa prelucrării automate a cunoştinţelor.
Informatica clasică are la bază noţiunea de prelucrare algoritmică iar informatica
inteligentă are la bază noţiunea de prelucrare simbolică in care dispare distincţia dintre
date şi programe. Văzută din acestă perspectivă inteligenţa artificială este acea parte a
informaticii care se ocupă cu rezolvarea unor probleme prin prelucrare simbolică,
nealgoritmică a informaţiilor.
Sistemele expert fac parte din clasa sistemelor cu inteligenţă artificială
pragmatică, deţinând un număr mare de cunoştinţe care să acopere în principiu toate
situaţiile posibile care pot apare în funcţionarea unui sistem social, tehnic sau economic.
Dacă sistemele expert au fost dezvoltate la început în domeniul tehnic şi
medical, în ultimul timp se asistă la o extindere acestora în domeniul economic. După
preluarea cunoştinţelor expertului uman, sistemele expert multiplică şi explicitează
experienţa acestuia, fapt foarte important ştiut fiind că un expert uman într- un domeniu se
formează greu şi necesită pe lângă pregătirea şi experienţa profesională şi calităţi native.
Sistemele expert fac parte dintr-o gamă de instrumente indispensabile pentru
realizarea de sisteme automate sau interactive capabile să efectueze sarcini complexe. Nu
se pot ignora toate raţionamentele calitative şi simbolice care formează baza
managementului unei întreprinderi. Incă de la început sistemele expert au avut asociate
instrumente de cercetare operaţională care au facilitat construirea de sisteme de asistare
foarte complexe pentru diagnostic financiar, asistarea concepţiei produselor în
întreprinderi şi în organizarea producţiei.
Pentru definirea sistemelor expert este necesară o partajare a cunoştinţelor
expertului uman dintr-un anumit domeniu. Astfel un expert uman recunoaşte şi rezolvă
probleme din domeniul său de expertiză având o capacitate crescută de a se orienta în
aspecte precum: complexitatea, incertitudinea, inconsistenţa şi aprecierile vagi. Pornind
de aici, expertul uman trebuie să aducă problema în stadiul în care lucrurile sunt cât mai
simple, complete, precise, consistente şi clare. Problema este trecută din sfera expertizei
în sfera cunoştinţelor comune de specialitate. In general, expertul uman acţioneză într-o
clasă de probleme slab structurate pentru care nu se pot defini algoritmi de rezolvare.
Sistemul expert, încercând să imite expertul uman, prezintă caracteristicile:
· cunoştinţele sunt independente de mecanismul de raţionament, nu depind
unele de altele iar modificarea unui element nu influenţează raţionamentul;
· sistemul expert trebuie să fie capabil să explice raţionamentele făcute şi să
argumenteze soluţiile obţinute;
· cunoştinţele folosite de sistemele expert sunt în principal de natură
simbolică;
· sistemul expert trebuie să poată gestiona baze de cunoştinţe de volum mare
şi să trateze cunoştinţe inexacte şi incomplete;
· sistemul expert utilizează metode empirice, bazate pe experienţă, care
conduc la soluţiile cele mai bune;
· sistemul expert este specializat într-un anumit domeniu şi nu în rezolvarea
unei singure probleme.
Sistemele expert sunt total dependente de calitatea şi volumul cunoştinţelor
înmagazinate pe care apoi le folosesc pentru a simula raţionamentul uman şi de a realiza
procese deductive. Se impune astfel formalizarea cunoştinţelor prin diferite metode de
reprezentare a acestora pe baza fenomenului de cunoaştere.
Cunoaşterea este o sinteza a unor concepte fundamentale proprii: fapte, reguli
şi strategii de raţionament. Astfel,
· Faptele sunt structuri de date complexe cu o semantică şi o semnificaţie
proprie derivată din sfera domeniului abordat.
· Regulile sunt modalităţi de reprezentare şi utilizare a faptelor în procesul de
prelucrare a cunoştinţelor. Distincţia dintre fapte şi reguli va fi evidenţiată în
cursul următor, care se va axa pe modalităţile de reprezentare a cunoştinţelor.
· Strategiile de raţionament denumite şi metode euristice, exprimă sintetic
modalitatea de utilizare a regulilor, prin intermediul unui anumit tip de
raţionament: deductiv, inductiv sau mixt.
Prelucrarea cunoştinţelor necesită un sistem de stocare şi manipulare a
cunoştinţelor de natură să permită declanşarea şi emiterea de raţionamente. La nivelul
sistemelor expert se folosesc structuri de cunoştinţe cu funcţii similare structurilor de date
utilizate în stocarea şi prelucrarea de date.
Particularităţile cunoştinţelor referitoare la un domeniu dat sunt:
· cunoştinţele exprimă informaţii specifice pentru anumite clase de obiecte de
natură materială sau conceptuală;
· cunoştinţele sunt valabile şi dependente strict de starea şi evoluţia domeniului
de referinţă;
· cunoştinţele pot fi incomplete datorită caracterului lor implicit pentru expertul
uman şi dificil de formulat şi transmis calculatorului;
· cunoştinţele sunt integrabile în anumite limite deoarece acestea pot fi fixe sau
variabile, certe sau incerte, exacte sau inexacte.
2
Benchimol G., Levine P., Pomerol J. C., Sisteme expert în întreprindere, Editura tehnică,
Bucureşti, 1993
· formare: transmiterea de cunoştinţe unei persoane al cărei nivel şi
caracteristici fac obiectul unui diagnostic de învăţare foarte bine adaptată.
Această transmitere de cunoştinţe sau de a şti ce trebuie făcut se poate baza pe
diagnostic, întreţinere, etc;
· supraveghere: declanşarea unei alarme în condiţii determinate care pot evolua
cu contextul sau trimiterea unei dări de seamă plecând de la semnale
interpretate şi folosite într-un diagnostic;
· previziune: descrierea unei situaţii prin anticipare, plecând de la o situaţie
curentă prin intermediul unui model construit pe o bază istorică sau prin
învăţare;
· simulare: deducţia, plecând de la un model al consecinţelor acţiunilor sau
evenimente declanşate de către sistemul aflat în curs de derulare a simulării;
· planificare: definirea în timp şi în spaţiu a acţiunilor care permit atingerea
unei stări finale prin compararea stării curente cu starea dorită prevând
consecinţele de acţiune într-o manieră care să permită respectarea restricţiilor
impuse de mediu, nivelul resurselor disponibile şi consecinţele previzibile ale
interacţiunilor dintre stări şi acţiuni sau dintre stări succesive;
· întreţinere: planul de acţiune particular care decurge dintr- un diagnostic ce
evidenţiază punctele slabe ale unui sistem indicând şi cauzele. Planul de
acţiune constă în furnizarea instrucţiunilor necesare pentru remediere;
· concepţie: mulţimea de alegeri şi de decizii care permit, plecând de la
performanţele fixate prin diagnosticare, să se determine caietul de sarcini
pentru un scop ce trebuie îndeplinit în funcţie de nevoile exprimate la un
moment dat. De asemenea se are în vedere furnizarea unor mijloace pentru a
se atinge acest obiectiv definind caracteristicile unui produs sau ai unui proces
care respectă caietul de sarcini;
· controlul şi pilotajul: mulţimea de acţiuni aplicate unui sistem după
informaţiile care rezultă din supravegherea sistemului şi din anticiparea
situaţiilor care asigură, printr-o întreţinere permanentă şi un răspuns adaptat la
diverse situaţii, o funcţionare a sistemului cât mai apropiată de cea normală
definită prin valorile posibile şi programul care rezultă dintr-o planificare
adecvată;
· bibliotecă: ajută la accesarea, organizarea şi interpretarea informaţiilor
necesare îndeplinirii unei anumite sarcini;
· consiliere: sintetizează şi distribuie informaţia aferentă unei expertize de
specialitate care este solicitată de către utilizator;
· asistenţă generală: preia anumite sarcini de rutină pentru a permite persoanei
să se ocupe doar de aspectele importante ale muncii.
Intr-un sistem real aceste funcţiuni de bază sunt adesea combinate între ele.
Astfel funcţiile cele mai utilizate sunt: diagnostic/întreţinere (circa 45% din aplicaţii),
concepţie şi planificare (20%), interpretare (20%) şi control/pilotaj/supraveghere (15%).
Ultima funcţiune se află în creştere constantă, ea fiind frecvent asociată cu aceea de
diagnostic şi de planificare.
Plecând de la aceste funcţiuni se pot defini domeniile de aplicare ale sistemelor
expert. Referitor la numărul de aplicaţii, din punct de vedere cronologic, primele au
apărut în domeniul medicinei şi biologiei. Funcţiile utilizate sunt de diagnostic şi de
prescripţii terapeutice. Diagnosticul tehnic şi de întreţinere (cercetări privind cauzele
penelor, incidentelor) a făcut obiectul a numeroase sisteme expert în domeniul
informaticii, electronicii, geologiei şi ingineriei.
In domeniul economic funcţiile de diagnostic şi de formare a vânzătorilor sunt în
centrul preocupărilor elaboratorilor. In realizarea aplicaţiilor în domeniul asistării
deciziilor, funcţiile de planificare, diagnostic şi de simulare se pot combina. In domeniile
planificării şi evaluării deciziilor strategice astfel de sisteme s-au elaborat deja.
Funcţia de interpretare a fost utilizată în chimie, biochimie iar în aplicaţiile
militare s-a folosit o combinaţie a acesteia cu funcţia de planificare. In domeniul învăţării
aplicaţiile se află încă într-o fază incipientă. In ceea ce priveşte controlul şi conducerea
sistemelor complexe există tot mai multe aplicaţii mai ales în informatică şi în inginerie.
Referitor la concepţia sau configurarea sistemelor complexe există deja sisteme
operaţionale în electronică şi chimie şi mai puţin în informatică.
În final se poate constata că în domeniul industriei funcţiile de diagnostic şi de
întreţinere ocupă primul loc. Ele sunt urmate de cele de control şi conducerea proceselor,
asistarea concepţiei şi a deciziei.
Toate elementele componente ale unui sistem expert (mai puţin baza de
cunoştinţe) formează aşa numitul “sistem esenţial”. Acest sistem permite dezvoltarea
rapidă de sisteme expert prin crearea unor noi baze de cunoştinţe, operaţie cunoscută sub
numele de “instanţiere a unui sistem esenţial”. Acest lucru este posibil deoarece
algoritmii de raţionament implementaţi în motorul de inferenţă sunt aceeaşi. Cu toate
acestea nu se poate construi un mecanism universal de inferenţă pentru toate domeniile
de expertiză.
DOMENIU DE ACTIVITATE
EXPERT
COGNITICIAN
BAZA DE CUNO{TIN}E
INTERFA}A UTILIZATOR
UTILIZATOR
3
Năstase P., Zaharie D., Sisteme expert: teorie şi aplicaţii, Dual Tech, Bucureşti, 1999
Toate elementele prezentate mai sus pot fi structurate în patru componente după
cum este prezentat în tabelul 1:
4
Davidescu N.D., Arhitectura sistemelor expert, Editura didactică şi pedagogică, Bucureşti, 1997
CURSUL 07
Sistemele informatice inteligente - suport pentru afaceri
Informaţia este unul din cele mai utilizate cuvinte din lumea economică, şi nu numai.
Percepţia sa este cât se poate de eterogenă, conceptul de informaţie fiind subiect de reflecţie şi
analiză în: teoria informaţiei, teoria comunicării, teoria cunoaşterii, logică, semantică etc.
Sintagma informaţie este pe cât de folosită, pe atât de dificilă în privinţa unei definiri
riguroase. Cuvântul din care provine este latinescul informare care înseamnă a da o formă. După
Lindsay J [1984], prima atestare în limba engleză a cuvântului information apare la Chaucer încă din
1386. După The Oxford English Dictionary, informaţia se referă la „acţiunea de a informa, de a
comunica cunoştinţe sau noutăţi despre un fapt sau o apariţie; acţiunea de a spune sau de a i se
spune ceva” sau „cunoştinţă comunicată ce priveşte un anumit fapt, subiect sau eveniment; despre
care se înştiinţează, se ia cunoştinţă; ştire, noutate”
În general, se poate vorbi de două categorii de referinţe la informaţie: ca fapt în sine şi ca
transmiterea unor fapte
Prin intermediul informaţiilor se asigură transferul cunoştinţelor de la o generaţie la alta, se
asigură accesul la cele mai avansate realizări ale omenirii.
Conceptul de informaţie reprezintă o noţiune de maximă generalitate care semnifică o
comunicare, o veste, o ştire, un mesaj, un semnal etc. despre evenimente, fapte, stări, obiecte, despre
forme de manifestare a realităţii care ne înconjoară. Informaţia reprezintă cantitatea de noutate
adusă de un mesaj din lumea reală şi este furnizată de altcineva.
Informaţia, energia, şi materia sunt cei mai importanţi factori ai economiei moderne pe lângă
pamânt, capital şi forţa de muncă.
Faţă de materie sau energie, informaţia prezintă caracteristici distincte:
Ea nu cunoaşte ideea de original, se poate copia ori de câte ori se doreşte şi este
independentă de loc;
Informaţia nu se învecheşte şi se poate combina aproape nelimitat;
Informaţia este puternic condensabilă;
Informaţia se percepe ca o anumită măsură a ordinii întrucât ea anihilează
incertitudinea şi nedeterminarea. O măsură a ordonării este entropia negativă, termen
care a luat naştere prin analogie cu entropia, care este, în termodinamică, o mărime
exprimabilă matematic a neordonării;
Calitatea unei informaţii constă în gradul de probabilitate cu care îi crează
utilizatorului certitudinea unei afirmaţii1.
Oamenii ajung la informaţii direct, prin intermediul altor oameni, sau prin purtători de
informaţie, precum ziare, cărţi, imagini, videocasete, CD, DVD, discuri sau echipamente de
comunicaţie (radio, televizor, fax, telefon sau calculator).
Trebuie facută distincţia între ştire ca informaţie despre ceva şi opinia despre acel
ceva. Ştirea întruneşte caracteristicile de informaţie în sensul că reflectă realităţi obiective, stări de
fapt existente. Opinia reprezintă exprimarea unor păreri, a unor gânduri proprii sau de grup. Opinia
este deci subiectivă sau prea puţin obiectivă, putând fi uneori promovată pe baza unor interese
dinainte stabilite, urmărind scopuri fie constructive (educaţionale, mobilizatoare etc.), fie distructive
(denaturarea realităţii, abaterea atenţiei de la problemele reale ale vieţii, dezinformarea etc). Opinia
fiind subiectivă are un grad redus de generalitate chiar atunci când priveşte unele evenimente
1
Rohner K., Ciber – marketing, Ed. ALL, 1999, pag. 51.
concrete2. De asemenea, informaţia nu trebuie să se confunde cu zvonul care reprezintă, ca şi opinia
falsă, o ştire neîntemeiată şi neverificată. Forma de exprimare şi transmitere a informaţiilor, opiniilor
şi comentariilor o reprezintă comunicarea. Informaţia este o comunicare despre un anumit aspect al
realităţii obiective.
Din punct de vedere conceptual informaţia reprezintă o reflectare în planul gândirii umane a
legăturilor de cauzalitate, privind aspecte din realitatea ce ne înconjoară.
Informaţia are deci sens de noutate pentru cel căruia i se adresează, indiferent de forma pe
care o ia (ştire, semnal, comunicare). Putem spune deci că informaţia este un mesaj, dar cu precizarea
că nu orice mesaj este o informaţie. Dacă mesajul nu transmite nici o noutate şi nu are suport real,
atunci acesta nu reprezintă interes pentru receptor şi deci nu are caracter de informaţie.
Informaţia primeşte întotdeauna atributul domeniului pe care îl reflectă. De exemplu,
realităţile din domeniul economic se reflectă în informaţiile economice.
Procesul de sesizare, înţelegere şi însuşire a informaţiilor dintr-un anumit domeniu reprezintă
un proces de informare. Informaţiile dobândite în urma unui proces de informare într-un anumit
domeniu, formează cunoştinţele despre acel domeniu, iar mulţimea acestora reprezintă baza de
cunoştinţe.
Cunoştinţele reprezintă deci o însumare a tuturor informaţiilor dobândite într-un anumit
domeniu, sau care se referă la un anumit obiect. În sinteză putem aprecia cunoştinţele că sunt
elemente abstracte şi individuale despre obiectele şi domeniile lumii reale, însuşite şi/sau dobândite.
Pentru a fi percepută informaţia, trebuie exprimată într-o formă concretă. Acestă formă
concretă poartă numele de dată. Prin dată, înţelegem un număr, o mărime, o relaţie etc. Care serveşte
la rezolvarea unei probleme sau care este obţinută în urma unei cercetări urmând a fi suspusă unor
prelucrări. Data poate fi considerată materia primă pentru informaţie. Ea este o informaţie potenţială.
Data este forma de reprezentare accesibilă a informaţiei prelucrate.
Există o corespondenţă determinată între informaţie, simbol şi dată astfel că, foarte adesea, în
practică, termenul de informaţie este utilizat pentru a desemna date, iar expresia „prelucrarea
informaţiilor” înlocuieşte expresia „prelucrarea datelor”. Putem considera că datele prelucrate, în
măsura în care afectează în sens pozitiv comportamentul receptorilor (oameni sau maşini), au
calitatea de informaţii.
Informaţiile se produc, se culeg, se procesează, se transmit, se stochează şi se înţeleg. În cazul
în care are loc o transmitere unilaterală de informaţii, vorbim despre informare. În cazul unei
transmiteri bidirecţionale a informaţiei, se poate vorbi de comunicare.
Datele nu au semnificaţie de aceea trebuie modificate şi aduse într-o formă utilizabilă şi
plasate înr-un anumit context pentru a avea valoare.
Informaţia reprezintă produsul prelucrării datelor, care sunt aduse într-o formă inteligibilă şi
care pot fi utilizate într-un scop anume. Informaţia poate fi percepută ca partea utilizabilă dintr-un
ansamblu de date sau ca „semnificaţie ce poate fi desprinsă dintr-un ansamblu de date, pe baza
asociaţiilor dintre acestea”. Deci informaţia înseamnă date care au semnificaţie pentru un receptor,
care îi asigură acestuia un plus de noutate. Schema informaţie = dată + semnificaţie este
cvasiutilizată.
Nu orice prelucrare de date generează informaţii. O procesare de date poate genera
informaţie, numai dacă există un receptor care să considere acest rezultat inteligibil şi folositor.
Data reprezintă un fapt sau o stare a unui eveniment fără a avea vreo legătură cu alte
elemente. Informaţia presupune înţelegerea unui tip de relaţii între date.
2
Surcel T., Sofronie G., Baron C., Informatica economică, Ed. Calipso 2000, 1999, pag 9.
Data poate fi caracterizată ca fiind materia primă a informaţiei. Poate fi definită ca un
ansamblu de simboluri ce nu au fost încă interpretate sau ca un lucru dat sau dobândit, ceva cunoscut
sau presupus a fi un fapt şi considerat baza unui raţionament sau calcul.
Cunoştinţa reprezintă o grilă, un tipar şi furnizează în mare măsură un grad de predictibilitate
despre ce a fost descris sau ce se va întâmpla în viitor.
Înţelepciunea presupune înţelegerea principiilor fundamentale înglobate în cunoştinţe care
sunt esenţiale pentru a înţelege evoluţia procesului de cunoaştere în timp, fiind atemporală.
După Russel Ackoff [1957] conţinutul creierului este structurat pe cinci clase3:
a. Datele sunt ansambluri de simboluri. Datele există pur şi simplu, sub orice formă; nu au nici o
semnificaţie în sine.
b. Informaţiile sunt date prelucrate, înzestrate cu o anumită semnificaţie şi care au sens prin
raportarea lor la alte elemente. Semnificaţia lor poate fi utilă, dar la fel de bine, inutilă.
Informaţiile sunt date organizate. Informaţiile sunt utile pentru receptor pentru că aduce un
element de noutate şi furnizează răspunsuri la întrebări de genul cine?, ce?, unde?, când?. Ele
scot la iveală modelele, tipare, grile care vor constitui baza unor decizii.
c. Cunoştinţele sunt ansambluri de informaţii care sunt, intenţionat, utile. Memorarea informaţiilor
este un proces de acumulare de cunoştinţe care au o semnificaţie utilă, dar care nu furnizează şi
cheia integrării cu alte cunoştinţe, a modului de inferenţă şi generare de noi cunoştinţe. Reluând
exemplul dat de Ackoff, să ne referim la un elev care ştie tabla înmulţirii. Învăţarea tablei
înmulţirii este un proces de memorare. Răspunsul la întrebarea „Cât fac 3×2?” este furnizat pe
baza cunoştinţei memorate mecanic: „3×2=6”. Dacă însă este întrebat „Cât fac 3214×327?”, nu
poate răspunde corect, deoarece această cunoştinţă nu este inclusă (încă) în tabla înmulţirii pe
care o are de învăţat. Răspunsul corect la această întrebare necesită cunoaşterea mecanismului
calculului produsului a două numere reale, deci înţelegerea modului de calcul al produsului dintre
două numere.
d. Înţelegerea este, după Ackoff, un proces neprobabilistic şi de neinterpolare, este cognitiv şi
analitic. Este procesul prin care cunoştinţele se pot distila, prin rafinare şi sintetizare rezultând un
plus de cunoaştere, de noi cunoştinţe. Diferenţa dintre înţelegere şi cunoaştere este diferenţa
dintre a învăţa şi a memora.
e. Înţelepciunea este un proces nedeterminist, neprobabilist şi de extrapolare, care se sprijină pe
celelalte niveluri ale conştiinţei omeneşti. Înţelepciunea ne conferă înţelegere despre ceea ce
anterior fusese de neînţeles şi, astfel, depăşeşte însăşi înţelegerea. Înţelepciunea reprezintă esenţa
demonstraţiei în filosofie. Faţă de celelalte niveluri, înţelepciunea ridică probleme la care nu
există răspuns (sau răspunsul este foarte dificil de găsit). Prin înţelepciune putem discerne, putem
judeca binele şi răul, corectitudinea şi greşala.
Dacă informaţia presupune înţelegerea relaţiilor dintre date sau a semnificaţie acestora,
cunoştinţele presupun înţelegerea grilelor, tiparelor ce se pot aplica informaţiilor. O grilă (pattern)
este mai mult decât o relaţie de relaţii, înglobând consecinţe şi completitudine (exhaustivitate) ale
relaţiilor care, până la un punct, îşi creează propriul context. Grila serveşte ca un tipar ce implică
repetabilitate. Grilele, tiparele ce reprezintă cunoaşterea au tendinţa de a fi autocreatoare de context,
fiind mult mai puţin dependente de context decât informaţiile; ele prezintă un mai mare grad de
încredere şi predictibilitate, fiind deosebit de dinamice.
Înţelepciunea izvorăşte din înţelegerea principiilor fundamentale pe baza cărora sunt
construite grilele ce reprezintă cunoaşterea. Atunci când cunoştinţele generează convingeri, credinţe,
3
Preluare din Bellinger G., Castro D., Mills A., Data, information, Knowledge, and Wisdom,
http://www.radix.net/~crbnblu/assoc/bellingr/dikw/dikw.htm.
valori ce ghidează comportamentul unui individ se poate vorbi de înţelepciune. Înţelepciunea îşi
creează, într-o măsură şi mai mare decât cunoaşterea, propriul său context, principiile fundamentale
fiind universale şi independente de situaţiile specifice.
Asemănător acestei abordări poate fi amintită şi ierarhia evocată de Barabba şi Zaltman4
[1990] care consideră că mintea omenească operează la nivelul a cinci paliere:
Date (numere, cuvinte);
Informaţii (propoziţii);
Inteligenţă (reguli);
Cunoaşterea (combinarea nivelurilor anterioare);
Înţelepciunea (baze de cunoştinţe combinate).
Gene Bellinger trasează următoarea paralelă5:
Informaţii: ce? - descriere, definiţie sau perspectivă
Cunoştinţe: cine, când, unde, cum? - strategie, practică, metodă, abordare
Înţelepciune de ce? Cu ce implicaţii? - principiu, convingere, morală, arhetip
Thomas Davenport şi Laurence Prusak6 [1998] atrag atenţia asupra faptului că lanţul valoric
poate fi parcurs şi în sens descendent, mai ales când, datorită volumului imens, cunoştinţele şi
informaţiile devin imposibil de gestionat. Cunoştinţele pot deveni informaţii şi chiar date. . Pentru a
întârii ideea, se face trimitere la Eschil care zicea că este înţelept nu cel care ştie multe, ci lucruri
utile
Schema lanţului valoric mental, aşa cum se prezintă în figura 1.1., deşi cuceritoare prin
simplitate, lasă nerezolvate o serie de probleme.
înţelepciune
rafinare
ii
cip
p rin
cunoştinţă
ile
gr
e l e, e
d r
mo tipa
informaţie
e
aţi ţie
rel f ica
i
mn
se
data
înţelegere
Figura nr. 1.1. Fluxurile ascendente şi descendente dintre palierele lanţului valoric mental
4
Barabba V., Zaltman G., Hearing the Voice of the Market, Harvard Business School Press, 1990.
5
Bellinger G., Knowledge Management, http://www.outsights.com/systems/kmgmt/kmgmt.htm.
6
Davenport T. H., Prusak L., Working Knowledge: How Organizations Manage What They Know, Harvard
Business School Press, Boston, 1998, pg. 2.
Să începem cu geneza informaţiilor din date: este în stare receptorul să transforme datele în
informaţii dacă nu are cunoştinţele, deprinderile prealabile care-i permit să realizeze că se află în faţa
unor date, că le poate interpreta într-un anumit fel.
Mai merită evocat şi un alt aspect: procesul rafinării datelor în informaţii nu numai că nu este
determinist sau pur şi simplu inferenţial, dar nu exclude apariţia unor false informaţii, unor false
cunoştinţe. Modul în care ne selectăm datele în funcţie de cunoştinţele de care dispunem cât şi
modurile în care datele pot fi alterate, falsificate pentru a induce în receptor o anumită viziune asupra
evenimentelor, o anumită percepţie – altfel spus, pentru a-l manipula sunt aspecte care dovedesc
importanţa fluxurilor ascendente şi descendente asupra percepţiei individului.
Datele sunt generate numai dacă dispunem în prealabil de informaţii, iar pentru apariţia
informaţiilor avem nevoie de cunoştinţe prealabile.
Conceptul de sistem informatic a fost definit în moduri diferite, nefiind acceptată o definiţie
unanimă, dar de fiecare dată fiind prezentat din prisma sistemelor informaţionale de management iar
în unele cazuri el este sinonim cu acest concept.
A defini un sistem informatic al unui organism înseamnă a-i preciza în mod concret regulile,
procedurile, mijloacele şi metodele, cu precădere automate, utilizate în cadrul sistemului pentru a
determina mărimile prestabilite şi legile care operează cu aceste mărimi.
Sistemul informatic poate fi definit ca un ansamblu de reguli, proceduri, mijloace şi metode,
cu precădere automate, folosite pentru culegerea, transmiterea, prelucrarea şi stocarea datelor7.
Sistemul informatic este o componentă a sistemului informaţional şi anume acea parte a
acestuia care preia şi rezolvă sarcinile de culegere, prelucrare, transmitere şi stocare a datelor cu
ajutorul sistemelor de calcul.
Pentru a-şi îndeplini în cadrul sistemului informaţional, sistemul informatic cuprinde
ansamblul tuturor resurselor, regulilor, procedurilor, mijloacelor, metodelor şi tehnicilor, prin care se
asigură prelucrarea automată a datelor, necesare proceducerii informaţiilor, care vor fi folosite la
toate nivelurile decizionale ale managementului şi de controlul activităţilor organizaţiei.
Literatura de specialitate informatică, în speţă, economică – nu a ajuns încă la un consens
...noţiona, se mai poartă discuţii dacă angrenajul utilizat pentru a oferi informaţii celor interesaţi
trebuie să fie numit sistem informaţional sau sistem informatic, cu referire la utilizarea
calculatoarelor în acest scop. Cum sistemul informaţional cuprinde şi sistemul informatic, folosirea
celei de-a doua ar fi mai inspirată, mai ales în condiţiile din ţara noastră, unde, după cum se ştie,
informatizarea n-a atins cotele din ţările dezvoltate, iar partea de prelucrare umană are încă o pondere
substanţială.
Cum, de regulă, ne place să ne raportăm la ţările cu o bogată experienţă, să o facem şi de
această dată, spunând că, în literatura de anglo-americană, information system înseamnă sistem
informaţional, iar computer based information system este ceea ce noi considerăm sistem informatic.
Adevărul este următorul: datorită nivelului tehnologic la care s-a ajuns în SUA, toţi autorii, după ce
fac delimitarea amintită, folosesc termenul de information system motivând gradul ridicat de
automatizare a activităţilor care lucrează cu informaţia.
În ultimii ani, în literatura de specialitate îşi face apariţia un nou concept – executive
information system – care ar trebui să dea mult de gândit celor care au tradus management
7
Ghe. Orzan – Sisteme informatice de marketing, Ed. Uranus, Bucureşti, 2001.
information system sub forma sistem informatic de conducere, pentru că noua apariţie înseamnă tot
sistem informatic pentru conducere, numai că se referă la nivelul de top al ei.
Procesul de conducere se realizează pe cele trei niveluri: operativ, tactic şi strategic, deci
nominalizarea unuia dintre ele constituie o condiţie esenţială a înţelegerii tipului de sistem
informaţional/informatic la care se face referire.
Oare atunci când s-a tradus conceptul de management information system, aşa cum am
menţionat anterior nu s-a ţinut cont de nivelurile la care se realizează procesul de conducere? Ar fi o
explicaţie, însă putem aduce ca argument şi înţelegerea greşită a cuvintelor management, manager.
De multe ori se consideră că managerul, printr-o traducere în formă „superlativă”, este similar cu
„director”, „conducător”, ceea ce nu denotă întotdeauna prea multă inspiraţie, prin ambiguitatea
provocată. Să nu uităm că, în limbajul american, manager este şeful unui depozit sau magazin, şi
administratorul unui bloc de locuinţe ş.a.m.d.
Din cele relatate, rezultă ca posibile două variante de utilizat pentru management information
system. O primă soluţie ar putea consta în specificarea nivelului de conducere căruia i se adresează,
numindu-l sistem informatic al conducerii operative şi /sau tactice, deşi pentru conducerea operativă
există o altă categorie a sistemelor informatice, transaction processing system, după cum vom vedea
în continuare. Aşadar trebuie făcută referire numai la nivelul tactic al conducerii, ceea ce, să
recunoaştem, nu prea intră în uzanţele noastre.
A doua variantă, mai scurtă şi suficient de plauzibilă ar consta în utilizarea conceptului de
sistem informatic de gestiune, întrucât acesta este obiectivul lor prioritar.
Dacă am analiza evoluţia în timp a tehnologiilor de realizare a sistemelor informatice, a
naturii şi rolului acestora putem identifica următoarele categorii de sisteme informatice:
La începutul anilor ’70 se încearcă trecerea spre uşurarea procesului decizional, prin
preluarea componentei informaţionale din efortul managementului strategic in fundamentarea
deciziilor. Obiectivul prioritar nu mai era simpla culegere a datelor, nici sintetizarea lor sub forma
rapoartelor, ci uşurarea procesului de luare a deciziilor. Şi-au făcut astfel apariţia Decision Support
System (DSS), cunoscute la noi ca sisteme suport de decizie, deşi s-ar putea considera mai inspirată
forma sisteme de sprijinire a procesului decizional, evitându-se, astfel, posibila concluzie că, până la
apariţia acestor sisteme, deciziile n-ar fi avut suport.
Sistemele informatice de asistare a deciziilor, mai cunoscute şi sub denumirea de sisteme
informatice inteligente de asistare a deciziilor (SIAD), oferă managerilor răspunsuri rapide la
întrebările ad-hoc şi urmăresc pregătirea şi fundamentarea deciziei.
Aceste sisteme oferă managerilor instrumentele necesare pentru a analiza blocuri mari de
date, utilizând modele sofisticate într-o manieră flexibilă pe care utilizatorii o pot controla cu
uşurinţă. Sunt proiecte pentru a furniza opţiuni şi alternative, nu numai pentru obţinerea
informaţiilor. Există mai multe categorii de astfel de sisteme. DSS de uz individual sprijină
decidenţii individuali. DSS de grup sunt orientate pe cerinţele unui grup de decidenţi angajaţi în
activităţi separate, dar nercorelate. DSS organizaţionale sunt focalizate pe nivelul organizaţional sau
pe activităţi dispersate pe diferite zone funcţionale ce implică resurse numeroase. DSS intra-
organizaţionale sprijină procesul decizional generat de globalizarea sarcinilor în cazul corporaţiilor
internaţionale şi multinaţionale.
În perioada de dezvoltare a acestor sisteme, graniţa dintre sistemul suport şi aplicaţia
informatică este foarte imprecisă, o mare parte din aplicaţii fiind create pentru rezolvarea unor
probleme punctuale şi utilizate o singură dată. Din acest motiv, în anii ”80 atât suportul cât şi
aplicaţiile au fost denumite generic sisteme interactive de asistare a deciziei, aspectul interactiv fiind
conferit în special de existenţa limbajelor grafice de modelare. Acest tip de sisteme sunt încadrate în
prezent în clasa sistemelor informatice de asistare a deciziilor orientate spre modele.
Se remarcă apariţia în ultimii ani a unei noi generaţii de sisteme informatice de asistare a
deciziei – cele orientate pe date, care au la bază depozitul sau zăcământul de date a corporaţiei drept
componentă tehnologică principală. Funcţionarea lor fiind bazată pe analiza şi agregarea datelor, ca
răspuns la necesitatea utilizării unor metode eficace de analiză. Funcţiile principale ale acestor
sisteme sunt: accesul imediat la date, realizarea unui mecanism pentru analize ad-hoc ale datelor
actuale sau cu caracter istoric şi analiza informaţiilor.
Sistemele informatice de asistare a deciziei orientate pe date sunt rezultatul unor tehnologii
inteligente create special şi anume:
Data Warehouse – tehnologie de centralizare, consolidare , reorganizare şi stocare a
volumelor mari de date acumulate de-a lungul timpului, date preluate din sisteme
informatice eterogene, care vor fi baza procesărilor analitice necesare proceselor de
decizie.
OLAP (On-line Analytical Processing) – este o tehnologie de agregare a datelor stocate în
depozite într-o abordare multidimensională care asigură acces rapid la informaţiile
necesare analiştilor şi managerilor într-o manieră consistentă, interactivă şi foarte
flexibilă.
Data mining – tehnologie de explorare a datelor stocate în depozite în încercarea dea
descoperi aspecte noi ale activităţii desfăşurate, aspecte trecute în mod normal cu
vederea: corelaţii între evenimente, asociaţii între anumite fapte, secvenţe, tipare de
comportament, etc.
Sistemele informatice inteligente bazate pe cunoştinţe care înglobează tehnologii ale
inteligenţei artificiale şi care sunt referite ca şi SIIAD.
Din categoria sistemelor SIAD la mijlocul anilor ’80, proliferează un nou tip de sisteme, şi
anume Expert System (ES), cunoscute ca sisteme expert, prin care se trece la prelucrarea
cunoştinţelor umane, motiv de a fi numite uneori şi Knowledge Work System (KWS). Ele preiau, sub
forme mult mai performante, o parte din activităţile surprinse prin tipurile de sisteme menţionate
până acum. De mai multe ori se consideră că sistemele expert sunt numai o prelungire a celor de
sprijinire a procesului decizional, ceea ce nu este adevărat, întrucât ele se pot regăsi pe orice treaptă a
conducerii – de la nivelul operativ până la cel strategic, - aşadar, de la sistemele de prelucrare a
tranzacţiilor economice până la sistemele de sprijinire a conducerii la nivel strategic.
Sistemele informatice inteligente – sistemele expert (Expert System) încorporează
cunoştinţele experţilor dintr-un domeniu dat şi le folosesc în luarea deciziilor, elaborarea de
recomandări, consultaţii etc. Un sistem expert reprezintă un ansamblu de programe informatice
destinate emulării raţionamentului unam al experţilor într-un domeniu specific.
Utilizarea sistemelor expert se bazează pe premisa că orice problemă poate fi rezolvată printr-
o succesiune de raţionamente care pot fi descompuse în reguli logice. Primele sisteme expert au
apărut în chimie şi medicină (DENDRAL – 1967, MYCIN – 1979). În domeniul marketingului,
financiar-bancar, al expertizei există nenumărate sisteme expert: GURU, INTELLIGENCE
SERVICE, DEXPER, PERSONAL PLUS CONSULTANT, etc.
Nivelul strategic al conducerii este sprijinit, într-un mod aparte, prin noile Executive
Information System (EIS), dezvoltate puternic începând cu mijlocul anilor ’80. Ele îşi propun mult
mai mult decât „clasicul” tablou de bord sau arhicunoscutele sisteme de raportare, formele moderne
de informare mult mai succintă, prin grafice, tabele, scheme. Veritabilii conducători, buni strategi, de
multe ori sunt interesaţi mai întâi să ştie ce fac alţii, ce se întâmplă pe piaţa globală şi abia apoi
doresc să ştie detalii despre firma lor. O astfel de optică a deranjat pe mulţi realizatori de sisteme
informatice de gestiune, care îşi văd neglijat efortul muncii lor de ani de zile.
O explicaţie se regăseşte to în noile tehnologii fiindcă o dată cu apariţia atâtor forme de
„ieşire în lume”, prin atâtea tipuri de reţele, care mai de care mai performante, este normal ca top-
managerii să dorească să vadă mai intâi ce se întâmplă în „ograda vecinilor lor”, chiar dacă ei se află
peste mări şi ţări.
Pri utilizarea informaţiilor provenind atât din mediul intern, cât mai ales din mediul extern al
organizaţiei, specific „top-managerilor” de marketing, EIS creează un mediu informatizat şi un cadru
propice comunicării, care poate aborda o gamă de probleme ce se schimbă în permanenţă. Astfel,
conducerea organizaţiei poate controla performanţele organizaţionale, studia activitatea
concurenţilor,poate prevedea tendinţe ale anumitor fenomene, poate sesiza diverse oportunităţi de
afaceri. Utilizarea unui astfel de sistem poate avea drept efect ameliorarea considerabilă a
performanţelor conducerii.
Reprezentarea grafică sugestivă din figura 1.2. scoate în relief comportamentele mediului de
lucru al sistemelor informatice inteligente folosite în managementul organizaţional structurat în
funcţie de tipurile de decizii (structurate, semistructurate şi nestructurate) şi nivelul de management
organizaţional.
Nivelul organizaţional
Strategic EIS ES
DSS
Tactic MIS
Cunoaşterea OAS KWS
Operaţional TPS
Tipul deciziei Structurate Semistructurate Nestructurate
Internet
Resurse
Logistică Producţie Marketing Distribuţie
Contabilitate, Financiar
Marketing
Marketing
Mediul intern
Mediul Online
Sisteme Sisteme Sisteme
Suport Inteligente Suport
Groupware
Site
Customer Relationship Management
Reţele
Servicii Distribuţie
Internet
Marketing Vânzări
clienţi
Clienţi, comercianţi
8
Adaptare după Kalakota R., Robinson M., E-Business 2.0: Roadmap for Success, Addison Wesley, SUA,
2001.
condiţiile unei pieţe extrem de versatile şi concurenţiale, iar globalizarea afacerilor a
exacerbat acest fenomen.
CRM cercetează aplicaţiile care promovează interacţiunea directă dintre clienţi şi
furnizori, prin intermediul angajaţilor şi proceselor presupuse, pe durata întregului ciclu de
viaţă al relaţiei furnizor – client. Pachetul de aplicaţii presupune o viziune cuprinzătoare,
integrată asupra clientului, care este aşezat în centrul preocupărilor şi presupune în viziunea
de marketing integrarea funcţiunilor întreprinderii, efortului de a creşte satisfacţia şi
mulţumirea clientului, ceea ce asigură creşterea vânzărilor şi diferenţiază firma faţă de
competitorii săi.
Sisteme informatice integrate pentru gestiunea relaţiilor cu furnizorii şi clienţii - Supply
Chain Management (SCM) acoperă comanda şi aprovizionarea, identificarea materiilor
prime şi materialelor, fabricarea, asamblarea, depozitarea şi urmărirea stocurilor, primirea
comenzilor, distribuirea pe toate canalele şi livrarea către consumator. Supply Chain
Management ete termenul întâlnit în lieratura română sub denumirea de managementul
lanţului de aprovizionare – desfacere sau managementul lanţului de distribuţie şi se
referă, în principal, la optimizarea şi automatizarea tuturor proceselor economice ce se
desfăşoară la nivelul unei întreprinderi, de la aprovizionarea cu materii prime şi materiale,
până la procesele de producţie, transport şi distribuţie a produselor finite.
Managementul eficient al lanţului de distribuţie asigură cantitatea necesară de bunuri
şi servicii acolo unde trebuie, la momentul oportun, în cantitatea solicitată şi la preţul cel
mai bun.
Liderul pieţei europene, SAP AG oferă soluţia mySAP SCM. Suita oferă toate
instrumentele necesare administrării proceselor de aprovizionare şi permite organizarea
colaborativă a acestora, dincolo de graniţele organizaţiei.
Sisteme informatice integrate pentru activităţi organizaţionale online – Groupware sunt
aplicaţii în reţea ce permit grupurilor de lucru să colaboreze într-o manieră facilă.
Groupware reprezintă un model organizaţional ce a apărut în anii ’90 şi corespunde
informaticii descentralizate. În literatura de specialitate, tehnologia groupware mai este
denumită şi cocktail grouware, deoarece înseamnă de fapt 1/3 management, 1/3 organizare şi
1/3 informatică; fiind astfel o sintagmă multidisciplinară.
Mediul groupware este destinat creării, gestionării şi conducerii eficiente a resurselor
unei întreprinderi. Groupware-ul reprezintă un set integrat de instrumente, care permite
indivizilor să lucreze împreună prin comunicare, colaborare şi coordonare la momente de
timp şi locuri diferite.
Groupware-ul îşi are rădăcinile în trei mari domenii distincte, dar foarte apropiate
cerinţelor grupurilor de lucru: mesagerie electronică, managementul informaţiilor,
automatizarea proceselor sau fluxului de lucru.
Groupware reprezintă un model organizaţional dezvoltat cu sprijinul tehnologiilor
informaţionale multiutilizator moderne, ce oferă posibilitatea reproiectării radicale a
proceselor, organizării şi mentalităţii din întreprinderi, prin intermediul unei clase de aplicaţii
reţea ce permit echipelor de lucru să colaboreze online.
Aplicaţiile groupware n-au fost gândite pentru a substitui personalul, ci pentru a-l
sprijini în orice relaţie de serviciu. Altfel spus, groupware este o extensie sau un instrument
de perfecţionare a procesului de colaborare. Tehnologia este compusă din produse orientate
„pe grup” ce au fost dezvoltate pentru a ajuta grupuri de persoane să lucreze împreună.
Aplicaţiile sunt diferite de aplicaţiile utilizator simple care izolează utilizatorul şi-i limitează
activitatea numai la îndeplinirea sarcinilor de lucru independente. Astfel, groupware este o
tehnologie multiutilizator care permite munca cooperativă informatizată. Noţiunile de
„activităţi comune” şi de „mediu partajat” sunt fundamentale pentru a distinge un sistem
groupware de un sistem multiutilizator convenţional.
Potrivit figurii 1.4. tehnologiile groupware delimitează trei categorii de aplicaţii:
comunicarea pe bază de formulare şi documente;
comunicarea de tip tranzacţional;
comunicarea organizaţională.
Principalele diferenţe dintre cele două categorii sunt vizibile la nivelul volumului, al
integrităţii informaţiei şi al tipului de aplicaţie.
Aplicaţiile groupware sunt orientate şi către comunicarea orizontală, rezolvând
probleme de comunicare şi cooperare din cadrul organizaţiei prin agenda de grup, messenger,
chat, videoconferinţe, conferinţe electronice şi redactarea multiutilizator. Remarcăm prezenţa
aplicaţiilor workflow în toate cele trei tipuri de aplicaţii.
Integrarea tehnologiilor groupware cu tehnologiile Internet este în prezent în atenţia
specialiştilor, a caselor producătoare de software. Majoritatea editorilor (Microsoft, Netscape
şi IBM-Lotus) îşi redefinesc platformele şi instrumentele client/server în acest sens. Notăm
apariţia termenului de GROUPWEB (rezultat din concatenarea termenilor GROUPware şi
WEB).
Sisteme informatice integrate geografice tehnologii geographic information system
(GIS) sunt aplicaţii sau suite de programe care permit crearea şi reprezentarea hărţilor
geografice. În general, sistemele informatice geografice conţin o componentă destinată
vizualizării hărţilor geografice, soluţiile de ultimă oră oferind posibilitatea de a realiza
aceste operaţiuni folosind un simplu browser web.
MOTOARE DE
E-Mail CĂUTARE
GESTIUNEA WORKFLOW
DOCUMENTELOR GED
SGBD
FORMULARE
GROUPWARE
E-Mail
WORKFLOW
COMUNICARE ORGANIZAŢIONALĂ
AGENDE
DE TIP REUNIUNI VIDEO ORGANIZAREA REDACTARE
CHAT
GRUP ELECTRONICE CONFERINŢE MEMORIEI COLECTIVĂ MESSENGER
9
Prel. după Khoshafian S., Buckiewicz, Groupware & workflow, Masson, Paris, 1998, pg. 17.
Sistemele informatice de tip GIS sunt tot mai frecvent utilizate în cadrul aplicaţiilor de
geomarketing, de localizare spaţială a clienţilor, de construire de hărţi privind atracţia şi gravitaţia
comercială de segmentare spaţială a clienţilor, furnizorilor şi concurenţilor.
CURSUL 8
Tipologia Sistemelor informatice inteligente
1.2.3. Sistemele informatice de automatizare a muncii de birou
Office Automation System – (OIS) sunt cunoscute şi sub denumirea scurtă de sisteme birotice
(birotică). Misiunea lor este de a prelua, prelucra, stoca şi transmite date şi informaţii sub forma
comunicaţiilor electronice între birouri şi nivelurile organizatorice dintr-o firmă.
S-au dezvoltat, în principal, datorită generalizării microinformaticii, la mijlocul anilor ’80.
Compartimentele sunt adevărate centre informaţionale prin care sunt vehiculate importante volume
informaţionale. Experienţa practică demonstrează că procurarea, culegerea, valorificarea şi
transmiterea direcţionată a informaţiilor este cea mai importantă sarcină. Birotica se bazează pe
procesoare de texte, programe de calcul tabelar, programe de prezentare grafică, mesagerii
electronice, alte tehnologii ale sistemelor informatice. Principalele aplicaţii sau subsisteme includ:
poşta electronică, teleconferinţele, aplicaţiile web, messenger, chat, videochaturi, videotelefon,
agende electronice, tehnoredactare computerizată etc.
La începutul anilor ’70 se încearcă trecerea spre uşurarea procesului decizional, prin
preluarea componentei informaţionale din efortul managementului strategic in fundamentarea
deciziilor. Obiectivul prioritar nu mai era simpla culegere a datelor, nici sintetizarea lor sub forma
rapoartelor, ci uşurarea procesului de luare a deciziilor. Şi-au făcut astfel apariţia Decision Support
System (DSS), cunoscute la noi ca sisteme suport de decizie, deşi s-ar putea considera mai inspirată
forma sisteme de sprijinire a procesului decizional, evitându-se, astfel, posibila concluzie că, până la
apariţia acestor sisteme, deciziile n-ar fi avut suport.
Sistemele informatice de asistare a deciziilor, mai cunoscute şi sub denumirea de sisteme
informatice inteligente de asistare a deciziilor (SIAD), oferă managerilor răspunsuri rapide la
întrebările ad-hoc şi urmăresc pregătirea şi fundamentarea deciziei.
Aceste sisteme oferă managerilor instrumentele necesare pentru a analiza blocuri mari de
date, utilizând modele sofisticate într-o manieră flexibilă pe care utilizatorii o pot controla cu
uşurinţă. Sunt proiecte pentru a furniza opţiuni şi alternative, nu numai pentru obţinerea
informaţiilor. Există mai multe categorii de astfel de sisteme. DSS de uz individual sprijină
decidenţii individuali. DSS de grup sunt orientate pe cerinţele unui grup de decidenţi angajaţi în
activităţi separate, dar nercorelate. DSS organizaţionale sunt focalizate pe nivelul organizaţional sau
pe activităţi dispersate pe diferite zone funcţionale ce implică resurse numeroase. DSS intra-
organizaţionale sprijină procesul decizional generat de globalizarea sarcinilor în cazul corporaţiilor
internaţionale şi multinaţionale.
În perioada de dezvoltare a acestor sisteme, graniţa dintre sistemul suport şi aplicaţia
informatică este foarte imprecisă, o mare parte din aplicaţii fiind create pentru rezolvarea unor
probleme punctuale şi utilizate o singură dată. Din acest motiv, în anii ”80 atât suportul cât şi
aplicaţiile au fost denumite generic sisteme interactive de asistare a deciziei, aspectul interactiv fiind
conferit în special de existenţa limbajelor grafice de modelare. Acest tip de sisteme sunt încadrate în
prezent în clasa sistemelor informatice de asistare a deciziilor orientate spre modele.
Se remarcă apariţia în ultimii ani a unei noi generaţii de sisteme informatice de asistare a
deciziei – cele orientate pe date, care au la bază depozitul sau zăcământul de date a corporaţiei drept
componentă tehnologică principală. Funcţionarea lor fiind bazată pe analiza şi agregarea datelor, ca
răspuns la necesitatea utilizării unor metode eficace de analiză. Funcţiile principale ale acestor
sisteme sunt: accesul imediat la date, realizarea unui mecanism pentru analize ad-hoc ale datelor
actuale sau cu caracter istoric şi analiza informaţiilor.
Sistemele informatice de asistare a deciziei orientate pe date sunt rezultatul unor tehnologii
inteligente create special şi anume:
Data Warehouse – tehnologie de centralizare, consolidare , reorganizare şi stocare a
volumelor mari de date acumulate de-a lungul timpului, date preluate din sisteme
informatice eterogene, care vor fi baza procesărilor analitice necesare proceselor de
decizie.
OLAP (On-line Analytical Processing) – este o tehnologie de agregare a datelor stocate în
depozite într-o abordare multidimensională care asigură acces rapid la informaţiile
necesare analiştilor şi managerilor într-o manieră consistentă, interactivă şi foarte
flexibilă.
Data mining – tehnologie de explorare a datelor stocate în depozite în încercarea dea
descoperi aspecte noi ale activităţii desfăşurate, aspecte trecute în mod normal cu
vederea: corelaţii între evenimente, asociaţii între anumite fapte, secvenţe, tipare de
comportament, etc.
Sistemele informatice inteligente bazate pe cunoştinţe care înglobează tehnologii ale
inteligenţei artificiale şi care sunt referite ca şi SIIAD.
Din categoria sistemelor SIAD la mijlocul anilor ’80, proliferează un nou tip de sisteme, şi
anume Expert System (ES), cunoscute ca sisteme expert, prin care se trece la prelucrarea
cunoştinţelor umane, motiv de a fi numite uneori şi Knowledge Work System (KWS). Ele preiau, sub
forme mult mai performante, o parte din activităţile surprinse prin tipurile de sisteme menţionate
până acum. De mai multe ori se consideră că sistemele expert sunt numai o prelungire a celor de
sprijinire a procesului decizional, ceea ce nu este adevărat, întrucât ele se pot regăsi pe orice treaptă a
conducerii – de la nivelul operativ până la cel strategic, - aşadar, de la sistemele de prelucrare a
tranzacţiilor economice până la sistemele de sprijinire a conducerii la nivel strategic.
Sistemele informatice inteligente – sistemele expert (Expert System) încorporează
cunoştinţele experţilor dintr-un domeniu dat şi le folosesc în luarea deciziilor, elaborarea de
recomandări, consultaţii etc. Un sistem expert reprezintă un ansamblu de programe informatice
destinate emulării raţionamentului unam al experţilor într-un domeniu specific.
Utilizarea sistemelor expert se bazează pe premisa că orice problemă poate fi rezolvată printr-
o succesiune de raţionamente care pot fi descompuse în reguli logice. Primele sisteme expert au
apărut în chimie şi medicină (DENDRAL – 1967, MYCIN – 1979). În domeniul marketingului,
financiar-bancar, al expertizei există nenumărate sisteme expert: GURU, INTELLIGENCE
SERVICE, DEXPER, PERSONAL PLUS CONSULTANT, etc.
Nivelul strategic al conducerii este sprijinit, într-un mod aparte, prin noile Executive
Information System (EIS), dezvoltate puternic începând cu mijlocul anilor ’80. Ele îşi propun mult
mai mult decât „clasicul” tablou de bord sau arhicunoscutele sisteme de raportare, formele moderne
de informare mult mai succintă, prin grafice, tabele, scheme. Veritabilii conducători, buni strategi, de
multe ori sunt interesaţi mai întâi să ştie ce fac alţii, ce se întâmplă pe piaţa globală şi abia apoi
doresc să ştie detalii despre firma lor. O astfel de optică a deranjat pe mulţi realizatori de sisteme
informatice de gestiune, care îşi văd neglijat efortul muncii lor de ani de zile.
O explicaţie se regăseşte to în noile tehnologii fiindcă o dată cu apariţia atâtor forme de
„ieşire în lume”, prin atâtea tipuri de reţele, care mai de care mai performante, este normal ca top-
managerii să dorească să vadă mai intâi ce se întâmplă în „ograda vecinilor lor”, chiar dacă ei se află
peste mări şi ţări.
Pri utilizarea informaţiilor provenind atât din mediul intern, cât mai ales din mediul extern al
organizaţiei, specific „top-managerilor” de marketing, EIS creează un mediu informatizat şi un cadru
propice comunicării, care poate aborda o gamă de probleme ce se schimbă în permanenţă. Astfel,
conducerea organizaţiei poate controla performanţele organizaţionale, studia activitatea
concurenţilor,poate prevedea tendinţe ale anumitor fenomene, poate sesiza diverse oportunităţi de
afaceri. Utilizarea unui astfel de sistem poate avea drept efect ameliorarea considerabilă a
performanţelor conducerii.
Reprezentarea grafică sugestivă din figura 1.2. scoate în relief comportamentele mediului de
lucru al sistemelor informatice inteligente folosite în managementul organizaţional structurat în
funcţie de tipurile de decizii (structurate, semistructurate şi nestructurate) şi nivelul de management
organizaţional.
Nivelul organizaţional
Strategic EIS ES
DSS
Tactic MIS
Cunoaşterea OAS KWS
Operaţional TPS
Tipul deciziei Structurate Semistructurate Nestructurate
Internet
Resurse
Logistică Producţie Marketing Distribuţie
Contabilitate, Financiar
Marketing
Marketing
Mediul intern
Mediul Online
Sisteme Sisteme Sisteme
Suport Inteligente Suport
Groupware
Site
Customer Relationship Management
Reţele
Servicii Distribuţie
Internet
Marketing Vânzări
clienţi
Clienţi, comercianţi
8
Adaptare după Kalakota R., Robinson M., E-Business 2.0: Roadmap for Success, Addison Wesley, SUA,
2001.
condiţiile unei pieţe extrem de versatile şi concurenţiale, iar globalizarea afacerilor a
exacerbat acest fenomen.
CRM cercetează aplicaţiile care promovează interacţiunea directă dintre clienţi şi
furnizori, prin intermediul angajaţilor şi proceselor presupuse, pe durata întregului ciclu de
viaţă al relaţiei furnizor – client. Pachetul de aplicaţii presupune o viziune cuprinzătoare,
integrată asupra clientului, care este aşezat în centrul preocupărilor şi presupune în viziunea
de marketing integrarea funcţiunilor întreprinderii, efortului de a creşte satisfacţia şi
mulţumirea clientului, ceea ce asigură creşterea vânzărilor şi diferenţiază firma faţă de
competitorii săi.
Sisteme informatice integrate pentru gestiunea relaţiilor cu furnizorii şi clienţii - Supply
Chain Management (SCM) acoperă comanda şi aprovizionarea, identificarea materiilor
prime şi materialelor, fabricarea, asamblarea, depozitarea şi urmărirea stocurilor, primirea
comenzilor, distribuirea pe toate canalele şi livrarea către consumator. Supply Chain
Management ete termenul întâlnit în lieratura română sub denumirea de managementul
lanţului de aprovizionare – desfacere sau managementul lanţului de distribuţie şi se
referă, în principal, la optimizarea şi automatizarea tuturor proceselor economice ce se
desfăşoară la nivelul unei întreprinderi, de la aprovizionarea cu materii prime şi materiale,
până la procesele de producţie, transport şi distribuţie a produselor finite.
Managementul eficient al lanţului de distribuţie asigură cantitatea necesară de bunuri
şi servicii acolo unde trebuie, la momentul oportun, în cantitatea solicitată şi la preţul cel
mai bun.
Liderul pieţei europene, SAP AG oferă soluţia mySAP SCM. Suita oferă toate
instrumentele necesare administrării proceselor de aprovizionare şi permite organizarea
colaborativă a acestora, dincolo de graniţele organizaţiei.
Sisteme informatice integrate pentru activităţi organizaţionale online – Groupware sunt
aplicaţii în reţea ce permit grupurilor de lucru să colaboreze într-o manieră facilă.
Groupware reprezintă un model organizaţional ce a apărut în anii ’90 şi corespunde
informaticii descentralizate. În literatura de specialitate, tehnologia groupware mai este
denumită şi cocktail grouware, deoarece înseamnă de fapt 1/3 management, 1/3 organizare şi
1/3 informatică; fiind astfel o sintagmă multidisciplinară.
Mediul groupware este destinat creării, gestionării şi conducerii eficiente a resurselor
unei întreprinderi. Groupware-ul reprezintă un set integrat de instrumente, care permite
indivizilor să lucreze împreună prin comunicare, colaborare şi coordonare la momente de
timp şi locuri diferite.
Groupware-ul îşi are rădăcinile în trei mari domenii distincte, dar foarte apropiate
cerinţelor grupurilor de lucru: mesagerie electronică, managementul informaţiilor,
automatizarea proceselor sau fluxului de lucru.
Groupware reprezintă un model organizaţional dezvoltat cu sprijinul tehnologiilor
informaţionale multiutilizator moderne, ce oferă posibilitatea reproiectării radicale a
proceselor, organizării şi mentalităţii din întreprinderi, prin intermediul unei clase de aplicaţii
reţea ce permit echipelor de lucru să colaboreze online.
Aplicaţiile groupware n-au fost gândite pentru a substitui personalul, ci pentru a-l
sprijini în orice relaţie de serviciu. Altfel spus, groupware este o extensie sau un instrument
de perfecţionare a procesului de colaborare. Tehnologia este compusă din produse orientate
„pe grup” ce au fost dezvoltate pentru a ajuta grupuri de persoane să lucreze împreună.
Aplicaţiile sunt diferite de aplicaţiile utilizator simple care izolează utilizatorul şi-i limitează
activitatea numai la îndeplinirea sarcinilor de lucru independente. Astfel, groupware este o
tehnologie multiutilizator care permite munca cooperativă informatizată. Noţiunile de
„activităţi comune” şi de „mediu partajat” sunt fundamentale pentru a distinge un sistem
groupware de un sistem multiutilizator convenţional.
Potrivit figurii 1.4. tehnologiile groupware delimitează trei categorii de aplicaţii:
comunicarea pe bază de formulare şi documente;
comunicarea de tip tranzacţional;
comunicarea organizaţională.
Principalele diferenţe dintre cele două categorii sunt vizibile la nivelul volumului, al
integrităţii informaţiei şi al tipului de aplicaţie.
Aplicaţiile groupware sunt orientate şi către comunicarea orizontală, rezolvând
probleme de comunicare şi cooperare din cadrul organizaţiei prin agenda de grup, messenger,
chat, videoconferinţe, conferinţe electronice şi redactarea multiutilizator. Remarcăm prezenţa
aplicaţiilor workflow în toate cele trei tipuri de aplicaţii.
Integrarea tehnologiilor groupware cu tehnologiile Internet este în prezent în atenţia
specialiştilor, a caselor producătoare de software. Majoritatea editorilor (Microsoft, Netscape
şi IBM-Lotus) îşi redefinesc platformele şi instrumentele client/server în acest sens. Notăm
apariţia termenului de GROUPWEB (rezultat din concatenarea termenilor GROUPware şi
WEB).
Sisteme informatice integrate geografice tehnologii geographic information system
(GIS) sunt aplicaţii sau suite de programe care permit crearea şi reprezentarea hărţilor
geografice. În general, sistemele informatice geografice conţin o componentă destinată
vizualizării hărţilor geografice, soluţiile de ultimă oră oferind posibilitatea de a realiza
aceste operaţiuni folosind un simplu browser web.
MOTOARE DE
E-Mail CĂUTARE
GESTIUNEA WORKFLOW
DOCUMENTELOR GED
SGBD
FORMULARE
GROUPWARE
E-Mail
WORKFLOW
COMUNICARE ORGANIZAŢIONALĂ
AGENDE
DE TIP REUNIUNI VIDEO ORGANIZAREA REDACTARE
CHAT
GRUP ELECTRONICE CONFERINŢE MEMORIEI COLECTIVĂ MESSENGER
9
Prel. după Khoshafian S., Buckiewicz, Groupware & workflow, Masson, Paris, 1998, pg. 17.
Sistemele informatice de tip GIS sunt tot mai frecvent utilizate în cadrul aplicaţiilor de
geomarketing, de localizare spaţială a clienţilor, de construire de hărţi privind atracţia şi gravitaţia
comercială de segmentare spaţială a clienţilor, furnizorilor şi concurenţilor.
Sisteme expert de marketing
Astfel de sisteme au apărut sub forma logicii interactive. Ele permit utilizatorului ca
plecând de la faptele de care dispune să poată obţine o sinteză integrând cunoştinţele din domeniu,
adaptate nevoilor sale imediate şi direct utilizabile la sfârşitul deciziei.
Posibilităţile de învăţare pe care le prezintă aceste sisteme în special prin memorarea
situaţiilor întâlnite şi a soluţiilor studiate au dus la apariţia unui nou mediu decizional.
Există mai multe moduri de reprezentare a cunoştinţelor într-un sistem inteligent dintre care
două au reţinut mai mult atenţia în literatura de specialitate.
O primă familie de sisteme inteligente se bazează pe o reprezentare analitică a
cunoştinţelor. Ele se exprimă sub forma unuia sau mai multor modele matematice unde parametrii
sunt specificaţi statistic. Aceste modele se utilizează în cadrul algoritmilor pentru găsirea unei soluţii
la o problemă ce a mai fost întâlnită. Sistemele interactive de asistare a deciziilor (SIAD după cum
mai sunt cunoscute) ilustrează această concepţie.
O serie de sisteme de acest tip sunt în prezent disponibile în sfera marketingului.
O a doua familie de sisteme inteligente se bazează pe reprezentarea euristică a
cunoştinţelor. Sistemele expert de marketing ilustrază această abordare. Ele integrează datele
existente şi judecăţile subiective într- un raţionament simbolic şi numeric în vederea rezolvării unui
ansamblu de probleme interdependente.
Pe parcursul execuţiei sistemul interacţionează permanent cu utilizatorul căruia îi explică
concluziile la care ajunge1 . Sistemul solicită informaţii complementare care îi permit elaborarea şi
îmbunătăţirea raţionamentului său.
În prezent există un număr semnificativ de sisteme expert de marketing, printre acestea mai
importante putând fi considerate:
1) Sistemul XCON produs de către Digital Equipment Corporation (DEC) şi Universitatea
Carnegie Mellon a avut ca obiectiv acordarea de consultanţă la configurarea calculatoarelor VAX-
11/780 plecând de la cerinţele unui client potenţial.
2) Sistemul ADCAD (Advertising Communication Approach Designer) este un prototip de
sistem expert în domeniul comunicării. Conţine circa 200 reguli de producţie fiind utilizat în scopul
asistării decidentului în evaluarea mesajelor publicitare şi alegerii unei anumite strategii.
3) Sistemul PROMOTER utilizează un ansamblu de date precum termenele de livrare,
ieşirile din depozit pentru a furniza un model de comportament al pieţii. Baza de cunoştinţe conţine
analizele efectuate în 70 de campanii promoţionale pentru produsele de larg consum. El poate evalua
ceea ce s-ar întâmpla în cazul lipsei campaniei publicitare oferind managerului o bază solidă de luare
a deciziilor.
1
Ernst C., Les systemes experts de gestion: banque, finance, marketing, Editura Eyrolles Paris, 1988
1
4) Sistemul MARKETING EDGE este utilizat în vederea elaborării unei strategii ajutând
decidentul în selectarea pieţelor, identificarea nevoilor consumatorilor şi stabilirea preţurilor.
5) Sistemul MABEL este folosit în domeniul utilajelor şi echipamentelor grele având ca
obiect prospectarea pieţei, alegerea mijloacelor publicitare şi evaluării rezultatelor târgurilor şi
expoziţiilor.
6) Sistemul DETECTOR produs de firma Novaction este utilizat în domeniul lansării
produselor noi de larg consum. Se bazează pe un mecanism de inferenţă bayesian şi poate oferi un
prim diagnostic asupra şanselor de succes şi al potenţialului economic al proiectelor de concepţie şi
dezvoltare a produselor noi pe pieţele internaţionale.
În scopul dezvoltării unui sistem expert este necesară studierea carcteristicilor problemei pe
baza unor criterii precum:
- importanţa factorilor calitativi în procesul de evaluare şi decizie;
- existenţa experţilor ce deţin performanţe recunoscute şi care pot fi transmise;
- necesitatea colaborării decidentului în diferite etape ale rezolvării problemei.
Domeniul de aplicare al sistemelor expert se poate lărgi considerabil în cazul unei abordări
plurisectoriale a marketingului: produse industriale, servicii, evoluţia câtorva tehnici de
comercializare precum marketingul direct, vânzările prin corespondenţă, etc.
Numeroase oportunităţi de dezvoltare există în domenii cum ar fi:
- definirea şi evaluarea ofertelor în marketingul industrial;
- diagnosticarea şi îmbunătăţirea performanţelor în domeniul serviciilor;
- controlul eficienţei acţiunilor de marketing direct;
- adaptarea ofertei la cerinţele cumpărătorului în vânzarea la distanţă.
2
În tabelul 1 sunt prezentate câteva domenii ale marketingului care sunt favorabile dezvoltării
de sisteme expert.
Deciziile de marketing au făcut obiectul a numeroase cercetări vizând mai bună evaluare a
consecinţelor şi reducerea riscurilor. Pe parcursul ultimelor decenii acest efort s-a concretizat într-un
număr de sisteme de asistare a deciziei orientate spre:
- analiza datelor disponibile şi exprimarea lor într-o formă sintetică (orientare spre date);
- identificarea relaţiilor cauzale şi evaluarea lor econometrică (orientare spre model);
- dezvoltarea de modele ce rezolvă anumite elemente ale mixului de marketing (orientare
spre problemă);
- stocarea şi transferul de experienţă (orientare spre decizie).
Achiziţionarea, memorarea, adaptarea şi punerea în valoare a cunoştinţelor de care dispun
decidenţii la nivelul reacţiilor pieţei, comportamentului consumatorilor, reacţia diferitelor elemente
ale mixului de marketing sunt principala responsabilitate a compartimentului de marketing. In acest
context rolul sistemelor expert va creşte deoarece ele sunt un mediu operaţional de îmbogăţire şi de
punere în valoare a unei resurse rare: competenţa.
Componenta cea mai importantă a unui sistem expert este baza sa de cunoştinţe. După
Waterman (1986) cunoştinţele unui sistem expert se pot dobândi în doua moduri:
2
Ernst C., Les systemes experts de gestion: banque, finance, marketing, Editura Eyrolles Paris, 1988
3
-metoda observaţională: prin analiza lucrărilor de specialitate, exemplelor şi a studiilor
de caz. In acest fel numai o parte limitată a problemei este analizată ceea ce face ca alte
surse potenţiale de informaţii să fie ignorate. Chiar şi astfel această abordare oferă surse
de cunoştinţe accesibile şi uşor de codificat sub forma regulilor de decizie pe baza cărora
se pot dezvolta sisteme expert în domeniul industriei.
- metoda intuitivă: în care deciziile se iau pe baza analizei experţilor care furnizează un
set de reguli euristice. Problema în acest caz este modul în care expertul uman poate
descrie cunoştinţele sale într- un mod uşor de înţeles. In practică mulţi experţi iau
deciziile pe baza intuiţiei, fiindu- le dificil sau chiar imposibil să explice modul în care au
acţionat.
Obiectivul este identificarea unui set de reguli de determinare a preţurilor care pot fi
adăugate bazei de cunoştinţe a unui sistem expert de marketing în vederea îmbunătăţirii
performanţelor acestuia. La baza stabilirii acestor reguli sunt lucrări din domeniul marketingului
precum “Managementul marketingului” de P. Kotler şi ”Luarea deciziilor în marketing” de D.W
Cravens, G.E Hill şi R.B Woodruff.
Primul pas în dezvoltarea regulilor de decizie este identificarea unui număr de condiţii sau
de situaţii pe care le întâlneşte un manager de marketing. Pasul următor este identificarea şi reţinerea
din setul de informaţii a acelor fapte şi acţiuni care se potrivesc cel mai bine situaţiei în care se află
respectivul decident. Regulile care se suprapun vor fi combinate, informaţiile redundante se vor
elimina, termenii ambugui fiind înlocuiţi de echivalentul lor cert. Regulile extrase ca rezultat sunt
independente între ele şi astfel este posibilă reprezentarea lor într-un singur modul în cadrul
sistemului expert.
Tabelul 2 prezintă 5 reguli extrase din lucrările mai sus menţionate.
3
Tse A., Pricing Decision Rules for an Expert System, Marketing Bulletin, 1990
4
4) Maximizarea profitului curent
5) Lărgirea gamei de produse
Utilizator> 3
(Deoarece răspunsul utilizatorului la prima întrebare este 3, sistemul va selecta regula 2 din
tabel şi va întreba utilizatorul asupra valorii ratei profitului)
Sistem> Care este rata profitului?
Utilizator> 25%
(In scopul determinării preţului optim pentru produs, sistemul va căuta în subsistemul de
contabilitate costul produsului şi găseşte valoarea 100 u.m.
Pe baza formulei corespunzătoare specificată în partea de acţiune a regulii 2 sistemul va
recomanda preţul)
Sistem> Preţul produsului este: 125 u.m.
În practică situaţia este mai complexă datorită numărului mult mai mare de reguli de decizie.
Deşi regulile sunt concepute cât mai independente între ele, ordinea acestora în baza de cunoştinţe
precum şi interacţiunile neprevăzute dintre ele pot conduce la rezultate neaşteptate.
In plus, trebuie să existe un număr de interfeţe între diferitele subsisteme şi modulul central.
In cazul în care anumite date sunt frecvent solicitate va exista o interfaţă între sistemul central şi
subsistemul de calcul pentru accesarea mai rapidă a datelor.
Sistemul trebuie să fie capabil să răspundă la întrebări de tipul “cum?” şi “de ce?” pentru a
fi înţeles de către utilizator. Toate aceste cerinţe impun un efort considerabil de programare şi
concepere în realizarea sistemului expert.
Există o serie de limitări în utilizarea metodei observaţionale prin analiza lucrărilor de
specialitate şi a studiilor de caz şi anume4 :
Prima limitare se referă la faptul că setul de reguli propus este valabil pentru determinarea
preţurilor în situaţii generale. Fiecare sistem economic naţional este format dintr- un număr de
industrii, fiecare fiind caracterizată de probleme şi decizii specifice. Nu este posibil astfel aplicarea
unui set general de reguli de determinare a preţurilor fără a ţine seama de specificul fiecărui domeniu.
A doua limitare apare datorită faptului că în situaţiile de decizie reale din marketing intuiţia
joacă adeseori un rol mai important decât acţiunile deduse strict pe baza unor strategii teoretice
desprinse din lucrările de specialitate.
A treia limitare este aceea că multe dintre regulile menţionate în cărţi nu sunt aplicate intr-
un context bine delimitat. Spre exemplu regula 5 care afirmă că firmele ce au o clientelă foarte fidelă
trebuie să-şi menţină preţul neschimbat este propusă fără efectuarea unei cercetări prealabile. De
asemenea multe dintre reguli sunt ambigui, termenul de “fidel” utilizat în regula 5 neavând un sens
bine explicitat.
A patra limitare este datorată subiectivităţii persoanelor care selectează regulile ce provin de
la o aceeaşi sursă (lucrare).
In ciuda acestor limitări, regulile obţinute pe baza lucrărilor de specialitate din domeniul
marketingului oferă un punct de plecare în fundamentarea procesului decizional la nivelul
întreprinderilor industriale.
4
Tse A., Pricing Decision Rules for an Expert System, Marketing Bulletin, 1990
5
arborelui de decizie), de transfer a acestora şi prin facilităţile de simulare disponibile, Expert Choice
se află la frontiera dintre sistemele bazate pe o reprezentare analitică a cunoştinţelor şi sistemele
expert bazate pe reprezentările euristice.
Pentru înţelegerea fenomenelor economice legate de distibuţia unui nou produs, eficienţa
publicităţii asupra vânzărilor, decidentul va utiliza modele normative. Acestea au ca obiect stabilirea
de reguli care să descrie mecanismul de funcţionare al pieţei.
Totuşi complexitatea deciziilor poate constitui un impediment major mai ales în cazul lipsei
anumitor cunoştinţe (informaţii). In acestă situaţie este necesară o metodă de structurare a
cunoştinţelor care să permită rezolvarea logică a problemei şi care să fie suficient de flexibilă pentru
a se adapta diferitelor contexte decizionale.
Metoda analizei ierarhice urmăreşte rezolvarea problemelor complexe în trei etape:
- identificarea problemei;
- analiza problemei;
- sinteza.
Identificarea problemei constă în stabilirea obiectului cercetării respective.
Analiza constă în descompunerea problemei pentru stabilirea dimensiunilor
elementare ce caracterizează fenomenul studiat. Este un proces natural al raţionamentului uman,
realitatea fiind înţeleasă plecând de la dimensiunile fundamentale care o compun.
Descompunerea ierarhică constă în reprezentarea problemei sub forma unei structuri
arborescente inversate unde radăcina este fie scopul ce trebuie atins, fie problema ce trebuie
rezolvată.
In figura 1 este prezentată descompunerea ierarhică a unei probleme ce priveşte definirea
unei strategii de marketing5 .
Problema Succesul strategiei de
complexă marketing
5
Ernst C., Les systemes experts de gestion: banque, finance, marketing, Editura Eyrolles Paris, 1988
6
Ponderarea parametrilor:
Analiza problemei a permis reprezentarea sub forma unei structuri arborescente ierarhizate.
Criteriile situate pe acelaşi nivel ierarhic au importanţe diferite.
In mod absolut ponderarea acestor criterii revine la a cere decidentului să acorde fiecărui
criteriu de pe acelaşi nivel ierarhic o notă cuprinsă între 0 şi 100. Acestă metodă prezintă avantajul
simplităţii în utilizare însă obligă decidentul să judece în mod absolut un element.
In practică cunoştinţele nu sunt niciodată poziţionate pe o scară absolută, ci pe una relativă.
Astfel acestă fază de ponderare poate fi înlocuită printr-o serie de comparaţii relative între perechi.
Există două avantaje principale:
- evaluarea mai fidelă a realităţii de către decident;
- permite măsurarea coerenţei decidentului şi structurarea modelului.
De fapt este vorba de o extindere a noţiunii clasice de măsură aplicată pe o scară de utilitate
în sens microeconomic. Atunci când utilitatea este un preţ, scara se identifică cu o scară a preţurilor
de pornire. Avantajul acestei metode apare din faptul că în majoritatea cazurilor utilitatea percepută
are un caracter subiectiv fiind asemănătoare gândirii manageriale. Această subiectivitate numită după
caz experienţă sau intuiţie şi care conţine toată bogăţia raţionamentului uman este astfel integrată în
model conform unui proces de structurare echivalent. In acest fel proiectantul modelului va pondera
pas cu pas structura arborescentă.
Volumul total de informaţii rezultante este de obicei mult mai mare decât numărul maxim
de canale informaţionale pe care persoana decidentă le poate folosi simultan.
Sinteza
Fazele precedente au permis reprezentarea problemei decizionale. Ultima etapă constă în a
sintetiza toate informaţiile identificate şi de a le integra în model. Această sinteză se va face
calculând pentru fiecare soluţie posibilă identificată un punctaj global proporţional cu capacitatea de
rezolvare a problemei considerate.
In tabelul 3 este prezentată sinteza stategiei de marketing a unei întreprinderi.
Evaluarea produselor
Nivel 1 Nivel 2 Nivel 3
Cota de piaţă = 0.35 Prod. C = 0.15
Prod. A = 0.18
Prod. B = 0.02
Strategia
de
marketing Nivelul profitului = 0.40 Prod. A = 0.20
a întreprinderii Prod. C = 0.15
(1.00) Prod. B = 0.05
Creşterea vânzărilor = 0.15 Prod. B = 0.07
Prod. A = 0.05
Prod. C = 0.03
Notorietatea = 0.10 Prod. A = 0.05
Prod. B = 0.03
Prod. C = 0.02
Tabelul 3: Evaluarea celor 3 tipuri de produse ale întreprinderii
Sinteza definirii strategiei de marketing se concretizează în prioritatea acordată celor 3 tipuri
de produse A,B,C:
Produsul A: 0.48 (48%)
Produsul C: 0.35 (35%)
Produsul B: 0.17 (17%)
7
Validarea modelului conceptual
2) Grafurile de sensitivitate
Al doilea aspect fundamental al unei metode de asistare a deciziei constă în măsurarea
riscului care poate fi:
- o eroare în ponderea atribuită unui anumit criteriu;
- o evoluţie conjuncturală.
Reprezentarea unei probleme de decizie este limitată datorită caracterului static al acesteia.
Modelarea unei situaţii reale se face printr-o structură arborescentă ale cărei ponderi au fost fixate de
la început. In practică există o dimensiune dinamică a realităţii (aspectul temporal şi conjunctural).
Fiecare graf de sensitivitate măsoară impactul asupra rezultatului final în urma modificării
ponderiii atribuite fiecărui criteriu considerat într-un domeniu de valori posibile. Aceste grafuri
permit evidenţierea criteriilor importante şi a criteriilor nesemnificative care nu conduc la riscuri de
eroare în decizia globală.
Aceste instrumente sunt foarte utile în luarea unei decizii manageriale oferind posibilitatea
de a măsura stabilitatea modelului faţă de fluctuaţiile conjuncturale sau a erorilor de ponderare.
Dezvoltarea unui sistem expert implică parcurgerea unui proces de structurare a expertizei
care se doreşte a fi modelată. Această etapă este adeseori greu de condus, lungă şi costisitoare.
Metoda analizei ierarhice este tocmai o metodă de structurare a cunoştinţelor care este perfect
utilizabilă în conducerea procesului de extragere şi ordonare a cunoştinţelor obţinute de la expertul
uman.
8
Pe de altă parte, pentru ca o expertiză să poată fi modelată sub forma unei baze de
cunoştinţe a unui sistem expert, trebuie să îndeplinească anumite condiţii:
- modularitate: posibilitatea descompunerii unei probleme în mai multe subprobleme;
- complexitate: referitor la conceptele utilizate şi relaţiile dintre acestea;
- raţionalitate: ponderarea conceptelor şi a procedurilor conform contextului problemei;
- fiabilitate: trebuie să existe un consens asupra existenţei unei expertize într-un domeniu
considerat;
- suficienţă: cunoştinţele necesare rezolvării problemei pentru care a fost realizat un
sistem expert trebuie să fie exhaustive. Acesta însuşire este fundamentală în controlul
coerenţei sistemului şi al fiabilităţii acestuia.
9
CURSUL 10
1
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
1
Reţea privată de firmă, locală sau extinsă, care foloseşte tehnologia INTERNET
(protocoale şi aplicaţii).
2
Sisteme informationale de marketing
3
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
4
Sisteme informationale de marketing
1
Kotler Philip: op. Citate, pag. 174.
5
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
7
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
fic Mediu
mogra l eco
nom
de
iul ic
ed Clienti
M
M
ed
iul
ial Marke
ural
erc tin
tehn
m g
o
Mediul nat
Re
ologic
Baza de
ie
su
re Product
rse u ne Fin
Furnizori B.D Organisme
ma
B.T publice
B.C
Mediu
lta
zvo
B.P an
de
nal
c
iar
l
-co re
c
ntabil Cerceta
utio
ult
ura
tit
ins
Macromediu
l
Concurenti
u
i M
ed ed
M soc
iul Micromediu
ial
c
Mediul politi Mediul intern
8
Sisteme informationale de marketing
MACROMEDIU
FLUX
FLUX
FLUX FLUX
DE DE
INTRARE IESIRE
META FLUX
MEDIUL
INETRN
9
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
11
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
12
Sisteme informationale de marketing
Tabela Cumpărător/Client
13
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
14
Sisteme informationale de marketing
15
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
16
Sisteme informationale de marketing
17
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
18
Sisteme informationale de marketing
19
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
20
Sisteme informationale de marketing
1
(eng.) Data Warehouse = depozit de date
21
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
manevrează datele cele mai cerute, cu tot mai puţine cereri de detaliere
către nivelele inferioare. Calculatoarele de pe primul nivel pot fi
optimizate pentru procesări intense pe volume mici de date, pe când
serverele de pe nivelele doi şi trei pot fi adaptate pentru procesări simple
pe volume mari.
Odată decisă arhitectura logică trebuie analizate posibilităţile
oferite de structurile hard. Factorii de influenţă asupra alegerii tipului de
server se referă la dimensiunea depozitului şi la nevoile întreprinderii în
ceea ce priveşte scalabilitatea, disponibilitatea şi administrarea
sistemului, fiind întâlnite:
a) serverele monoprocesor sunt cel mai uşor de întreţinut dar sunt
limitate ca de putere calcul şi scalabilitate. Reţelele de servere
monoprocesor se pot extinde prin intermediul arhitecturilor distribuite.
b) Sistemele cu multiprocesare simetrică îşi sporesc puterea prin
adăugarea de procesoare care partajază memoria internă a serverului
precum şi unităţile de stocare. Această arhitectură este ideală pentru
căutări în baze mari de date.
Referitor la deciziile privitoare la SGBD alese, acestea se bazează
pe nevoia de flexibilitate şi pe dimensiunile depozitului de date.
Versiunile moderne ale SGBD-urilor relaţionale şi distribuite dau
posibilitatea analizei multidimensionale şi pot beneficia din plin de
hardware-ul specializat pentru bazele de date (de exemplu Teradata).
Depozitele de date permit o analiză independentă de procesare
zilnică a datelor din cadrul firmei. De asemenea, s-a constatat că mai
mult de o treime din datele existente în DB nu sunt luate niciodată în
considerare, fiind complet ignorate. Analizând şi aceste date se poate
constata dacă, unde şi când a greşit şi cum se pot evita pe viitor aceste
greşeli. Analizele multidimensionale care permit interpretarea datelor în
funcţie de diferite criterii fac de trei ani obiectul marilor firme
producătoare de SGBD-uri. Acestea pot fi făcute în principiu şi pe baza
curentă de date, dar în cazul unor volume mari de date obţinerea de
situaţii este foarte dificilă, deoarece implică comenzi complexe. Scopul
SGBD-ului este de a asigura tranzacţiile cu datele într-o manieră sigură,
şi deci nu poate fi eficientă. Aceste noi programe asigură o bună
performanţă în analizarea acestui uriaş volum de date şi posibilitatea
schimbării continue a metodelor de analiză. De această dată sistemul este
organizat cu totul altfel deoarece nu mai este nevoie de funcţia de
actualizare a informaţiilor şi nici de protecţie. Efectuarea statisticilor,
analizelor şi comparaţiilor se face având la bază calculatoare foarte
22
Sisteme informationale de marketing
Interogari Data
Activitati Interactiuni OLAP
si rapoarte mining
zilnice on-line
Date
Baze adunate Depozit
de date in timp de date
Date
operationale Date de
istoric
23
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
1
(eng.) On Line Analytical Processing – OLAP = procesare analitică on-line
2
(eng.) Data Mining = mineritul (forarea) datelor
24
Sisteme informationale de marketing
Acces la
Cunostinte Cunostinte
Data
mining
Rafinare
OLAP/ROLAP
Interogari
si analize
Statistici
Date si Rapoarte
1970 1980 1990 2000
Figura 6.4. Etapele de procesare şi rafinare a informaţiei
1
(eng.) Data Analysis Paradigm = Model de Analiză a Datelor
2
(eng.) Knowledge Acces Paradigm = Model de Acces la Cunoştinţe
25
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
26
Sisteme informationale de marketing
27
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
Sisteme informatice
Motor Aplicatii
Data OLAP
Warehouse OLAP
OPERATIONALE
Metadate
28
Sisteme informationale de marketing
1
Data Mining at Dun&Bradsheet, White Papers, 1998, pag. 14.
30
Sisteme informationale de marketing
Depozit de date
Conditionare
logica
Baza de date 1
Afinitati si
Descoperire
Asocieri
Tendinte si
Variatii
32
Sisteme informationale de marketing
Depozit de date
Vecinul
Baza de date 1 imediat
Date retinute Argumentare
pe cazuri
Inductie
Reguli Algoritmi
Baza de date 2 Data genetici
Mining
Logic Arbori de CART
. decizie CHAID
. C4.5 etc.
. Agenti
Tabelare
Date distilate incrucisata
Retele de
Baza de date n incredere
Ecuational Statistici
Propagare
Retele
inversa
neurale
Kohonen
37
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
1
URL:fttp://www.eudora.com
38
Sisteme informationale de marketing
Intreprindere Browser
Web
Server
baza de date
Aplicatie
Server Web
Web
Server de
aplicatii
Reteaua locala Aplicatie
Documente Web
Web
Server de
aplicatii
Salariat
39
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
1
Groupware reprezintă un set integrat de instrumente software care permite lucrul în
colectivele de muncă prin comunicare, colaborare şi coordonare la momente de timp şi
locuri diferite.
2
(eng.) Firewall = ,,perete de foc” – într-o traducere lejeră.
40
Sisteme informationale de marketing
Telelucrator
Documente mobil
Web ISP
Modem
Modem
INTERNET
Reteaua locala Firewall ISP
Modem
ISP
Salariat
Magazin
Furnizor
Filiale
41
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
Baze de date PC
Internet
Server Web
Documente Web
Documente
Web
Modem
INTERNET
Reteaua locala Firewall ISP
Server e-mail
Salariat Server de stiri (News)
42
Sisteme informationale de marketing
1
(eng.) The Internet Computing = prelucrarea datelor pe Internet.
2
(eng.) Domain Name System (DNS) = sistemul numelor de domeniu.
43
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
INTERNET
46
Sisteme informationale de marketing
Middle Tier
Languages
OLE DB
ADO
Tools
ADO
Client/Server
OLE DB
Components HDBMS
Open VMS
Internet/Intranet
Internet Server
OLE DB
ADO
47
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
1
www.stormy.net101.com
48
Sisteme informationale de marketing
49
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
50
Sisteme informationale de marketing
51
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
52
Sisteme informationale de marketing
53
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
55
Tendinţe actuale în proiectarea şi realizarea sistemelor informatice de marketing
56
Sisteme de asistarea deciziilor bazate pe depozite de date şi analiză
multidimensionlă
Bazele de date relaţionale sunt nucleul în jurul căruia se dezvoltă indiferent de tipologia lor.
Sistemele de gestiune a bazelor de date relaţionale ele mai folosite la ora actuală sunt MS Access,
Visual FoxPro, Oracle şi sistemele SQL Server, respectiv MySQL. pe sistemul de operare Linux..
Tabelul este conceptul fundamental care stă la temelia construcţiei unei baze de date
relaţionale. Tabelul reprezintă în planul datelor descrierea informaţiilor asociate unei entităţi din
lumea reală. Astfel într-o bază de date de marketing vom opera cu tabelele: Mărfuri, Clienţi,
Vânzări, Magazine, etc.
Structura logică a unui tabel cumulează suma atributelor ce caracterizează informaţional
entitatea asociată tabelului. Fiecare atribut este identificat printr-un nume si un set de proprietăţi
descriptive. Sistemele de gestiune a bazelor de date permit prin interfaţa limbajului LDA –
Limbajul de Descriere a Datelor, introducerea şi a unor elemente de verificare logică care devin
operaţionale automat la momentul populării tabelelor cu date reale. Tot la acest moment se
selectează atributele (câmpurile) cheie primară – primary key, stabilite pentru fiecare tabel, vezi
figura 1.
SGBDR asigură reprezentarea legăturilor care există firesc între tabelele bazei de date. În
baza acestor legături – relationships, înregistrările din două tabele corelate se pot asocia, grupa,
pentru a permite o informare mai relevantă şi pentru a se putea obţine calcule mai cuprinzătoare
necesare procesului decizional, vezi figura 2.
Pentru a lega două tabele, deci pentru a defini o relaţie între ele, trebuie să amplasăm de la
bun început, câmpuri comune în cele două tabele. Aceste câmpuri comune asigură corespondenţa
dintre înregistrările celor două tabele. Această corespondenţă poate fi de tipul:
- unu la unu, 1:1;
- unu la mulţi, 1:M, relaţie ierarhic-arborescentă de tip tabel părinte-tabel fiu;
- mulţi la unu, M:1;
2
O chei primară are valori unice în vreme ce cheile externe admit valori multiple.
- mulţi la mulţi, M:M, care se descompune în două relaţii 1:M prin intermediul
unui tabel de legătură.
Câmpurile comune sunt câmpuri cheie, în tabelul părinte va fi cheia primară iar
corespondenta din tabela fiu va fi cheia externă.
Legăturile dintre tabele, de tip relationship, asigură prin forţarea restricţiei de integritate
referenţială, consistenţa bazei de date. Această restricţie previne:
- introducerea într-o tabelă fiu a unei înregistrări a cărui cheie externă nu- i
corespunde o valoare din domeniul de valori al cheii primare din tabela părinte,
- ştergerea unei înregistrări dintr-o tabelă părinte dacă mai sunt încă înregistrări
active în tabela fiu.
Bazele de date relaţionale oferă soluţii de calcul şi centralizare pentru sinteza datelor
utilizând interogările de tip Query, rapoartele – Reports care apelează la funcţiile statistice
intrinseci ale limbajului SQL – Sum, Min, Max, Avg, Count. Astfel se obţin rapoarte cu unu sau
mai multe grade de totaluri, se mai numesc subtotaluri centralizate după diverse caracteristici de
grupare (Group by). Caracteristicile de grupare pot fi caracteristici calendaristice – lună, trimestru,
an, sau spaţiale (geografice – zonă, ţară, judeţ, sau atributive, cele mai multe, categorie produs,
produs, culoare, mărime, model.
Până la un anumit volum de date prelucrat şi pănă la un anumit timp de răspuns solicitat,
sistemele de gestiune a bazelor de date relaţional în variantă clasică, s-au dovedit eficiente. Dar
realitatea de astăzi, şi mai ales în marketing impune prelucrarea unui volum foarte mari de date cu
o dinamică a schimbărilor deosebit de rapidă, mai ales dacă luăm în calcul şi tranzacţiile on- line
din spaţiul www. Şi timpul de răspuns se doreşte a fi cât mai mic. Soluţia care s-a impus în prezent
în lumea informaticii o reprezintă stocarea datelor în depozite de date – Data Warehouse şi analiza
multidimensională a datelor cu tehnologii de tip OLAP – On-Line Analytical Proccess.
Înainte de a oferi o definiţie se impune a preciza că depozitul de date este într-un fel
complementul sistemului informatic operaţional, compuse din cunoscutele subsisteme de
contabilitate, comercial, marketing, resurse umane.
Depozitul de date este şi el la rândul său constituit tot din tabele asemenea bazelor de date
relaţionale. În aceste tabele se stochează indicatori sintetici, totaluri, frecvenţe, obţinute din
arhivele şi bazele de date ale subsistemelor informatice menţionate, care susţin activitatea curentă a
întreprinderii.
Depozitul de date în sistemele informatice inteligente este o colecţie de date tematică,
integrată, actualizată la intervale regulate, plasată într-un context temporal, disponibilă
permanent pentru interogări dinamice, în vederea asistării proceselor decizionale.
Depozitul de date se construieşte alături de bazele de date ale sistemului informatic
tranzacţional. Datele din depozitul de date provin în principal din datele capturate din sistemul
informatic operaţional de marketing, din bazele de date de tip arhivă/istoric precum şi din bazele de
3
date publice cum ar fi: baze de date demografice, statistice, de prognoză economică, furnizate de
instituţiile de sondare a pieţei sau instituţii de cercetări de marketing. Datele pot fi publice, gratuite,
sau cumpărate sau preluate pe bază de abonament.
Odată construit, depozitul de date este alimentat, deci actualizat, periodic cu datele sintetice
rezultate din prelucrările efectuate asupra datelor perioadei curente. După elaborarea situaţilor
centralizatoare totalurile sintetice se introduc în depozitul de date. În ultima vreme, în sistemele
mari se poate face această operaţie de „refresh” a depozitului de date şi zilnic, dacă platforma
hardware este puternică şi sistemul software este performant.
Datele se mai pot stoca selectiv , pe anumite domenii şi activităţi, în magazii de date Data
Marts, adiacente depozitului de date. Această separare fizică urmăreşte creşterea performanţelor
exploatării datelor de către managerii unor compartimente funcţionale mai importante pentru firmă.
Pentru a simplifica înţelegerea modului de construcţie şi apoi de utilizare a unui
DataWarehouse vom ilustra pe scurt modul în care datele dintr-o bază de date relaţională, de
exemplu Access, migrează în tabelele depozitului de date, utilizând limbajul SQL.
CLIENŢI PRODUSE
Cod_cl Cod_porod
Den_cl Den_prod
CUI Categorie
Adr_cl FACTURA Pret_catalog
Nr_factura
Data_factura
Cod_prod TABELE BDR
Cod_cl
Cantitate
DATAWAREHOUSE
Dimensiunea_Client Dimensiunea_Produse
Cod_cl Cod_prod
Den_cl Den_prod
Anul Anul
Luna Luna
NR_TRANZACTII CANTITATE_TOTALA
VALOARE_MEDIE VALOARE_TOTALA
4
Din baza de date a sistemului tranzacţional utilizăm tabelele clasice Clienti, Produse, facturi
şi prin centralizarea vânzărilor
- pe client;
- pe produs;
obţinem datele de sinteză, totalurile, de exemplu:
- numărul total de tranzacţii de vânzare – cumpărare realizate de un client pe un
fiecare an, pe fiecare lună, şi chiar pe fiecare pe zi, pentru a urmări frecvenţa
actului de cumpărare;
- valoarea totală a cumpărărilor realizate de client pe aceleaşi caracteristici de
grupare din dimensiunea timp, sau altă dimensiune;
- cantitatea şi valoarea totală a vânzărilor dintr-un produs pe aceleaşi caracteristici
de grupare aparţinând dimensiunii timp, an, lună, decadă, zi.
Deci, în depozitul de date vor fi transferate totalurile, subtotalurile, frecvenţele, alţi indicatori
statistici pe diverse caracteristici de grupare şi nivele de agregare. Sistemele software complexe
cum sunt SQL Server, Oracle pun la dispoziţia programatorilor serviciul de transformare a datelor
– DTS care include pe lângă componentele de migrare şi transformare a datelor şi componente
pentru validarea şi curăţirea datelor, acţiuni necesare asigurării consistenţei şi acurateţii datelor.
4
Figura 4: Arhitectura simplă a unui depozit de date
4
după Ion Lungu, Adela Bara, Sisteme informatice executive, note de curs, ASE, Bucureşti, 2005
5
Pentru depozitele care folosesc sisteme Data Marts, completate cu sisteme Data Minning
pentru de extragerea de informaţii noi, cunoştinţe, din depozitul de date, arhitectura acestuia
devine o arhitectură complexă. Sistemele Data Warehouse cu arhitectură complexă folosesc şi un
sistem de purificare şi integrare a datelor precum şi multiple sisteme data mart proiectate pentru
compartimente ale întreprinderii. Structura unui sistem Data Warehouse cu arhitectură complexă
este redată în figura următoare:
6
la sisteme distribuite din cadrul companiilor cum ar fi sisteme de gestiune a comenzilor, de
eliberare a facturilor, de contabilitate financiară. Indiferent de originea lor, datele trebuie să
fie colectate şi aduse într-o formă consistentă pentru a putea fi folosite. Acest proces se
numeşte transformarea datelor şi reprezintă baza pe care se construieşte un depozit de date
consistent, de înaltă calitate. Transformarea datelor presupune un proces de extragere,
condiţionare, curăţare, fuziune, validare şi încărcare.
2. nivelul central al depozitului de date – reprezentat de SGBD-ul si de serverul pe care
acesta rulează ş i de modul în care este implementat depozitul - există în acest moment două
tendinţe: una ar fi implementarea unui sistem distribuit, descentralizat unde datele sunt
păstrate în unităţi independente (Independent Data Marts) fiecare conţinând datele relevante
pentru un anumit aspect al operaţiilor unei instituţii. O a două posibilitate ar fi
implementarea unei surse de date unice, centralizate la care au acces utilizatorii din toate
departamentele unei instituţii.
3. nivelul strategic, - ultimul nivel al arhitecturii, la care datele sunt prezentate analistului
pentru interpretare. Valoarea finală a unui depozit de date este determinată de avantajele pe
care le oferă utilizatorului final în diferite procese de luare a deciziilor şi analiză. Prin
folosirea diferitelor unelte de acces la informaţie şi “data mining” disponibile, utilizatorii
pot obţine informaţii care îi vor ajuta în procesele de stabilire a strategiei firmei..
Interpretarea uzuală constă în reprezentarea temporară, grafică a datelor create pe desktop.
Instrumentele de cereri grafice, prezentările, rapoarte scrise, browserele Web, instrumente
de vizualizare a datelor, toate aparţin acestui nivel. Aplicaţiile de asistere a deciziilor ale
clienţilor, care ne dau noi informaţii despre bugete, prognoze, recomandări cu privire la
alocarea resurselor şi multe altele se afla în data mart la acest nivel al arhitecturii.
Utilizatorii IT accesează cu prioritate nivelul operaţional şi nivelul central, în vreme ce
utilizatorii finali, managerii accesează nivelul strategic.
7
Măsurile
Măsurile reprezintă datele cantitativ- valorice care fac obiectul calculelor aritmetice, care se
totalizează, se contorizează şi conduc la obţinerea informaţiilor, a indicatorilor sintetici. Măsurile
se mai numesc şi metrici. De exemplu: cantitatea vândută, valoarea unei promoţii, etc.
Dimensiunile
Dimensiunile individualizează o caracteristică de grupare a datelor, de exemplu:
clientul, produsul. Centralizările se fac pe clienţi, pe produs sau alte dimensiuni. Timpul este o
dimensiune obligatorie pentru depozitele de date de marketing. Dimensiunile sunt de fapt codurile
după care se sortează şi se grupează datele în vederea centralizării. Dimensiunile se regăsesc în
cadrul bazelor de date relaţionale fie sub forma atributelor cheie primară, sau a cheilor externe şi
desigur atribute descriptive şi calendaristice. De regulă în practică dimensiunile se regăsesc sub
forma nomenclatoarelor de coduri, mai puţin dimensiunea timp
Faptele
Faptele sunt tabele care stochează valorile numerice ale măsurilor identificate, grupate
conform dimensiunilor acestor măsuri. În tabelele de fapte se regăsesc două categorii de câmpuri:
8
- câmpuri cantitativ – valorice, care reprezintă măsurile depozitului de date;
- coduri de tip cheie externă sau câmpuri descriptive asociate dimensiunilor.
Ierarhiile
Ierarhiile sunt structuri logice utilizate pentru ordonarea datelor. Ierarhiile se asociază
dimensiunilor complexe. În cadrul lor se stabilesc nivele ierarhice. De exemplu dimensiunea timp,
o dimensiune complexă admite ca nivele ierarhice: anul, trimestrul, luna, decada, săptămâna, ziua.
Nivelele se structurează în funcţie de ierarhie de la general la particular, Având întotdeauna un
nivel rădăcina, nivelul superior. Relaţiile dintre diferite nivele sunt relaţii de tip părinte – fiu.
Nivelele unei ierarhii permit stabilirea unor reguli de navigare atunci când accesul la date
presupune şi trecerea la detalierea informaţiilor sintetice.
Scheme relaţionale
Tabelele de fapte şi tabelele de tip dimensiune se leagă între ele p baza relaţiilor identificate
prin asocierile binecunoscute dintre atributele „cheie primară” şi „cheile externe”.
În funcţie de complexitatea legăturilor dintre tabele, în practică se întâlnesc 3 scheme de
modelare a relaţiilor:
- schema de tip stea;
9
- schema de tip constelaţie;
- schema de tip fulg de zăpadă.
DIMENSIUNEA DIMENSIUNEA
TIMP MARFĂ
TABELA
FAPTE
VÎNZĂRI
DIMENSIUNEA DIMENSIUNEA
CLIENT ZONE
DIMENSIUNEA DIMENSIUNEA
TABELA DE
TIMP MARFĂ
FAPTE
VÎNZĂRI
TABELA DE
FAPTE
DIMENSIUNEA NUMĂR DE DIMENSIUNEA
TRANZACŢII
CLIENT ZONE
10
i se asociază mai multe tabele dimensiune – tabele de tip nomenclator, ce reprezintă, aşa cum am
mai precizat, criteriile de grupare a datelor centralizatoare. Schema de tip stea este redată în figura
8.
Schema de tip constelaţie reuneşte mai multe scheme de tip stea care utilizează în comun
mai multe tabele de tip dimensiune. Schema de tip constelaţie este reprezentată în figura 9.
Schema de tip fulg de zăpadă se utilizează în situaţia în care unele dimensiuni au la rândul
lor subdimensiuni. Este cazul în care unele nomenclatoare au la rândul lor asociate alte
nomenclatoare pentru detaliu.
DIMENSIUNEA DIMENSIUNEA
TABELA DE
TIMP MARFĂ
FAPTE
VÎNZĂRI
DIMENSIUNEA DIMENSIUNEA
CLIENT ZONE
TABELA DE
FAPTE
NUMĂR DE
DIMENSIUNEA DIMENSIUNEA
TRANZACŢII
MAGAZINE ORAŞ
Toate aceste scheme au proprietatea că sunt scgheme deschise care se pot modifica pentru a
corespunde cât mai bine necesităţilor proceselor de informare şi decizie.
11
CURSUL 12
Depozitele de date – un nou model de structurare a bazelor de date de
mari dimensiuni
Sistemele informatice operaţionale de marketing utilizează baze de date relaţionale şi
distribuite care înmagazinează date din activitatea zilnică privind aprovizionările, comenzile,
vânzările, încasările, plăţile şi activităţile specifice de marketing, precum şi informaţiile culese prin
interogarea unor baze de date publice din reţele locale, metropolitante sau de pe Internet.
În bazele de date de marketing se regăsesc stocate informaţii privind practic toată activitatea
întreprinderilor, indiferent de domeniu. Accesul rapid la baze de date permite obţinerea informaţiilor
în timp util contribuind la creşterea eficienţei. De asemenea, capacitatea de stocare a dispozitivelor
de astăzi permite găsirea şi accesarea unor date de mai mulţi ani vechime, care fără ajutorul acestor
baze de date ar fi fost practic inutilizabile.
Aceste date sunt ulterior organizate multidimensional făcând posibile analize după cele mai
variate criterii la anumite intervale (lunar, trimestrial, anual etc.). Aceste analize sunt necesare
echipei de conducere pentru o mai bună fundamentare a deciziilor. Datele acumulate zi de zi sunt
organizate în depozite de date, care permit obţinerea celor mai variate situaţii.
1
(engl.) Data Warehouse = depozit de date
c) abordare stratificată ce presupune păstrarea datelor foarte sumarizate pe staţia de lucru,
datele mai puţin sumarizate pe un al doilea server iar datele de detaliu pe un al treilea. Staţia de la
primul nivel manevrează datele cele mai cerute, cu tot mai puţine cereri de detaliere către nivelele
inferioare. Calculatoarele de pe primul nivel pot fi optimizate pentru procesări intense pe volume
mici de date, pe când serverele de pe nivelele doi şi trei pot fi adaptate pentru procesări simple pe
volume mari.
Odată decisă arhitectura logică trebuie analizate posibilităţile oferite de structurile hard.
Factorii de influenţă asupra alegerii tipului de server se referă la dimensiunea depozitului şi la
nevoile întreprinderii în ceea ce priveşte scalabilitatea, disponibilitatea şi administrarea sistemului,
fiind întâlnite:
a) serverele monoprocesor sunt cel mai uşor de întreţinut dar sunt limitate ca putere calcul şi
scalabilitate. Reţelele de servere monoprocesor se pot extinde prin intermediul arhitecturilor
distribuite.
b) Sistemele cu multiprocesare simetrică îşi sporesc puterea prin adăugarea de procesoare
care partajază memoria internă a serverului precum şi unităţile de stocare. Această arhitectură este
ideală pentru căutări în baze mari de date.
Referitor la deciziile privitoare la SGBD alese, acestea se bazează pe nevoia de flexibilitate şi
pe dimensiunile depozitului de date. Versiunile moderne ale SGBD-urilor relaţionale şi distribuite
dau posibilitatea analizei multidimensionale şi pot beneficia din plin de hardware-ul specializat
pentru bazele de date (de exemplu Teradata).
Depozitele de date permit o analiză independentă de procesare zilincă a datelor din cadrul
firmei. De asemenea, s-a constatat că mai mult de o treime din datele existente în DB nu sunt luate
niciodată în considerare, fiind complet ignorate. Analizând şi aceste date se poate constata dacă,
unde şi când a greşit şi cum se pot evita pe viitor aceste greşeli. Analizele multidimensionale care
permit interpretarea datelor în funcţie de diferite criterii fac de trei ani obiectul marilor firme
producătoare de SGBD-uri. Acestea pot fi făcute în principiu şi pe baza curentă de date, dar în cazul
unor volume mari de date obţinerea de situaţii este foarte dificilă, deoarece implică comenzi
complexe. Scopul SGBD-ului este de a asigura tranzacţiile cu datele într-o manieră sigură, şi deci nu
poate fi eficientă. Aceste noi programe asigură o bună performanţă în analizarea acestui uriaş volum
de date şi posibilitatea schimbării continue a metodelor de analiză. De această dată sistemul este
organizat cu totul altfel deoarece nu mai este nevoie de funcţia de actualizare a informaţiilor şi nici
de protecţie. Efectuarea statisticilor, analizelor şi comparaţiilor se face având la bază calculatoare
foarte puternice, care pot manipula volume foarte mari de date.
Exploatarea depozitelor de date poate consta din:
extragerea unor rapoarte (la cerere sau pe baza unui ,,abonament” cu o anumită periodicitate);
extragerea unor date pentru a fi utilizate de aplicaţiile de birotică (programe de calcul tabelar,
procesoare de text, programe de prezentare etc.);
utilizarea unor instrumente de acces de către aplicaţii specializate de analiză, cum ar fi:
Interogari Data
Activitati Interactiuni OLAP
si rapoarte mining
zilnice on-line
Date
Baze adunate Depozit
de date in timp de date
Date
operationale Date de
istoric
Figura 6.3. Tendinţe în stocarea şi procesarea informaţiilor
1
(engl.) On Line Analytical Processing – OLAP = procesare analitică on-line
2
(engl.) Data Mining = mineritul (forarea) datelor
Acces la
Cunostinte Cunostinte
Data
mining
Rafinare
OLAP/ROLAP
Interogari
si analize
Statistici
Date si Rapoarte
1970 1980 1990 2000
Figura 6.4. Etapele de procesare şi rafinare a informaţiei
În cazul statisticilor şi rapoartelor erau disponibile utilizatorilor rezumate ale datelor. În plus şi
aceste date sumare erau obţinute prin intermediul unui analist. Odată cu apariţia depozitelor de date,
anumite interogări şi rapoarte pot fi obţinute chiar de utilizatorul direct prin consultarea bazelor de
date.
Începând cu OLAP, întrebări generalizatoare multi-dimensionale au putut fi adresate chiar de
utilizatorii direcţi, de ex. ,,un total pe produs, pe canal de distribuţie, pe lună”.
Cu ajutorul Data mining, analiştii de marketing şi o categorie mai rafinată de utilizatori
economici pot descoperi corelaţii semnificative, modele de informaţii, factorii de influenţă şi
tendinţele ce reies din date.
Noţiunea de ,,acces la cunoştinţe”, semnifică faptul că modelele relevante din date sunt găsite
dinainte şi stocate pentru necesităţile utilizatorilor. Aceştia pot folosi modelele interesante furnizate
săptămânal sau lunar sau pot interoga ei înşişi modelele de bază.
Deoarece marile baze de date adeseori oferă multe date utile, abordările bazate pe Interogări şi
OLAP se confruntă, de obicei, cu greutăţi în a identifica generalizări utile din cauza prea multor date.
Forţa tehnicii Data Mining constă în abilitatea de a efectua din proprie iniţiativă cercetări printre
date, descoperind în mod autonom modele cheie.
Cu toate că cele trei abordări de mai sus sunt utile, ele împart o trăsătură comună care se referă
la faptul că utilizatorul trebuie să realizeze mai multe analize pentru a dobândi cunoştinţele, procedeu
cunoscut ca Modelul de Analiză a Datelor1. O nouă abordare care pune la dispoziţia utilizatorilor
informaţie rafinată este Modelul de Acces la Cunoştinţe2. Prin modelul de acces la cunoştinţe
analiza datelor este efctuată în prealabil, iar utilizatorul doar urmăreşte cunoştinţele ,,pre-minerite” la
cerere.
Pentru a distila informaţia dintr-o bază de date este evident necesar să se realizeze analize la un
moment dat. Altfel spus, analiza se efectuează la momentul în care utilizatorul are nevoie de
cunoştinţe sau este realizată anterior, astfel încât sunt gata de a fi accesate. În mod tradiţional
analizele de tip data mining erau efectuate după lansarea cererii de către utilizator. Modelul accesului
la cunoştinţe elimina riscul unor analize întârziate prin această operaţie de preminerire a informaţiei.
1
(engl.) Data Analysis Paradigm = Model de Analiză a Datelor
2
(engl.) Knowledge Acces Paradigm = Model de Acces la Cunoştinţe
Aşadar există două modele distincte capabile să ofere utilizatorilor cunoştinţe:
Modelul de Analiză a Datelor: în acest caz utilizatorii operează asupra datelor pentru a
descoperi informaţia. Acest model se bazează pe o abordare de tipul ,,analiză la cerere”.
Modelul de Acces la Cunoştinţe: în acest caz analizele sunt efectuate în mod automat în
prealabil, modelele rafinate sunt pre-generate, iar utilizatorii obţin cunoştinţele în momentul
în care au nevoie de ele (abordare de tipul ,,cunoştinţe la cerere”).
Motor Aplicatii
Data OLAP
Warehouse OLAP
OPERATIONALE
Metadate
a) Bazele de date formează nivelul cel mai de jos, responsabil cu stocarea şi regăsirea datelor.
De regulă aplicaţiile tranzacţionale utilizează sisteme relaţionale dar pentru depozitele de date se
folosesc şi sisteme multidimensionale. Dat fiind volumul mare de date, este recomandabil ca SGBD-
urile folosite să ofere suport pentru prelucrări paralele şi distribuite, să dispună de mecanisme
performante de indexare şi de optimizare, să ofere un înalt nivel de siguranţă.
b) Motorul analitic OLAP (OLAP engine) are sarcina de a prelua cererile exprimate de
utilizatori şi, pe baza consultării metadatelor, să genereze cererile necesare pentru obţinerea datelor
ce vor fi redirectate către clienţi. În plus, datelor obţinute li se vor aplica la acest nivel o serie de
prelucrări.
Generarea de interogări – se bazează pe criterii furnizate de clienţi sub forma unor formule
exprimate prin operatori logici.
Manipulările matematice – se aplică pentru a aduce datele la forma dorită de utilizatori.
Acestea constau de cele mai multe ori în calcularea unor distanţe (metrice) derivate pe baza
unor formule date, analize statistice complexe etc.
Sintetizarea rezultatelor este o altă sarcină a motorului analitic. Deşi depozitul de date
conţine şi date deja agregate, adeseori utilizatorul doreşte consolidarea unor sinteze pe baza
unor combinaţii de atribute care nu au fost prevăzute.
c) Aplicaţiile OLAP sunt reprezentate de instrumente mânuite de utilizatorul final. Există
aplicaţii generale care răspund suficient de bine nevoilor unei categorii largi de utilizatori, există
instrumente specializate pe domenii (cum ar fi de pildă analiza financiară) şi, în fine, există
posibilitatea de a dezvolta instrumente foarte specifice.
Din punct de vedere al utilizatorului final, aplicaţia pe care o foloseşte trebuie să-i asigure două
funcţionalităţi importante: navigarea liberă prin depozitul de date în căutarea informaţiilor relevante
şi posibilităţi diverse de prezentare a datelor. Aceste funcţionalităţi sunt strâns legate între ele şi
este greu de spus care operaţie este de navigare şi care este de prezentare. Operaţiile OLAP sunt:
Specificarea criteriilor de selecţie este primul pas în orice analiză. Utilizatorul trebuie să
poată exprima cu uşurinţă criterii simple, bazate pe valori ale atributelor şi/sau pe valori ale
metricelor. Aceste criterii simple trebuie să poată fi apoi combinate prin operatori logici şi trebuie să
poată fi salvate în biblioteci pentru eventuale reutilizări.
Rotaţiile sunt operaţii care permit utilizatorilor să găsească perspectiva care-l interesează
specificînd dimensiunile şi direcţiile de rotaţie sau indicând un pivot.
Schimbarea nivelului de agregare permite găsirea nivelului de agregare optim pentru analiză.
Se poate adânci analiza spre nivele de detaliu (drill-down) pentru anumite dimensiuni în timp ce
pentru alte dimensiuni se creşte nivelul de agregare (drill-up).
Conform unui raport din 1997 al Grupului Gartner1: ,,Data mining şi inteligenţa artificială se
află între primele cinci tehnologii cheie care vor avea în mod sigur un impact major asupra unui mare
număr de industrii în următorii 3 până la 5 ani”. Gartner situează data mining între primele 10
tehnologii în care firmele vor investi în următorii 5 ani.
Studiile arată că ultimul an a cunoscut o explozie dramatică a nivelului de interes privind data
mining, în condiţiile în care utilizatorii au dorit să profite de avantajul oferit de această tehnologie
pentru a obţine un foarte util plus concurenţial.
Anumite produse software de vârf în domeniul data mining, provenite de la companii ca SAS
sau IBM, reprezintă acum mai mult decât simple motoare de modelare bazate pe algoritmi
1
Data Mining at Dun&Bradsheet, White Papers, 1998, pag. 14.
complecşi. Acestea se adresează unei categorii mai largi de probleme tehnice şi economice şi se
integrează în mediile actuale de tehnologie informaţională.
Deşi se credea că data miningul va elimina nevoia de specialişti în crearea de modele statistice,
lipsa experienţei umane şi a intuiţiei între nişte corelaţii relevante şi unele nerelevante, lipsă ce
caracterizează softurile, infirmă această previziune.
Tradiţional sunt avute în vedere două tipuri de analize statistice: analize confirmatorii şi
analize exploratorii. În cazul analizelor confirmatorii, având o ipoteză formulată aceasta se acceptă
sau se respinge. În analizele exploratorii, se urmăreşte găsirea de ipoteze, care apoi se acceptă sau se
resping. În acest punct sistemul preia ,,iniţiativa” în procesul analizei datelor sistemul gândeşte
singur ipotezele acestea ne mai fiind formulate de utilizator. În prezent termenul de data mining se
referă la procesul automat de analiză a datelor în care sistemul preia iniţiativa de a genera modele.
a) Din punct de vedere al procesului există trei clase de activităţi data mining: descoperire,
modelare predictivă şi analiza excepţiilor (figura 6.6.).
Depozit de date
Conditionare
logica
Baza de date 1
Afinitati si
Descoperire
Asocieri
Tendinte si
Variatii
Descoperirea este procesul de căutare în baza de date pentru a găsi modele, fără a
avea o idee predeterminată sau ipoteza asupra ceea ce pot fi modele. Cu alte cuvinte programul preia
iniţiativa în găsirea a ceea ce sunt modelele interesante, fără a fi necesar ca utilizatorul să se
gândească la întrebările relevante în prealabil. În marile baze de date există atât de multe modele
încât utilizatorul nu ar putea niciodată practic să se gândească la toate întrebările care ar trebui puse.
Problema cheie în acest caz constă în bogăţia de modele care pot fi găsite şi exprimate, precum şi în
calitatea informaţiei livrate – elemente care determină puterea şi utilitatea tehnicii de descoperire.
În modelare predictivă modelele descoperite din baza de date sunt folosite pentru a
face previziuni. Modelarea predictivă permite astfel utilizatorului să prelucreze înregistrări ce au
câmpuri valorice necunoscute, iar sistemul va intui valorile necunoscute pe baza unor modele
anterioare din baza de date.
Analiza excepţiilor reprezintă procesul prin care se aplică modelele extrase pentru a
găsi anomalii sau elemente de date neobişnuite. Pentru a descoperi anomaliile, mai întâi aflăm ceea
ce e normal, apoi detectăm acele articole care deviază de la normă în cadrul unui interval dat. De
exemplu odată ce am observat că 90% dintre cumpărători au sub 50 de ani, ne putem înteba în
legătură cu cei 10% cumpărători care au
peste 50 de ani şi sunt în baza de date. Se observă că descoperirea ne poate ajuta să găsim
,,cunoştinţe uzuale”, vreme în care analiza excepţiilor caută cazurile neobişnuite şi specifice.
Fiecare din aceste procese pot fi clasificate la rândul lor după regulile If/Then, asocieri etc. În
timp ce IF/THEN presupune: Dacă – condiţie, atunci regula 1, astfel regula 2, regulile de asociere se
referă la gruparea articolelor (de ex. când cineva cumpără un produs la magazin, el poate cumpăra alt
produs în acelaşi timp – un proces numit de obicei analiza coşului de cumpărături).
b) Din punct de vedere al tehnicilor utilizate de data mining (figura 6.7.) identificăm:
Depozit de date
Vecinul
Baza de date 1 imediat
Date retinute Argumentare
pe cazuri
Inductie
Reguli Algoritmi
Baza de date 2 Data genetici
Mining
Logic Arbori de CART
. decizie CHAID
. C4.5 etc.
. Agenti
Tabelare
Date distilate incrucisata
Retele de
Baza de date n incredere
Ecuational Statistici
Propagare
Retele
inversa
neurale
Kohonen
Figura 6.7. Tehnologiile data mining
CURSUL 13 - continuare
Tehnologii informatice inteligente de accesare
multidimensională a bazelor şi depozitelor de date de
marketing
Autor: Gheorghe Orzan
Abstract: În mod tradiţional, una dintre cele mai importante şi mai frecvente activităţi
ale unui departament de marketing constă în gestionarea unor volume mari de
date acumulate dea lungul timpului, de consultare a variate baze de date
cantitative, de grafică sau multimedia in stare offline sau online, orientate spre
piaţă (marketoriented), date care provin din cercetările de marketing, de la
alte organizaţii şi care impun operativ consultarea interactivă şi de o manieră
flexibilă şi consistentă prin operaţii de integrare, sintetizare şi agregare, de
reorganizare şi stocare, de gestionare şi procesare în raport de obiectivele de
marketing. Acestea se constituie în surse de informaţii esenţiale în procesul de
fundamentare a deciziilor, atât la nivelul activităţilor de marketing, cât şi în
ansamblul organizaţiei. Tehnicile moderne din domeniul IT&C fac însă
posibilă o analiză mult mai rapidă şi mai eficientă a acestor date, practic în
timp real, în ciuda eventualelor distribuţii geografice. Această lucrare îşi
propune prezentare unor situaţii teoretice şi practice în care tehnici de tip
OLAP sau data mining eficientizează activitatea profesioniştilor în domeniul
marketingului.
Cuvinte cheie: asistarea deciziilor, strategii de marketing, data warehouse, sisteme
asistarea deciziilor, OLTP, OLAP, data mining.
A. Depozitele de date (data warehause) reprezintă un produs al mediului
economic tot mai competitiv, global, dinamic şi complex în care organizaţia îşi
desfăsoară activitatea şi care solicită informaţii relevante, actuale, de o manieră
consistentă şi foarte flexibilă în procesul de fundamentare a deciziilor de marketing iar,
pe de altă parte este rezultatul evoluţiilor spectaculoase în ceea ce priveşte tehnologiile
din domeniul IT&C.
Un depozit de date este o sumă de date consistentă din punct de vedere semantic
care serveşte la o implementare fizică a unui model de date ca suport pentru sprijinirea
deciziei şi stochează informaţii pe care o organizaţie le solicită în fundamentarea
decizilor strategice. Un data warehouse (Inmon, 1996) este „o colecţie de date orientată
pe subiecte, integrată, atemporală, istorică si persistentă, destinată spijinirii procesului
de fundamentare a deciziei manageriale”. În sinteză definitia prezentată mai sus exprimă
caracteristicile de bază ale depozitelor de date: orientarea pe subiecte majore (clienţi,
furnizori, concurenţi, producţie, vînzari), prin integrarea unor multiple surse eterogene
de informaţii (baze de date relaţionale, distribuite, baze de date multimedia şi de tip
hipermedia, fişiere şi inregistrări), sunt independente de timp şi au caracter de istoric
atribuit prin dimensiunile spaţiale şi temporale ale depozitului (prin consultarea
valorilor succesive ale variabilelor cercetate pentru a determina evoluţia în timp şi
spaţiu şi a estima tendinţele proceselor şi fenomenelor investigate), cât şi persistenţa
datelor (datele din depozit sunt permanente şi nu pot fi modificate, fiind deja istorie a
29
Revista de Marketing Online – Vol.1 Nr.2
evenimentului). In mod uzual depozitele de date implică numai două operaţii:
construirea sau încarcarea iniţială a datelor (integrarea datelor, filtrarea, curăţarea şi
consolidarea datelor) şi accesul la date printro colecţie de tehnologii inteligente de
asistare a procesului de fundamentare a deciziilor si care va permite specialiştilor
(manageri, analişti, consultanţi, executivi) acces rapid, consistent şi facil la informaţiile
din depozit.
O comparaţie între bazele de date şi depozitele de date pune în valoare rolul
depozitelor de date, ca model de organizare şi sursă suport de informaţii pentru
fundamentarea deciziei. Atît bazele de date cît şi depozitele de date sunt structuri logice
de organizare de date, exploatează tehnologii informatice de organizare şi gestiune de
date diferite şi înmagazinează mari cantităţi de date.
Diferenţele semnificative între cele două modele de organizare logică de date
pot fi structurate astfel:
· Bazele de date din sistemele informatice conţin date curente, detaliate, care
sunt actualizate şi interogate în aceleaşi perioade cu culegerea şi procesarea lor
şi fac obiectul sistemelor informatice de prelucrare a tranzacţiilor (TPS).
Depozitele de date sunt construite special ca sisteme suport de asistare a
deciziei şi au ca obiectiv regruparea şi consolidarea datelor, agregarea şi
sintetizarea lor, reorganizarea şi stocarea informaţiilor provenite din surse
diverse şi variate de date inclusiv date multimedia, hipermedia şi de localizare
spaţială şi fac obiectul sistemelor informatice inteligente – sisteme suport de
asistare a deciziei (DSS). Ele se aplică asupra unor volume foarte mari de date,
eterogene, constituite ca depozite de istoric/arhivă de date şi presupun calcule
complexe (analiză de tendinţă, corelaţii între evenimente, asociaţii intre
anumite fapte, secvenţe, tipare de comportament, modele de cunoaştere) ;
· Sistemele de gestiune a bazelor de date sunt adecvate aplicaţiilor curente de
gestiune şi servesc la crearea şi întreţinerea sistemelor de baze de date
tranzacţionale OLTP (OnLine Transaction Processing) şi au ca obiectiv
execuţia în timp real a tranzacţiilor zilnice (aprovizionare, vînzari, stocuri,
producţie, decontări, plăti, activităţi de marketing şi management,
contabilitate) cât şi a procedurilor de interogare (Query). Sistemele de gestiune
a depozitelor de date, pe de altă parte, servesc top managerii, managerii,
utilizatorii sau specialiştii în domeniul analizei şi fundamentării deciziei, fac
obiectul sistemelor informatice OLAP (OnLine Analytical Processing) şi
oferă tehnologii de agregare a datelor stocate în depozitele de date întro
abordare multidimensională, cu acces rapid la informaţiile necesare, întro
manieră consistentă, interactivă şi foarte flexibilă;
· Un sistem OLTP este centrat pe client (customer oriented) şi este utilizat
pentru procesarea tranzacţiilor şi interogărilor din bazele de date constituite
operaţional, baze care pot oferi răspunsuri la întrebări de tipul Cine?, Ce?,
Unde?, Când? prin analiza datelor de tip numeric sau statistic. Un sistem
OLAP este orientat spre piaţă (maket oriented) şi este utilizat de manageri,
analişti, specialişti prin instrumente FASMI (Fast Analysis Shared
Multidimensional Information) de analiza rapidă a informaţiei
multidimensionale distribuită în locaţii multiple şi accesibilă în acelaşi timp
unui număr mare de utilizatori pentru analize complexe prin agregare,
sintetizare, consolidare şi care permit construirea de scenarii, prin posibilitatea
de a răspunde la întrebări de tipul Ce ar fi dacă? pentru a descoperi corelaţii
30
Revista de Marketing Online – Vol.1 Nr.2
între evenimente, asociaţii între anumite fapte, secvenţe şi tipare de
comportament;
· Tehnologiile OLAP utilizează bazele de date multidimensionale, construite de
regulă din date de istoric sau date care provin de la diferite organizaţii ,
integrând informaţii din surse eterogene, de tipuri şi naturi diferite.
Tehnologiile OLTP utilizează baze de date relaţionale, care sunt
bidimensionale prin definiţie, fiind focalizate pe datele curente dintro
organizaţie sau departament fără a referi date istorice sau date din alte
organizaţii.
31
Revista de Marketing Online – Vol.1 Nr.2
· să fie bazate pe o arhitectură deschisă deoarece evoluţia tehnologiei informaţiei
poate aduce schimbări radicale în structura sistemului informatic care, însă, nu
trebuie să afecteze instrumentaţia utilizată pentru analiză.
O bază de date multidimensională utilizată de tehnologiile OLAP este formată
din două structuri:
· Structura datelor prin care se descriu structurile proprii ale bazelor de date
referite, cu câmpurile, atributele şi caracteristicile asociate;
· Structura metadatelor definită prin dimensiunile, structurile ierarhice ale
dimensiunilor, membrii şi multipli acestor structuri.
Dimensiunile OLAP sunt identificate în bazele de date tranzacţionale ca fiind
cîmpurile ce conţin caracteristicile unei tranzacţii, datele de identificare a tranzacţiei
respective şi care în cele mai multe cazuri sunt cheile externe utilizate în bazele
respective. Dimensiunile reprezintă parametrii în care sa desfăsurat o activitate, nu se
intersectează cu alte dimensiuni şi sunt de natură complet diferită (timp, spaţiu, produse,
furnizori, clienţi, resurse financiare, resurse materiale, resurse umane). Mulţimea
valorilor posibile pe care le poate lua dimensiunea respectivă poartă numele de membrii
dimensiunii. Prin regruparea valorilor se generează multipli de membrii, grupe de valori
ale dimensiunii respective cu o caracteristică comună. De exemplu se poate defini
localitatea ca multiplu de membrii formaţi din toţi clienţii organizaţiei din localitatea
respectivă. Dimensiunile şi multipli lor formează structuri arborescente cunoscute în
OLAP sub numele de ierarhii. Modelarea dimensională oferă un model conceptual,
cubul OLAP, care permite agregarea datelor întro structură ierarhică, simpla şi foarte
flexibilă, fără a modifica structura de bază a colecţiilor încorporate în depozit, cu
păstrarea legăturilor cu sursele iniţiale de date şi cu posibilitatea de descompunere a
datelor centralizate pe niveluri ierarhice inferioare pînă la setul de tranzacţii iniţiale.
Motorul OLAP foloseşte ca mod de vizualizare a datelor în depozitul de date, o
reprezentare întrun spaţiu n dimensional, prin care axele dau dimensiunea logică a
cubului.
Figura 1: Cubul de date
32
Revista de Marketing Online – Vol.1 Nr.2
Dacă luăm ca exemplu dimensiunile: Produsul, timpul regiunea (zona), cubul
măsurilor cantitative sau valorice ar avea reprezentarea din figura 1.
Asupra cuburilor n dimensionale motorul analitic execută o serie de operaţii
care se integrează în aplicaţii OLAP manevrate de utilizatorul final. Pentru execuţia
acestor operaţii este necesară „navigarea liberă” dea lungul nivelelor ierarhice definite
pentru depozitul de date.
Principalele operaţii OLAP care se pot efectua sunt:
· Specificarea criteriilor de selecţie este primul pas în orice analiză. Utilizatorul
trebuie să poată exprima cu uşurinţă criterii simple, bazate pe valori ale
atributelor şi/sau pe valori ale metricelor. Aceste criterii simple trebuie să poată
fi apoi combinate prin operatori logici şi trebuie să poată fi salvate în biblioteci
pentru eventuale reutilizări.
· Rotaţiile sunt operaţii care permit utilizatorilor să găsească perspectiva carel
interesează specificînd dimensiunile şi direcţiile de rotaţie sau indicând un pivot.
· Schimbarea nivelului de agregare permite găsirea nivelului de agregare optim
pentru analiză. Se poate adânci analiza spre nivele de detaliu prin operaţii de
schimbare a sensului de navigării dea lungul nivelelor unei ierarhii; prin drill
down se poate naviga pe nivelele cu un grad de detaliu mai mare, iar prin roll up
se va naviga pe nivelele ierarhice superioare ca nivel de agregare.
· Specificarea modului de prezentare trebuie să permită analistului să găsească
modalităţile optime de valorificare vizuală a datelor extrase. În afară de
posibilităţile grafice tipice pentru prezentare, este important ca utilizatorul să
poată vizualiza date multidimensionale întro manieră tabelară. În acest sens se
pot utiliza tabele complexe, care să poată grupa coloane şi linii exprimând
dimensiuni diferite (de pildă timpul şi dispunerea în spaţiu) şi nivele de agregare
diferite.Perspectiva multidimensională asupra datelor se face prin operaţii care
permit obţinerea de vederi (view) bidimensionale dintrun cub n dimensional,
care se mai numesc sliceuri, felii de informaţii care servesc unor anumite
scopuri si decizii manageriale.
REGIUNEA
PRODUS
TIMP
Figura 2: Slice pentru viziunea managerului de produs
De exemplu viziunea managerului de produs interesează doar vânzările anumitor
produse, în toată regiunea şi în toată perioada de timp considerată
33
Revista de Marketing Online – Vol.1 Nr.2
Alte tipuri de sliceuri pot felia cubul pe toate cele trei coordonate carteziene aşa
cum se poate vedea în figura de mai jos.
Figura 3: Alte tipuri de sliceuri
Pentru prezentarea convenabilă a rezultatelor se fac racordări ale vederilor
bidimensionale cu baza de date multidimensională, prin mapări de date, coroborate cu
utilizări de grafice şi tabele complexe
Fiind o tehnologie relativ nouă, modelul de arhitectură OLAP (figura 4) care sa
impus pentru sistemele orientate spre analiză multidimensională este unul de tip
client/server în trei straturi.
Sisteme informatice
Motor Aplicatii
Data OLAP
Warehouse OLAP
OPERATIONALE
Metadate
Figura 4:. Arhitectura unui sistem OLAP
a) Data Warehouse formează nivelul cel mai de jos, responsabil cu stocarea şi
regăsirea datelor. De regulă aplicaţiile tranzacţionale utilizează sisteme relaţionale dar
pentru depozitele de date se folosesc sisteme multidimensionale. Dat fiind volumul
mare de date, este recomandabil ca SGBDurile folosite să ofere suport pentru prelucrări
paralele şi distribuite, să dispună de mecanisme performante de indexare şi de
optimizare, să ofere un înalt nivel de siguranţă;
b) Motorul analitic OLAP (OLAP engine) are sarcina de a prelua cererile
exprimate de utilizatori şi, pe baza consultării metadatelor, să genereze cererile necesare
pentru obţinerea datelor ce vor fi redirectate către clienţi. În plus, datelor obţinute li se
vor aplica la acest nivel o serie de prelucrări de generarea de interogări, manipulări de
date şi de sintetizarea rezultatelor;
34
Revista de Marketing Online – Vol.1 Nr.2
c) Metadatele – în care sunt stocate dimensiunile, membrii şi multipli lor, precum
şi structurile ierarhice ale dimensiunilor, informaţii care apar pe axele cuburilor şi sunt
prezentate utilizatorului ca nume de rînduri sau de coloane (pivot table);
d) Aplicaţiile OLAP sunt reprezentate de instrumente mânuite de utilizatorul final.
Există aplicaţii generale care răspund suficient de bine nevoilor unei categorii largi de
utilizatori, există instrumente specializate pe domenii (cum ar fi de pildă analize
regresionale, analize ANOVA, analize SWOT, analiza financiară) şi, în fine, există
posibilitatea de a dezvolta instrumente foarte specifice.
Din punct de vedere al utilizatorului final, aplicaţia pe care o foloseşte trebuie săi
asigure două funcţionalităţi importante: navigarea liberă prin depozitul de date în
căutarea informaţiilor relevante şi posibilităţi diverse de prezentare a datelor. Aceste
funcţionalităţi sunt strâns legate între ele şi este greu de spus care operaţie este de
navigare şi care este de prezentare.
Cerinţele de administrare şi dezvoltare pentru OLAP, deşi similare cu cele pentru
instrumentele de interogare şi raportare, sunt în general mult mai complexe. Punerea în
funcţiune a unui sistem OLAP şi a softului de acces la date necesită o înţelegere clară a
modelului de date al întreprinderii şi a funcţiilor analitice cerute de conducerea
executivă şi strategică. Produsele comerciale pot fi de mare folos, dar rareori există
soluţii ,,la cheie” pentru OLAP; arhitectura trebuie reglată astfel încât să suporte sursele
de date folosite şi să facă faţă cerinţelor. În schimb, odată ce sistemul OLAP este
funcţional, suportul tehnic pentru utilizator este minimal.
C. Tehnologiile Data mining (mineritul în date) reprezintă, întro accepţiune
simplă, un mod automat de detectare întro bază de date a unor tipare relevante. Data
mining utilizează o serie de tehnici statistice şi de inteligenţă artificială ce dau
posibilitatea construirii de modele ce pot previziona comportamentul clienţilor.
Tehnologia îşi sporeşte calităţile prin integrare cu depozitele de date comerciale şi cu
noile modalităţi de prezentare şi raportare.
Data mining îşi datoreşte numele similarităţii dintre căutarea de informaţii
valoroase întro bază de date mare şi săparea unor galerii în munte pentru detectarea
unor zăcăminte valoroase.
Data mining este un proces de descoperire a cunoştinţelor (Knowledge discovery
KD), de extragere a informaţiei necunoscută anterior din baze de date foarte mari.
Procesul descoperirii de corelaţii semnificative, modele şi tendinţe se asigură
prin explorarea unor mari cantităţi de date stocate în depozite de date, utilizând
tehnologii de recunoaştere a modelelor, precum şi tehnici statistice şi matematice.
Conform unui raport din 1997 al Grupului Gartner: ,,Data mining şi inteligenţa
artificială se află între primele cinci tehnologii cheie care vor avea în mod sigur un
impact major asupra unui mare număr de industrii în următorii ani”. Gartner situează
data mining între primele 10 tehnologii în care firmele vor investi în următorii 5 ani.
Studiile arată că în ultima perioadă sa înregistrat o explozie dramatică a nivelului
de interes privind data mining, în condiţiile în care utilizatorii au dorit să profite
dinstrumentele oferite de această tehnologie pentru a obţine un avantaj competitiv
inteligent în plan concurenţial.
Anumite produse software de vârf în domeniul data mining, provenite de la
companii ca SAS sau IBM, reprezintă acum mai mult decât simple motoare de modelare
bazate pe algoritmi complecşi. Acestea se adresează unei categorii mai largi de
35
Revista de Marketing Online – Vol.1 Nr.2
probleme tehnice şi economice şi se integrează în mediile actuale de tehnologie
informaţională.
Deşi se credea că data miningul va elimina nevoia de specialişti în crearea de
modele statistice, lipsa experienţei umane şi a intuiţiei între nişte corelaţii relevante şi
unele nerelevante, lipsă ce caracterizează softurile, infirmă această previziune.
Tradiţional sunt avute în vedere mai multe tipuri de analize statistice: analize
predictive, analize descriptive, analize confirmatorii şi analize exploratorii. Un
exemplu tipic de analize predictive şi descriptive sunt cele specifice acţiunilor şi
fenomenelor de marketing. În cazul analizelor confirmatorii, având o ipoteză formulată
aceasta se acceptă sau se respinge. În analizele exploratorii, se urmăreşte găsirea de
ipoteze, care apoi se acceptă sau se resping. În acest punct sistemul preia ,,iniţiativa” în
procesul analizei datelor sistemul gândeşte singur ipotezele acestea nefiind formulate de
utilizator. În prezent termenul de data mining se referă la procesul automat de analiză a
datelor în care sistemul preia iniţiativa de a genera modele.
Din punct de vedere al procesului există trei clase de activităţi data mining:
descoperire, modelare predictivă şi analiza excepţiilor (figura 5).
· Descoperirea este procesul de căutare în baza de date pentru a găsi modele,
fără a avea o idee predeterminată sau ipoteza asupra ceea ce pot fi modele.
Cu alte cuvinte programul preia iniţiativa în găsirea a ceea ce sunt modelele
interesante, fără a fi necesar ca utilizatorul să se gândească la întrebările
relevante în prealabil. În marile baze de date există atât de multe modele
încât utilizatorul nu ar putea niciodată practic să se gândească la toate
întrebările care ar trebui puse. Problema cheie în acest caz constă în bogăţia
de modele care pot fi găsite şi exprimate, precum şi în calitatea informaţiei
livrate – elemente care determină puterea şi utilitatea tehnicii de descoperire.
· Modelare predictivă modelele descoperite din baza de date sunt folosite
pentru a face previziuni. Modelarea predictivă permite astfel utilizatorului să
prelucreze înregistrări ce au câmpuri valorice necunoscute, iar sistemul va
intui valorile necunoscute pe baza unor modele anterioare din baza de date.
· Analiza excepţiilor reprezintă procesul prin care se aplică modelele extrase
pentru a găsi anomalii sau elemente de date neobişnuite. Pentru a descoperi
anomaliile, mai întâi aflăm ceea ce e normal, apoi detectăm acele articole
care deviază de la normă în cadrul unui interval dat. De exemplu odată ce am
observat că 90% dintre cumpărători au sub 50 de ani, ne putem înteba în
legătură cu cei 10% cumpărători care au peste 50 de ani şi sunt în baza de
date. Se observă că descoperirea ne poate ajuta să găsim ,,cunoştinţe uzuale”,
vreme în care analiza excepţiilor caută cazurile neobişnuite şi specifice.
36
Revista de Marketing Online – Vol.1 Nr.2
Depozit de date
Conditionare
logica
Baza de date 1
Afinitati si
Descoperire
Asocieri
Tendinte si
Variatii
Baza de date 2 Previzionarea
Modelare rezultatului
Data Mining
predictiva
. Previziuni
.
. Detectarea
Analiza deviatiilor
exceptiilor
Analize ale
Baza de date n legaturilor
Figura 5: Clase de activităţi Data mining
Fiecare din aceste procese pot fi clasificate la rândul lor după regulile If/Then,
asocieri etc. În timp ce IF/THEN presupune: Dacă – condiţie, atunci regula 1, astfel
regula 2, regulile de asociere se referă la gruparea articolelor (de ex. când cineva
cumpără un produs la magazin, el poate cumpăra alt produs în acelaşi timp – un proces
numit de obicei analiza coşului de cumpărături).
Din punct de vedere al tehnicilor utilizate de data mining (figura 6) identificăm:
· Reţelele artificiale neurale – modele de previzionare nonliniare care sunt
capabile de acumulare de cunoştinţe prin antrenament;
· Algoritmi genetici – tehnici de optimizare ce se bazează pe procese cum ar fi
combinaţii genetice, mutaţii şi selecţie naturală. Sunt utilizate în modele ce
folosesc concepte de evoluţie naturală;
· Arbori de decizie – structuri pe trei nivele ce reprezintă seturi de decizii.
Aceste decizii generează reguli de clasificare a seturilor de date. Printre
modelele bazate pe arborii de decizie se include Arborii de regresie şi
clasificare (CART) şi Detectarea automată a interacţiunilor de tip c 2
(CHAID);
· Metoda celui mai apropiat vecin – o tehnică ce permite clasificarea fiecărei
înregistrări din baza de date a k clase de înregistrări, cele mai similare;
· Inducţia unor reguli – extragerea unor reguli utile de tip dacăatunci pe baza
semnificaţiei statistice;
· Vizualizarea datelor – interpretarea vizuală a relaţiilor complexe pentru date
multidimensionale.
Cea mai importantă dihotomizare a tehnologiilor data mining se referă la păstrarea
datelor; adică, se mai păstrează sau mai este nevoie de date odată ce au fost minerite. În
abordările iniţiale mare parte din seturile de date se păstrau pentru viitoare analize. În
mod evident, o astfel de tehnică se poate aplica numai în cazul sarcinilor de tip
modelare predictivă şi analiză a excepţiilor, nefiind necesară în cazul descoperirii de
cunoştinţe întrucât nu mai sunt alte modele de distilat.
37
Revista de Marketing Online – Vol.1 Nr.2
Depozit de date
Vecinul
Baza de date 1 imediat
Date retinute Argumentare
pe cazuri
Inductie
Reguli Algoritmi
Baza de date 2 Data genetici
Mining
Logic Arbori de CART
. decizie CHAID
. C4.5 etc.
. Agenti
Tabelare
Date distilate incrucisata
Retele de
Baza de date n incredere
Ecuational Statistici
Propagare
Retele
inversa
neurale
Kohonen
Figura 6: Tehnologiile data mining
Aşa cum uşor se poate bănui, abordările bazate pe păstrarea datelor pot avea uşor
probleme din cauza dimensiunilor foarte mari ale unor astfel de seturi de date.
În timp ce în cazul distilării de modele se analizează datele, se extrag modelele,
iar apoi se renunţă la date, în abordările bazate pe păstrare, datele sunt reţinute pentru
analogiile de modele. Atunci când noi seturi de date sunt avute în vedere, atunci aceste
seturi sunt comparate cu seturi anterioare de date.
Un exemplu cunoscut al abordării bazate pe reţinerea datelor este metoda
,,vecinului imediat”. În acest caz setul de date este păstrat (de obicei în memorie) pentru
comparaţii cu noi înregistrări. Când o nouă înregistrare este supusă analizei, este găsită
,,distanţa” dintre acestea şi înregistrările similare din setul de date şi ,,cele mai similare”
(sau vecinii cei mai apropiaţi) sunt identificaţi.
Tehnologiile bazate pe distilarea modelelor extrag modelele dintrun set de date,
apoi folosesc aceste modele pentru diverse scopuri. În mod evident, este necesar ca
aceste modele să fie exprimate întro anumită formă şi limbaj. Această opţiune a dat
naştere la trei abordări distincte: logică, ecuaţii şi tabelare încrucişată. Fiecare dintre
aceste abordări îşi are originile istorice în anumite secţiuni ale matematicii.
· Logica formează baza celor mai multe limbaje scrise. Modelele exprimate
în limbaje logice se disting prin două principale caracteristici: pe de o parte
sunt citibile şi inteligibile, iar pe de altă parte sunt excelente pentru
reprezentarea grupurilor de elemente de date. Sistemele logice condiţionate
pot fi separate în două grupuri disticte: reguli şi arbori de decizie. Regulile
condiţionale pot fi implementate prin inducţie sau algoritmi genetici.
Există mai multe abordări şi pentru generarea arborilor de decizie (de ex.,
CART, CHAID, C4.5).
· Tabelarea încrucişată este o formă simplă de analiză a datelor, bine
cunoscută în statistică, şi folosită pe larg în rapoarte. Un tabel încrucişat
bidimensional este similar unei foi de calcul, cu capetele, atât de rânduri
cât şi de coloană, fiind valori ale atributelor. Celulele din foaia de calcul
reprezintă o operaţie agregată, de obicei numărul de coapariţii ale
38
Revista de Marketing Online – Vol.1 Nr.2
valorilor atributelor. Multe tabele încrucişate sunt efectiv echivalente cu un
grafic tridimensional care înfăţişază o numărătoare a coapariţiilor.
Termenul de ,,agent” este folosit uneori pentru a desemna tabelele
încrucişate care sunt reprezentate grafic întro reţea şi permit folosirea unor
conjuncţii AND, OR etc. Reţelele de încredere, uneori numite reţele
cauzale , sunt un graf direcţionat, constituit din noduri (variabilele
reprezentate) şi legături între noduri (coeficienţi probabilistici de
încredere).
· Abordările ecuaţionale folosesc de obicei un set de ecuaţii pentru a defini
,,o suprafaţă” (reprezentare grafică a unei funcţii de orice grad) în cadrul
unui spaţiu iar apoi măsurarea distanţelor de la această suprafaţă pentru a
face estimări.
O problemă a tehnicilor data mining a reprezentato necesitatea păstrării
sau nu a datelor obţinute din minerit. Au apărut tehnologii cu păstrarea datelor
şi tehnologii fără păstrarea datelor. Păstrarea datelor se poate aplica numai în
cazul sarcinilor de tip modelare predictivă şi analiză a excepţiilor, nefiind
necesară în cazul descoperirii de cunoştinţe întrucât nu mai sunt alte modele de
distilat.
În timp ce în cazul distilării de modele se analizează datele, se extrag
modelele, iar apoi se renunţă la date, în abordările bazate pe păstrare, datele sunt
reţinute pentru analogiile de modele. Atunci când noi seturi de date sunt avute în
vedere, atunci aceste seturi sunt comparate cu seturi anterioare de date.
Rezultatele obţinute prin data mining trebuie să fie operaţionale şi să
poată fi aplicate pentru obţinerea unui anumit avantaj, fapt dependent în mare
măsură şi de abilităţile decidentului. Data Mining şi OLAP sunt instrumente ale
afacerilor inteligente bazate pe tehnologia IT&C.
Cererile OLAP se adresează unei baze de date existente generând ipoteze
şi relaţii, OLAP fiind în esenţă un proces deductiv. Data mining utilizează
datele pentru a descoperi modele printrun mecanism predictiv.
In concluzie tehnologia OLAP şi tehnologia Data Mining se completează
reciproc contribuind la utilizarea eficientă a depozitelor de date.
Literatura de specialitate prezintă numeroase şi variate situaţii care
impun utilizarea depozitelor de date şi a tehnicilor moderne de accesare:
insuficienta partajarea a resurselor,, grupuri distincte de manageri produc
rapoarte contradictorii, procesul de creare a rapoartelor este foarte anevoios,
rapoartele nu sunt dinamice şi nu favorizează stilul de interogarea online,
rapoarte care necesită date de istoric sunt dificil de realizat, nivelul de pregătire
şi de întelegere a personalului de decizie, a analistului sau specialistului lasă de
dorit..
Instrumentele data mining vor continua să se maturizeze şi din ce în ce
mai multe organizaţii vor adopta acest gen de tehnologie , incorporat în
instrumente software din ce în ce mai performante. Iniţiativele data mining
provin cel mai adesea din zona departamentelor de marketing şi vînzări care
deţin baze de date cu volume foarte mari, sunt generate cu instrumente software
care acentuează şi garantează calitatea datelor din depozitele de date iar
evoluţiile din ultima perioadă impun analize detaliate, analitice, pe perioade de
timp, pe zone şi segmente diferite pentru a oferi răspunsuri operative şi eficace
39
Revista de Marketing Online – Vol.1 Nr.2
pe o piaţă globalizată şi pentru un client individualizat şi personalizat.
Tehnologiile date warehouse , OLAP, data mining sunt influenţate
semnificativ de popularitatea soluţiilor inteligente bazate pe Internet şi Intranet,
suportă facilitătile oferite de aplicaţiile WEB, prin hypertext, hyperlink şi
hypermedia, iar unele organizaţii deja folosesc aceste instrumente pentru
prelucrarea pe Internet a informaţiilor din depozitele proprii de date distribuite
sau pun aceste informaţii la dispoziţia partenerilor strategici ai organizaţiei
Bibliografie:
Andone, I. Tugui, A., s.a. (2001) Dezvoltarea sistemelor inteligente în
economie, Ed. Economică, Bucureşti, 2001;
Cătoiu, I. (coordonator) (2002) Cercetări de Marketing, Ed. Uranus, Bucureşti, ;
Cipolla, E. T. (1995) „Data Mining: Techniques to Gain Insight Into Your Data”,
Enterprise Systems Journal, Decembrie 1995;
Harmon, P. şi King, D. (1985) Expert Systems: Artificial in Business, John Wiley
& Sons, New York.
Inmon, W.H. (1996) Buiding the Data Warehouse, John Wiley & Sons, New
York.
Orzan G.(2001), Sisteme informatice de marketing, Ed. Uranus, Bucureşti;
Turban, E., Jay Aronson J. (2001)– Decision Support Systems and Intelligent
Systems, Ed. Prentince Hall, New Jersey, USA;
Zaharie, D., Albescu, F., ş.a (2001) – Sisteme informatice pentru asistarea
deciziei, Ed. DuAl Tech Bucureşti, 2001,
Wallinger, J. (1997) Database Marketing Guide, Ed. Dryden Press, New York.
40
CURSUL 13
Ciclul de viaţă al unui depozit de date este compus dintr-o serie de etape, şi anume crearea,
actualizarea, exploatarea şi în final dezvoltarea depozitului.
2
depozitului de date. Datele sintetice se obţin şi se introduc în depozit prin intermediul interogărilor
de tip „Crosstab Query” sau „Pivot-Table Query”.
Actualizarea depozitului de date este o acţiune complexă care se execută la intervale
regulate de timp şi care adaugă noi fapte în tabelele depozitului. Acest lucru se traduce prin rularea
aceloraşi interogări de tip „Append Query”.
Exploatarea depozitului de date vizează procesul de valorificare datelor din depozitul de
date şi îmbracă diverse forme concrete în funcţie de instrumentele software folosite, şi care pot fi
de la pachete software pentru generarea şi prezentarea de rapoarte până la analiză
multidimensională cu pachete OLAP şi tehnici Data Mining.
3
Figura 3: Cubul de date
Analizorul OLAP foloseşte ca mod de vizualizare a datelor in depozitul, o reprezentare
intr- un spaţiu n – dimensional, cunoscută sub denumirea de CUBUL n – dimensional. Axele care
dau dimensiunea logică a cubului sunt tocmai dimensiunile depozitului de date.
Dacă luăm ca exemplu dimensiunile PRODUS, TIMP, ZONA, cubul măsurilor cantitative
sau valorice ar avea reprezentarea din figura 4.
Asupra cuburilor n-dimensionale motorul analitic execută o serie de operaţii care se
integrează în aplicaţii OLAP manevrate de utilizatorul final. Pentru execuţia acestor operaţii este
necesară „navigarea liberă” de-a lungul nivelelor ierarhice definite pentru depozitul de date.
Operaţiile OLAP cuprind:
- specificarea criteriilor de selecţie, pe baza atributelor şi/sau pe baza valorilor
metricilor care să poată fi combinate prin operatori logici şi relaţionali;
- rotaţiile, sunt operaţii care permit utilizatorului să găsească perspectiva care- l
interesează specificând dimensiunile şi direcţiile de rotaţie sau indicând un pivot;
- drill down şi roll up , sunt operaţii de schimbare a sensului de navigării de-a lungul
nivelelor unei ierarhii; prin drill down se poate naviga pe nivelele cu un grad de detaliu
mai mare, iar prin roll up se va naviga pe nivelele ierarhice superioare ca nivel de
agregare.
- secţiuni, operaţii care permit obţinerea de vederi (view) bidimensionale dintr- un cub n-
dimensional, care se mai numesc „slice” – uri, felii de informaţii care servesc unor
anumite scopuri manageriale,
REGIUNEA
PRODUS
TIMP
Figura 4: Slice pentru viziunea managerului de produs
4
De exemplu viziunea managerului de produs interesează doar vânzările anumitor produse,
în toată regiunea şi în toată perioada de timp considerată
Alte tipuri de „slice - uri” pot felia cubul pe toate cele trei coordonate carteziene ş cum se
poate vedea în figura de mai jos.
Data Mining
Mineritul de date, cum se traduce acest termen reprezintă, într-o accepţie simplă, un mod
automat de detectare într-o bază de date a unor tipare relevante. Data mining utilizează o serie de
tehnici statistice şi de inteligenţă artificială ce dau posibilitatea construirii de modele ce pot
previziona comportamentul clienţilor. Tehnologia îşi sporeşte calităţile prin integrare cu depozitele
de date comerciale şi cu noile modalităţi de prezentare şi raportare.
Data mining este un proces de descoperire a cunoştinţelor, de extragere a informaţiei
necunoscută anterior din baze de date foarte mari. Procesul descoperirii de corelaţii semnificative,
modele şi tendinţe se asigură prin explorarea unor mari cantităţi de date stocate în depozite de date,
utilizând tehnologii de recunoaştere a modelelor, precum şi tehnici statistice şi matematice.
Tradiţional sunt avute în vedere două tipuri de analize statistice: analize confirmatorii şi
analize exploratorii. În cazul analizelor confirmatorii, având o ipoteză formulată aceasta se
acceptă sau se respinge. În analizele exploratorii, se urmăreşte găsirea de ipoteze, care apoi se
acceptă sau se resping. În acest punct, sistemul preia „iniţiativa” în procesul analizei datelor şi
generării de modele. Sistemul gândeşte singur ipotezele, acestea ne mai fiind formulate de
utilizator.
Din punctul de vedere al procesului de descoperire al cunoştinţelor există trei clase de
activităţi de data mining: descoperire, modelare predictivă şi analiza excepţiilor.
Descoperirea este procesul de căutare în baza de date pentru a găsi modele, fără a avea o
idee predeterminată sau ipoteze asupra ceea ce pot fi modele. Programul preia iniţiativa în găsirea
a ceea ce sunt modele interesante, fără a fi necesar ca utilizatorul să formuleze întrebări relevante
sau ipoteze prealabile.
5
Modelarea predictivă presupune că modelele descoperite din baza de date să fie folosite
pentru a face previziuni. Modelarea predictivă permite astfel utilizatorului să prelucreze înregistrări
ce au câmpuri valorice necunoscute, iar sistemul va intui valorile necunoscute pe baza unor modele
din baza de date.
Analiza excepţiilor reprezintă procesul prin care se aplică modelele extrase pentru a găsi
anomalii sau elemente de date neobişnuite. Pentru a descoperi anomaliile, mai întâi aflăm ceea ce e
normal, apoi detectăm acele articole care deviază de la normă în cadrul unui interval dat. De
exemplu odată ce am observat că 90 % dintre cumpărători au sub 50 de ani, ne putem întreba în
legătură cu cei 10 % cumpărători care au peste 50 de ani şi sunt în baza de date. Se observă că
descoperirea ne poate ajuta să găsim „cunoştinţe uzuale”, vreme în care analiza excepţiilor caută
cazurile neobişnuite şi specifice.
Din punctul de vedere al tehnicilor de data mining se operează cu următoarele tipuri de
tehnologii de data mining: reţele neuronale, algoritmi genetici, arbori de decizie, metoda celui mai
apropiat vecin, inducţia unor reguli.
Reţelele neuronale, reprezintă modele de previzionare non lineare care sunt capabile de acumulare
de cunoştinţe prin antrenament.
Algoritmi genetici, sunt tehnici de optimizare ce se bazează pe procese cum ar fi combinaţii
genetice, mutaţii şi selecţie naturală. Sunt utilizate în modele ce folosesc concepte
de evoluţie naturală.
Arbori de decizie sunt structuri pe trei nivele ce reprezintă seturi de decizii. Acestei decizii
generează reguli de clasificare a seturilor de date. Printre modelele bazate pe arbori
de decizie se includ arborii de regresie şi clasificare – CART, şi detectarea
2
interacţiunilor de tip χ - CHAID.
Metoda celui mai apropiat vecin , o tehnică ce permite clasificarea fiecărei înregistrări din baza
de date utilizând k clase de înregistrări similare.
Inducţia unor reguli extrage anumite reguli utile de tip dacă – atunci pe baza semnificaţiei
statistice.
6
Cererile OLAP se adresează unei baze de date existente generând ipoteze şi relaţii, OLAP fiind în
esenţă un proces deductiv. Data mining îi utilizează datele pentru a descoperi modele printr-un
mecanism predictiv.
In concluzie tehnologia OLAP şi tehnologia Data Mining se completează reciproc
contribuind la utilizarea eficientă a depozitelor de date.
7
Revista de Marketing Online – Vol.1 Nr.2
Autor: Gheorghe Orzan
Abstract: În mod tradiţional, una dintre cele mai importante şi mai frecvente activităţi
ale unui departament de marketing constă în gestionarea unor volume mari de
date acumulate dea lungul timpului, de consultare a variate baze de date
cantitative, de grafică sau multimedia in stare offline sau online, orientate spre
piaţă (marketoriented), date care provin din cercetările de marketing, de la
alte organizaţii şi care impun operativ consultarea interactivă şi de o manieră
flexibilă şi consistentă prin operaţii de integrare, sintetizare şi agregare, de
reorganizare şi stocare, de gestionare şi procesare în raport de obiectivele de
marketing. Acestea se constituie în surse de informaţii esenţiale în procesul de
fundamentare a deciziilor, atât la nivelul activităţilor de marketing, cât şi în
ansamblul organizaţiei. Tehnicile moderne din domeniul IT&C fac însă
posibilă o analiză mult mai rapidă şi mai eficientă a acestor date, practic în
timp real, în ciuda eventualelor distribuţii geografice. Această lucrare îşi
propune prezentare unor situaţii teoretice şi practice în care tehnici de tip
OLAP sau data mining eficientizează activitatea profesioniştilor în domeniul
marketingului.
Cuvinte cheie: asistarea deciziilor, strategii de marketing, data warehouse, sisteme
asistarea deciziilor, OLTP, OLAP, data mining.
A. Depozitele de date (data warehause) reprezintă un produs al mediului
economic tot mai competitiv, global, dinamic şi complex în care organizaţia îşi
desfăsoară activitatea şi care solicită informaţii relevante, actuale, de o manieră
consistentă şi foarte flexibilă în procesul de fundamentare a deciziilor de marketing iar,
pe de altă parte este rezultatul evoluţiilor spectaculoase în ceea ce priveşte tehnologiile
din domeniul IT&C.
Un depozit de date este o sumă de date consistentă din punct de vedere semantic
care serveşte la o implementare fizică a unui model de date ca suport pentru sprijinirea
deciziei şi stochează informaţii pe care o organizaţie le solicită în fundamentarea
decizilor strategice. Un data warehouse (Inmon, 1996) este „o colecţie de date orientată
pe subiecte, integrată, atemporală, istorică si persistentă, destinată spijinirii procesului
de fundamentare a deciziei manageriale”. În sinteză definitia prezentată mai sus exprimă
caracteristicile de bază ale depozitelor de date: orientarea pe subiecte majore (clienţi,
furnizori, concurenţi, producţie, vînzari), prin integrarea unor multiple surse eterogene
de informaţii (baze de date relaţionale, distribuite, baze de date multimedia şi de tip
hipermedia, fişiere şi inregistrări), sunt independente de timp şi au caracter de istoric
atribuit prin dimensiunile spaţiale şi temporale ale depozitului (prin consultarea
valorilor succesive ale variabilelor cercetate pentru a determina evoluţia în timp şi
spaţiu şi a estima tendinţele proceselor şi fenomenelor investigate), cât şi persistenţa
datelor (datele din depozit sunt permanente şi nu pot fi modificate, fiind deja istorie a
29
Revista de Marketing Online – Vol.1 Nr.2
evenimentului). In mod uzual depozitele de date implică numai două operaţii:
construirea sau încarcarea iniţială a datelor (integrarea datelor, filtrarea, curăţarea şi
consolidarea datelor) şi accesul la date printro colecţie de tehnologii inteligente de
asistare a procesului de fundamentare a deciziilor si care va permite specialiştilor
(manageri, analişti, consultanţi, executivi) acces rapid, consistent şi facil la informaţiile
din depozit.
O comparaţie între bazele de date şi depozitele de date pune în valoare rolul
depozitelor de date, ca model de organizare şi sursă suport de informaţii pentru
fundamentarea deciziei. Atît bazele de date cît şi depozitele de date sunt structuri logice
de organizare de date, exploatează tehnologii informatice de organizare şi gestiune de
date diferite şi înmagazinează mari cantităţi de date.
Diferenţele semnificative între cele două modele de organizare logică de date
pot fi structurate astfel:
· Bazele de date din sistemele informatice conţin date curente, detaliate, care
sunt actualizate şi interogate în aceleaşi perioade cu culegerea şi procesarea lor
şi fac obiectul sistemelor informatice de prelucrare a tranzacţiilor (TPS).
Depozitele de date sunt construite special ca sisteme suport de asistare a
deciziei şi au ca obiectiv regruparea şi consolidarea datelor, agregarea şi
sintetizarea lor, reorganizarea şi stocarea informaţiilor provenite din surse
diverse şi variate de date inclusiv date multimedia, hipermedia şi de localizare
spaţială şi fac obiectul sistemelor informatice inteligente – sisteme suport de
asistare a deciziei (DSS). Ele se aplică asupra unor volume foarte mari de date,
eterogene, constituite ca depozite de istoric/arhivă de date şi presupun calcule
complexe (analiză de tendinţă, corelaţii între evenimente, asociaţii intre
anumite fapte, secvenţe, tipare de comportament, modele de cunoaştere) ;
· Sistemele de gestiune a bazelor de date sunt adecvate aplicaţiilor curente de
gestiune şi servesc la crearea şi întreţinerea sistemelor de baze de date
tranzacţionale OLTP (OnLine Transaction Processing) şi au ca obiectiv
execuţia în timp real a tranzacţiilor zilnice (aprovizionare, vînzari, stocuri,
producţie, decontări, plăti, activităţi de marketing şi management,
contabilitate) cât şi a procedurilor de interogare (Query). Sistemele de gestiune
a depozitelor de date, pe de altă parte, servesc top managerii, managerii,
utilizatorii sau specialiştii în domeniul analizei şi fundamentării deciziei, fac
obiectul sistemelor informatice OLAP (OnLine Analytical Processing) şi
oferă tehnologii de agregare a datelor stocate în depozitele de date întro
abordare multidimensională, cu acces rapid la informaţiile necesare, întro
manieră consistentă, interactivă şi foarte flexibilă;
· Un sistem OLTP este centrat pe client (customer oriented) şi este utilizat
pentru procesarea tranzacţiilor şi interogărilor din bazele de date constituite
operaţional, baze care pot oferi răspunsuri la întrebări de tipul Cine?, Ce?,
Unde?, Când? prin analiza datelor de tip numeric sau statistic. Un sistem
OLAP este orientat spre piaţă (maket oriented) şi este utilizat de manageri,
analişti, specialişti prin instrumente FASMI (Fast Analysis Shared
Multidimensional Information) de analiza rapidă a informaţiei
multidimensionale distribuită în locaţii multiple şi accesibilă în acelaşi timp
unui număr mare de utilizatori pentru analize complexe prin agregare,
sintetizare, consolidare şi care permit construirea de scenarii, prin posibilitatea
de a răspunde la întrebări de tipul Ce ar fi dacă? pentru a descoperi corelaţii
30
Revista de Marketing Online – Vol.1 Nr.2
între evenimente, asociaţii între anumite fapte, secvenţe şi tipare de
comportament;
· Tehnologiile OLAP utilizează bazele de date multidimensionale, construite de
regulă din date de istoric sau date care provin de la diferite organizaţii ,
integrând informaţii din surse eterogene, de tipuri şi naturi diferite.
Tehnologiile OLTP utilizează baze de date relaţionale, care sunt
bidimensionale prin definiţie, fiind focalizate pe datele curente dintro
organizaţie sau departament fără a referi date istorice sau date din alte
organizaţii.
31
Revista de Marketing Online – Vol.1 Nr.2
· să fie bazate pe o arhitectură deschisă deoarece evoluţia tehnologiei informaţiei
poate aduce schimbări radicale în structura sistemului informatic care, însă, nu
trebuie să afecteze instrumentaţia utilizată pentru analiză.
O bază de date multidimensională utilizată de tehnologiile OLAP este formată
din două structuri:
· Structura datelor prin care se descriu structurile proprii ale bazelor de date
referite, cu câmpurile, atributele şi caracteristicile asociate;
· Structura metadatelor definită prin dimensiunile, structurile ierarhice ale
dimensiunilor, membrii şi multipli acestor structuri.
Dimensiunile OLAP sunt identificate în bazele de date tranzacţionale ca fiind
cîmpurile ce conţin caracteristicile unei tranzacţii, datele de identificare a tranzacţiei
respective şi care în cele mai multe cazuri sunt cheile externe utilizate în bazele
respective. Dimensiunile reprezintă parametrii în care sa desfăsurat o activitate, nu se
intersectează cu alte dimensiuni şi sunt de natură complet diferită (timp, spaţiu, produse,
furnizori, clienţi, resurse financiare, resurse materiale, resurse umane). Mulţimea
valorilor posibile pe care le poate lua dimensiunea respectivă poartă numele de membrii
dimensiunii. Prin regruparea valorilor se generează multipli de membrii, grupe de valori
ale dimensiunii respective cu o caracteristică comună. De exemplu se poate defini
localitatea ca multiplu de membrii formaţi din toţi clienţii organizaţiei din localitatea
respectivă. Dimensiunile şi multipli lor formează structuri arborescente cunoscute în
OLAP sub numele de ierarhii. Modelarea dimensională oferă un model conceptual,
cubul OLAP, care permite agregarea datelor întro structură ierarhică, simpla şi foarte
flexibilă, fără a modifica structura de bază a colecţiilor încorporate în depozit, cu
păstrarea legăturilor cu sursele iniţiale de date şi cu posibilitatea de descompunere a
datelor centralizate pe niveluri ierarhice inferioare pînă la setul de tranzacţii iniţiale.
Motorul OLAP foloseşte ca mod de vizualizare a datelor în depozitul de date, o
reprezentare întrun spaţiu n dimensional, prin care axele dau dimensiunea logică a
cubului.
Figura 1: Cubul de date
32
Revista de Marketing Online – Vol.1 Nr.2
Dacă luăm ca exemplu dimensiunile: Produsul, timpul regiunea (zona), cubul
măsurilor cantitative sau valorice ar avea reprezentarea din figura 1.
Asupra cuburilor n dimensionale motorul analitic execută o serie de operaţii
care se integrează în aplicaţii OLAP manevrate de utilizatorul final. Pentru execuţia
acestor operaţii este necesară „navigarea liberă” dea lungul nivelelor ierarhice definite
pentru depozitul de date.
Principalele operaţii OLAP care se pot efectua sunt:
· Specificarea criteriilor de selecţie este primul pas în orice analiză. Utilizatorul
trebuie să poată exprima cu uşurinţă criterii simple, bazate pe valori ale
atributelor şi/sau pe valori ale metricelor. Aceste criterii simple trebuie să poată
fi apoi combinate prin operatori logici şi trebuie să poată fi salvate în biblioteci
pentru eventuale reutilizări.
· Rotaţiile sunt operaţii care permit utilizatorilor să găsească perspectiva carel
interesează specificînd dimensiunile şi direcţiile de rotaţie sau indicând un pivot.
· Schimbarea nivelului de agregare permite găsirea nivelului de agregare optim
pentru analiză. Se poate adânci analiza spre nivele de detaliu prin operaţii de
schimbare a sensului de navigării dea lungul nivelelor unei ierarhii; prin drill
down se poate naviga pe nivelele cu un grad de detaliu mai mare, iar prin roll up
se va naviga pe nivelele ierarhice superioare ca nivel de agregare.
· Specificarea modului de prezentare trebuie să permită analistului să găsească
modalităţile optime de valorificare vizuală a datelor extrase. În afară de
posibilităţile grafice tipice pentru prezentare, este important ca utilizatorul să
poată vizualiza date multidimensionale întro manieră tabelară. În acest sens se
pot utiliza tabele complexe, care să poată grupa coloane şi linii exprimând
dimensiuni diferite (de pildă timpul şi dispunerea în spaţiu) şi nivele de agregare
diferite.Perspectiva multidimensională asupra datelor se face prin operaţii care
permit obţinerea de vederi (view) bidimensionale dintrun cub n dimensional,
care se mai numesc sliceuri, felii de informaţii care servesc unor anumite
scopuri si decizii manageriale.
REGIUNEA
PRODUS
TIMP
Figura 2: Slice pentru viziunea managerului de produs
De exemplu viziunea managerului de produs interesează doar vânzările anumitor
produse, în toată regiunea şi în toată perioada de timp considerată
33
Revista de Marketing Online – Vol.1 Nr.2
Alte tipuri de sliceuri pot felia cubul pe toate cele trei coordonate carteziene aşa
cum se poate vedea în figura de mai jos.
Figura 3: Alte tipuri de sliceuri
Pentru prezentarea convenabilă a rezultatelor se fac racordări ale vederilor
bidimensionale cu baza de date multidimensională, prin mapări de date, coroborate cu
utilizări de grafice şi tabele complexe
Fiind o tehnologie relativ nouă, modelul de arhitectură OLAP (figura 4) care sa
impus pentru sistemele orientate spre analiză multidimensională este unul de tip
client/server în trei straturi.
Sisteme informatice
Motor Aplicatii
Data OLAP
Warehouse OLAP
OPERATIONALE
Metadate
Figura 4:. Arhitectura unui sistem OLAP
a) Data Warehouse formează nivelul cel mai de jos, responsabil cu stocarea şi
regăsirea datelor. De regulă aplicaţiile tranzacţionale utilizează sisteme relaţionale dar
pentru depozitele de date se folosesc sisteme multidimensionale. Dat fiind volumul
mare de date, este recomandabil ca SGBDurile folosite să ofere suport pentru prelucrări
paralele şi distribuite, să dispună de mecanisme performante de indexare şi de
optimizare, să ofere un înalt nivel de siguranţă;
b) Motorul analitic OLAP (OLAP engine) are sarcina de a prelua cererile
exprimate de utilizatori şi, pe baza consultării metadatelor, să genereze cererile necesare
pentru obţinerea datelor ce vor fi redirectate către clienţi. În plus, datelor obţinute li se
vor aplica la acest nivel o serie de prelucrări de generarea de interogări, manipulări de
date şi de sintetizarea rezultatelor;
34
Revista de Marketing Online – Vol.1 Nr.2
c) Metadatele – în care sunt stocate dimensiunile, membrii şi multipli lor, precum
şi structurile ierarhice ale dimensiunilor, informaţii care apar pe axele cuburilor şi sunt
prezentate utilizatorului ca nume de rînduri sau de coloane (pivot table);
d) Aplicaţiile OLAP sunt reprezentate de instrumente mânuite de utilizatorul final.
Există aplicaţii generale care răspund suficient de bine nevoilor unei categorii largi de
utilizatori, există instrumente specializate pe domenii (cum ar fi de pildă analize
regresionale, analize ANOVA, analize SWOT, analiza financiară) şi, în fine, există
posibilitatea de a dezvolta instrumente foarte specifice.
Din punct de vedere al utilizatorului final, aplicaţia pe care o foloseşte trebuie săi
asigure două funcţionalităţi importante: navigarea liberă prin depozitul de date în
căutarea informaţiilor relevante şi posibilităţi diverse de prezentare a datelor. Aceste
funcţionalităţi sunt strâns legate între ele şi este greu de spus care operaţie este de
navigare şi care este de prezentare.
Cerinţele de administrare şi dezvoltare pentru OLAP, deşi similare cu cele pentru
instrumentele de interogare şi raportare, sunt în general mult mai complexe. Punerea în
funcţiune a unui sistem OLAP şi a softului de acces la date necesită o înţelegere clară a
modelului de date al întreprinderii şi a funcţiilor analitice cerute de conducerea
executivă şi strategică. Produsele comerciale pot fi de mare folos, dar rareori există
soluţii ,,la cheie” pentru OLAP; arhitectura trebuie reglată astfel încât să suporte sursele
de date folosite şi să facă faţă cerinţelor. În schimb, odată ce sistemul OLAP este
funcţional, suportul tehnic pentru utilizator este minimal.
C. Tehnologiile Data mining (mineritul în date) reprezintă, întro accepţiune
simplă, un mod automat de detectare întro bază de date a unor tipare relevante. Data
mining utilizează o serie de tehnici statistice şi de inteligenţă artificială ce dau
posibilitatea construirii de modele ce pot previziona comportamentul clienţilor.
Tehnologia îşi sporeşte calităţile prin integrare cu depozitele de date comerciale şi cu
noile modalităţi de prezentare şi raportare.
Data mining îşi datoreşte numele similarităţii dintre căutarea de informaţii
valoroase întro bază de date mare şi săparea unor galerii în munte pentru detectarea
unor zăcăminte valoroase.
Data mining este un proces de descoperire a cunoştinţelor (Knowledge discovery
KD), de extragere a informaţiei necunoscută anterior din baze de date foarte mari.
Procesul descoperirii de corelaţii semnificative, modele şi tendinţe se asigură
prin explorarea unor mari cantităţi de date stocate în depozite de date, utilizând
tehnologii de recunoaştere a modelelor, precum şi tehnici statistice şi matematice.
Conform unui raport din 1997 al Grupului Gartner: ,,Data mining şi inteligenţa
artificială se află între primele cinci tehnologii cheie care vor avea în mod sigur un
impact major asupra unui mare număr de industrii în următorii ani”. Gartner situează
data mining între primele 10 tehnologii în care firmele vor investi în următorii 5 ani.
Studiile arată că în ultima perioadă sa înregistrat o explozie dramatică a nivelului
de interes privind data mining, în condiţiile în care utilizatorii au dorit să profite
dinstrumentele oferite de această tehnologie pentru a obţine un avantaj competitiv
inteligent în plan concurenţial.
Anumite produse software de vârf în domeniul data mining, provenite de la
companii ca SAS sau IBM, reprezintă acum mai mult decât simple motoare de modelare
bazate pe algoritmi complecşi. Acestea se adresează unei categorii mai largi de
35
Revista de Marketing Online – Vol.1 Nr.2
probleme tehnice şi economice şi se integrează în mediile actuale de tehnologie
informaţională.
Deşi se credea că data miningul va elimina nevoia de specialişti în crearea de
modele statistice, lipsa experienţei umane şi a intuiţiei între nişte corelaţii relevante şi
unele nerelevante, lipsă ce caracterizează softurile, infirmă această previziune.
Tradiţional sunt avute în vedere mai multe tipuri de analize statistice: analize
predictive, analize descriptive, analize confirmatorii şi analize exploratorii. Un
exemplu tipic de analize predictive şi descriptive sunt cele specifice acţiunilor şi
fenomenelor de marketing. În cazul analizelor confirmatorii, având o ipoteză formulată
aceasta se acceptă sau se respinge. În analizele exploratorii, se urmăreşte găsirea de
ipoteze, care apoi se acceptă sau se resping. În acest punct sistemul preia ,,iniţiativa” în
procesul analizei datelor sistemul gândeşte singur ipotezele acestea nefiind formulate de
utilizator. În prezent termenul de data mining se referă la procesul automat de analiză a
datelor în care sistemul preia iniţiativa de a genera modele.
Din punct de vedere al procesului există trei clase de activităţi data mining:
descoperire, modelare predictivă şi analiza excepţiilor (figura 5).
· Descoperirea este procesul de căutare în baza de date pentru a găsi modele,
fără a avea o idee predeterminată sau ipoteza asupra ceea ce pot fi modele.
Cu alte cuvinte programul preia iniţiativa în găsirea a ceea ce sunt modelele
interesante, fără a fi necesar ca utilizatorul să se gândească la întrebările
relevante în prealabil. În marile baze de date există atât de multe modele
încât utilizatorul nu ar putea niciodată practic să se gândească la toate
întrebările care ar trebui puse. Problema cheie în acest caz constă în bogăţia
de modele care pot fi găsite şi exprimate, precum şi în calitatea informaţiei
livrate – elemente care determină puterea şi utilitatea tehnicii de descoperire.
· Modelare predictivă modelele descoperite din baza de date sunt folosite
pentru a face previziuni. Modelarea predictivă permite astfel utilizatorului să
prelucreze înregistrări ce au câmpuri valorice necunoscute, iar sistemul va
intui valorile necunoscute pe baza unor modele anterioare din baza de date.
· Analiza excepţiilor reprezintă procesul prin care se aplică modelele extrase
pentru a găsi anomalii sau elemente de date neobişnuite. Pentru a descoperi
anomaliile, mai întâi aflăm ceea ce e normal, apoi detectăm acele articole
care deviază de la normă în cadrul unui interval dat. De exemplu odată ce am
observat că 90% dintre cumpărători au sub 50 de ani, ne putem înteba în
legătură cu cei 10% cumpărători care au peste 50 de ani şi sunt în baza de
date. Se observă că descoperirea ne poate ajuta să găsim ,,cunoştinţe uzuale”,
vreme în care analiza excepţiilor caută cazurile neobişnuite şi specifice.
36
Revista de Marketing Online – Vol.1 Nr.2
Depozit de date
Conditionare
logica
Baza de date 1
Afinitati si
Descoperire
Asocieri
Tendinte si
Variatii
Baza de date 2 Previzionarea
Modelare rezultatului
Data Mining
predictiva
. Previziuni
.
. Detectarea
Analiza deviatiilor
exceptiilor
Analize ale
Baza de date n legaturilor
Figura 5: Clase de activităţi Data mining
Fiecare din aceste procese pot fi clasificate la rândul lor după regulile If/Then,
asocieri etc. În timp ce IF/THEN presupune: Dacă – condiţie, atunci regula 1, astfel
regula 2, regulile de asociere se referă la gruparea articolelor (de ex. când cineva
cumpără un produs la magazin, el poate cumpăra alt produs în acelaşi timp – un proces
numit de obicei analiza coşului de cumpărături).
Din punct de vedere al tehnicilor utilizate de data mining (figura 6) identificăm:
· Reţelele artificiale neurale – modele de previzionare nonliniare care sunt
capabile de acumulare de cunoştinţe prin antrenament;
· Algoritmi genetici – tehnici de optimizare ce se bazează pe procese cum ar fi
combinaţii genetice, mutaţii şi selecţie naturală. Sunt utilizate în modele ce
folosesc concepte de evoluţie naturală;
· Arbori de decizie – structuri pe trei nivele ce reprezintă seturi de decizii.
Aceste decizii generează reguli de clasificare a seturilor de date. Printre
modelele bazate pe arborii de decizie se include Arborii de regresie şi
clasificare (CART) şi Detectarea automată a interacţiunilor de tip c 2
(CHAID);
· Metoda celui mai apropiat vecin – o tehnică ce permite clasificarea fiecărei
înregistrări din baza de date a k clase de înregistrări, cele mai similare;
· Inducţia unor reguli – extragerea unor reguli utile de tip dacăatunci pe baza
semnificaţiei statistice;
· Vizualizarea datelor – interpretarea vizuală a relaţiilor complexe pentru date
multidimensionale.
Cea mai importantă dihotomizare a tehnologiilor data mining se referă la păstrarea
datelor; adică, se mai păstrează sau mai este nevoie de date odată ce au fost minerite. În
abordările iniţiale mare parte din seturile de date se păstrau pentru viitoare analize. În
mod evident, o astfel de tehnică se poate aplica numai în cazul sarcinilor de tip
modelare predictivă şi analiză a excepţiilor, nefiind necesară în cazul descoperirii de
cunoştinţe întrucât nu mai sunt alte modele de distilat.
37
Revista de Marketing Online – Vol.1 Nr.2
Depozit de date
Vecinul
Baza de date 1 imediat
Date retinute Argumentare
pe cazuri
Inductie
Reguli Algoritmi
Baza de date 2 Data genetici
Mining
Logic Arbori de CART
. decizie CHAID
. C4.5 etc.
. Agenti
Tabelare
Date distilate incrucisata
Retele de
Baza de date n incredere
Ecuational Statistici
Propagare
Retele
inversa
neurale
Kohonen
Figura 6: Tehnologiile data mining
Aşa cum uşor se poate bănui, abordările bazate pe păstrarea datelor pot avea uşor
probleme din cauza dimensiunilor foarte mari ale unor astfel de seturi de date.
În timp ce în cazul distilării de modele se analizează datele, se extrag modelele,
iar apoi se renunţă la date, în abordările bazate pe păstrare, datele sunt reţinute pentru
analogiile de modele. Atunci când noi seturi de date sunt avute în vedere, atunci aceste
seturi sunt comparate cu seturi anterioare de date.
Un exemplu cunoscut al abordării bazate pe reţinerea datelor este metoda
,,vecinului imediat”. În acest caz setul de date este păstrat (de obicei în memorie) pentru
comparaţii cu noi înregistrări. Când o nouă înregistrare este supusă analizei, este găsită
,,distanţa” dintre acestea şi înregistrările similare din setul de date şi ,,cele mai similare”
(sau vecinii cei mai apropiaţi) sunt identificaţi.
Tehnologiile bazate pe distilarea modelelor extrag modelele dintrun set de date,
apoi folosesc aceste modele pentru diverse scopuri. În mod evident, este necesar ca
aceste modele să fie exprimate întro anumită formă şi limbaj. Această opţiune a dat
naştere la trei abordări distincte: logică, ecuaţii şi tabelare încrucişată. Fiecare dintre
aceste abordări îşi are originile istorice în anumite secţiuni ale matematicii.
· Logica formează baza celor mai multe limbaje scrise. Modelele exprimate
în limbaje logice se disting prin două principale caracteristici: pe de o parte
sunt citibile şi inteligibile, iar pe de altă parte sunt excelente pentru
reprezentarea grupurilor de elemente de date. Sistemele logice condiţionate
pot fi separate în două grupuri disticte: reguli şi arbori de decizie. Regulile
condiţionale pot fi implementate prin inducţie sau algoritmi genetici.
Există mai multe abordări şi pentru generarea arborilor de decizie (de ex.,
CART, CHAID, C4.5).
· Tabelarea încrucişată este o formă simplă de analiză a datelor, bine
cunoscută în statistică, şi folosită pe larg în rapoarte. Un tabel încrucişat
bidimensional este similar unei foi de calcul, cu capetele, atât de rânduri
cât şi de coloană, fiind valori ale atributelor. Celulele din foaia de calcul
reprezintă o operaţie agregată, de obicei numărul de coapariţii ale
38
Revista de Marketing Online – Vol.1 Nr.2
valorilor atributelor. Multe tabele încrucişate sunt efectiv echivalente cu un
grafic tridimensional care înfăţişază o numărătoare a coapariţiilor.
Termenul de ,,agent” este folosit uneori pentru a desemna tabelele
încrucişate care sunt reprezentate grafic întro reţea şi permit folosirea unor
conjuncţii AND, OR etc. Reţelele de încredere, uneori numite reţele
cauzale , sunt un graf direcţionat, constituit din noduri (variabilele
reprezentate) şi legături între noduri (coeficienţi probabilistici de
încredere).
· Abordările ecuaţionale folosesc de obicei un set de ecuaţii pentru a defini
,,o suprafaţă” (reprezentare grafică a unei funcţii de orice grad) în cadrul
unui spaţiu iar apoi măsurarea distanţelor de la această suprafaţă pentru a
face estimări.
O problemă a tehnicilor data mining a reprezentato necesitatea păstrării
sau nu a datelor obţinute din minerit. Au apărut tehnologii cu păstrarea datelor
şi tehnologii fără păstrarea datelor. Păstrarea datelor se poate aplica numai în
cazul sarcinilor de tip modelare predictivă şi analiză a excepţiilor, nefiind
necesară în cazul descoperirii de cunoştinţe întrucât nu mai sunt alte modele de
distilat.
În timp ce în cazul distilării de modele se analizează datele, se extrag
modelele, iar apoi se renunţă la date, în abordările bazate pe păstrare, datele sunt
reţinute pentru analogiile de modele. Atunci când noi seturi de date sunt avute în
vedere, atunci aceste seturi sunt comparate cu seturi anterioare de date.
Rezultatele obţinute prin data mining trebuie să fie operaţionale şi să
poată fi aplicate pentru obţinerea unui anumit avantaj, fapt dependent în mare
măsură şi de abilităţile decidentului. Data Mining şi OLAP sunt instrumente ale
afacerilor inteligente bazate pe tehnologia IT&C.
Cererile OLAP se adresează unei baze de date existente generând ipoteze
şi relaţii, OLAP fiind în esenţă un proces deductiv. Data mining utilizează
datele pentru a descoperi modele printrun mecanism predictiv.
In concluzie tehnologia OLAP şi tehnologia Data Mining se completează
reciproc contribuind la utilizarea eficientă a depozitelor de date.
Literatura de specialitate prezintă numeroase şi variate situaţii care
impun utilizarea depozitelor de date şi a tehnicilor moderne de accesare:
insuficienta partajarea a resurselor,, grupuri distincte de manageri produc
rapoarte contradictorii, procesul de creare a rapoartelor este foarte anevoios,
rapoartele nu sunt dinamice şi nu favorizează stilul de interogarea online,
rapoarte care necesită date de istoric sunt dificil de realizat, nivelul de pregătire
şi de întelegere a personalului de decizie, a analistului sau specialistului lasă de
dorit..
Instrumentele data mining vor continua să se maturizeze şi din ce în ce
mai multe organizaţii vor adopta acest gen de tehnologie , incorporat în
instrumente software din ce în ce mai performante. Iniţiativele data mining
provin cel mai adesea din zona departamentelor de marketing şi vînzări care
deţin baze de date cu volume foarte mari, sunt generate cu instrumente software
care acentuează şi garantează calitatea datelor din depozitele de date iar
evoluţiile din ultima perioadă impun analize detaliate, analitice, pe perioade de
timp, pe zone şi segmente diferite pentru a oferi răspunsuri operative şi eficace
39
Revista de Marketing Online – Vol.1 Nr.2
pe o piaţă globalizată şi pentru un client individualizat şi personalizat.
Tehnologiile date warehouse , OLAP, data mining sunt influenţate
semnificativ de popularitatea soluţiilor inteligente bazate pe Internet şi Intranet,
suportă facilitătile oferite de aplicaţiile WEB, prin hypertext, hyperlink şi
hypermedia, iar unele organizaţii deja folosesc aceste instrumente pentru
prelucrarea pe Internet a informaţiilor din depozitele proprii de date distribuite
sau pun aceste informaţii la dispoziţia partenerilor strategici ai organizaţiei
Bibliografie:
Andone, I. Tugui, A., s.a. (2001) Dezvoltarea sistemelor inteligente în
economie, Ed. Economică, Bucureşti, 2001;
Cătoiu, I. (coordonator) (2002) Cercetări de Marketing, Ed. Uranus, Bucureşti, ;
Cipolla, E. T. (1995) „Data Mining: Techniques to Gain Insight Into Your Data”,
Enterprise Systems Journal, Decembrie 1995;
Harmon, P. şi King, D. (1985) Expert Systems: Artificial in Business, John Wiley
& Sons, New York.
Inmon, W.H. (1996) Buiding the Data Warehouse, John Wiley & Sons, New
York.
Orzan G.(2001), Sisteme informatice de marketing, Ed. Uranus, Bucureşti;
Turban, E., Jay Aronson J. (2001)– Decision Support Systems and Intelligent
Systems, Ed. Prentince Hall, New Jersey, USA;
Zaharie, D., Albescu, F., ş.a (2001) – Sisteme informatice pentru asistarea
deciziei, Ed. DuAl Tech Bucureşti, 2001,
Wallinger, J. (1997) Database Marketing Guide, Ed. Dryden Press, New York.
40