Documente Academic
Documente Profesional
Documente Cultură
Concepte. Generalitati
- are la baza experienta acumulata de produsele software utilizate pentru foile de calcul
(calcul tabelar)
- trateaza exceptiile de la regula
- utilizeaza metode de cautare complexa in scopul identificarii unor modele si grupari ale
datelor
- extrapoleaza si adauga la cazurile similare
- poate sa invete in orice situatie si sa ofere o solutie cu un anumit grad de siguranta
- poate identifica tendinte nesuspectate in comportamentul consumatorului, care, potential,
pot fi utilizate pentru a prevedea comportamentul viitor
- utilizeaza o multitudine de algoritmi de cautare si extragere precum: arbori de diferite
tipuri, retele neuronale, cautare aleatorie, probabilitati, predictii etc
1
- clusterizarea: constituie procesul de grupare a elementelor similare in grupuri omogene
denumite clustere. Mai mult decat atat, constituie o clasa de probleme ce utilizeaza
mecanisme de invatare nesupervizata avand in vedere faptul ca informatiile initiale
despre clustere nu sunt cunoscute apriori aplicarii procesului de invatare.
- predictia: reprezinta procesul ce are la baza dependentele detectate in datele istorice ale
caror intensitate este modelata pentru a stabili valori viitoare ale unor atribute.
Initial, tehnologia data mining a fost utilizata pentru colectarea datelor numerice dintr-o
singura baza de date iar numeroase tehnici au evoluat pentru fisierele de tip flat sau pentru bazele
de date relationale, unde datele se caracterizau printr-o structura tabulara.
Ulterior, prin integrarea tehnicilor specifice unor domenii precum ML sau statistica, s-
au dezvoltat algoritmi pentru extragerea informatiilor non-numerice.
2
baze de date sunt ulterior prelucrate si transformate in functie de cerinte iar in final accentul este
comutat la nivelul procesului de vizualizare a datelor – important pentru utilizatorii finali.
3
In functie de formatul datelor extrase, se evidentiaza urmatoarele tipuri de data mining :
- are la baza evolutia unor dispozitive precum: laptopuri ,telefoane mobile sau alte
dispozitive portabile
- UDM-ul reprezinta procesul de analiza a datelor in vederea extragerii informatiilor
utile specifice ubicom-ului ( ubiquitous computing)
- domenii de activitate vizate: aplicatii pentru dispozitivele mobile, PDA-uri etc
- datele de tip multimedia sunt reprezentate de cele audio, video, imagine sau animatii
- tehnicile de tip Data Mining care sunt aplicate asupra acestor date de tip
multimedia sunt algoritmi precum retele neuronale, SVM ( Support Vector
Machine) , metodele de clusterizare etc
- domeniile de activitate vizate sunt: aplicatii de tip audio/video
4
Spatial Data Mining
- datele spatiale sunt constituite din linii, suprafete, volume si obiecte de dimensiuni
superioare utilizate in aplicatiile de proiectare asistata de calculator, cartografie,
sisteme informatice georgrafice etc
- printre tehnicile utilizate se numara cele specifice bazelor de date spatiale , OLAP spatial,
sau metode de clusterizare spatiala
- printre aplicatiile vizate se numara: teledetectia, GIS etc
Aplicatiile de tip Data Mining sunt data-driven (figura 2), existand un nivel ridicat de
complexitate la nivelul datelor stocate sau a interrelatiilor dintre datele prezente intr-un depozit
de date care sunt dificil de identificat prin intermediul unor alti algoritmi sau tehnici.
5
Din acest punct de vedere, aplicatiile de tip Data Mining se caracterizeaza prin urmaroarele
aspecte:
6
Concluzii
7
Bibliografie
8
9