Documente Academic
Documente Profesional
Documente Cultură
Xiao Gang
Xiaoli Geng
PREFA
Vara trecut am primit o sansa de a face internship meu de la Hebei Tehnologie &
Science Management Centre comunicare, alturai unei echipe de lucru pe data mining.
Asta a fost prima dat cnd am atins acest dosar, am nvat o mulime de noi
cunotine i sunt profund interesat de aceasta. Am facut proiectul pentru o companie
de semine, exploatare unele date i statistici, iar apoi au raportat rezultatele la acestea.
Am fost att de norocos pentru a avea ansa de a se altura acestei echipe pentru c
acest proiect are nevoie de gen ntotdeauna o cantitate mare de date reale. Acest lucru
mi-a dat o ans practic de a aplica cunotinele mele de data mining n proiect real,
care a extins aria mea de cunotine n acest domeniu. Aa c atunci cnd am nceput
s fac teza mea, am fcut nite cercetri i studii n acest domeniu, i conectat fundal
teoria cu experiena mea practic apoi a finalizat teza.
Deci, la nceput am nevoie s-i mulumesc pentru a-mi Company fundal, Hebei
Tehnologie & Science Management Centre comunicare, precum i, de asemenea, v
mulumesc pentru mdularele mele echipei de proiect. n al doilea rnd, apreciez ntradevr instructorul meu, domnul Wikstrm Yngvar; i profesorul meu de limb, doamna
Skarli Poppy; i Guider nostru tez, domnul Vnnen Ossi. Pe parcursul activitii
mele teze, toi au dat mult ajutor i sfaturi. V mulumesc pentru toi!
n cele din urm, datorit familiei mele, la tatl meu i pe mama. Fr tine nu am putut
avea ansa de a studia n strintate. Mulumesc!
2011/05/18 Turku
Xiaoli Geng
Cuprins:
1
Introduction---------------------------------------------------------------------------------------------
2.1
10
22
LISTA FIGURI
1 Figura 3.1 Cum pot analiza aceste date? -------------------------------------------------- - 11
Date Figura 3.2 Mineritul este similar cu aur miniere ---------------------------------------2 - ------12
3 Tabelul 3-1 diferite definiii ale mining ----------------------------------------- ----------
13
37
38
1 Introducere
Odat cu dezvoltarea tehnicii de calcul, capacitatea oamenilor de a colecta date i
stocarea datelor a fost mult mbuntit. Cercetare tiinific sau toate domeniile vieii
sociale au acumulat o cantitate mare de date, astfel, analiza acestor date se poate
descoperi informaii utile cuprinse n datele, s devin o nevoie comun n aproape
toate domeniile. Ca urmare, rolul de exploatare a datelor a devenit tot mai important.
Tehnologia mining schimb acestor date n informaii i cunotine utile; informaiile i
cunotinele obinute pot fi utilizate pe scar larg n diverse aplicaii, inclusiv
gestionarea afacerilor, controlul produciei, analiza de marketing, proiectare i
explorare tiin. Prin urmare, data mining este rezultatul firesc evaluare a tehnologiei
informaiei, ceea ce este important.
Aa c am ales acest subiect ca proiectul meu tezei. Am folosit, de asemenea, testul
de proiect de a crea un studiu de caz pe data mining. Aceast tez introduce separat
metoda de data mining i diferite aplicaii pe suprafa, explic impactul mining zilele
noastre, i avantajele acestei tehnologii, i prin testul demonstreaz i arat aceast
tehnologie aliat iconic.
Am citit alte teze similare cu a mea, principalele lucruri despre data mining sunt
metodele miniere i aplicaiile. Pot gsi c principalele i utile metode de exploatare
sunt similare ca am introdus n aceast tez, clasificare i clustering, metodele de
exploatare pe baz de arbore de decizie i aa mai departe. Concluziile finale sunt
exprimate avantajele mining din zilele noastre i noile aplicaii n multe domenii diferite.
Obiectivele tezei mele sunt de a explica ideea principal a mining, si de a invata cateva
metode comune de baz, s pun n aplicare un experiment pentru a verifica
avantajele i funciile de data mining.
Cunotine 2 Context
2.1 Contextul i semnificaia proiectului
n epoca reea, computere i tehnologii de reea se schimb viaa oamenilor. Deoarece
APARNET a fost stabilit, internetul a cunoscut o dezvoltare rapid. Ea a devenit acum
o facilitate global care acoper aproape fiecare gaura i col de pe aceast planet. Ca
o parte principal a Internetului, protocoale de reea au fost bine dezvoltate pentru a
satisface o gam larg de aplicaii practice. Cu toate acestea, cu extinderea continu a
scar de la ambele servicii i utilizatori, problemele pe care Internetul le are de a face
fa sunt, de asemenea, n cretere.
Datorit utilizarea pe scar larg a sistemelor de gestionare a bazelor de date, datele
sunt piling sus ca timpul trece. Oamenii pot nva de la date, dar corpurile mari de date
sunt, cu excepia cazului, deoarece oamenii au nevoie de date specifice, nu o
unassorted. De-a lungul ultimilor ani, dezvoltarea de descoperire de cunotine n acest
domeniu este n cretere rapid datorit pieelor mari i interesele de cercetare.
Progresul tehnologiei informatice i de colectare a datelor tehnici permite oamenilor de
a colecta i stoca date de la o gam mai larg la o vitez fr precedent. Pe de alt
parte, dei tehnologia modern baz de date ne poate ajuta pentru a stoca cantiti
mari de date cu uurin, nu se poate s ne ajute s analizeze i s neleag de date,
sau reprezint date ntr-o form de informaii uor de neles. n trecut, metoda comun
am folosit pentru dobndirea de cunotine a fost analiz, se filtreaz comparaie, iar
apoi am extras normele de cunoatere i create. Cu toate acestea, ca inginerii de
cunotine au limitri privind cunotinele, astfel nct cunotinele am ctigat va fi
limitat. n prezent, n cazul n care achiziia tradiional cunotine se confrunt cu
depozitul de mare de date, aceasta nu poate face nimic, aa tehnologiei de data mining
a fost creat pentru a rspunde acestor provocri.
Data Mining este procesul de extragere de informaii i cunotine implicite de mare,
incomplete, zgomotos, neclare, date aleatoare de aplicare practic, oamenii nu tiu n
avans, dar care este potential util [1, 2].
Motivul pentru extragerea de date are o mare importan n industria de informaii este
cauza cantiti mari de date trebuie s fie schimbat la informaii utile care pot fi uor de
neles de ctre oameni, i ei, de asemenea, pot fi utilizate pe scar larg n diverse
aplicaii, inclusiv managementul afacerilor, producie control, analiz de marketing,
inginerie
design i explorare tiin. Prin urmare, data mining este rezultatul firesc evaluare a
tehnologiei informaiei, ceea ce este important.
2.2
Algoritmi data mining au devenit un sistem de tehnologie imens dup ani de dezvoltare.
Acest lucru implic amestecarea diferitelor discipline i un numr mare de algoritmi i
funcii diferite instrumente. Unul din obiectivele de baz ale acestui proiect este de a
studia tehnicile de data mining, citii materiale de data mining aferente, s neleag
conceptele de baz i metodologia general, apucai metodele comune i pentru a
realiza algoritmul preliminar, n special s stpneasc clasificare, gruparea i selecia
facilitate algoritm. Un alt obiectiv este de a studia crile i materialele legate de data
mining, citii ziarele legate de reea clasificare de trafic bazat pe tehnologia de data
mining, s se familiarizeze cu fluxul de reea de curent, afla stadiul de dezvoltare i
rolul de data mining n societatea modern, s nvee tehnologia de aplicare data
mining n reea i modul de aplicare n probleme de afaceri. Ultimul obiectiv este de a
dezvolta abilitile mele de aplicare practice cu tehnici de data mining.
Aceast tez descrie mediul de reea actual acum, pur i simplu analiza dezvoltarea i
statutul matur de tehnologie de reea, discut urmtorul faa locului tehnologie fierbinte,
care poate avansa progresul societii umane, i de a obine actualul fenomen
"explozia de date, dar lipsa de cunotine". Gsim c oamenii sper s analizeze la un
nivel mai ridicat de a face o mai bun utilizare a acestor date, acest lucru duce la
tehnicile de data mining i de descoperire de cunotine, precum i reuete o
elaborare detaliat i introducerea pe metoda de exploatare a datelor, care a fost
propus n 1980. Capitolul trei i patru Capitolul introduce detalii cu privire la aplicarea
de data mining n reea i de afaceri, precum i mai multe cazuri de succes. Aceste
capitole introduce, de asemenea metoda de data mining pe baza caracteristicilor
statistice, un algoritm tipic bazat pe aceast metod numit algoritm arbore de decizie.
n cele din urm, teza introduce software-ul WEKA i unele cunotine relaie, iar
procesul de testare bazat pe platforma WEKA.
Structura 2.3Thesis
10
11
12
atenie organizaii. Cu toate acestea, ceea ce este data mining? Pe scurt, data mining
este extragerea datelor sau cunotine "exploatare" de la cantiti mari de date.
13
Definiii
SAS
Gartner
Grup
Aaron Zornes
Fayyad
Zekulin
Extragerea
n
prealabil
Ferruzza
necunoscut,
informaii de la
Jonn
Parsay
Bhavani
14
Dei definiiile din tabelul 3-1 au unele diferene, toate mining culminant ca procesul de
date ntr-un model util; fiecare model util ofer un potenial informaii valoroase pentru
utilizatori. Scopul su este de a schimba datele n cunotine, i de a crete valoarea
intrinsec a datelor.
Prin urmare, data mining poate fi definit ca: extragerea de date este procesul care
transform din date de mari dimensiuni, incomplete, zgomotoase, fuzzy, aleatoare
practice de aplicare n informaii i cunotine care este implicit i c oamenii nu tiu n
avans, dar este potenial util dup prelucrare [ 3]. Aceast definiie implic faptul c:
Surse de data mining trebuie s fie real, substanial i zgomotos; cunoaterea gsit
este cel care utilizatorii sunt interesai n; cunoaterea descoperit poate fi acceptabil,
uor de neles i utilizat; aceasta nu are nevoie de cunotine descoperit pentru a se
potrivi tuturor i obiectivul este de a rezolva probleme specifice ntr-un domeniu
specific.
15
16
Metodele sunt rezumate dup cum urmeaz; ele sunt din diferite unghiuri cu privire la
datele de excavare i gsirea modelelor utile i acumularea de cunotine.
(1) Categorizare este de a gsi un set de caracteristici comune de obiecte de date n
baza de date, i n conformitate cu modelul de clasificare datele mpart n diferite clase,
n scopul de a cartografia elementele de date din baza de date la un anumit stil,
prognoza variabilelor int discrete.
(2) Analiza Cluster este de a face un set de date n funcie de asemnrile i
deosebirile mprite n mai multe categorii. Principiul de baz este de a face
similitudinea ntre aceleai categorii date la fel de mari ca posibil, similitudinea dintre
diferitele categorii de date la fel de mici ca posibil. Scopul este de a gsi un grup strns
legat de grupul de observare.
(3) Analiza de regresie reflect valorile de proprietate n cifrele de timp din baza de
date tranzacie; creeaz o funcie de variabile predictor cu date reale, identificarea
dependenelor dintre variabile sau atribute.
(4) Regul de asociere descrie regulile relaia existent ntre elementele de date din
baza de date, care este un produs apariie ntr-un obiect, aceste articole va exporta alte
elemente apar i n acelai obiect, asociaia sau corelarea ascunse n date, gasirea
modul are o asociere puternic caracteristici n datele.
(5) Analiza Caracteristic este extragerea tipul caracteristic legat de date de la un
grup de date din baza de date. Aceste tipuri caracteristice arat caracteristicile
generale ale setului de date. n analiza schimbrilor i abatere, abaterea include o
clas mare de cunotine potenial interesant, cum ar fi situaiile anormale n procesul
de clasificare; scopul este de a cuta diferene semnificative ntre rezultatul de
observare i volumul de referin. Normele neateptat exploatare pot fi aplicate la
descoperire, analiza, identificarea, evaluarea i avertizare timpurie i aa mai departe
pentru o varietate de informaii anormale.
(6) Plase neuronale imita reele neuronale biologice. Este un model de predictie
neliniar prin nvare de formare i se poate finaliza clasificare, grupare, caracteristica
minerit, prognoz i alte sarcini de data mining.
(7) Tehnologia Vizualizare este o tehnologie grafic. Acesta utilizeaz o prezentare
grafic intuitiv a modelului informaii, asociaia de date sau tendina de a factorilor de
decizie. Vizualizare mbuntete eficiena data mining.
17
18
Figura 3-1-5 descrie un procedeu de baz mining tipic i paii sale majore, include
selecia de date aferente din baza de date; curarea i integrarea transformarea de
date selectate, date, folosind algoritmul data mining pentru minerit model, interpretare
i evaluare a modelului obinut. Date de intrare pot fi stocate n diferite forme, pot locui
intens n baza de date, sau s fie distribuite pe mai multe site-uri, dup operaia de
selecie a datelor a format datele int. Curenie Datele completeaz valorile lips,
netezete date de zgomot pentru a elimina zgomotul i observaii repetate, selecteaz
nregistrrile i caracteristici legate de sarcinile curente de data mining. Integrarea
datelor combin datele din surse multiple de date. O transformare de date schimb
tipul de date ntr-un tip adecvat pentru minerit i este un proces de pre-tratare orientate
spre succes pentru data mining. Analiza i prelucrarea datelor transformate folosesc
algoritmi de data mining, exploatare conine modelul i dezvluie disciplina n datele.
Apoi, urmeaza interpretarea i evaluarea pe modelul obinut, n cazul n care modelele
obinute din minerit nu au nici o importan practic, sau nu se poate obine prin
msura de statistic sau testarea ipotezelor, atunci ele sunt considerate ca rezultatele
mining mincinoase i se elimin. Acest proces necesit repetat, acest proces repetare
se va apropia de esena lucrurilor, prelucrare continuu are o soluie la problema de
optimizare.
Procesul de exploatare a datelor nu este automat. Cele mai multe dintre lucrrile
trebuie s fie fcut manual. Data mining are cerine stricte cu privire la datele i datele
de prelucrare a pre este conturilor de lucru mai dificile i consumatoare de timp pas n
ntregul proces, n general, reprezentnd 60% din timp pe parcursul procesului, i
miniere de doar 10% din volumul de munc total.
3.2.1 Clasificare
n data mining, clasificare este o metod sistematic bazat pe datele de intrare pentru
a stabili un model de clasificare. Sarcina Clasificare [8] este de a nva pentru a obine
o funcie f predicie int. Aceast funcie este, de asemenea, numit ca modelul de
clasificare, n procesul de predicie sau de identificare, f dribleaz fiecare atribut setat x
hart a unei predefinit etichet de clas y. Exemplele de clasificare includ metoda
arborelui de decizie de clasificare, clasificarea bazat pe reguli, naiv metoda de
clasificare Bayesian, suport metoda de clasificare vector, Retele neuronale metoda de
clasificare, etc .. Toate acestea
19
20
Metoda Compartimentare: Aceast metod creeaz mai nti o divizie iniial, apoi
interactiv prin mutarea obiectului n intervalul diviziune a mbunti partiionarea. Dar
aceast metod poate gsi doar grupuri sferice.
Metodele bazate pe Grid: Aceast metod face obiect fie distanate n limitele uniti.
Aceast metod are o vitez de procesare rapida.
21
Algoritmul
k-means
Sensibilitate
pe murdare
sau
pe ordinea
anormal
de intrare
Date
Date
Sensibil
Insensibil
Convex sau
Mai Puin
Insensibil
Sferic
Sensibil
Convex sau
Sensibil
Algorith
Appropriat
Grup
Tip
Eficien
Tip de date
S-au gsit
mare
Valoare
Convex sau
Sensibilitate
Sferic
K-medoids
K-pototypes
Sczut
General
Valoare
Mixt
Sferic
CLARA
Inferior
Valoare
Convex sau
Sensibil
Sensibil
Sferic
CLARANS
Inferior
Valoare
Convex sau
Mare
Valoare
Convex sau
Mai Puin
Sensibil
Insensibil
Sferic
Mesteacan
Mai Puin
Foarte
Sensibil
Insensibil
Sensibil
Insensibil
Mai Puin
Sferic
CURE
Superior
Valoare
Arbitrar
Form
DBSCAN
General
Valoare
Arbitrar
Sensibil
Sensibil
Sensibil
Sensibil
Insensibil
Insensibil
Insensibil
Form
STING
Mare
Valoare
Orizontal
sau vertical
Val
Mare
Grup
3.3
Valoare
Arbitrar
Form
Capitolul Rezumat
Acest capitol prezint metodele de exploatare a datelor. Ea descrie pentru prima dat
conceptul de baz de data mining, metodele comune de data mining i fluxul de baz
de data mining. i apoi scoate n eviden de clasificare i clustering metodele i n
cele din urm ofer un criteriu de evaluare comun. Se face o evaluare indice mediu
macro i micro. Aceti indicatori vor servi drept criterii de evaluare pentru selecia
caracteristic i sub-gruparea.
22
23
24
(3) Avnd n vedere c stratul de transport i stratul de aplicare sunt strns legate,
putem pune aceste dou Trafic mpreun pentru studiu analiz. Fluxul de la acest
nivel poate fi definit ca: tur este un obiect i l descrie un tren pachet cu aceeai
adres IP, numrul de port i protocol (TCP, UDP). Este o perioada de cinci tuplu
format din adresa sursa, portul surs i portul de destinaie i protocol strat de
transport. Aceast serie de trenuri de pachete IP poate acorda aceast definiie
pentru a compune un dou sensuri TCP / IP sau UDP fluxului. Scopul cercetrii a
acestui strat este de a identifica stratul de aplicare
protocol.
Proiect de cercetare i Scopul treilea strat de flux de date este de a identifica protocol
de strat de aplicaie. Grup de cinci-tuplu treilea strat este cuplat cu protocolul strat de
aplicare constituie fluxul n acest articol.
Pentru a rezuma, o reea de trafic de flux pot fi definite dup cum urmeaz: fluxul de
trafic de reea este cantitatea de date transmise prin reea, i poate fi vzut ca suma
intre informaiilor care printr-un link de reea sau un dispozitiv ntr-un anumit termen,
specific, poate fi vzut ca un pachete IP care trec printr-un punct de observaie n
reea la un anumit interval de timp.
25
Tip de proprietate
Nominal
Clasificare
Descriere
Exemplu
Culoarea pielii,
ochilor
culoare,
Valoare
Raport
identificare
numr
Calitate,
solubilitatea
Date Calendar,
temperatur
Calitate, vrst
Structurarea un set de caracteristici este una dintre misiunile de baz n data mining.
Calitatea de setul de caracteristici va influena n mod direct rezultatul de data mining.
Procesul structura pe fluxul de reea caracteristic poate fi mprit ntr-un singur sens
de curgere i fluxul bidirecional. ntr-un fel fluxul, secvena de pachete este strict
evaluat de normele n conformitate cu cele 5-tuplele. Caracteristica statistic a fluxului
de reea ntr-un fel de obicei, conine: numrul mediu de mrimea pachetelor, numrul
pachetelor, numrul pachetelor cu SYN sau
26
27
Din procesul de implementare, toate metodele de mai sus fac parte din metoda de
msurare pasiv n msur reea i nu va avea niciun impact n timpul procesului de
clasificare. Comun dezavantaj este c metodele de mai sus nu pot nelege
comportamentul reeaua unele aplicaii, cum ar fi cel mai popular P2P
28
X{X1 , X2 , ..., Xn}, Prin utilizarea metodei de nvare main la "nva" aceast
reea flux stabilit, la structura fluxul de model de clasificare f : X C , Acest model
poate fi folosit pentru a clasifica i prezice necunoscut fluxul de reea de tip.
Clasificarea trafic de reea este o clasificare tipic multiplu. n general, clasificarea
traficul n reea este, prin punctele de observaie de msurare tot TCP sau UDP
informaiile flux "sau proprietatea (cum ar fi porturile, coninut pachete, informaiile de
conectare, statistice trafic, etc.) care trec pe link-ul de reea sau a dispozitivului. Pe
baza acestor informaii, putem specula aplicaia de reea de sus sau protocolul strat
(cum ar fi WWW, FTP, P2P, etc.)
Activitatea de baz a manipulare a problemei de clasificare de trafic prin metoda
exploatare de date conine n principal dou aspecte:
(1) Selectarea corespunztoare proprietile de curgere de reea, abstract-l la vectorul
caracteristic.
(2) Selectarea corespunztoare algoritmi de nvare main pentru a construi modelul
de clasificare. n reea clasificare trafic acum, metoda exploatare mai des utilizate de
date este
29
Decizia metod de clasificare Arborele, metoda naiv Bayes clasificare [4, 13, i 14],
precum i metoda de clasificare main reea de sprijin [15, 17].
30
31
de
consumatori
sau
persoane
corespunztoare
pentru
urmatorul
32
33
(1) Cross-platform, acesta susine Windows i Unix, precum i multe alte sisteme de
operare;
(2) Acesta susine fiierul text structuri, formatul mining (C4.5), i ofer interfa de
baze de date (JDBC);
(3) Se poate ocupa de tipurile de date ale discrete caracteristice, tipuri continue,
data,.
(4) Acesta ofer tratament lips de valoare, zgomotul eliminare, standardizarea,
discretizarea de date, structura atribut, transforma variabila, date pe pri,
echilibru de date, sortarea proba, proba shuffle, gruparea datelor, reducerea
dimensional, valoare
34
35
Desigur, atunci cnd importai fiierul de date, vom constata c putem importa de
asemenea, forma fiier cu extensia de nume de fiier. csv (care pot fi exportate ctre
Excel sau Matlab); instana a fiierului C4.5 original, cu nume de fiier extensia este
.names i .data, i a fost serializat numele fiierului extensie este de .bsi. Aceasta se
datoreaz faptului c sistemul WEKA vine cu trei tipuri de convertoare format de fiier
au fost: CSVLoader, C45Loader i SerializedInstanceLoader astfel atunci cnd fiierul
WEKA ARFF nu a putut fi ncrcat, sistemul va apela n mod automat convertorul
format de fiier n mod automat Converter pentru tipurile suplimentare de fiiere n
format ARFF pentru testare.
36
37
38
(3) CLI simpl: Prin rularea interfa simpl CLI, utilizatorii pot realiza funciile de baz
ale Explorer. Cunoaterea Flow i experimentator de WEKA. Cnd utilizatorul
tasteaza un programul fr nici opiunile de linie de comand n caseta de editare
din partea de jos a interfeei, panoul de deasupra casetei de editare va afia toate
opiunile disponibile: n primul rnd, opiunile generale, apoi opiuni asociate cu
programul. Prin introducerea comenzii de funcionare corespunztoare, funcia
corespunztoare poate fi atins.
Deoarece acest test necesit o mulime de date reale pentru a testa, am ales datele
experimentale i rezultatele experimentale din echipa de proiect am fcut nainte, n
39
40
7 Concluzii
Aceast tez descrie mediul de reea actual noi trim acum, pur i simplu analizeaz
dezvoltarea i starea matur de tehnologie de reea, a discuta despre urmatorul faa
locului tehnologie fierbinte, care pot promova progresul societii umane, i de a obine
actualul fenomen "explozia de date, dar lipsa de cunotine ". Am descoperit ca
oamenii spera pentru a analiza datele de nivel superior pentru a face mai bun utilizare
a acestor date, ceea ce duce la mining i de descoperire de cunotine tehnici, i a
fcut o elaborare detaliat i introducerea pe metoda de exploatare a datelor, care a
fost propus n anii 80 ai secolului 20. Capitolul trei i patru capitol introduce detaliile
cererii mining n reea i de afaceri, i s introduc mai multe cazuri de succes i
metode de exploatare a datelor bazate pe caracteristicile statistice, i un algoritm tipic
bazat pe aceast metod, care este algoritmul arbore de decizie. n cele din urm, teza
introduce software-ul WEKA i unele cunotine interdependente, iar procesul de
testare, precum i un test simplu pe data mining bazat pe platforma WEKA.
Desigur, pentru c acest subiect este un domeniu care nu le-am atins nainte, trebuie
s existe unele deficiene, fie opinii de la un punct de cercetare sau un punct de
aplicaie practic. n viitor a dori s studieze mai profund, aplicaii de data mining de
cercetare.
Ca un instrument de minerit, data mining este convenabil pentru analiz. Nu pot fi
utilizate numai pentru cunoatere a mea, dar, de asemenea, poate fi folosit pentru
suport decizional i analiz de predicie, faciliteaz foarte mult de gestiune a bazei de
date.
Data mining este acelasi cu alte tehnologii, aplicaii sale au avantaje i dezavantaje.
Deoarece data mining poate extrage un fel de cunoatere care nu este uor de gsit,
dac nu este folosit corect, acesta poate reprezenta o ameninare la adresa vieii
private i de informaii de securitate. Pentru a rezolva aceast problem, trebuie s
dezvolte n continuare metodologia, n scopul de a asigura protecia vieii private i de
securitate a informaiilor n timpul procesului de exploatare.
41
Referinte
[1] Zhangwei, Liao Xiaofeng, Wu Zhongfu. O nou metod de grupare bazat pe
algoritmul generic [J]. Informatic. 2002, 29 (6): 114-116.
[2] Lin Sin, Xu Peng, Liu Qiong. Clasificare de trafic bazat pe mainile vectoriale suport
[J]. Cercetare i dezvoltare de calculator 2008, 25 (8): 2488-2490.
[3] Kim H, K Claffy, Fomenkov M, Barman D, Faloutsos M, Lee K. clasificare trafic
Internet demistificat: mituri, obiecii i cele mai bune practici [A]. In: ACM CoNEXT
Conference [C]. ACM: Madrid, Spania, 2008, 1-12.
[4] Data Mining Aplicaii site-ul introducere:
http://wenku.baidu.com/view/594457cda1c7aa00b52acb38.htmlAccessed:2011-04-02
[5] Reea de trafic site-ul introducere:
http://baike.baidu.com/view/411702.htmAccessed:2011-04-02
[6] Han J, Kamber M. Data Mining: Concepte i tehnici [M]. Morgan Kaufmann
Publishers: San Francisco, Statele Unite ale Americii, 2000.
[7] Tan PN, Steinbach M, Kumar V. Introducere n Data Mining [M]. Addison-Wesley:
Michigan State, Statele Unite ale Americii, 2006.
[8] Soare Guijie, Liu Jie, Zhao Lianyu. Cercetare algoritm Clustering [J]. Software-ul
Jurnal 2008, 19 (1): 48-61
[9] Nguyen TTT, Armitage G. Un sondaj de tehnici de clasificare a traficului pe
Internet, folosind masina de nvare [J]. Sondaje i Tutoriale 2008 IEEE
Communications, 10 (4): 56-76.
[10] Xu Peng, Lin Sin. Clasificare de trafic bazat pe arbori de decizie C4.5 [J].
Software Jurnalul 2009,20 (10): 2691-2074
[11] Site-ul oficial WEKA:
http://www.cs.waikato.ac.nz/ml/weka/Accessed:2011-03-01