DL - Prezentare Concept

DE E P
LE A RN IN G
ANDREI CRIȘAN
DUMITRESCU DANIEL
G RUPA 1 AN 2
MARKETING ONLINE
TEORIE
DEFINIȚIE
Deep learning-ul reprezintă o clasă de algoritmi de învățare automată
ce folosesc rețelele neuronale artificiale (RNA) care se remarcă prin
faptul că într-o primă etapă învață cum să se prelucreze datele de
intrare și ulterior funcția dorită, unde rețelele neuronale sunt folosite
pentru a extrage caracteristici de nivel superior.
Straturile inferioare identifica margini si colțuri iar straturile

superioare cifre, litere, fețe de oameni.
DEEP LEARNING: LA CE AJUTĂ?
 Recunoașterea facială ( Algoritmi supervizați).
 Recunoaștere automată a vorbirii . (Audio)
 Conversații cu clienți automate.
 Prelucrarea limbajului natural.
 Filtrare în rețele sociale.
 Traducere automată.
 Detectarea fraudelor financiare. (Spălare de bani)
 Domeniul Medical: Analiza imaginilor medicale, Bioinformatica,
Descoperirea unor medicamente, Toxicologie(prezicerea toxicității)
REȚELELE NEURONALE
• Au fost descoperite in anii 1950, inspirate în mare parte din țesutul
animal, folosindu-se de un anumit algoritm.
• Algoritm:
CE ESTE O REȚEA NEURONALĂ ?
• Structural, atunci când avem o serie neuroni interconectați putem

vorbi de o rețea neuronală. Este o definiție inspirată din biologie, din
analogia cu creierul uman unde neuronii, deși pot avea funcții foarte
specifice, aparent formează un tot unitar.
• Funcțional, am putea defini o rețea neuronală, ca acel sistem format

dintr-un număr variabil (adesea mare) de elemente interconectate, ce
ajută la rezolvarea unei probleme.
TRĂSATURI IERARHICE ALE UNEI
REȚELE NEURONALE
EXEMPLE DE COMPANII
TIP DEEP LEARNING
OK, FACEM ȘI
PRACTIC?
CE URMEAZĂ SĂ FACEM?
• Conectarea sursei de date pentru a fi analizată și prepararea datelor.

• Identificarea vulnerabilităților sursei de date și oportunităților pentru
dezvoltarea bazei de date.
• Alegerea modelului de analiză folosind IBM SPSS MODELER
• Cum exploatăm un model deja antrenat și îl folosim pe setul propriu
de date?
CONECTARE SURSĂ DE DATE
Pentru acest exemplu, avem două datasets – unul cu date despre
consumatori și unul cu statistici churn (de părăsire a businessului).
Totul începe cu Și se continuă cu selectarea sursei de date din partea de jos

un dublu-clic (Sources palette) – Excel Node
CONECTARE SURSĂ DE DATE - 2
Presupunând că datele sunt în format .xlsx, selectăm fișierul
CONECTARE SURSĂ DE DATE - 3
E o idee bună să apăsăm butonul de preview din dialogul anterior pentru a ne

asigura că importăm sursa de date corectă (hint din experiență). După verificare,
apăsăm ok (dreapta jos) și ok în dialogul anterior.
PREPARARE DATE
Datele trebuie unite înainte de Iar ulterior, cele două surse de

utilizarea modelului, iar asta se date trebuie conectate la nodul
poate face prin selecția și merge
adăugarea unui nod merge în
workspace.
PREPARARE DATE - 2
Există multiple metode de unire, dar cea folosită de noi este pe baza unei
chei fiindcă în ambele baze de date avem ID, astfel, IBM SPSS va ști că
id-ul 2 din baza de date cu utilizatori va corespunde ID-ului 2 din baza de
date cu statistici churn.
PREPARARE DATE - 3
Pentru că nu avem o bază de date extrem de mare (prima condiție pentru un Deep Learning autentic), vom
grupa datele de vârstă și le vom rescrie pentru a fi încadrate într-o categorie, astfel vârsta de 26 de ani va
deveni 25-34 (scală ordonată) printr-un nod de binning.
PREPARARE DATE - 4
Și am reușit să creăm variabila Age_Bin în dataset.
ANTRENARE MODEL
Cum încercăm să ne dăm seama de ce consumatorul renunța la serviciile
businessului nostru și cum nu știm exact ce model se potrivește mai bine
pentru inspectarea acestei relații, putem folosi funcția de Auto-Modeler.
Din tabelul de modelare, adăugăm în workspace, conectat la ultimul

nod, un nod Auto-Classifier, iar acesta se va ocupa de modelare.
Datorită partiției datelor, numele va fi automat creat CHURN (fiind
variabila target a modelului).
ANTRENARE MODEL
La dublu-clic pe nod, putem

vedea propriețățile acestuia și
putem seta proprietățile
generale ale modelului. În
cadrul tabului Expert, vom
putea vedea ce modele va
testa clasificatorul.
ANTRENARE MODEL - 2
Selectând run, autoclasificatorul
va încerca să descopere cel mai
bun match pentru datele noastre,
iar în următorul ecran vom avea
un golden-nugget – modelul
selectat.
EVALUARE MODEL
La dublu clic pe modelul câștigător putem analiza diferite detalii statistice, printre care
cel mai important este acuratețea de descriere a fenomenului de către model.
PREDICȚIE
Modelul curent acum este antrenat și poate fi folosit pentru a face predicții, astfel
folosind aceeași procedură urmează să importăm un set de date cu consumatori, să
facem aceleași operațiuni de prelucrare, și să aplicăm modelul în flow-ul de noduri
respectiv.
PREDICȚIE 2
Pentru a vedea rezultatele, adăugăm în flow un nod table, executăm modelul, iar
rezultatul va arăta astfel:
DETALII DESPRE MODEL
În vederea scopului practic, vom explica decizia luată automat de clasificatorul SPSS și
de ce aceasta a fost cea mai potrivită pentru setul nostru de date.
•Algoritmul a fost supervizat (derivat din sursele de date de intrare). Întotdeauna un

algoritm supervizat primește și rezultate după care să orienteze studiând astfel
cauzalitatea și relațiile efect – cauză (nu viceversa).
•Drept model de antrenare selectat, a fost autoselectat un perceptron multilayer – se
bazează în linii mari pe mimarea procesului de învățare uman prin șiruri de layeri
binari și simulare. Motivele din spatele alegerii sunt:
– Sursa datelor: realitatea – acest model se pliază bine pe date numerologice reale.
– Seturile de date sunt tabelare
– Target-ul: comportamentul uman de renunțare prezintă o doză mare de flexibilitate, motiv
pentru care acest model e preferabil fiindcă reușește să identifice patternuri mai variate.
CONCLUZII DE UTILIZARE
Aplicarea Deep Learning și a modelului multilayer perceptron este variată, dar între
aceste aplicații softwarerurile de Business Intelligence sunt cele mai relevante în sfera
marketingului deoarece reușesc să identifice patternuri comportamentale ce ajută mai
departe mediul de business să ia decizii strategice. (valabil pentru afaceri ce dețin deja
date și au un oarecare istoric – pentru startupuri simularea și experimentul sunt un tip
de metode de cercetare mai potrivite).

DL - Prezentare Concept

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

DL - Prezentare Concept

Încărcat de

Drepturi de autor:

Formate disponibile

DE E P

Straturile inferioare identifica margini si colțuri iar straturile

• Structural, atunci când avem o serie neuroni interconectați putem

• Funcțional, am putea defini o rețea neuronală, ca acel sistem format

• Conectarea sursei de date pentru a fi analizată și prepararea datelor.

Totul începe cu Și se continuă cu selectarea sursei de date din partea de jos

E o idee bună să apăsăm butonul de preview din dialogul anterior pentru a ne

Datele trebuie unite înainte de Iar ulterior, cele două surse de

Din tabelul de modelare, adăugăm în workspace, conectat la ultimul

La dublu-clic pe nod, putem

•Algoritmul a fost supervizat (derivat din sursele de date de intrare). Întotdeauna un

S-ar putea să vă placă și