Sunteți pe pagina 1din 16

ANALIZA PREDICTIVĂ

Scopul și motivația

Analiza predictivă este un set de tehnologii de business


intelligence (BI) care descoperă diferite relații și tipare în cadrul unor volume
mari de date care sunt utilizate pentru a prezice comportamentul sau
evenimentele. Spre deosebire de alte tehnologii de business intelligence,
analiza predictivă este orientată spre viitor, folosind evenimente din trecut
pentru a anticipa viitorul.
Analiza predictivă are ca scop identificarea rezultatelor viitoare
pe baza datelor istorice cu ajutorul algoritmilor statistici și a tehnicilor de
învățare automată. Scopul acesteia este de a oferi o evaluarea cât mai bună a
ceea ce se va întâmpla în viitor. Analiza predictivă este o ramură a analizei
avansate care este utilizată pentru a face predicții despre evenimentele
viitoare necunoscute.
Utilizarea analizei predictivă
Domenii în care analiza predictivă este foarte utilă:
Data analysis și data analytics tind să fie utilizate în mod interschimbabil. Data analysis se
referă la procesul de examinare detaliată a componentelor unui set de date și studierea părților
individual și a relațiilor între ele, în timp ce data analytics este un termen mai larg ce acoperă o
gamă largă de metode. Este percepută ca o disciplină care cuprinde gestionarea completă a datelor,
inclusiv colectarea, curățarea, organizarea, stocarea, guvernarea și analiza lor. Astfel, putem afirma
faptul că una dintre cele mai importante diferențe între acestea este că data analysis este un proces,
iar data analytics este o disciplină generală. Ambele sunt folosite pentru a descoperi modele,
tendințe și anomalii care se află în cadrul datelor oferind informații ce permit luarea unor decizii.

Data Analysis Data Analytics


Comparații

5
Analiză descriptivă, Analiză predictivă,
Analiză prescriptivă

Analiza descriptivă formează nucleul raportării de zi cu zi în multe afaceri. Rapoartele anuale de venituri sunt un
exemplu clasic de analiză descriptivă, împreună cu alte rapoarte, cum ar fi datele de inventar, depozitare și vânzări, care pot fi
agregate cu ușurință și oferă o imagine clară a operațiunilor unei companii. În timp ce datele descriptive pot fi utile pentru a
identifica rapid tendințele și modelele, analiza are limitări. Privită izolat, este posibil ca analiza descriptivă să nu ofere
imaginea completă.

În timp ce analiza predictivă arată companiilor rezultatele brute ale


Analiza predictivă este o metodă acțiunilor lor potențiale, analiza prescriptivă arată companiilor care opțiune
mai avansată de analiză a datelor care este cea mai bună. Acest lucru se realizează prin colectarea datelor dintr-o
utilizează probabilitățile pentru a face serie de surse descriptive și predictive și aplicarea acestora în procesul de
evaluări a ceea ce s-ar putea întâmpla în luare a deciziilor. Algoritmii creează apoi și recreează posibile modele de
viitor. Pentru a face predicții, algoritmii de decizie care ar putea afecta o organizație în moduri diferite. Ceea ce face ca
învățare automată preiau datele existente și analiza prescriptivă să fie deosebit de valoroasă este capacitatea lor de a
încearcă să completeze datele lipsă cu cele
măsura repercusiunile unei decizii pe baza diferitelor scenarii viitoare și apoi
mai bune presupuneri posibile.
de a recomanda cel mai bun curs de acțiune pentru a atinge obiectivele unei
companii.
Tehnicile utilizate în analiza
1
predictivă
Arbori de decizie 2
Dacă doriți să înțelegeți ce Regresia
duce la deciziile cuiva, atunci s-ar 3
putea să găsiți folositori arborii de Acesta este modelul cel mai
decizie. Acest tip de model utilizat în analiza statistică. Rețele neuronale
plasează datele în diferite secțiuni Utilizați-l atunci când doriți să
pe baza anumitor variabile, cum ar determinați modele în seturi mari Rețelele neuronale au fost
fi prețul sau capitalizarea bursieră. de date și când există o relație dezvoltate ca o formă de analiză
liniară între intrări. Această metodă predictivă prin imitarea modului în care
Așa cum sugerează și numele,
funcționează prin descoperirea funcționează creierul uman. Acest model
arată ca un copac cu ramuri și
unei formule, care reprezintă poate face față relațiilor complexe de
frunze individuale. Ramurile indică
relația dintre toate intrările găsite date folosind inteligența artificială și
opțiunile disponibile, în timp ce în setul de date. De exemplu, puteți
frunzele individuale reprezintă o recunoașterea modelelor. Folosiți-l dacă
utiliza regresia pentru a afla cum
anumită decizie. aveți mai multe obstacole pe care trebuie
prețul și alți factori cheie pot
să le depășiți, cum ar fi atunci când aveți
modela performanța.
prea multe date la îndemână, când nu
aveți formula de care aveți nevoie pentru
a vă ajuta să găsiți o relație între intrările
și ieșirile din setul dvs
Beneficiile Analizei Predictive

Există numeroase beneficii în utilizarea analizei predictive. După cum s-a menționat mai sus, utilizarea
acestui tip de analiză poate ajuta entitățile atunci când trebuie să faceți predicții despre rezultate.
Investitorii, profesioniștii financiari și liderii de afaceri pot folosi modele pentru a ajuta la reducerea
riscului. De exemplu, un investitor și consilierul lor pot folosi anumite modele pentru a ajuta la elaborarea unui
portofoliu de investiții cu risc minim pentru investitor, luând în considerare anumiți factori, cum ar fi vârsta,
capitalul și obiectivele.
Există un impact semnificativ asupra reducerii costurilor atunci când sunt utilizate modele. Companiile
pot determina probabilitatea de succes sau eșec al unui produs înainte de a fi lansat. Sau pot rezerva capital
pentru îmbunătățirea producției folosind tehnici predictive înainte de începerea procesului de fabricație.
Critica Analizei Predictive

Utilizarea analizei predictive a fost criticată și, în unele cazuri, restricționată din punct de vedere legal
din cauza inechităților percepute în rezultatele sale. Cel mai frecvent, aceasta implică modele predictive care au
ca rezultat discriminarea statistică împotriva grupurilor rasiale sau etnice în domenii precum evaluarea
creditului, împrumutul pentru locuințe, angajarea sau riscul de comportament criminal.
Netflix & Analiza predictivă

Cum folosește Netflix analiza predictivă?


Colectarea datelor este foarte importantă pentru o companie precum Netflix. Colectează date de la clienții săi pe baza
comportamentului lor și a modelelor de vizionare anterioare. Folosește informații și face predicții pentru a face recomandări pe
baza preferințelor lor. Aceasta este baza din spatele listelor „Pentru că ai urmărit...” pe care le vei găsi în abonament.
Care sunt cei trei piloni ai analizei datelor?
Există trei piloni pentru analiza datelor. Acestea sunt nevoile entității care utilizează modelele, datele și tehnologia
utilizate pentru a le studia, precum și acțiunile și perspectivele care vin ca urmare a utilizării acestui tip de analiză. Recapitulam
ideea principala: Analiza predictivă utilizează date istorice pentru a prezice evenimente viitoare. De obicei, datele istorice sunt
folosite pentru a construi un model matematic care surprinde tendințele importante. Acest model predictiv este apoi utilizat pe
datele curente pentru a prezice ce se va întâmpla în continuare sau pentru a sugera acțiuni de întreprins pentru rezultate optime.
Analiza predictivă este adesea discutată în contextul datelor mari, datele de inginerie, de exemplu, provin de la senzori,
instrumente și sisteme conectate din lume.
Exemple specifice metodelor
de Analiză Predictivă

• Aerospațial – Monitorizarea stării motorului aeronavei


• Producția de energie – Prognoza prețului și a cererii de energie electrică
• Servicii financiare – Dezvoltarea modelelor de risc de credit
• Automatizări industriale și mașini – Predicția defecțiunilor mașinii
• Dispozitive medicale – Utilizarea algoritmilor de detectare a modelelor pentru a identifica astmul
Modele specifice Analizei
1
Predictive
Model de clasificare 2
Modelul de clasificare este,
în anumite privințe, cel mai simplu Modelul de clusterizare 3
dintre cele mai multe tipuri de
Modelul de grupare sortează Model de prognoză
modele de analiză predictivă pe
datele în grupuri inteligente separate,
care le vom acoperi. Pune datele în Unul dintre cele mai utilizate
imbricate, pe baza atributelor
categorii în funcție de ceea ce modele de analiză predictivă, modelul de
similare. Dacă o companie de pantofi
învață din datele istorice. prognoză se ocupă de predicția valorii
de comerț electronic urmărește să
metrice, estimând valoarea numerică
Modelele de clasificare sunt implementeze campanii de marketing
pentru date noi pe baza învățării din
cele mai bune pentru a răspunde la direcționate pentru clienții lor, ar
datele istorice. Acest model poate fi
întrebările da sau nu, oferind o putea trece prin sutele de mii de
aplicat oriunde sunt disponibile date
analiză amplă care este utilă pentru înregistrări pentru a crea o strategie
numerice istorice. Scenariile includ: O
a ghida acțiuni decisive. Aceste personalizată pentru fiecare individ.
companie poate estima câți clienți ar
modele pot răspunde la întrebări Dar este aceasta cea mai eficientă
putea converti într-o anumită săptămână.
precum: utilizare a timpului? Probabil ca nu.
Folosind modelul de grupare, aceștia
Pentru un comerciant cu pot separa rapid clienții în grupuri
amănuntul, „Este acest client pe similare pe baza caracteristicilor
cale să abandoneze?” comune și pot concepe strategii
pentru fiecare grup la o scară mai
mare.
Analiza decizională în condiții de risc

Algoritmi predictivi comuni


În general, algoritmii de analiză predictivă pot fi separați în două grupuri: învățarea automată și
învățarea profundă. Învățarea automată implică date structurale pe care le vedem într-un tabel. Algoritmii
pentru aceasta cuprind atât varietăți liniare, cât și neliniare. Cu modelarea predictivă a învățării automate,
există mai mulți algoritmi diferiți care pot fi aplicați.
Exemple: Random Forest, Gradient Boosted (GBM), K-Means
Random Forest

Random Forest este probabil cel mai popular algoritm, capabil atât de clasificare, cât și de
regresie. Poate clasifica cu precizie volume mari de date.
Numele „Random Forest” este derivat din faptul că algoritmul este o combinație de arbori de
decizie. Fiecare copac depinde de valorile unui vector aleatoriu eșantionat independent, cu aceeași
distribuție pentru toți copacii din „pădure”. Fiecare este crescut în cea mai mare măsură posibilă.
Algoritmii de analiză predictivă încearcă să obțină cea mai mică eroare posibilă fie folosind
„boosting” (o tehnică care ajustează greutatea unei observații pe baza ultimei clasificări) fie „bagging”
(care creează subseturi de date din eșantioane de antrenament, alese aleatoriu cu înlocuire). Dacă aveți o
mulțime de date eșantion, în loc să vă antrenați cu toate, puteți să luați un subset și să vă antrenați cu
privire la el și să luați un alt subset și să vă antrenați pe acesta (suprapunerea este permisă).
Concluzii
Mulțumesc!

16

S-ar putea să vă placă și