Documente Academic
Documente Profesional
Documente Cultură
- o ipoteză alternativă
iar respingerea ipotezei nule se face folosind teste precum Testul t, Chi Square Test
și ANOVA.
Observaţie: Testul Chi Square este mai mult pentru variabilele categoriale, iar
testul t este mai mult pentru variabilele continue. Testul ANOVA este destinat
aplicațiilor complexe.
Analiza de regresie este utilizată pentru a identifica relațiile dintre două sau mai
multe variabile.
Regresiile pot fi
- regresii liniare
sau
- regresii neliniare.
Vizualizarea datelor este tehnica folosită pentru a comunica sau prezenta date
folosind
- grafice;
- diagrame;
- tablouri de bord.
Capitolul 1. Introducere în Analiza Datelor 11
Teoria ce Domeniul
stă la baza analizat/expertizat
Cercetarea
domeniulu statistică
i
li t Data
Science
Matematica Informatica
Machine Procesarea
Analiza de
Learning datelor
condiționalitat
e
Capitolul 1. Introducere în Analiza Datelor 12
Stabilire obiectiv/subobiective
Înțelegerea conceptului de
afacere analizată
Pregătirea datelor
- eliminarea outlieri-lor;
- completarea valorilor lipsă;
- normalizarea datelor;
- standardizarea datelor;
- centrarea datelor etc
Modelarea
Evaluarea rezultatelor
posibile
Implementarea practică
- este folosită pentru a extrage pattern-urile din date textuale (de tip text)
precum
o Twitter;
o postări pe blog;
o feedback-uri primite;
o etc.
- este cunoscută și sub denumirea de Data Mining Text.
- sarcinile de extragere a textului pot consta în
o clasificarea textului;
o gruparea (clusterizarea) textului;
o extragerea de entității;
o analitica textului (Text Analitycs) poate include
analiza sentimentelor (Sentiments Analysis)
marcare parțială a vorbirii;
recunoașterea entității de nume;
analiza legăturilor text.
Preprocesarea textului
(transformarea acestuia)
Învățare
Modelarea supervizată
propriu-zisă
(se cunosc valorile
- descoperirea modelelor;
- extragerea celordesemnificative;
variabilelor ieșire)
- organizarea cunoștințelor.
Validarea modelului
Capitolul 1. Introducere în Analiza Datelor 14
Evaluarea rezultatelor
Posibile/a performanțelor
Implementarea
practică/realizare aplicații
Capitolul 1. Introducere în Analiza Datelor 15
Unitățile de măsură
Parțialitatea informațiilor
Erorile
Capitolul 1. Introducere în Analiza Datelor 16
- reprezintă
o o succesiune de operații de prelucrare și interpretare
o operații efectuate asupra unor informații primare referitoare la
fenomene și procese din realitatea economico-socială
o bazate pe o mare varietate de metode și tehnici specifice
o în scopul
adâncirii cunoașterii comportamentului acestor
fenomene și procese
formulării unor concluzii cu privire la specificitatea
manifestării lor.
Activități:
• formularea ipotezelor cu privire la comportamentul fenomenului ce
constituie obiectul studiului;
• organizarea experimentelor necesare măsurării caracteristicilor
fenomenului studiat;
• culegerea datelor privind comportamentul fenomenului;
• analiza și interpretarea datelor disponibile;
• formularea concluziilor, efectuarea predicțiilor și luarea deciziilor.
Un ciclu de utilizare a Data mining, presupune parcurgerea a patru etape:
Capitolul 1. Introducere în Analiza Datelor 17
Data
mining
Oportunitate Decizie şi
de afaceri acţiune
Evaluare
rezultate
Capitolul 1. Introducere în Analiza Datelor 18
Tabelul 1.1.
Capitolul 1. Introducere în Analiza Datelor 19
Tabelul 1.2.