Bine ați venit la Scribd!

Săriți peste schemele de tip carusel

Stiinta Datelor

Încărcat de

Oana Tess

0% au considerat acest document util (0 voturi)

103 vizualizări2 pagini

doc

Titlu original

stiinta datelor

Drepturi de autor

Formate disponibile

DOCX, PDF, TXT sau citiți online pe Scribd

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Raportați acest document

doc

Drepturi de autor:

Formate disponibile

Descărcați ca DOCX, PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

0% au considerat acest document util (0 voturi)

103 vizualizări2 pagini

Stiinta Datelor

Încărcat de

Oana Tess

doc

Drepturi de autor:

Formate disponibile

Descărcați ca DOCX, PDF, TXT sau citiți online pe Scribd

Indicator pentru conținut neadecvat

Salt la pagina

Sunteți pe pagina 1din 2

Căutați în document

Sa presupunem ca sunteti o companie care incearca sa raspunda la urmatoarele intrebari:

- Care dintre oportunitatile viitoare au probabilitatea cea mai mare de a fi inchise cu succes?
- Care sunt cei mai importanti factori care duc la cresterea vanzarilor?
- In ce magazine ar trebui sa-mi desfasor noua campanie de marketing? Pe ce grupuri de clienti?
- Care e probabilitatea ca un anumit client sa-si reinnoiasca contractul?
- Care sunt clientii care in perioada urmatoare sunt cel mai probabili sa plece?

Pentru a raspunde la asemenea intrebari, de cele mai multe ori se analizeaza o serie de date istorice
(care provin de obicei din interactiunea cu utilizatorii unor aplicatii software) si se face o proiectie sau
pentru viitor. Astfel s-a nascut unul din cele mai cautate si bine platite joburi din IT in ultimii ani: Data
Scientist.

El e cel care analizeaza istoricul si e capabil sa gaseasca un algoritm care sa prezica viitorul. Exista de
multe ori confuzii in legatura cu responsabilitatile pe care le presupune rolul de Data Scientist, confuzii
care vin de cele mai multe ori din doua directii.

Prima este cea a abilitatilor si pregatirii necesare si aici vorbim despre un amalgam greu de gasit intr-o
singura persoana. Este nevoie de statistica si matematica (uneori la un nivel avansat), de programare (de
cele mai multe ori, R, Python, sau chiar Java/Scala), de cunostinte de machine learning (Clustering, k-NN,
Naive Bayes, SVM, Decision Forests), dar si de cunostinte avansate in contextul lucrului cu date:
interogare, prelucrare si vizualizare (SQL + Analytics + instrumente de vizualizare de genul D3.js).

Cea de-a doua sursa de confuzii vizeaza un alt concept foarte la moda in present si anume Big Data.
Conform Gartner, Big Data se refera la volum, viteza si varietate, toate in contextul datelor. In general
termenul de Big Data se foloseste cu referire la un volum foarte mare de date (TB sau PB), a caror
prelucrare si stocare presupune utilizarea unor sisteme care automatizeaza si permit realizarea in
paralel a sarcinilor de lucru.

Sursele Big Data sunt de cele mai multe ori Internet-ul, senzorii, logurile, etc. Data Scientist-ul va fi cel
care analizeaza acesti munti de date pentru a gasi corelatii, modele si algoritmi care pot fi folositi drept
suport decizional. Asadar Big Data se refera la stocare si procesare, in timp ce Data Science (in traducere
fortata stiinta datelor) va “intelege” datele respective.

Noțiuni introductive

Ca drept exemplu, am completat câteva căsuțe în dreptul limbajelor pe care le voi folosi în articole, în
funcție de interes, chef și gust.

Arie Subiect Din engleză C# Python Java R

Clasificarea datelor Classification

1
Arie Subiect Din engleză C# Python Java R

Regresii Regression

Random K-
Modelarea Grupare Means;
Clustering
problemelor K-Means cu ELKI Forgy K-
Means

Serii de timp Time series

de definit, multe capitole

Modelarea micro…
datelor de intrare
și de ieșire Ce înseamnă model de
învățare?

Evaluarea învățării

Învățarea în timp real

Învățarea în
inteligența
Învățare supravegheată
artificială
Învățare
nesupravegheată

Normalizarea
Normalizare de detaliat… Normalizing observațiilor
nominale

de definit, multe capitole

Vectori micro (exemplu: tipuri de
distanțe)…

de definit, multe capitole

Random
micro…

Erori de definit

Machine Learning de definit, multe capitole

S-ar putea să vă placă și

Lucrul cu baze de date
De la Everand
Lucrul cu baze de date
Nicolae Sfetcu
Încă nu există evaluări
Curs 1
Document27 pagini
Curs 1
Patricia Isabell
Încă nu există evaluări
Programa Scolara de A Intensiv IX
Document6 pagini
Programa Scolara de A Intensiv IX
costinel68
Încă nu există evaluări
Proiect Didactic 1
Document6 pagini
Proiect Didactic 1
alina_burlacu20027080
67% (3)
Proiect Unitate de Invatare
Document1 pagină
Proiect Unitate de Invatare
anon_93334437
Încă nu există evaluări
Etica
Document1 pagină
Etica
Oana Tess
Încă nu există evaluări
Ghid Studii Licenta 2019 - 2020 FEAA PDF
Document26 pagini
Ghid Studii Licenta 2019 - 2020 FEAA PDF
Oana Tess
100% (1)
Curs 7 Intro ML
Document37 pagini
Curs 7 Intro ML
Oana Drăgan
100% (1)
Curs 6
Document18 pagini
Curs 6
simona
Încă nu există evaluări
Curs Bac C++
Document4 pagini
Curs Bac C++
Andreea Bratu
Încă nu există evaluări
Informatica Clasa A Ix A Ciclul Inferior
Document6 pagini
Informatica Clasa A Ix A Ciclul Inferior
Soreanu Dumitru-Paul
100% (1)
Curs 1 SIA Introducere in AI
Document18 pagini
Curs 1 SIA Introducere in AI
Mihai Radu
Încă nu există evaluări
Teme Licenta Informatica Zi
Document6 pagini
Teme Licenta Informatica Zi
mmmaya
Încă nu există evaluări
Teme Licenta Informatica Zi
Document6 pagini
Teme Licenta Informatica Zi
ionut95rosv
Încă nu există evaluări
133 50 Teme Licenta Programare Avansata Si Baze de Date Zi 2
Document6 pagini
133 50 Teme Licenta Programare Avansata Si Baze de Date Zi 2
Mihaita Rosca
Încă nu există evaluări
Notite SBC
Document21 pagini
Notite SBC
Nguyen Mayorn
Încă nu există evaluări
HD Portofoliu Molnar Simona
Document27 pagini
HD Portofoliu Molnar Simona
Cristina Ciută-Ioniță
Încă nu există evaluări
SIAA
Document24 pagini
SIAA
ramonast
Încă nu există evaluări
Ia Rezumat
Document21 pagini
Ia Rezumat
Mircea Neag
Încă nu există evaluări
9 G info-planificare-SIMO
Document3 pagini
9 G info-planificare-SIMO
Cristina Ciută-Ioniță
Încă nu există evaluări
Crearea Unui Joc in Scratch
Document11 pagini
Crearea Unui Joc in Scratch
Aurel Nechiforel
Încă nu există evaluări
Programa Scolara Informatica Clasa A Ix A - 1
Document5 pagini
Programa Scolara Informatica Clasa A Ix A - 1
Cristina Ciuta
100% (2)
Evaluare Finala Calin Gabriela Seria 1 Grupa 2
Document12 pagini
Evaluare Finala Calin Gabriela Seria 1 Grupa 2
Bivol Victor
Încă nu există evaluări
Educația Digitală. Modulul Robotica
Document26 pagini
Educația Digitală. Modulul Robotica
vitalie98
Încă nu există evaluări
Programa Intensiv Informatică
Document2 pagini
Programa Intensiv Informatică
Matei Serban
Încă nu există evaluări
Curs FR - Unitatea de Invatare 1 PDF
Document29 pagini
Curs FR - Unitatea de Invatare 1 PDF
Mirel Bogdan
Încă nu există evaluări
Albu Rodica Si Negrea Ariadna - Algoritmi
Document29 pagini
Albu Rodica Si Negrea Ariadna - Algoritmi
Dana Oncioiu
Încă nu există evaluări
Cursuri Completate
Document66 pagini
Cursuri Completate
Ionut Alexandru
Încă nu există evaluări
Algoritmi Si Structuri de Date
Document84 pagini
Algoritmi Si Structuri de Date
Gina Mirzan
100% (1)
Planuri Invatamant IR Anul I
Document61 pagini
Planuri Invatamant IR Anul I
Wickedfruitz Wickedstep
Încă nu există evaluări
Proiect Balanici Olga
Document18 pagini
Proiect Balanici Olga
Olga Balanici
Încă nu există evaluări
8 Optional Programa Infogim
Document9 pagini
8 Optional Programa Infogim
Maria Gheorghe
Încă nu există evaluări
Curs 1
Document27 pagini
Curs 1
Ana Maria Cucu
Încă nu există evaluări
Modulul 3 Robotica Inteligentă
Document68 pagini
Modulul 3 Robotica Inteligentă
Vian Gob
Încă nu există evaluări
Huawei Quiz Cpe
Document2 pagini
Huawei Quiz Cpe
ScribdTranslations
Încă nu există evaluări
Cls IX-Planificare-matematică-informatică Intensiv Informatică-Laborator
Document5 pagini
Cls IX-Planificare-matematică-informatică Intensiv Informatică-Laborator
vasile neagu
Încă nu există evaluări
Proiect Didactic Informatica Prof. Abrudean Carmela
Document3 pagini
Proiect Didactic Informatica Prof. Abrudean Carmela
Douglas Schmidt
Încă nu există evaluări
Curs 00 OOP - Java - Tipuri de Date Fundamentale
Document38 pagini
Curs 00 OOP - Java - Tipuri de Date Fundamentale
Feri Veres
Încă nu există evaluări
Data Science DM
Document6 pagini
Data Science DM
Florin Cojocaru
Încă nu există evaluări
Programarea Calculatorului. Metode Și Tehnici de Programare În C++
Document282 pagini
Programarea Calculatorului. Metode Și Tehnici de Programare În C++
Colesnic Daniela
Încă nu există evaluări
Note de Curs IA
Document76 pagini
Note de Curs IA
Zăvadă Ted
Încă nu există evaluări
Sirbu Florin - Algoritmi de Recunoastere A Formelor Bazati Pe Retele Nuronale
Document17 pagini
Sirbu Florin - Algoritmi de Recunoastere A Formelor Bazati Pe Retele Nuronale
FlorinSîrbu
Încă nu există evaluări
Proiect Didactic
Document10 pagini
Proiect Didactic
Cristina Ioan
100% (1)
Algoritmi Si Programare
Document22 pagini
Algoritmi Si Programare
Cucu Constantin
Încă nu există evaluări
Informatica Teorie IX
Document3 pagini
Informatica Teorie IX
tovarasudsd
Încă nu există evaluări
Curs 1
Document14 pagini
Curs 1
Ana Maria Cucu
Încă nu există evaluări
Informatica Clasa 9
Document1 pagină
Informatica Clasa 9
DIANA
Încă nu există evaluări
Exemplu de Proiect Didactic de Lungă Durată Modificat CES
Document25 pagini
Exemplu de Proiect Didactic de Lungă Durată Modificat CES
Mariana Popa
Încă nu există evaluări
Informatica - Teorie - IX SN 2020 Februarie
Document3 pagini
Informatica - Teorie - IX SN 2020 Februarie
joiaugust
Încă nu există evaluări
Proiect de Lectie 9a Recapitulare Teza
Document3 pagini
Proiect de Lectie 9a Recapitulare Teza
Claudia Pietrareanu
Încă nu există evaluări
Plan de Lectie Si Sinteza Lectiei Aconi Gabriel
Document4 pagini
Plan de Lectie Si Sinteza Lectiei Aconi Gabriel
Bogdan radu
Încă nu există evaluări
SBC Cursurile 1-6
Document199 pagini
SBC Cursurile 1-6
Ionut Alexandru
Încă nu există evaluări
Lectia 3 4 Rom
Document29 pagini
Lectia 3 4 Rom
Ecaterina Basarab
Încă nu există evaluări
Plan de Lectie Informatica Clasa IX 2
Document5 pagini
Plan de Lectie Informatica Clasa IX 2
Toader Prangate
Încă nu există evaluări
Fisa Calcul Stiintific MFIC Ani Romana
Document4 pagini
Fisa Calcul Stiintific MFIC Ani Romana
Ion popescu
Încă nu există evaluări
Planificare Cls 9 Liceu
Document12 pagini
Planificare Cls 9 Liceu
Adina Trif
Încă nu există evaluări
Proiectul Unit Informatica Si Societatea, Algoritmi
Document2 pagini
Proiectul Unit Informatica Si Societatea, Algoritmi
managemet turceni
Încă nu există evaluări
Algoritmi Si Limbaje de Program Are
Document88 pagini
Algoritmi Si Limbaje de Program Are
Gopo Cosmo
100% (1)
IT & C, Volumul 2, Numărul 3, Septembrie 2023
De la Everand
IT & C, Volumul 2, Numărul 3, Septembrie 2023
Nicolae Sfetcu
Încă nu există evaluări
Întreţinerea şi repararea calculatoarelor
De la Everand
Întreţinerea şi repararea calculatoarelor
Nicolae Sfetcu
Încă nu există evaluări
Criterii
Document1 pagină
Criterii
Oana Tess
Încă nu există evaluări
Info
Document1 pagină
Info
Oana Tess
Încă nu există evaluări
GHIDVAR11aprilie PDF
Document193 pagini
GHIDVAR11aprilie PDF
Victoria Ioana Iordache
Încă nu există evaluări
Grades
Document1 pagină
Grades
Oana Tess
Încă nu există evaluări
Lege 82 Pe 1991
Document25 pagini
Lege 82 Pe 1991
culearazvan
Încă nu există evaluări
Research
Document1 pagină
Research
Oana Tess
Încă nu există evaluări
Programarea Restantelor Februarie 2020
Document44 pagini
Programarea Restantelor Februarie 2020
Oana Tess
Încă nu există evaluări
Rezultate Finale
Document1 pagină
Rezultate Finale
Oana Tess
Încă nu există evaluări
Buget Februarie 2020
Document141 pagini
Buget Februarie 2020
Oana Tess
Încă nu există evaluări
Programare Sustinere Proiect AF
Document2 pagini
Programare Sustinere Proiect AF
Oana Tess
Încă nu există evaluări
Fisa Discipl ManagEvenimente MP 2018 2019 PDF
Document5 pagini
Fisa Discipl ManagEvenimente MP 2018 2019 PDF
Oana Tess
Încă nu există evaluări
Buget Februarie 2018 Master - Liste Provizorii PDF
Document35 pagini
Buget Februarie 2018 Master - Liste Provizorii PDF
Oana Tess
Încă nu există evaluări
Note Exam
Document1 pagină
Note Exam
Oana Tess
Încă nu există evaluări
Programarea Sesiunii 20 Ian - 2 Feb 2020
Document25 pagini
Programarea Sesiunii 20 Ian - 2 Feb 2020
Oana Tess
Încă nu există evaluări
2019 Producator
Document1 pagină
2019 Producator
Oana Tess
Încă nu există evaluări
2 Marjacomercialasiadaosulcomercial Definitieformuladecalculstudiudecazanalizarev2 120316035713 Phpapp01 1
Document3 pagini
2 Marjacomercialasiadaosulcomercial Definitieformuladecalculstudiudecazanalizarev2 120316035713 Phpapp01 1
Oana Tess
Încă nu există evaluări
Anexa 1 - Declaratie Plagiat 2018 DISERTATIE
Document1 pagină
Anexa 1 - Declaratie Plagiat 2018 DISERTATIE
Oana Tess
Încă nu există evaluări
Fisa - Disciplina EconomieMRU
Document6 pagini
Fisa - Disciplina EconomieMRU
Oana Tess
Încă nu există evaluări
Instructiuni Completare Grile
Document2 pagini
Instructiuni Completare Grile
Oana Tess
Încă nu există evaluări
Formular Proiect ManagEvenim2018
Document7 pagini
Formular Proiect ManagEvenim2018
Oana Tess
Încă nu există evaluări
Fisa Discipl ManagEvenimente MP 2018 2019 PDF
Document5 pagini
Fisa Discipl ManagEvenimente MP 2018 2019 PDF
Oana Tess
Încă nu există evaluări
INSCRIERE DISERTATIE - Set1
Document6 pagini
INSCRIERE DISERTATIE - Set1
Oana Tess
Încă nu există evaluări
Duratamediedeincasareaclientilor
Document1 pagină
Duratamediedeincasareaclientilor
Oana Tess
Încă nu există evaluări
Legea Educatiei, Publicata in Monitorul Oficial
Document64 pagini
Legea Educatiei, Publicata in Monitorul Oficial
Iulian Baicus
100% (3)
FEAA Master Admitere Iulie 2019 Etapa1 Alfabetic PDF
Document11 pagini
FEAA Master Admitere Iulie 2019 Etapa1 Alfabetic PDF
Oana Tess
Încă nu există evaluări
Rbac
Document3 pagini
Rbac
Oana Tess
Încă nu există evaluări
Piata Si Concurenta
Document33 pagini
Piata Si Concurenta
Oana Tess
Încă nu există evaluări