Documente Academic
Documente Profesional
Documente Cultură
2
STRUCTURĂ
Covarianța
Corelația
Aplicații
3
ASOCIEREA DINTRE DOUĂ VARIABILE
MODURI DE REZUMAREA
DATELOR
X: venitul lunar
Întrebări:
II I
y = 51
III IV
INTERPRETARE
(xi -x ̄)(yi - y ̄) < 0 x=3 (xi -x ̄)(yi - y ̄) > 0
II I
y = 51
III IV
Desigur, dacă punctele sunt distribuite oarecum în mod egal între cele
patru cadrane, covarianța va fi aproape de 0; nu vom vedea relație de
asociere între cele două variabile
LIMITE ALE COVARIANȚEI
dar și când
Source: http://www.tylervigen.com/spurious-correlations
Conceptul de “BIG DATA” si
corelatiile
BIG DATA
Seturi mari de date care
pot fi analizate
computațional pentru a
dezvălui trend-uri, tipare
și asociații, în special
legate de comportamentul
uman si interacțiuni
Se poate referi la toată Toate companiile care își
informația pe care cineva o
înregistrează ”în scopul doresc să se dezvolte / au
îmbunătățirii serviciilor” sale. ceva de vanzare
Include analiza informațiilor -> folosesc BIG DATA.
offline și online.
Ex. Google
Conceptul de “BIG DATA” si
corelatiile
Am fost învățați și ne-am obișnuit că efectul este determinat de o cauză,
motiv pentru care în mod natural suntem tentați să aflăm "de ce?".
În lumea Big Data corelația devine mai importantă decât cauzalitatea.
Exemplu: Amazon
Printr-un algoritm intitulat "item-to-item collaborative filtering" dezvoltat de
către Amazon, recomandările se fac în mod complet automatizat, dinamic și
cu un impact masiv în vânzări (1/3 din veniturile generate de comerțul
electronic provenind din recomandările automate).
Amazon nu vrea să știe de ce clienții care cumpără "The Lord of the Rings" de
J. R. R. Tolkien sunt interesați să cumpere și "Friendship and the Moral Life"
de Paul J. Wadell, însă ce-i interesează este că există o corelație puternică
între aceste două titluri, iar aceast fapt le va genera venituri de trei ori mai
mari decât în lipsa unui astfel de sistem.
Sursa: https://www.todaysoftmag.ro/article/388/big-data-big-confusion
PE DATA VIITOARE!