Documente Academic
Documente Profesional
Documente Cultură
volumelor
mari de date
NOTE DE CURS
Analiza volumelor mari
de date
Volum Varietate
Viteza Veridicitate
Stocarea pe coloane:
– datele sunt stocate în celule grupate pe coloane.
Aceste coloane sunt grupate logic în familii de
coloane.
– Exemple de sisteme NoSQL orientate pe coloane
sunt: Hadoop / HBase, Cassandra, Hypertable,
Accumulo, Amazon Simple DB, Cloudata,
Cloudera
Stocarea datelor NOSQL
ID Carti publicate
ID Nume ID Email 121 C1
121 Ionescu 121 i@gmail.com 121 C2
123 Pop 121 i@yahoo.com ... ...
124 Popa 123 p1@gmail.com 124 C2
124 p2@ymail.com 124 C4
Stocarea datelor NOSQL
Cheie Valoare
010101010 … … … … …
Inregistrari
010101011 … … … … …
… … … … … …
Stocarea datelor NOSQL
user/mark.smith@aol.com.12/10/1988 user/john.henny@aol.com.12/10/1971
user/mark.smith@aol.com.2004567 user/john.henny@aol.com.2003498
user/mark.smith@aol.com.651-345-1234 user/john.henny@aol.com.672-345-1234
user/mark.smith@aol.com.mark user/john.henny@aol.com.john
user/mark.smith@aol.com.smith user/john.henny@aol.com.henny
P1 P2 P3 P4 P5 P6
Partiții
Stocarea datelor NOSQL
{ "firstName": "John",
"lastName": "Smith",
"age": 25,
"address": { "streetAddress": "21 2nd Street", "city": "New
York", "state": "NY", "postalCode": "10021-3100" },
"phoneNumbers": [ { "type": "home", "number": "212 555-
1234" }, { "type": "office“, "number": "646 555-4567" } ],
"children": [],
"spouse": null }
Stocarea datelor NOSQL
Ionescu 121 C1
122 C2
Pop
C3
Popa 123
C4
Concluzii