Sunteți pe pagina 1din 16

Conceptul Big Data i oportunitile pentru afaceri

Stanciu Valentin Gabriel Grupa 1068 A

Bigdata = "Datele pstrate i prelucrate n cantiti imense, datorit unor medii de stocare
mai ieftine, unor metode de procesare mai rapide i unor algoritmi mai performani"
definiia din - Big Data: A revolution that will transform how we live - de Viktor MayerSchnberger i Kenneth Cukier.
Big Data a devenit o problem n afaceri, sau cel puin o problem pe care oamenii de
afaceri incep s o contientizeze. Presa ncepe s aloce din ce n ce mai mult spaiu acestui
subiect. Pornind cu Wall Street Journal "Companiile sunt inundate cu date" (Companies
are being inundated with data") la Financial Times "Din ce n ce n afaceri sunt aplicate
analize din mass-media, cum ar fi Facebook i Twitter" ("Increasingly businesses are
applying analytics to social media such as Facebook and Twitter"), Forbes "Big Date a
ajuns la Seton Health Care Family" ("Big Data has arrived at Seton Health Care
Family"). De ce attea articole pe aceasta tem? Deoarece Big Data are potenialul de a
afecta profund modul in care facem afaceri i chiar modul de a tri.

Big Data are 4 caracteristici principale.


Prima caracteristic este VOLUMUL.
Da, volumul de date este n cretere. Experii prezic c volumul de date din lume, va crete
la 25 de Zettabytes n 2020. Acelai fenomen afecteaz fiecare companie - datele sunt n
cretere la aceeai rat exponenial. Dar nu este numai volumul de date care este n
cretere, numrul de surse de date este de asemenea n cretere.

A doua caracteristic este VITEZA.


Datele se creeaz la viteze din ce n ce mai mari. Companiile i mut aplicaiile de la
aplicaii de tip "batch" la aplicaii n timp real. i cerinele de afaceri au crescut la fel - de
la rspunsuri sptmna viitoare sau mine la un rspuns ntr-un minut sau la secund. i
lumea este, de asemenea, din ce n ce mai instrumentat i interconectat. Volumul de date
de streaming de pe aceste instrumente este exponenial mai mare dect a fost chiar cu 2 ani
n urm.
A treia caracteristic este VARIETATEA datelor
Varietatea datelor prezint o provocare la fel de dificil. Creterea surselor de date a
alimentat i creterea tipurilor de date. De fapt, 80% din datele generate n lume sunt date
nestructurate. Cu toate acestea, metodele tradiionale de analiz se aplic numai la
informaii structurate.
A patra caracteristic este VERIDICITATEA datelor.
Cum se poate aciona pe baza acestor informaii, dac nu sunt de ncredere. Stabilirea
ncrederii n datele pe care le folosete orice companie reprezint o provocare uria odat
cu creterea surselor i tipurilor de date.
Un alt motiv pentru care Big Data este un subiect fierbinte astzi este noua tehnologie care
permite unei organizaii s beneficieze de resursele interne de date. Ceea ce este nou, este
tehnologia pentru a procesa i analiza aceste date la volumul i viteza dorit. Scopul
tehnologiei Big Data este s analizeze toate datele disponibile, eficient din punct de vedere
costuri. Orice date, aa cum sunt. Se pot analiza date structurate, video, audio, date spaiale
sau orice tip de date.
Datele pot veni de la sistemele noastre tradiionale - sisteme de facturare, sisteme ERP,
sisteme CRM. De asemenea, vin de la maini - de la etichetele RFID, senzori, comutatoare
de reea. i datele vin de la oameni - site-ul web, social media, etc. Acest lucru face foarte
dificil analiza datelor sociale - extragerea ideilor de coninut n mare parte sub form de
text ntr-un timp foarte scurt.
Conceptul de Big Data este in prim-planul temelor actuale in cele mai multe cercuri de IT.
Intelegerea conceptului de Big Data, la fel ca orice alta tehnologie in curs de dezvoltare ,
necesita mai intai ca acesta sa fie definit. In timp ce definitia este doar inceputul
conversatiei, in cele din urma, valoarea pe care o promite Big Data este ceea ce face acest
concept atat de interesant si demn de atentie. Capacitatea de a utiliza Big Data pentru a
conduce la rezultate mai bune in afaceri face ca acesta sa fie foarte atractiv.

Este n general acceptat faptul c datele mari pot fi explicate n conformitate cu cei trei V:
Velocity, Variety i Volum. Intr-un raport de cercetare 2001, META Group (acum Gartner),
analistul Doug Laney a definit cantiata de date ca fiind foarte mare ca fiind tridimensional, i anume creterea volumului (cantitatea de date), viteza (viteza de date i n
afar) i varietatea (gama de tipuri de date i surse). Mai trziu, n 2012, Gartner a
actualizat definiia de date mari ca volum mare, viteza mare, mare varietate. Cu toate c nu
doresc s diminueze importana definiiei de Gartner, cred c datele mari pot fi explicate
mai bine prin adugarea de alte cteva V-uri. Acestea V-uri explica aspecte importante ale
datelor mari i o strategie de date de mare pe care organizaia nu poate ignora. S ne uitm
la aceste V i pentru caracterul complet, de asemenea, s mai menionm o dat comun
cunoscut lui V:

Vitez
Viteza este viteza cu care se creeaz date, stocate, analizate i vizualizate. In trecut, atunci
cnd prelucrarea lot era o practic obinuit, era normal s primeasc o actualizare din
baza de date n fiecare noapte sau chiar n fiecare sptmn. Calculatoare i servere
nevoie de timp substaniale pentru a procesa datele i s actualizeze bazele de date. n
epoca mare de date, datele sunt create n timp real sau aproape n timp real.
Odat cu disponibilitatea dispozitivelor conectate la internet, wireless sau cu fir, maini i
dispozitive pot trece pe datele lor n momentul n care este creat.
Viteza la care datele sunt create n prezent este aproape de neimaginat: In fiecare minut
vom ncrca 100 de ore de video de pe Youtube. n plus, n fiecare minut peste 200 de
milioane de email-uri sunt trimise, n jur de 20 de milioane de fotografii: sunt vizualizate i
ncrcate pe Flickr 30.000, aproape de tweet-uri sunt trimise 300.000 i sunt realizate
aproape 2,5 milioane de interogri pe Google.
Provocarea Organizaiile trebuie s se fac fa cu viteza enorm de date este creat i
utilizat n timp real.
Volum
90% din toate datele create vreodata, a fost creat n ultimii 2 ani. De acum ncolo,
cantitatea de date din lume se va dubla la fiecare doi ani. Pn n 2020, vom avea de 50 de
ori mai mare dect cantitatea de date ca i pe care am avut-o n 2011. Volumul mare de
date este enorm i un factor care contribuie foarte mare pentru universul digital de
expansiune vreodat este internetul obiectelor cu senzori peste tot n lume, n toate
dispozitivele de creare de date n fiecare secund. Era de un trilion de senzori este peste
noi.
Dac ne uitm la avioane, ele genereaz aproximativ 2,5 miliarde de terabyte de date n
fiecare an de la senzorii instalai n motoarele mainii de conducere auto-2 va genera
Petaoctet de date n fiecare an. De asemenea, industria agricol genereaz cantiti masive
de date cu senzori instalate pe tractoare. Shell a utilizeaz senzori de super-sensibile pentru
a gsi uleiul suplimentare n puuri i n cazul n care instaleaz aceti senzori la toate
10.000 de puuri vor colecta aproximativ 10 Exabyte de date anual. Din nou, c este
absolut nimic, dac vom compara cu Piaa Kilometrul Array Telescopul, care va genera 1
Exabyte de date pe zi.
In trecut, crearea att de multe date ar fi cauzat probleme serioase. In zilele noastre, cu
costuri de depozitare n scdere, soluii de stocare mai bune, cum ar fi Hadoop i algoritmi
pentru a crea semnificaii din toate c datele nu este deloc o problem.

Varietate
In trecut, toate datele care au fost create au fost structurate pe date, frumos montate n
coloane i rnduri, dar acele zile s-au terminat. n prezent, 90% din datele care sunt
generate de organizaie sunt date nestructurate. Astazi datele vin in mai multe formate
diferite: date structurate, date semi-structurate, nestructurate de date i a datelor structurate
chiar complexe. Varietatea larg de date necesit o abordare diferit, precum i tehnici
diferite pentru a stoca toate datele brute.
Exist mai multe tipuri diferite de date i fiecare dintre aceste tipuri de date necesit
diferite tipuri de analiza sau de diferite instrumente pentru a utiliza. Social media, cum ar fi
Facebook sau posturi pot da tweeturi perspective diferite, cum ar fi analiza sentimentelor
pe brand-ul, n timp ce datele senzoriale v va oferi informaii despre modul n care un
produs este folosit i ce greelile sunt.
Acum, cci contextul este stabilit n ceea ce privete tradiionale V-uri, s vedem care
celuilalt V sunt importante pentru organizaiile s pstreze n minte atunci cnd acestea
dezvolta o strategie de date de mare.
Veredicitate
Avnd o mulime de date n diferite volume venind n vitez mare, acestea sunt lipsite de
valoare n cazul n care datele sunt incorecte. Datele incorecte pot provoca o mulime de
probleme pentru organizaii, ct i pentru consumatori. Prin urmare, organizaiile trebuie s
se asigure c datele sunt corecte, precum i analizele efectuate asupra datelor sunt corecte.
Mai ales n automatizat de luare a deciziilor, n cazul n care nici un om nu mai este
implicat, trebuie s fie sigur c att datele i analizele sunt corecte.

Variabilitate
Multimea de date este mare si este extrem de variabil. Brian Hopkins, un analist principal
la Forrester, definete variabilitatea ca "variaia n sens, n lexicon". El se refer la
supercomputerul Watson, care a ctigat Jeopardy. Supercomputerul a trebuit s "disece un
rspuns n sensul su i [...] s dau seama ce intrebarea corecta era". Acest lucru este
extrem de dificil, deoarece cuvintele au sensuri diferite, iar totul depinde de context. Pentru
rspunsul corect, Watson a trebuit s neleag contextul.
Variabilitatea este adesea confundata cu o varietate. S presupunem c avei produse de
panificaie care vinde 10 pine diferite. Acum, imaginai-v c mergei la acea brutrie trei

zile la rnd i n fiecare zi cumperi acelai tip de pine, dar n fiecare zi are un gust si
miroase diferit. Aceasta este variabilitatea.
Variabilitatea este, prin urmare, foarte relevanta n efectuarea analizelor s. Variabilitatea
nseamn c sensul se schimb (rapid). n (aproape) aceleai tweet-uri, un cuvnt poate
avea un sens total diferit. n scopul de a realiza un sentiment adecvat de analize, algoritmii
trebuie s fie capabili de a nelege contextul i s fie capabili de a descifra sensul exact al
unui cuvnt n acest context. Acest lucru este nc foarte dificil.
Vizualizarea
Aceasta este partea cea mai grea a datelor mari. Ceea ce face tot ce cantitate mare de date
uor de neles ntr-un mod care este uor de neles i de citit. Cu analizele corecte i
vizualizrile, datele brute pot fi folosite date altfel brute rmne n esen inutil.
Vizualizrilor, desigur, nu nseamn grafice obinuite sau diagrame plcint. Ele nseamn
grafice complexe, care pot include mai multe variabile de date n timp ce nc rmase de
neles i uor de citit.
Vizualiznd s-ar putea s nu fie cea mai dificil parte tehnologic; este sigur c este partea
cea mai dificil. A spune o poveste complex ntr-un grafic este foarte dificil, dar, de
asemenea, extrem de important. Din fericire, exist mai multe startup-uri mari de date care
apar care se concentreaz asupra acestui aspect i, n cele din urm, vizualizrilor va face
diferena. Una dintre ele este n viitor acest lucru va fi direcia de a merge, n cazul n care
vizualizrile ajuta organizaiile s rspund la ntrebri care nu au tiut s cear.
Valoarea
Toate c datele disponibile vor crea o mulime de valoare pentru organizaii, societi i
consumatori. Date de mare nseamn o afacere mare i fiecare industrie vor beneficia de
avantajele de date mari. McKinsey afirm c potenialul valorii anuale de date mari la
Health Care SUA este de 300 miliarde $, mai mult dect dublu cheltuielile totale anuale de
ingrijire a sanatatii din Spania. De asemenea, ei menioneaz c datele de mare are o
valoare anual potenial de 250 de miliarde pentru administraia sectorului public al
Europei. Chiar mai mult, n raportul lor bine privit din 2011, acestea afirm c surplusul
potenial anual de consum de la utilizarea datelor de localizare cu caracter personal la nivel
global poate fi de pn la 600 miliarde $ n 2020. Aceasta este o mulime de valoare.
Desigur, datele n sine nu sunt valoroase deloc. Valoarea este n analizele efectuate pe
aceste date i modul n care datele sunt transformate n informaii i n cele din urm de
cotitur n cunoatere. Valoarea este n modul n care organizaiile vor folosi datele i s
transforme organizaia lor ntr-o companie de informaii centrice care se bazeaz pe
perspective derivate din analizele de date pentru procesul de luare a deciziilor.

Ce promite Big Data?

Diferite sisteme stocheaza datele in diferite formate, chiar si in cadrul aceleiasi companii,
ceea ce face dificil agregarea datelor pentru analiza. Ca urmare, investitiile unei organizatii
in date, unul dintre activele sale cele mai de valoarea, nu sunt utilizate in totalitate.
Cresterea gradului de constientizare a valorii dobandite prin analiza datelor intr-un context
geografic duce la dorinta de a descoperi tipare si relatii bazate pe locatie in Big Data care
permit luarea de decizii informate pentru rezultate mai bune in afaceri.

Cine utilizeaza vizualizarea geospatiala si Big Data?

Analistii GIS: Tehnologiile Big Data ofera acces la date nestructurate, generate de aparate,
generate pe web, si date NoSQL. Vizualizarea pe harta si analiza acestor date pot dezvalui
modele si tendinte, care sunt dincolo de capacitatile bazelor de date traditionale, foilor de
calcul si fisierelor. Accesul la mai multe tipuri de date poate rafina, de asemenea, analize
existente care rezulta in o mai mare incredere in deciziile de afaceri.

Utilizatorii non-GIS: analisti de afaceri, cercetatori si oamenii de stiinta beneficiaza de


vizualizarea pe harta si analiza. Oricine este interesat de crearea de informatii din Big Data
si de alte aplicatii de afaceri de tip enterprise poate obtine perspective valoroase prin
expunerea si exploatarea dimensiunii geografice a acestor date folosind hartile ca
instrument de vizualizare. Organizarea datelor in functie de locatie ofera, de asemenea,
acces la alte date cu referinta spatiala, cum ar fi extensia Esri Business Analyst, care
imbogateste si mai mult analiza datelor, imbunatateste colaborarea si permite un proces de
luare a deciziilor mai riguros.

Ce este unic despre Big Data?


Companiile s-au cutat de zeci de ani pentru a face cea mai bun utilizare a informaiilor
pentru a mbunti capacitile lor de afaceri. Cu toate acestea, este structura (sau lipsa
acesteia) i dimensiunea mare de date pe care o face att de unic. Big Data este de
asemenea special, deoarece reprezint att informaii semnificative - care pot deschide ui
noi - i modul n care aceste informaii sunt analizate pentru a ajuta la deschiderea acestor
ui. Analiza a merge mn n mn cu informaii, astfel nct n acest sens "Big Data"
reprezinta un substantiv - "date" - si un verb - ". Pieptnarea datelelor pentru a gsi o
valoare"
Zilele de pstrare a datelor companiei n documentele Microsoft Office de pe fiiere
partajate organizate cu atenie i sunt n spatele nostru, la fel ca epoca apusa de a naviga
peste ocean n nave mici. Aceast cot de fiier de 50 gigabytes n 2002 pare destul de
mica n comparaie cu o baz de date de marketing 50 Tb moderne ce conine preferinele
clienilor i obiceiurile. Cum putem s gasim, eventual, prin tot ceea ce materialul pentru a
identifica tendinele ce sugereaz n ce fel gusturile consumatorilor sunt conduse sau ce
clima schimbri au loc? Asta e n cazul n care procesul de interpretare vine.

Cum ne putem folosi de Big Data?


Interpretarea Big Data poate aduce perspective care ar putea s nu fie vizibile imediat sau
care ar fi imposibil de gsit folosind metode tradiionale. Acest proces se concentreaz pe
gsirea de fire de ascunse, tendine sau tipare care pot fi invizibile cu ochiul liber. Ei bine,
este nevoie de noi tehnologii i abiliti pentru a analiza fluxului de material i s trag
concluzii.

Apache Hadoop este o astfel de tehnologie, i este, n general, software-ul cel mai frecvent
asociat cu Big Data. Apache l numete "un cadru care s permit prelucrarea distribuit a
seturilor de date mari ntre grupuri de calculatoare care folosesc modele de programare
simple." La fel ca i Big Data poate fi att un substantiv i un verb, Hadoop implic ceva
care este si ceva care face - n mod specific, de stocare a datelor i de prelucrare a datelor.
Ambele au loc ntr-o manier distribuit pentru a mbunti eficiena i rezultatele. Un set
de sarcini cunoscute sub numele de MapReduce coordoneaz prelucrarea datelor n diferite
segmente ale cluster-ului, apoi descompune rezultatele la buci mai uor de gestionat, care
sunt prezentate pe scurt.

Hadoop este open-source i exist variante de produse de muli furnizori diferii, cum ar fi
Cloudera, Hortonworks, MapR i Amazon. Exist, de asemenea, alte produse, cum ar
HPCC i servicii bazate pe cloud, cum ar fi Google BigQuery.

Abilitile sunt aduse la masa de oamenii de stiinta Big Data, care obtin valoare de afaceri
de la o multitudine de informaii prin ao analiza sensului i tendine. Acest lucru necesit o
expertiz matematic i statistic precum i creative, de comunicare, de rezolvare a
problemelor i abiliti de afaceri, ceea ce face un rol foarte complex, dar incredibil de
valoroase. Noi domenii s-au dezvoltat pentru a instrui pentru aceast cale de carier n
expansiune, i exist o multitudine de sfaturi pentru cei care aspir s intre n industria Big
Data - care este de ateptat s vad o cretere de locuri de munc de 500 la sut din
ianuarie 2012 pn ianuarie 2014, n conformitate cu ntr-adevr. com.

Un un exemplu de modul n care Big Data a venit la ndemn


In toamna anului 2012, Wall Street Journal a publicat un articol care descrie modul n care
Netflix foloseste Big Data pentru a construi serviciul lor de streaming video. Ei au fost
capabili s analizeze detaliile de trafic pentru diverse dispozitive, zone cu probleme la faa
locului i se adaug tranzitat de reea pentru a ajuta la pregtirea pentru cererea viitoare.
Netflix a fost, de asemenea, posibilitatea de a obine mai multe detalii n tipul de clieni de
coninut preferat, pe care le-a permis s fac sugestii mai exacte cu privire la ceea ce s-ar
putea plcea abonailor.
Netflix este all-in pentru Big Data-utilizarea acestuia pentru a optimiza calitatea i
stabilitatea fluxurilor sale video i pentru a evalua preferinele de divertisment pentru

clieni, astfel nct se poate face o treab mai bun direcionare utilizatorilor si cu oferte
pentru spectacole n care s-ar putea dori s vad. Aceste eforturi sunt critice pentru
companie, care a fcut o tranziie de succes din nchirierea DVD-uri pentru a furniza video
digitale n ultimii civa ani, dar se confrunt acum cu mai mult concuren i presiune
asupra activitii sale.
Compania a apelat la Big Data n urma unei ntreruperi n 2008, care a plecat de unii
clieni, fr serviciu timp de trei zile, a declarat Kurt Brown, directorul Netflix al tiinei
datelor i inginerie, n timpul unei prezentri la Conferina Strata din New York. Este un
exemplu de modul n care instrumentele de CIO si departamentul IT sunt n cretere n
importan strategic.
Evenimentul a fost mai puin catastrofal dect ar fi astzi, dar a fost suficient de severe
pentru a expune vulnerabilitile companiei, si sa impulsioneze sa actioneze. Mult mai
puini clieni au fost utilizai de streaming la momentul respectiv i Netflix a fost
procesarea unei cantiti mai mici de informaii cu privire la centrul su de date gestionate.
"Majoritatea clienilor au avut deja DVD-urile lor pentru urmtoarele trei zile", a spus
Brown. "Dar am tiut c aa cum am nceput s facem streaming i merge internaional
acest lucru a fost de gnd s fie o problem", a spus Brown.
Pe msur ce compania pregtit s ofere mai mult de streaming, Netflix mutat de stocare
de la centrele de date interne ctre Amazon Cloud. Avantajul principal al norului este faptul
c arhitectura care sa include open source platforma foarte scalabil de procesare a datelor
cunoscut sub numele de Hadoop-permite companiei s rapid de asigurare a resurselor de
calcul ca nevoile sale cresc.
C capacitatea de reacie este critic pentru o companie care se afl sub o presiune intens.
Netflix a anunat mari c venitul net pentru al treilea trimestru a sczut la 88% la
7,680,000 $. i creterea numrului de abonai nu se ridic la nlimea ateptrilor, fie.
Netflix a adugat doar 1,2 milioane de abonai din SUA digitale trimestru trecut, pentru un
total de 25100000. Compania a redus previziunile sale interne pentru noi abonamente de
streaming la o serie de 4700000-5,400,000, n jos dintr-o estimare iniial de 7 milioane.
Hadoop are puterea de procesare ce permite companiei sa ruleze analize masive de date,
cum ar fi modele de trafic pentru reprezentarea grafic a fiecrui tip de dispozitiv pe mai
multe piee.
Acest efort a ajuta Netflix mbunti fiabilitatea video de feed-uri pe diferite platforme i
planificarea pentru creterea viitoare a filmelor de streaming i spectacole. De exemplu,
capacitile de procesare mai poate permite inginerilor s vad unde traficul n reea
funcioneaz mai lent, permindu-le s-i planifice pentru capacitatea suplimentar de
reea. The-tehnologie care poate manipula date mai mari sets- ajut, de asemenea, Netflix
pentru a analiza mai bine preferinele clienilor, astfel nct s poat face recomandri
mbuntite.

De ce este Big Data pe val chiar acum?


Postul de informare (att private, ct i publice) generate de umanitatea a ajuns la fierbere
recenta. Noi generam mai mult coninut dect oricnd nainte, dar n multe cazuri, aceasta
conduce la mai multe ntrebri i mai puine rspunsuri. Ceea ce se ntmpl n atmosfer?
Care candidat prefer alegtorii? Care filme, cri i emisiuni TV vor sature apetitul
publicului? Ce tendine vin pe drum?
Facand sentiment de tot acest coninut este ca ncercarea de a auzi ce cineva se optete n
culise n timp ce participa la un concert n aer liber n plin expansiune. Exist o nevoie
profund pentru structura pentru a analiza datele pentru a separa cacofonia i de a gsi
firele utile pentru a descoperi oportuniti. Chiar mai mult potenial i-a deschis pentru cei
care pot orchestrarea acest feat.
Parry Malm de Econsultancy.com declara ntr-un articol intitulat "Trei motive pentru Big
Data este minunat", c beneficiile includ gsirea "avantaje competitive", obtinerea "date de
pe ordinea de zi a consiliului" i de conducere "produse inovatoare i start-up." Este clar c
aceasta este una dintre cele mai bune exemple ca de trziu la modul n care tehnologia
poate conduce de afaceri, i vice-versa si este foarte clar c Big Data strnete pasiune n
oameni (sau cel putin, la fel de mult ca i pasiune se poate simi omenete pentru date.)
Necesitatea de a asigura securitatea datelor sensibile, pentru a proteja informaiile private
i de a gestiona calitatea datelor, exist seturi de date dac sunt mari sau mici. Cu toate
acestea, proprietile specifice de date mari (volum, varietate, viteza, veridicitatea) crearea
unor noi tipuri de riscuri, care necesit o strategie cuprinztoare pentru a permite unei
companii s utilizeze date mari, evitnd n acelai timp capcanele.

Noi sugerm c organizaiile trebuie s ia n considerare urmtoarele ntrebri pentru cele


apte etape cheie ale succesului atunci cnd se evalueaz disponibilitatea acestora de a
ncepe cu adevrat s beneficieze de date de mare:

Guvernan - Buna guvernan cuprinde orientri coerente, proceduri i gestionare clare de


luare a deciziilor. Organizaiile au nevoie pentru a se asigura captarea de date standard i
exhaustiv; ei nu trebuie s protejeze toate datele, dar ele trebuie s nceap schimbul de
date cu protecie de-a construit cu nivelurile potrivite i funciile organizaiei.

Avnd n vedere caracterul omniprezent al datelor mari, nu-cadru de date recunosc dvs. de
guvernan definiiile n schimbare ale proprietarilor de date i consumatori?
Are guvernana actual a aborda riscurile legate de ciclul de via al datelor de mare?

Management - Integrarea i mutarea datelor n ntreaga organizaie este constrns n mod


tradiional de platforme de stocare a datelor, cum ar fi baze de date relaionale sau fiiere
lot, cu o capacitate limitat de a procesa volume foarte mari de date, date cu structur
complex sau fr structur, la toate, sau datele generate sau primite la viteze foarte mari.

Ai aptitudinile i capacitile interne pentru a face fa cu tehnologiile de date mari i


metode care sunt relativ noi?
Ai un control suficient asupra marilor volume de date, varietatea, viteza i veridicitatea,
care poate impune riscuri suplimentare?
Arhitectura - Arhitectura de date ar trebui s fie pregtite pentru a rupe n jos silozuri
interne, care s permit schimbul de seturi de date cheie n ntreaga organizaie i pentru a
se asigura c invataminte sunt capturate i transmise pe la setul potrivit de persoane n
organizaie, n timp util i exacte.

Are infrastructura IT susine strategia de date de mare?


Pot s v scar flexibil de prelucrare i de stocare pentru a rspunde cerinelor de
prelucrare a datelor de mare?
De utilizare - Rezultatele date de mare poate benefic pentru o gam larg de pri interesate
din ntreaga organizaie - conducerea executiv i plci, operaiunile de afaceri i
profesioniti de risc, inclusiv juridic, audit intern, financiar i conformitatea; precum i
departamente orientate spre client, cum ar fi vnzri i marketing. Provocarea este de a
avea capacitatea de a interpreta cantitatea mare de date care pot fi adunate din diverse
surse.

Ai talentul dreptul de a fi capabil de a procesa, modelul i interpretarea rezultatelor mari de


date?
Este fora de lucru gata s se mute n noua paradigm a deciziilor bazate pe date?
Calitate - Calitatea seturilor de date i deducia extrase din astfel de seturi de date sunt din
ce n ce n ce mai critic. Organizaiile au nevoie pentru a construi funcii i parametrii de
calitate i de monitorizare a datelor mari. Corectarea unei erori de date poate fi mult mai
costisitoare dect obinerea datelor din dreapta prima dat - i obinerea de date greit poate
fi catastrofale i mult mai costisitoare pentru organizaie, dac nu sunt corectate.

Sunt metodele existente suficiente pentru a face fa cu datele nestructurate?


Ce nivel de calitate a datelor este necesar pentru a ndeplini obiectivul de date de mare?
De securitate - Companiile trebuie s nceap stabilirea unor politici de securitate, care sunt
auto-configurabile: aceste politici trebuie s impulsioneze relaiile existente de ncredere, i
de a promova schimbul de date i a resurselor n cadrul organizaiilor, asigurnd n acelai
timp c de analiz de date sunt optimizate i nu este limitat din cauza unor astfel de
politici.

Este infrastructura de securitate suficient de robust pentru a face fa cerinelor tot mai
mari de protejare a unui stoc tot mai mare de date, n timp ce suficient de flexibil pentru a
nu deveni bottlenecked de inovare?
De confidenialitate - Utilizarea sporit a datelor marilor provocri cadrele tradiionale
pentru protejarea confidenialitii informaiilor cu caracter personal, fornd companiile s
verifice punerea n aplicare a politicilor lor de confidenialitate pentru a se asigura c viaa
privat este meninut n mod corespunztor.

V-ai definit care deine informaii mari de date, i dac exist consimmnt real sau
implicit de a utiliza acelai lucru?
Ai neles c modul n care datele sunt stocate de mare i modul n care acesta este utilizat
poate crea, de asemenea, probleme semnificative de confidenialitate?

Disponibilitatea Big Data, hardware-ul low-cost cu o schimbare de mrfuri, precum i un


nou management de informaii i software-ul analitic s-au produs un moment unic n
istoria de analiz a datelor. Convergena acestor tendine nseamn c avem capacitile
necesare pentru a analiza seturi de date uimitoare rapid i rentabil pentru prima dat n
istorie. Aceste capaciti nu sunt nici teoretice, nici banale. Ele reprezint un salt veritabil
nainte i o oportunitate clar de a realiza ctiguri enorme n ceea ce privete eficiena,
productivitatea, veniturile i profitabilitatea.

Era Big Data este aici, iar acestea sunt cu adevrat revoluionare ori n cazul n care att
profesionitii din domeniul afacerilor i tehnologie continu s lucreze mpreun i s
livreze promisiunea.

Bibliografie:
www.wikipedia.com
www.safaribooksonline.com
www.datadiversity.net
www.sas.com