Sunteți pe pagina 1din 9

ACADEMIA DE STUDII ECONOMICE, BUCUREȘTI

Facultatea de Cibernetică, Statistică și Informatică Economică

Big Data and Analytics

Coordonator: Student:
Alexandra Corbea Stoica Maria Georgiana
CUPRINS

INTRODUCERE 2

CONCEPTUL DE BIG DATA 2

CARACTERISTICI BIG DATA & ANALYTICS 3

PLATFORME SOFTWARE PENTRU BIG DATA AND ANALYTICS 5

STUDIU DE CAZ 6

CONCLUZII 7

BIBLIOGRAFIE 8

1
I. INTRODUCERE

În societatea cotidiană, unde datele digitale reprezintă informații prețioase, aproape


fiecare acțiune pe care o desfășurăm este înregistrată.
În acest caz, organizațiile înregistrează fiecare activitate ce se realizează în cadrul lor, de
cele mai multe ori pe un suport electronic. Prin urmare, din dorința de a se schimba modul în
care companiile fac afaceri, s-a dezvoltat Big Data.
Întrucât colectarea datelor, fiind un rezultat al activității desfășurate de către companii,
nu reprezintă o problemă majoră, provocarea apare atunci când vine vorba de analiza, stocarea,
transferul, interogarea și securizarea datelor purtătoare de conținut informațional.
Companiile urmăresc în mod continuu găsirea de produse software care să le permită
analiza acestor date și să ajute la obținerea de informații relevante în luarea deciziilor.

II. CONCEPTUL DE BIG DATA


De-a lungul timpului, cantitatea de informație existentă pe diverse medii de stocare a crescut
într-un ritm din ce în ce mai alert.
Conceptul de Big Data face referire la o cantitate foarte mare de date care rezultă dintr-o
activitate desfășurată, fie că este vorba de o afacere sau nu. Ceea ce trebuie menționat referitor la
acest concept este că, deși cantitatea de date este mare, aceasta nu înseamnă că ele au și un
conținut informațional relevant pentru cei ce le dețin. Așadar, este necesară o tehnologie care să
colecteze, stocheze, și să proceseze datele prin analiză în timp real, iar dacă se are în vedere
activitatea desfășurată de o companie trebuie avute în vedere comportamentul clienților, riscul la
care se supune compania prin activitatea desfășurată, performanța, productivitatea și valoarea de
piață a acesteia.

Fig. II.1 - Conceptul de Big Data

2
După cum se poate observa în Fig. II.1, pentru ca utilizarea Big Data să aibă relevanță
pentru o organizație, este necesar ca, mai întâi să se extragă informațiile relevante din sursele de
date (Big Data conținând sursele de stocare), utilizându-se tehnici potrivite de management al
datelor. În funcție de tipul datelor trebuie utilizate apoi programele software de analiză a
acestora.
Datele pot fi atât istorice, dar pot fi furnizate și în timp real. Rezultatele obținute trebuie
să fie relevante și, astfel, vor fi folosite de către organul decizional din cadrul unei companiilor.
Aceste decizii pot, la rândul lor să fie legate de managementul datelor, sub o altă formă, astfel
încât, într-un alt ciclu al fluxului, să poată fi adoptate decizii mai productive.
Așadar, se poate determina cu ușurință dacă un anumit proces aduce sau nu un beneficiu
companiei respective sau dacă cele deja existente pot fi îmbunătățite. Dacă da, se poate obține și
o analiză a măsurii în care politicile enunțate ajută compania.
De asemenea, prin această analiză pot fi descoperite noi metode de abordare a unei
probleme particulare, favorizând în acest fel adaptarea permanentă a organizației la mediul în
cadrul căruia își desfășoară activitatea.

III. CARACTERISTICI BIG DATA & ANALYTICS

Fig. III.1 - Caracteristici Big Data & Analytics

După cum se poate observa în Fig. III.1, caracteristicile Big Data & Analytics sunt:

3
● Volumul - Companiile colectează date dintr-o varietate de surse, atât din mediul intern
cât și din mediul extern.
Așadar, sursele de date sunt din ce în ce mai numeroase, iar volumul de date existent
crește din ce în ce mai mult. Acest lucru se întâmplă și în cadrul companiilor unde, spre
exemplu, în vederea desfășurării activităților proprii obiectului de activitate, stabilesc
relații pe termen lung cu tot mai mulți parteneri, colectând informații despre aceștia,
despre mediul în care se desfășoară, dar și alte informații.
● Viteza - În contextul informațional din zilele noastre, companiile gestionează/
interacționează cu un flux foarte mare de date care trebuie tratate în timp util. Tocmai de
aceea datele sunt preluate, stocate, sortate și analizate în timp real, sau cu o întârziere
foarte mică. Spre exemplu, în cazul stabilirii prețurilor acțiunilor cu care este cotată la
bursă o anumită companie, modificarea are loc în timp real în funcție de cerere și ofertă.
● Varietatea - Această caracteristică se referă la faptul că datele sunt preluate în formate tot
mai diferite, de la date structurate cum ar fi date numerice conținute în baze de date ,
până la date nestructurate de tipul documentelor text, email, video, audio sau tranzacții
financiare, în funcție de specificul activității fiecărei companii, de obiectivele și
strategiile acesteia.
● Veridicitate - Din cauza volumului mare și varietății datelor, companiile întâmpină
dificultăți în a stabili care sunt datele relevante pentru o anumită analiză și care este
gradul acestora de credibilitate.

Așadar, putem afirma că rolul Big Data & Analytics este de a permite unei organizații să
beneficieze de resursele interne dar și de cele externe în măsura în care consideră că este benefic
pentru afacere.
În acest scop, se va folosi o tehnologie care să proceseze datele la volumul și viteza pe
care compania le dorește, eficient din punct de vedere al costurilor. Datele cuprinse în analiză pot
veni de la sisteme de facturare, sisteme ERP, sisteme CRM, senzori, comutatoare de rețea sau
vin de la oameni - site-ul web, social media.
Acest lucru face foarte dificilă analiza datelor sociale - extragerea ideilor de conținut în
mare parte sub formă de text într-un timp foarte scurt. Trebuie avut în vedere faptul că eficiența
funcționării în organizație are în vedere, cu precădere combinația optimă de resurse umane,
procese și tehnologie.

4
IV. PLATFORME SOFTWARE PENTRU BIG DATA AND
ANALYTICS

1. Pentaho Business Analytics


Pentaho este o platformă software care a început ca un generator de rapoarte, acesta ramifică
cantitățile mari de date pentru a le face mai ușor de preluat informații din noile surse de stocare.
Această tehnologie permite conectarea la mai multe baze de date. Odată ce bazele de date sunt
conectate, se pot stabili legăturile dintre coloane. Astfel, vor fi extrase datele necesare
companiei.

2. Karmasphere Studio and Analyst


Este un plug-in al mediului de dezvoltare Eclipse. Este un program software integrat
(IDE7) cu rol în a facilita realizarea activităților Hadoop. Hadoop este cel mai adesea utilizat
pentru efectuarea de analize pe termen lung, de obicei fiind necesare anumite cicluri de
dezvoltare software.
Acest program ajută la vizualizarea părților intermediare atunci când se va efectua o
analiză cu ajutorul Hadoop. Practic, va fi mai eficient pentru analiști să observe fiecare parte a
analizei în mod independent, putând urmări mult mai clar modificările ce au loc asupra datelor și
putând compara rezultatele aflate la diverse stagii.

3. Skytree Server
Acest program oferă soluții atunci când vine vorba despre Machine Learning. Poate să ruleze
o mulțime de algoritmi într-un timp foarte scurt. Există o multitudine de programe software care
să faciliteze lucrul cu datele în contextul unui volum foarte mare și viteză cum ar fi: Tableau
Desktop and Server, Splunk.
Principalul avantaj al acestor noi tehnologii îl constituie capacitatea de a gestiona orice
date structurate, fără a exista necesitatea unor eforturi legate de integrarea datelor. Se constată
astfel o creștere a vitezei de răspuns prin adaptarea la modificările permanente apărute în mediul
în cadrul căruia o afacere se desfășoară, creând premisele pentru inovare realizată în paralel cu
excluderea costurilor asociate sistemelor de management ale bazelor de date relaționale.
Pe de altă parte, dacă se au în vedere doar sistemele de management al bazelor de date
tradiționale, acestea sunt orientate spre a furniza utilizatorilor datele necesare în urma unor
interogări concrete asupra unor elemente precizate. Altfel spus, se vor compara elemente care au
aceleași caracteristici și nu elemente care fac parte din aceeași categorie, aici evidențiindu-se
rigiditatea sistemelor ce include și necesitatea ca datele să fie incluse în acele scheme din
categoria cărora fac parte înainte de a fi analizate.
De-a lungul anilor însă, după cum am precizat și mai sus, unele relații dintre tabele au
devenit atât de complexe, încât interogarea se face prin multiple selecții, uneori foarte greu de
urmărit. Noile tehnologii au adus o îmbunătățire venind în rezolvarea acestor probleme.

5
V. STUDIU DE CAZ
Eficiența adoptării Big Data de către compania de curierat UPS

UPS (United Parcel Service) este cea mai mare companie de curierat la nivel mondial dar
și furnizor de soluții de management pentru lanțul său de aprovizionare. Compania de logistică la
nivel mondial își are sediul în Georgia. De asemenea, această companie are și un sistem de
transport aerian și naval.
Deși a fost înființată în anul 1907, cu un capital social de doar 100$, activitatea acesteia a
trecut cu timpul de la livrări de colete private, la cele de tip comercial, înregistrând o expansiune
foarte importantă în anul 1975, când aria de livrare cuprindea 48 de state vecine din Statele Unite
ale Americii și sudul Canadei. Un an mai târziu s-au extins în Germania de Vest. Câțiva ani mai
târziu, din necesitatea de a reduce timpul de transporta coletelor, compania a introdus livrarea de
tipul “NextDay Air Service”. În anii ’90 sediul organelor de decizie a fost mutat în Atlanta, iar
de atunci și până astăzi UPS continuă să achiziționeze tehnologii care să îi eficientizeze
activitatea dar și companii mai mici, concurențe sau nu.
Perspectiva utilizării Big Data de către UPS a început în anii 1990, când a pus în aplicare
o suită de idei care au oferit soluții de bază ale analizei descriptive. Compania a colectat datele
din toate sursele pe care le cunoștea și care erau legate de realizarea activității sale de la
calculatoare portabile, care adună informații referitoare la pachete, dispozitive telematice
instalate pe camioane, sisteme GPS si GIS folosite, până la informații cu privire la rutele
alternative. Toate au fost puse cap la cap și s-a constatat că s-a găsit o soluție de transport mai
bună decât cea folosită până atunci.
Întrucât amploarea companiei a furnizat posibilitatea de a realiza mai multe venituri,
consolidând activitățile pe care le desfășurau, s-a constatat necesară îmbunătățirea procesului de
livrare. Astfel eficiența firmei a trecut la un nou nivel, consolidându-și procesul de urmărire a
pachetelor, eliminându-se astfel datele descentralizate. Au început cu comasarea foilor de calcul,
a rapoartelor și a altor surse de date până când, în anul 2000 au construit un model de date
centralizat.
Noul sistem, combină toate elementele, inclusiv dispozitivele portabile, chiar și cele mai
inteligente, purtate de conducătorii auto. Acestea din urmă au avut un impact major asupra
operațiunilor UPS. Potrivit lui Jack Levis, director adjunct de proces din cadrul UPS, noua suită
de instrumente de date utilizate de UPS a permis să reducă numărul milelor (pentru că UPS este
firmă cu capital american) parcurse de mașinile acestora pe an, s-au redus cu 85 de milioane,
salvându-se astfel 22 milioane de litri de combustibil pe an, reducând emisiile de dioxid de
carbon cu 85.000 de tone.
Cu timpul, prin dezvoltarea tehnologiilor, reușesc să previzioneze momentul în care un
anumit pachet va ajunge la destinație.
Astăzi, nivelul la care Big Data este utilizat în această companie a atins cote foarte mari,
iar odată cu implementarea sistemului ORION compania va automatiza procesul prin care se va

6
ști sigur dacă un pachet va ajunge unde trebuie în momentul în care trebuie. În imaginea de mai
jos se poate observa perspectiva celor de la UPS asupra sistemului ORION.

Fig. V.1 - perspectiva UPS asupra sistemului ORION

VI. CONCLUZII

Deși termenul de “Big Data” este asociat cu diferite elemente, pentru majoritatea celor
care fac parte dintr-o afacere, acest termen are înțeles de descriere și anticipare, fie că este a
pieței, a activității desfășurate, sau a clienților. Big Data are în toate companiile în care se
folosește un impact pozitiv asupra performanțelor afacerii, fiind direct corelată cu analiza și
utilizarea corespunzătoare a datelor de care firma dispune.
Totuși, trecerea de la bazele de date tradiționale la Big Data se face succesiv, în funcție
de obiectivele, strategiile, obiectul de activitate și specificul fiecărei companii în parte.
Big Data reprezintă un concept ce oferă companiilor noi soluții de afaceri, mai bune
decât sistemele tradiționale, care dar necesită totuși investiții majore, dar care totuși nu ar fi util
dacă nu ar fi utilizat corespunzător de către cel mai important element din cadrul unei companii,
resursa umană, care trebuie să fie întotdeauna suficient de bine pregătită și cu un pas înaintea
tehnologiei.

7
BIBLIOGRAFIE

1. “Managementul sistemelor informaționale”, Marian Stoica, Constanta Bodea, Bogdan


Ghilic Micu, Marinela Mircea, Editura ASE, 2012.
2. https://en.wikipedia.org/wiki/Big_data, consultat în noiembrie 2019.
3. https://www.zdnet.com/article/big-data-case-study-how-ups-is-using-analytics-to-
improve-performance/ , consultat în noiembrie 2019.
4. https://searchbusinessanalytics.techtarget.com/definition/big-data-analytics , consultat în
noiembrie 2019.

S-ar putea să vă placă și