Sunteți pe pagina 1din 12

Analiza volumelor mari de date – Seminar 4

Descarcati si instalati PowerBI: https://powerbi.microsoft.com/en-us/downloads/

Click Advanced download options:

Select English -> in fereastra nou aparuta selectam versiunea

PBIDesktop_x64.msi 206.2 MB

Se instaleaza PowerBI Desktop.

Dupa deschidere, se completeaza datele personale (fictive) si se poate lucra.

Analiza și vizualizarea datelor în Power BI

1. Accesarea surselor .csv sau .json

Din meniul principal se alege opțiunea Get Data și Text/CSV:

Click Connect și selectăm fișierul clienti_daune.csv

1
Analiza volumelor mari de date – Seminar 4

Acceptam setările implicite și încărcăm datele (Load). Sursele se vor încărca în Power BI
fiind disponibile în partea dreaptă, în secțiunea Fields. Din secțiunea Visualization se pot
adăuga filtre, tipuri de reprezentări grafice, formatări.

În secțiunea din partea stângă se pot vizualiza rapoartele realizate, se pot accesa datele și
crea relații între sursele de date.

2. Crearea rapoartelor în Power BI

Din secțiunea Fields se selectează colecția Clienti_Daune.

Vom realiza un grafic de tip bar/column (stacked) pentru reprezentarea daunelor pe


fiecare tip de componentă în funcție de valoarea totală a daunelor și manopera aferentă.

Selectăm coloanele COMPONENTA, VALOARE_DAUNA și PRET_MANOPERA.

Implicit se va genera un tabel cu sumele totale pe fiecare componenta:

2
Analiza volumelor mari de date – Seminar 4

Selectăm tabelul (click in regiunea sa) și îl transformăm într-o vizualizare de tip Stacked
column chart (butonul de tip grafic din secțiunea Visualizations):

Observăm în secțiunea Filters că sunt afișate implicit toate valorile. Putem filtra aceste
valori în funcție de atributele selectate sau putem introduce noi atribute care nu apar în
grafic. De exemplu adaugăm în secțiunea Filters (cu drag and drop) AN_FABRICATIE
și filtrăm valorile astfel încât să fie reprezentate grafic doar autoturismele mai vechi de
2010.

3
Analiza volumelor mari de date – Seminar 4

Graficul este redesenat în funcție de filtrele setate.

Putem schimba reprezentarea grafică astfel încât să afișăm procentual costul manoperei și
al echipamentelor: deselectăm atributul VALOARE_DAUNA și alegem PRET_TOTAL
(acesta este costul total al componentelor). Schimbăm tipul de grafic în 100% Stacked
bar chart:

Denumim pagina creată (click dr. pe Page 1, în stg-jos a ecranului) cu numele de Raport
daune.

Salvăm raportul realizat cu denumirea Raport_Clienti_Daune.

Adăugăm un nou grafic în pagină pentru vizualizarea mărcilor cu cele mai mari daune.

Click în afara graficului existent. Din meniul Visualizations adăugăm un grafic de tip Pie
Chart. Din secțiunea Fields alegem atributele MARCA și VALOARE_DAUNA.
Limităm autoturismele afișate astfel încât să apară doar cele cu valori mari. Click dr. pe

4
Analiza volumelor mari de date – Seminar 4

grafic->Show data. Putem filtra datele astfel încât să fie afișate doar mărcile cu valori mai
mari decât 50000 lei sau mai mari decât 100000 lei. În secțiunea Filters adăugăm un filtru
pentru VALOARE_DAUNA.

Raportul va arăta astfel:

Adăugăm un nou grafic pentru vizualizarea daunelor în funcție de timp. Vom crea o nouă
măsură prin care valoarea daunelor este agregată în funcție de intervalul de timp (lună,
trimestru, an). Vom utiliza 2 atribute existente: DATA_CERERE și
VALOARE_DAUNA.

Mai întâi transformăm DATA_CERERE din Text în Date. Din meniu, click pe Edit
Queries. În cazul în care coloana DATA_CERERE nu este deja de tip Date, în dreptul
său apare ABC. Selectăm din lista Date astfel încât coloana să fie convertită. Aplicăm
modificările (Close&Apply) și revenim în pagina raportului.

Realizăm o nouă coloană (măsură) prin care datele să fie agregate pe perioade de timp.
Din meniu selectăm New Quick Measure. Alegem din meniul Calculation, Year-to-date-
total, la Base value adăugăm cu drag&drop coloana VALOARE_DAUNA, iar la Date
adăugăm DATA_CERERE.

5
Analiza volumelor mari de date – Seminar 4

Noua coloană se va numi implicit VALOARE_DAUNA YTD și o regăsim în secțiunea


Filters.

Adăugăm un nou grafic de tip Clustered column chart. Selectăm pentru acesta atributele:
DATA_CERERE și VALOARE_DAUNA YTD. Repoziționăm graficul în partea dreaptă
a raportului.

Selectați graficul și observați în partea de sus a sa o serie de opțiuni de navigare (săgeți).


Acest grafic este interactiv, oferind posibilitatea navigării pe ierarhia de timp: YEAR-

6
Analiza volumelor mari de date – Seminar 4

>QUARTER->MONTH creată automat. Exersați diverse opțiuni și observați modificările


apărute și în celelalte 2 grafice.

Adăugați o nouă pagină în raport. În aceasta adăugați din Visualizations o reprezentare de tip
Treemap.

Selectați pentru aceasta atributele MARCA, MODEL și VALOARE_DAUNA. Observați


tipul de reprezentare.

Adăugați în partea de sus a raportului o vizualizare de tip Slicer și pentru aceasta selectați
coloana VALOARE_DAUNA. Exersați diferite valori ale slicer-ului și observați
reprezentarea de tip Treemap.

Redenumiți pagina Raport Modele.

Adăugați o nouă pagină în raport și selectați din Visualizations reprezentarea de tip Matrix.
Selectați pentru aceasta coloanele MARCA, COMPONENTA și VALOARE_DAUNA.

În partea dreaptă a paginii adăugăm o nouă vizualizare de tip Map (Atenție! Nu de tip Filled
Map) pentru care selectăm coloanele: MARCA, GEOCODE_REPREZENTANȚĂ și
VALOARE_DAUNA. Atât harta cât și tabelul sunt interarctive, exersați diverse combinații și
observați reprezentările.

7
Analiza volumelor mari de date – Seminar 4

Redenumiți pagina Raport Harta.

Salvați raportul cu denumirea Raport Daune.

Opțional! Configurarea mediului de lucru și accesul la colecțiile de date din MongoDB

Pas 1. Configurare conector BI pentru MongoDB

Se descarcă și se instalează conectorul de BI pentru MongoDB:

https://www.mongodb.com/download-center/bi-connector

Implicit acesta se va instala în directorul: C:\Program Files\MongoDB\Connector for BI\2.9\

Se editează fișierul example-mongosqld-config.yml astfel:

Linia

uri: "mongodb://localhost:27017"

Devine:

uri: "mongodb://37.120.249.57:27017"

Se salvează fișierul sub denumirea mongosqld.conf în directorul \bin sau se copiază fișierul
atașat în același director.

Se deschide Command Prompt și se apelează conetorul de BI specificându-se fișierul


configurat anterior:

8
Analiza volumelor mari de date – Seminar 4

C:\Program Files\MongoDB\Connector for BI\2.9\bin>mongosqld.exe --config


mongosqld.conf

Se lasă pornit serviciul mongosqld.

Pas 2. Configurare driver ODBC

Se descarcă și se instalează driverul ODBC pentru MongoDB:


https://github.com/mongodb/mongo-odbc-driver/releases/

Se deschide ODBC DataSource Administrator (64-bit) din Control panel -> System &
Security-> Administrative Tools.

Pentru System DNS se adaugă o nouă sursă de tip ODBC. Se alege MongoDB ODBC 1.1.0 ANSI
Driver sau MongoDB ODBC 1.1.0 Unicode Driver:

Conexiunea va fi salvată în listă. Se închide fereastra.

9
Analiza volumelor mari de date – Seminar 4

După acest pas conexiunea este pregătită pentru instrumentele de BI: Power BI, Qlik,
Tableau.

Mai multe detalii referitoare la instalarea și configurarea conectorului de BI:


https://docs.mongodb.com/bi-connector/current/

Documentația pentru realizarea conexiunilor cu aceste instrumente este disponibilă aici:


https://docs.mongodb.com/bi-connector/current/client-applications/

10
Analiza volumelor mari de date – Seminar 4

1. Realizarea interfețelor în Power BI

Se instalează Power BI: https://powerbi.microsoft.com/en-us/

Se deschide Power BI Desktop și din meniul Get Data se alege sursa ODBC:

Selectați MongoDB:

La username puteti sa treceti admin sau doar litera a.

Conexiunea cu serverul de MongoDB se va realiza și colecțiile de documente vor fi


disponibile pentru analize. Selectam din baza de date daune_leasing doar colecțiile
clienti_daune și clienti_leasing:

11
Analiza volumelor mari de date – Seminar 4

Selectați butonul Load și sursele se vor încărca în Power BI fiind disponibile în partea
dreaptă, în secțiunea Fields. Din secțiunea Visualization se pot adăuga filtre, tipuri de
reprezentări grafice, formatări.

În secțiunea din partea stângă se pot vizualiza rapoartele realizate, se pot accesa datele și crea
relații între sursele de date.

Tutorial complet Power BI: https://docs.microsoft.com/en-us/power-bi/desktop-getting-


started

12

S-ar putea să vă placă și