Sunteți pe pagina 1din 92

IBM Cognos Analytics

Versiunea 11.1.0

Ghidul utilizatorului pentru explorări

IBM
Cuprins

Capitolul 1. Getting started with Explorations........................................................ 1


Explorările.................................................................................................................................................... 1
Încărcarea datelor.................................................................................................................................. 1
Pornirea unei explorări dintr-un tablou de bord sau o poveste existentă ........................................... 1
Pornirea unei explorări noi de la meniul Nou........................................................................................ 1
Pornirea unei noi explorări de la un activ de date pe pagina de întâmpinare.......................................1
Adăugarea unei surse de date................................................................................................................2

Capitolul 2. Exploring relationships........................................................................3


Explorarea relaţiilor din datele dumneavoastră..........................................................................................3
Deschiderea diagramei de relaţii........................................................................................................... 7

Capitolul 3. Visualizations..................................................................................... 9
Vizualizările.................................................................................................................................................. 9
Vizualizarea cardurilor în panoul de navigare ....................................................................................... 9
Crearea unei singure vizualizări............................................................................................................. 9
Crearea unei vizualizări utilizând căutarea în câmpurile de date....................................................... 10
Compararea a două vizualizări............................................................................................................. 11
Compararea a două puncte de date pe o vizualizare.......................................................................... 12
Analiza de date avansată..................................................................................................................... 12
Alegerea unui alt tip de vizualizare...................................................................................................... 13
Insight-urile în vizualizări.....................................................................................................................43
Alegerea insight-urilor corelate........................................................................................................... 44
Alegerea vizualizărilor recomandate................................................................................................... 44
Alegerea vizualizărilor înrudite............................................................................................................ 44

Capitolul 4. Forecasting....................................................................................... 45
Previzionarea............................................................................................................................................. 45
Caracteristici de previzionare.............................................................................................................. 45
Opţiunile de previzionare..................................................................................................................... 46
Tipurile de vizualizare care suportă previzionarea..............................................................................49
Previzionarea datelor........................................................................................................................... 49
Detaliile statistice ale previzionării...................................................................................................... 52
Modelele de previzionare..................................................................................................................... 54

Capitolul 5. Principles of advanced data analytics................................................ 59


Principiile analizei de date avansate......................................................................................................... 59
Pregătirea datelor.................................................................................................................................59
Pregătirea datelor pentru câmpurile numerice................................................................................... 60
Pregătirea datelor pentru câmpurile categoriale................................................................................ 60
Pregătirea datelor pentru câmpurile ţintă........................................................................................... 61
Driver-ele cheie unifactoriale...............................................................................................................61
Driver-ele cheie bifactoriale.................................................................................................................62
Arborele de decizie...............................................................................................................................63
Insight-urile în vizualizări.....................................................................................................................65
Detaliile limbajului natural................................................................................................................... 73
Relaţiile.................................................................................................................................................77
Diferenţe între Cognos Analytics şi Watson Analytics privind analiza de date avansată...................78

Capitolul 6. Assistant...........................................................................................83

iii
Asistentul................................................................................................................................................... 83
Aptitudinile asistentului....................................................................................................................... 84

iv
Capitolul 1. Getting started with Explorations

Explorările
Explorarea este un spaţiu de lucru flexibil unde puteţi descoperi şi analiza date. De asemenea, puteţi
explora o vizualizare existentă dintr-un tablou de bord sau poveste. Dezvăluiţi relaţii ascunse şi
identificaţi tipare care transformă datele dumneavoastră în insight-uri. Insight-urile corelate sunt
reprezentate de o pictogramă verde cu un număr, pe axa x, axa y sau titlul unei diagrame.

Pornirea explorărilor
Puteţi folosi câteva metode pentru a porni explorările.

Încărcarea datelor
Încărcaţi un activ de date în folderul Conţinutul meu pentru a-l folosi în explorare.

Procedură
1. Faceţi clic pe pictograma Nou şi apoi faceţi clic pe Încărcare fişiere.

2. Răsfoiţi până unde aţi salvat activul şi selectaţi-l.


Activul de date apare în folderul Conţinutul meu.

Pornirea unei explorări dintr-un tablou de bord sau o poveste existentă


Când lucraţi cu un tablou de bord sau cu o poveste, puteţi crea sau edita o explorare dintr-o vizualizare.

Despre acest task


Finalizaţi aceşti paşi pentru a deschide o vizualizare într-o explorare nouă sau pentru a o adăuga la o
explorare existentă:

Procedură
1. Deschideţi un tablou de bord sau o poveste existentă.
2. Selectaţi o vizualizare.

3. Faceţi clic pe pictograma Explorări din bara de unelte.


4. Selectaţi Explorare nouă sau Adăugare la existentă.

Pornirea unei explorări noi de la meniul Nou


Din pagina Bine aţi venit, puteţi porni o nouă explorare din meniul Nou.

Procedură

1. Faceţi clic pe pictograma Nou şi apoi faceţi clic pe Explorare.


2. Selectaţi o sursă de date şi faceţi clic pe Adăugare.
O pagină cu puncte de pornire este generată din sursa de date pe care aţi selectat-o.

Pornirea unei noi explorări de la un activ de date pe pagina de întâmpinare


Puteţi selecta meniul Acţiune pe un activ de date utilizat recent de pe pagina Bine aţi venit.

© Copyright IBM Corp. 2018, 2020 1


Procedură
1. Pe pagina de întâmpinare, dacă activul de date pe care doriţi să-l utilizaţi este afişat ca o placă în
zona Recent, faceţi clic pe pictograma meniului Acţiuni .
2. Selectaţi Creare explorare.

Adăugarea unei surse de date


Adăugaţi o sursă de date la explorare pentru a explora datele sale.

Procedură

1. În panoul Surse selectate, faceţi clic pe pictograma Adăugare sursă .


2. Deplasaţi-vă la folderul Conţinutul meu sau Conţinut de echipă şi selectaţi sursa de date pe care vreţi
să o adăugaţi. Faceţi clic pe Adăugare.
3. Expandaţi sursa de date în panoul Surse selectate, pentru a vedea ce este disponibil.
4. Utilizaţi pagina cu puncte de pornire pentru a genera o diagramă de relaţii din datele dumneavoastră.

2 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Capitolul 2. Exploring relationships

Explorarea relaţiilor din datele dumneavoastră


Atunci când creaţi o explorare, puteţi porni de la o sursă de date. O pagină de puncte de pornire este
afişată cu sugestii despre cum să începeţi.
Puteţi introduce un nume de coloană care apare în sursa dumneavoastră de date. Sau, puteţi să faceţi clic
pe una dintre coloanele sugerate pe care sistemul le identifică ca interesante. Dacă nu sunteţi sigur cu ce
coloană să începeţi, faceţi clic Se sare peste - arată-mi orice pentru a vedea o diagramă de relaţii cu
unele vizualizări de puncte de pornire sugerate.

În diagrama de relaţii, coloana cu care începeţi este focalizarea principală şi este reprezentată de un nod
albastru închis. Câmpurile asociate sunt reprezentate de nodurile violete. Liniile conectează nodurile şi
reprezintă relaţiile. Grosimea liniei indică puterea relaţiei.

© Copyright IBM Corp. 2018, 2020 3


Relaţiile primare cele mai puternice sunt afişate implicit şi sunt relaţiile directe între focalizarea primară şi
câmpurile asociate. Relaţiile secundare sunt relaţiile între alte câmpuri asociate cu ţinta, direct sau
indirect.
Pentru a vizualiza ambele relaţii primare şi secundare, selectaţi caseta de bifare Relaţii secundare de sub
Editare diagramă.

4 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Diagrama de relaţii desenează aceste câmpuri pe baza unei evaluări statistice a articolelor asociate.
Diagrama de relaţii nu este o poză a modelului de date. Totuşi, modelul poate fi un factor de influenţă în
analiză. Pentru a îmbunătăţi performanţa când există multe rânduri în sursa de date, analiza se bazează
pe un eşantion reprezentativ al tuturor datelor.
Puteţi interacţiona cu diagrama de relaţii prin selectarea unui nod de care sunteţi interesat. Pe măsură ce
faceţi aceasta, lista de vizualizări cu puncte de pornire, din dreapta diagramei, se actualizează pentru a
include nodurile pe care le-aţi selectat. De asemenea, puteţi utiliza Ctrl+clic pentru a selecta mai multe
noduri.
Faceţi clic pe Resetare la original dacă doriţi să resetaţi domeniul şi vizualizarea tuturor câmpurilor din
diagrama de relaţii la setarea implicită.

Punctele de pornire sugerate


Vizualizările de puncte de pornire sunt afişate ca miniaturi lângă diagrama de relaţii. Pentru a genera
aceste vizualizări, selectaţi noduri singulare sau noduri multiple din diagrama de relaţii.
Faceţi clic pe o vizualizare dacă vreţi să o adăugaţi la explorare şi să o vizualizaţi în acelaşi timp. Faceţi clic

pe pictograma plus de pe vizualizarea punct de pornire pentru a o adăuga la explorare şi pentru a


menţine vederea curentă.

Capitolul 2. Exploring relationships 5


6 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări
Deschiderea diagramei de relaţii
Când utilizaţi o vizualizare şi vreţi să reveniţi la diagrama de relaţii, folosiţi cardul Relaţii date pentru a
reveni la vizualizarea cu punctele de pornire.

Despre acest task


Finalizaţi următorii paşi pentru a reveni la vizualizarea puncte de pornire pentru a vedea o diagramă de
relaţii şi punctele de pornire sugerate.

Procedură
1. Faceţi clic pe pictograma Explorări din panoul lateral.

2. Faceţi clic pe cardul Relaţii date.

Indiciu: Cardul Relaţii date este disponibil şi din meniul Card nou, pe bara de unelte.

Capitolul 2. Exploring relationships 7


8 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări
Capitolul 3. Visualizations

Vizualizările
Puteţi schimba tipul de vizualizare sau modifica coloanele care sunt utilizate în vizualizare.

Vizualizarea cardurilor în panoul de navigare


Vedeţi miniaturile vizualizărilor dumneavoastră, numite carduri, în panoul de navigare din stânga vederii
principale.

Despre acest task


Cardurile sunt o colecţie de vizualizări în Explorarea dumneavoastră. Utilizaţi cardurile pentru a vă
deschide vizualizările pentru a vedea detaliile şi a le modifica folosind sloturile de date.

Procedură
1. Faceţi clic pe pictograma Explorări din panoul lateral.

Cardurile dumneavoastră sunt listate aici.


2. Faceţi clic pe cardul care afişează o miniatură de vizualizare pe care doriţi să o deschideţi.
Vizualizarea se deschide în vederea principală.
3. Vizualizaţi textul generat sub fila Detalii sau adăugaţi mai multe articole de date în fila Câmpuri.

Dacă nu vedeţi fila Detalii şi fila Câmpuri, faceţi clic pe Afişare detalii şi câmpuri .

Afişarea detaliilor vizualizării


Când deschideţi o vizualizare, este afişată în zona de explorare principală. Panoul de explorare afişează
fila Detalii, fila Câmpuri şi fila Proprietăţi .

Dacă nu vedeţi panoul de explorare, faceţi clic pe pictograma Afişare detalii şi câmpuri .

Detalii vizualizare
Fila Detalii afişează textul care este generat pentru a descrie aspectele datelor reprezentate în vizualizări.
Aceste detalii nu sunt evidente doar privind la vizualizare. De exemplu, detaliile pot afişa o medie a
valorilor în timp.

Câmpuri
Fila Câmpuri este locul în care puteţi adăuga coloane pentru a construi şi modifica vizualizări. Adăugaţi o
coloană la fiecare câmp obligatoriu.

Proprietăţi
Fila Proprietăţi este locul în care puteţi modifica proprietăţile care se aplică vizualizărilor dumneavoastră.

Crearea unei singure vizualizări


În timp ce lucraţi cu explorarea decideţi că aveţi nevoie de o vizualizare nouă.

Despre acest task


Finalizaţi următorii paşi pentru a crea o singură vizualizare.

© Copyright IBM Corp. 2018, 2020 9


Procedură
1. Pe bara de unelte, selectaţi Card nou.
2. Selectaţi cardul blanc Singular.
3. În fereastra Surse, expandaţi activul de date pe care vreţi să-l folosiţi.
Dacă este deschis un alt activ de date, faceţi clic pe Întoarcere lângă numele activului de date care
este deschis.

4. Pentru a crea o nouă vizualizare, finalizaţi una din următoarele acţiuni:


• Trageţi şi plasaţi articole de date pe zona Creare vizualizare.
IBM® Cognos Analytics creează o vizualizare care să se potrivească articolelor de date. De exemplu,
când adăugaţi An sau Departament, este creat un tabel. Trageţi în ea o măsură cum ar fi Venit, şi
este creată o vizualizare bară.
• Faceţi clic pe Alegere tip şi selectaţi un tip de vizualizare. Apoi, adăugaţi un articol de date în
fiecare câmp.

Crearea unei vizualizări utilizând căutarea în câmpurile de date


Puteţi construi rapid o vizualizare care utilizează căutarea în câmpurile de date.

Procedură
1. Faceţi clic pe pictograma Explorări din panoul lateral.

Cardurile dumneavoastră sunt listate aici.


2. Faceţi clic pe cardul care afişează o miniatură de vizualizare pe care doriţi să o deschideţi.
Vizualizarea se deschide în vederea principală.
3. Faceţi clic pe fila Câmpuri .

Dacă nu vedeţi fila Câmpuri, faceţi clic pe Afişare detalii şi câmpuri .


4. Căutaţi datele de care aveţi nevoie. Faceţi clic pe date pentru a popula câmpul de date.

10 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Rezultate

Compararea a două vizualizări


Puteţi crea propria comparaţie pentru a analiza datele între două vizualizări. Sau, puteţi începe cu o
comparaţie recomandată. În ambele cazuri, este generat un sumar cu informaţii cheie şi diferenţele între
cele două vizualizări.

Despre acest task


Finalizaţi următorii paşi pentru a crea o comparaţie între două vizualizări.
Notă: Când creaţi o nouă vizualizare, puteţi selecta un card de comparare blanc card cu două sloturi
pentru vizualizări.

Capitolul 3. Visualizations 11
Procedură

1. Faceţi clic pe pictograma Explorări din panoul lateral.


Se deschide panoul Carduri.
2. Selectaţi un card pentru a crea o comparaţie.
Este afişată o vizualizare.
3. În bara de unelte, faceţi clic pe Comparare.
Pagina Cum vreţi să comparaţi? este afişată cu instrucţiuni de ghidare privind crearea propriei
comparaţii sau începeţi cu o recomandare.
4. Faceţi clic pe pictograma Adăugare card pe o miniatură de card pentru a-l adăuga la lista de
carduri în panoul de navigare. Sau, faceţi clic pe miniatura de card pentru a adăuga cardul nou şi a-l
vizualiza imediat.
5. Opţional, modificaţi datele dintr-o vizualizare pentru a o compara cu cealaltă vizualizare.
a) Selectaţi una dintre cele două vizualizări.
b) În fila Câmpuri, modificaţi vizualizarea folosind una dintre următoarele modalităţi, de exemplu:
• Înlăturaţi filtrele.
• Afişaţi numărul pentru primele sau ultimele.
• Înlăturaţi articole de date.
• Din panoul Surse, adăugaţi articole de date noi sau filtre. Sau utilizaţi căutarea în câmpurile de
date. Pentru informaţii suplimentare, consultaţi “Crearea unei vizualizări utilizând căutarea în
câmpurile de date” la pagina 10.

Compararea a două puncte de date pe o vizualizare


Puteţi selecta două puncte de date pe o vizualizare existentă şi comparaţi datele.

Procedură

1. Faceţi clic pe pictograma Explorări din panoul lateral.


Se deschide panoul Carduri.
2. Din panoul Carduri, selectaţi cardul care afişează miniatura vizualizării pe care vreţi să o deschideţi.
Vizualizarea se deschide în vederea principală.
3. Selectaţi două puncte de date pe vizualizare.
4. Faceţi clic dreapta şi apoi clic pe Comparare după.
5. Tastaţi o coloană pentru a compara cele două puncte de date.
Un tabel afişează informaţii despre cele două puncte de date comparate între ele.

Analiza de date avansată


IBM Cognos Analytics este o unealtă business intelligence pentru gestionarea şi analizarea datelor.
Include diverse caracteristici cu autoservire, care le permit utilizatorilor să pregătească, să exploreze şi să
partajeze datele. Ca parte a acestei oferte, Cognos Analytics include mai multe tehnici predictive,
descriptive şi de explorare, care mai sunt numite şi "numeric inteligence". Cognos Analytics utilizează
numeroase teste statistice pentru a vă analiza datele. Este important să înţelegeţi definiţiile acestor teste
deoarece ele se aplică la Cognos Analytics.
Pentru informaţii suplimentare, consultaţi Ghidul pentru tablouri de bord şi de poveşti IBM Cognos
Analytics.

12 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Alegerea unui alt tip de vizualizare
Vizualizările comunică comparaţii, relaţii şi tendinţe. Ele subliniază şi clarifică cifrele. Pentru a alege un tip
de vizualizare, luaţi în considerare ce doriţi să ilustreze vizualizarea şi ce ar fi atrăgător pentru publicul
ţintă.

Înainte de a începe
Pentru informaţii suplimentare despre tipurile de vizualizare, consultaţi documentaţia despre vizualizare
din Ghidul utilizatorului pentru tablouri de bord şi poveşti IBM Cognos Analytics.

Procedură
1. Din panoul Carduri, selectaţi cardul care reprezintă vizualizarea pe care vreţi să o deschideţi.

2. Faceţi clic pe pictograma Alegere tip de vizualizare din bara de unelte.


3. Faceţi clic pe tipul de vizualizare pe care doriţi să-l folosiţi.
Observaţi că fiecare tip de vizualizare comunică datele în mod diferit. De exemplu, folosiţi o vizualizare
cu bare, coloane sau linii pentru a compara un set de valori. Folosiţi o vizualizare linie sau suprafaţă
pentru a urmări relaţiile. Folosiţi o vizualizare hartă arbore sau radială pentru a vedea părţile unui
întreg.

Suprafaţă
Utilizaţi o vizualizare suprafaţă pentru a evidenţia magnitudinea modificării în timp.
Diagramele suprafaţă sunt la fel ca diagramele linie, dar suprafeţele de sub linii sunt umplute cu modele
sau culori. Diagramele stivuite sunt utile pentru a compara proporţional contribuţiile într-o categorie.
Acestea trasează valoarea relativă cu care contribuie la total fiecare serie de date.
Deoarece o vizualizare suprafaţă cuprinde rezultatele pentru fiecare coloană sau articol, este uşor de
văzut totalul tuturor rezultatelor.
De exemplu, o vizualizare suprafaţă este excelentă pentru a vă uita la venit în timp, peste mai multe
produse.
De exemplu, această vizualizare suprafaţă arată valoarea de durată de viaţă client pentru fiecare clasă de
autovehicul pe lună. Deoarece vizualizarea suprafaţă stivuieşte rezultatele, vedeţi totalurile pentru fiecare
lună.

Capitolul 3. Visualizations 13
Vizualizarea suprafaţă a fost creată prin tragerea următoarele articole de date din panoul Surse:
• Trageţi tipul Expiry Month pe câmpul axa x .
• Trageţi Vehicle Class în câmpul Culoare .
• Trageţi Customer Lifetime Value pe câmpul axa y

Eşantioane
Puteţi vedea un exemplu de vizualizare nor de cuvinte în raportul eşantion Customer lifetime value
analysis. Puteţi găsi eşantionul aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime
value analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.

Bară
Utilizaţi o vizualizare bară pentru a compara valorile uneia sau a mai multor coloane, cum ar fi vânzările de
produse sau vânzările de produse pentru fiecare lună.

14 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Vizualizările bară utilizează repere de date orizontale care sunt aranjate în grupuri, pentru a compara
valori individuale. Puteţi folosi vizualizări bară pentru a compara date discrete sau pentru a afişa
tendinţele în timp.
O vizualizare bară poate afişa modificarea într-o anumită perioadă de timp sau puteţi compara şi pune în
contrast două sau mai multe coloane într-o perioadă sau în timp. Dacă există multe bare astfel încât
etichetele sunt imposibil de citit, filtraţi datele pentru a focaliza un subset de date sau utilizaţi o hartă
arbore.

Utilizaţi câmpul Ţintă pentru a afişa măsurile care trebuie comparate cu o valoare ţintă.
Utilizaţi câmpul Pornire y pentru a defini unde trebuie să înceapă măsura.

Bulă
Folosiţi o vizualizare bulă pentru a arăta relaţiile dintre coloanele care conţin valori numerice, cum ar fi
venitul şi profitul.
O vizualizare bulă utilizează puncte de date şi bule pentru a trasa măsurile oriunde de-a lungul unei scale.
De-a lungul fiecărei axe este trasată câte o măsură. Mărimea bulei reprezintă o a treia măsură. Folosiţi
vizualizări bulă pentru a reprezenta date financiare sau orice date pentru care valorile de măsură sunt
înrudite.
Bulele au diferite mărimi şi culori. Pe axa x este reprezentată o măsură. Pe axa y este reprezentată altă
măsură, iar mărimea bulelor reprezintă a treia măsură. În exemplul de mai jos, culoarea este reprezentată
de un identificator.
Exemplu arătat reprezintă lunile de la începutul poliţei.

Creaţi diagrama cu bule prin tragerea următoarelor articole de date de la Customer Analysis din panoul

Sources :
• Trageţi Months Since Policy Incention în câmpul axa x .
• Trageţi Total Claim Amount în câmpul axa y .

Capitolul 3. Visualizations 15
• Trageţi Customer Lifetime Value în câmpul Mărime .
• Trageţi Employment Status în Color.
Puteţi personaliza diagrama cu bule. De exemplu, pentru a face axa x a diagramei cu bule să apară ca în
eşantion, efectuaţi următorii paşi:
1. faceţi clic pe vizualizare şi apoi în panoul Date, faceţi clic pe articolul de date <Total Claim Amount>.
2. Faceţi clic pe

3. Lângă Format date, faceţi clic pe şi setaţi următoarele opţiuni:


• Tip format: Monedă
• Simbol monedă: K
• Poziţie simbol monedă: Sfârşit
• Număr de zecimale: 0
• Scală: -3 (aceasta prezintă valorile în mii).
4. Faceţi clic pe OK.
Pentru a modifica mărimea vizualizării, faceţi clic pe vizualizare, apoi setaţi următoarea opţiune în panoul
Proprietăţi.
• Mărime - Lăţime: 700 px, Înălţime: 300 px
Faceţi clic pe pentru a închide panoul Proprietăţi.

Eşantioane
Puteţi vedea exemple de vizualizări în raportul eşantion Customer lifetime value analysis. Puteţi găsi
eşantioanele aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime value analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.

Marcator
Folosiţi diagrame marcator pentru a arăta măsurile care trebuie să fie comparate cu o valoare ţintă.
Într-un centru de apel, o diagramă marcator poate fi folosită pentru a măsura indici de măsurare cum ar fi
numărul de apeluri, timpul de răspuns la apel şi procentajul apelurilor abandonate.
În producţie, o diagramă marcator pot fi folosită pentru a urmări indici de măsurare cum ar fi numărul de
defecte şi comenzile livrate.
Într-un centru de fitness, o diagramă marcator poate fi folosită pentru a măsura indici de măsurare cum
ar fi numărul de paşi parcurşi şi caloriile arse.
Vizualizările marcator compară o măsură reală (marcatorul) cu măsura vizată (ţinta). De asemenea,
vizualizările marcator asociază măsurile comparate cu regiuni colorate din fundal, pentru a furniza mai
multe măsuri calitative, cum ar fi bine, satisfăcător şi nesatisfăcător. Vizualizările marcator pot să aibă
mărimi mici şi totuşi să furnizeze eficient informaţii.
O vizualizare marcator prezintă o singură măsură primară. De exemplu, venitul la zi pe anul curent. Şi
compară această măsură cu una sau mai multe măsuri, pentru o semnificaţie mai bogată. De exemplu,
comparată cu măsura ţintă, măsura primară este afişată în contextul unui interval calitativ privind
performanţa, cum ar fi nesatisfăcător, satisfăcător şi bine.
Dacă selectaţi o vizualizare marcator, specificaţi următoarele câmpuri:
• Câmpul Bară reală specifică măsura reală.
• Câmpul Ţintă specifică măsura ţintă.
• Câmpul Interval minim specifică intervalul calitativ minim.
• Câmpul Interval mediu specifică intervalul calitativ mijlociu.
• Câmpul Interval maxim specifică intervalul calitativ superior.

16 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Notă: Pentru o vizualizare marcator nu se poate face drill-through.
Asiguraţi-vă că intervalele minim, mediu şi maxim sunt asociate cu măsura reală şi ţintă.

Vizualizarea marcator a fost creată prin tragerea următoarele articole de date din panoul Surse:
• Trageţi Minimum Range în câmpul Interval minim .
• Trageţi Minimum Range în câmpul Interval minim .
• Trageţi Maximum Range în câmpul Interval maxim
• Trageţi Maximum Range în câmpul Bară reală
• Trageţi Target în câmpul Ţintă.
• Trageţi Vehicle class în câmpul Date suplimentare.

Eşantioane
Puteţi vedea un exemplu de vizualizare marcator în raportul eşantion Customer lifetime value analysis.
Puteţi găsi eşantionul aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime value
analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.

Coloană
Utilizaţi o vizualizare coloană pentru a compara valorile uneia sau a mai multor coloane, cum ar fi
vânzările de produse sau vânzările de produse pentru fiecare lună.
Vizualizările coloană utilizează repere de date verticale care sunt aranjate în grupuri, pentru a compara
valori individuale. Folosiţi vizualizări coloană pentru a compara date discrete sau pentru a afişa tendinţele
în timp.
O vizualizare coloană arată modificarea într-un anumit interval de timp sau poate compara şi pune în
opoziţie două sau mai multe coloane într-un interval de timp sau de-a lungul timpului. Dacă există multe
bare astfel încât etichetele sunt imposibil de citit, filtraţi datele pentru a focaliza un subset de date sau
utilizaţi o hartă arbore.
De exemplu, venitul pentru fiecare linie de produse este grupat pe trimestre, ceea ce evidenţiază
performanţa din fiecare trimestru.

Capitolul 3. Visualizations 17
Utilizaţi câmpul Ţintă pentru a afişa măsurile care trebuie comparate cu o valoare ţintă.
Utilizaţi câmpul Pornire y pentru a defini unde trebuie să înceapă măsura.

Tabel încrucişat
Utilizaţi un tabel încrucişat atunci când doriţi să afişaţi relaţiile dintre trei sau mai multe coloane. Tabele
încrucişate afişează datele în rânduri şi coloane, cu informaţiile sumarizate în punctele de intersecţie.
De exemplu, acest tabel încrucişat afişează costurile cursului pentru fiecare departament după
organizaţie.

Începând cu Cognos Analytics versiunea 11.1.4, puteţi trage date din panoul Surse selectate şi să le
inseraţi într-o coloană sau rând sau să le plasaţi peste date existente pentru a le înlocui.

18 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Player de date
Utilizaţi un player de date pentru a vedea o animaţie a impactului unei coloane pe alte vizualizări.

Arborele de decizie
Un arbore de decizie arată o ierarhie conectată de casete pentru a reprezenta valorile înregistrărilor.
Înregistrările sunt segmentate în grupuri, care sunt numite noduri. Fiecare nod conţine înregistrări, care
sunt similare din punct de vedere statistic una cu alta în ceea ce priveşte câmpul ţintă. De exemplu, un
nod poate conţine înregistrările cu bărbaţii care au mai mult de 18 ani de studii. Nodurile pot fi apoi
folosite pentru a face o predicţie referitoare la câmpul ţintă. De exemplu, nodul despre bărbaţi şi educaţie
poate fi folosit pentru o predicţie privitoare la salariu.
Fiecare ramură din arborele de decizie corespunde unei reguli de decizie. Pentru informaţii suplimentare
despre regulile de decizie, vedeţi “Vizualizarea regulilor de decizie” la pagina 22
Pentru a îmbunătăţi performanţa, din cauza numărului mare de rânduri din sursa de date, analiza se
bazează pe un eşantion reprezentativ din toate datele.
De exemplu, o vizualizare arbore de decizie poate arăta aşa:

Notă: Filtrele nu sunt suportate pentru vizualizările arbore de decizie.


Pentru informaţii suplimentare, consultaţi “Explorarea unei vizualizări de arbore de decizie” la pagina
19.

Explorarea unei vizualizări de arbore de decizie


O vizualizare arbore de decizie este folosită pentru a ilustra modul în care datele subiacente prevăd o
ţintă aleasă şi evidenţiază insight-urile cheie despre arborele de decizie.

Despre acest task


Puterea de predicţie a unui arbore de decizie determină gradul în care deciziile reprezentate de fiecare
ramură afişată în arbore, prevede valoarea ţintei.
Arborii de decizie au o singură ţintă. Dacă câmpul ţintă al arborelui de decizie este continuu, atunci
indicatorii de insight cheie evidenţiază grupurile neobişnuit de mari sau de mici. Dacă câmpul ţintă al
arborelui de decizie este categorial, atunci insight-ul cheie este modul nodului. Modul nodului este
categoria sau categoriile câmpului ţintă care apar cel mai frecvent în grup.

Capitolul 3. Visualizations 19
Pentru a îmbunătăţi performanţa, din cauza numărului mare de rânduri din sursa de date, analiza se
bazează pe un eşantion reprezentativ din toate datele.
Când examinaţi un arbore de decizie:
• Dacă vreţi să vedeţi toate driver-ele, utilizaţi fila Diagramă arbore sau fila Reguli.
• Dacă vreţi să vă focalizaţi pe driver-ele cheie, utilizaţi fila Explozie solară arbore.

Pentru a edita sau adăuga driver-e cheie, faceţi clic pe de pe câmpul ţintă.
Insight-urile sunt diferite în funcţie de tipul de ţintă. Dacă faceţi predicţia unei măsuri continue, de
exemplu venitul, vârsta sau profitul, atunci arborele de decizie arată în cadrul nodurilor valoarea medie a
ţintei în condiţiile date până acum în grupul care este reprezentat de nod. De exemplu, dacă aveţi un
arbore care face predicţia venitului şi aveţi o ramură care are genul şi apoi oraşul. Dacă urmaţi calea de la
bărbat la Chicago, atunci valoarea care este în nodul Chicago, este venitul mediu al bărbaţilor în Chicago.

Procedură
1. Dacă aveţi o măsură continuă, următorul exemplu ilustrează un arbore de decizie.
Culoarea arată dacă valoarea nodului este asociată cu valorile mare, mediu şi mică ale ţintei. Culoarea
nodului se bazează pe media ţintei pentru măsură. Cu cât este mai mare media pentru un nod, cu atât
este mai închisă culoarea.
De exemplu, mai jos este arătată o vizualizare detaliată pentru Cheltuieli la restaurant (Restaurant
Spending). Terminalul internaţional este un predictor puternic pentru cheltuieli mari la restaurant ale
celor care călătoresc pentru afaceri. O curăţenie precară la aeroport este un predictor de cheltuieli
mici pentru călătorii care participă la conferinţe/convenţii.
Mini-harta vă ajuta să vă mişcaţi în jurul arborelui. Mini-harta este de ajutor în special când sunt multe
noduri.
În acest exemplu, primele cinci cele mai mari valori ţintă sunt indicate cu un număr. Puteţi alege dintre
următoarele opţiuni:
• Arbore complet. Nu sunt indicate în mod specific valorile cele mai mari şi cele mai mici.

• Primele cinci cele mai mari valori ţintă. Sunt arătate primele cinci cele mai mari valori ţintă.

• Primele cinci cele mai mici valori ţintă. Sunt arătate primele cinci cele mai mici valori ţintă.

Dacă aveţi o măsură categorială, selectaţi categoria pentru care vreţi să vedeţi primele cinci sau
ultimele cinci din meniul Primele 5 noduri pentru: sau meniul Ultimele 5 noduri pentru:.
În cazul în care măriţi prea mult, primele cinci şi ultimele cinci noduri nu sunt vizibile.

20 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


2. Dacă aveţi o măsură categorială, următorul exemplu ilustrează arborele de decizie.
Culoarea arată valoarea sau valorile de câmp care sunt reprezentate cel mai mult.
În fila Explozie solară arbore, puteţi vedea că dacă măsurile din arborele de decizie sunt factori de
predicţie pentru o valoare ţintă sau valori ţintă, atunci culorile predomină în nodul respectiv. Valorile
nesemnificative sunt lăsate afară.
De exemplu, mai jos este prezentată o vizualizare detaliată a stării civile în fila Explozie solară arbore.
Aceasta arată că a fi angajat este un factor de predicţie puternic pentru a fi căsătorit.

În fila Diagramă arbore, nodurile prezintă vizual distribuţia persoanelor în funcţie de starea civilă.

Capitolul 3. Visualizations 21
Vizualizarea regulilor de decizie
O regulă de decizie face predicţia unui rezultat în câmpul ţintă. Vizualizarea regulilor de decizie vă ajută să
determinaţi ce condiţii par să ducă la un anumit rezultat.
De exemplu, luaţi în considerare câteva reguli de decizie ipotetice care are putea prognoza migrarea
clienţilor. Aceste reguli pot identifica clasificări bazate pe intervalul de vârstă al clienţilor şi numărul de
cereri de revendicare anterioare. Din aceste reguli, puteţi observa că este mai probabil să pierdeţi clienţii
care au o cerere sau niciuna şi au vârsta peste 50 de ani.
Fiecare ramură din arborele de decizie corespunde unei reguli de decizie.

Procedură
1. Într-un arbore de decizie, apăsaţi Reguli.
2. Examinaţi regulile de decizie.
3. Pentru a reveni la vizualizare, apăsaţi Diagramă arbore.

Analiză driver-e
O vizualizare de analiză a driver-elor vă arată driver-ele cheie (predictorii) pentru o ţintă. Cu cât un driver
este plasat mai spre dreapta, cu atât driver-ul respectiv este mai puternic.
IBM Cognos Analytics utilizează algoritmi complecşi pentru a furniza insight-uri ci nivel înalt de
semnificaţie, bazate pe o modelare complexă. Nu trebuie să ştiţi ce teste statistice trebuie să fie rulate
pentru datele dumneavoastră. Cognos Analytics alege teste corespunzătoare pentru date.
În vizualizarea de analiză a driver-elor din tablouri de bord şi explorări sunt disponibile driver-ele cheie,
atât pentru ţinte continue, cât şi pentru cele categoriale.
Pentru informaţii suplimentare, consultaţi documentaţia Teste statistice în Ghidul utilizatorului pentru
tablouri de bord şi poveşti IBM Cognos Analytics.
De exemplu această vizualizare de analiză a driver-elor arată că o combinaţie dintre satisfacţia generală,
nivelul de semnalizare, nivelul de securitate şi impresia artistică reprezintă cele mai puternice driver-e
pentru evaluarea aeroportului ţintă.

Pentru a edita sau adăuga driver-e cheie, faceţi clic pe pe slotul de date ţintă.
Pentru a îmbunătăţi performanţa, din cauza numărului mare de rânduri din sursa de date, analiza se
bazează pe un eşantion reprezentativ din toaste datele.

22 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Dacă treceţi cu mouse-ul peste un punct de date, vizualizarea de analiză a driver-elor vă arată ce anume
influenţează evaluarea generală a unui aeroport.

Dacă faceţi clic pe un punct de date din arbore, sunt afişate alte vizualizări recomandate.

Notă: Filtrele nu sunt suportate pentru vizualizările de analiză a driver-elor.

Harta termică
Folosiţi o vizualizare hartă termică pentru a vedea relaţia dintre coloanele reprezentate într-o vizualizare
de tip matrice.
O vizualizare hartă termică utilizează culoarea şi intensitatea culorii pentru a afişa relaţia dintre două
coloane.
De exemplu, această vizualizare hartă termică arată valoarea pe durata de viaţă client după gen şi
educaţie.

Capitolul 3. Visualizations 23
Creaţi vizualizarea hartă termică prin tragerea următoarelor articole de date din panoul Surse :
• Trageţi Gender în câmpul Rânduri .
• Trageţi Education în câmpul Coloane .
• Trageţi Customer Lifetime Value în câmpul Căldură .

Eşantioane
Puteţi vedea exemple de vizualizări în raportul eşantion Customer lifetime value analysis. Puteţi găsi
eşantioanele aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime value analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.

Ierarhie
Utilizaţi o ierarhie când doriţi să vedeţi datele în rânduri şi coloane.
De exemplu, această ierarhie afişează tipurile de produse.

24 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Bulă ierarhie
Folosiţi o vizualizare bulă ierarhie atunci când vreţi să arătaţi relaţiile dintre coloanele care conţin valori,
cum ar fi pierderea netă. Este similară cu vizualizarea bulă, dar bulele sunt strâns lipite în loc să fie
distribuite peste o grilă. Bulele sunt imbricate pentru a reprezenta ierarhia. O vizualizare bulă ierarhie
prezintă o cantitate mare de date într-un spaţiu mic.
Mărimea fiecărei bule arată dimensiunea cantitativă a fiecărui punct de date. Acesta arată multe niveluri
într-o ierarhie şi relaţiile între grupuri bazate pe atributele alocate. Utilizează mărimea bulei şi culoarea
pentru a furniza informaţii comparative despre categorii.
Bulele au diferite mărimi şi culori.
De exemplu, această vizualizare bulă ierarhie arată valoarea de durată de viaţă a clientului în funcţie de
clasa de vehicul per mărime vehicul. Fiecare bulă este o clasă de vehicul diferită, în una dintre cele trei
mărimi de vehicul. Mărimea fiecărei bule este determinată de valoarea de durată de viaţă a clientului a
acelei clase de vehicul. Culorile bulelor sunt determinate de mărimea vehiculului.

Capitolul 3. Visualizations 25
Vizualizarea cu bule grupate ierarhică a fost creată prin tragerea următoarele articole de date din panoul
Surse:
• Trageţi Vehicle Class şi Vehicle Class în câmpul Bule .
• Trageţi Customer Lifetime Value în câmpul Mărime .
• Trageţi Dimensiune vehicul în câmpul Culoare

Eşantioane
Puteţi vedea un exemplu de vizualizare nor de cuvinte în raportul eşantion Customer lifetime value
analysis. Puteţi găsi eşantionul aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime
value analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.

KPI
Folosiţi o vizualizare KPI pentru a afişa un indicator de performanţă cheie (KPI) ce conţine două măsuri
conexe, cum ar fi venitul real şi venitul ţintă. Opţional, puteţi afişa o diagramă sparkline şi o formă cu
semnificaţie în vizualizările dumneavoastră KPI.
O vizualizare KPI compară o valoare de bază cu o valoare ţintă şi arată variaţia între cele două măsuri.

26 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


De exemplu, această vizualizare KPI arată venitul real cu verde şi o săgeată în sus, pentru a indica faptul
că venitul este comparat cu ţinta. În acest caz, valoarea ţintă este venitul planificat. O diagramă sparkline
afişează forma variaţiei de-a lungul timpului şi are aceeaşi culoare ca valoarea de bază.

Creaţi o vizualizare KPI prin tragerea măsurilor din sursa de date proprie la sloturile de date la câmpurile
dintr-o vizualizare KPI goală:
1. Pe bara de unelte, selectaţi Card nou.
2. Selectaţi cardul blanc Singular.
3. Faceţi clic pe Alegeţi un tip şi selectaţi tipul de vizualizare KPI. Apoi, adăugaţi un articol de date în
fiecare câmp.
4. Trageţi o măsură în câmpul Valoare de bază. Această valoare este ţinta reală.
5. Trageţi o măsură în câmpul Valoare ţintă.
6. Trageţi o altă măsură în câmpul Timp. Această valoare creează o diagramă sparkline pentru
vizualizarea dumneavoastră KPI. Puteţi adăuga mai multe măsuri, de exemplu Ani şi Luni, la câmpul
Timp.
Folosiţi proprietăţile pentru a personaliza o vizualizare KPI. De exemplu, proprietăţile sunt setate implicit
pentru afişarea culorii condiţionale verde atunci când este atinsă ţinta şi a culorii condiţionale roşu atunci
când nu este îndeplinit obiectivul. Pentru a afişa ţinta reală cu altă culoare, sub proprietăţi, expandaţi
regula şi apoi selectaţi altă Culoare text.
Finalizaţi următorii paşi pentru a edita o regulă de culoare condiţională şi selectaţi o culoare
personalizată:
1. Selectaţi vizualizarea KPI pe explorarea dumneavoastră.
2. Faceţi clic pe fila Proprietăţi.
3. Sub Reguli, expandaţi regula pe care vreţi să o editaţi.
4. Din Culoare text, selectaţi o culoare.
Informaţiile următoare explică proprietăţile KPI de sub Stil regulă:
• Culoare text
Setaţi culoarea pentru valoare, diagrama sparkline şi forma de indicator.
• Indicator
Selectaţi o formă pentru afişarea pe vizualizarea KPI când este îndeplinită regula. De exemplu, aţi putea
afişa o săgeată în jos atunci când valoarea de bază scade sub un anumit prag comparativ cu valoarea
ţintă.

Capitolul 3. Visualizations 27
Hartă moştenită
Folosiţi o hartă moştenită atunci când vreţi să vedeţi modele în datele dumneavoastră în funcţie de zona
geografică. Puteţi folosi o hartă moştenită când nu sunteţi conectat la internet.
De exemplu, această vizualizare hartă moştenită prezintă venitul după ţara vânzătorului cu amănuntul,
culorile mai închise indicând un venit mai mare.

Pentru informaţii suplimentare, consultaţi https://www.ibm.com/support/knowledgecenter/


SSEP7J_11.1.0/com.ibm.swg.ba.cognos.ug_ca_legacymaps.doc/ug_ca_legacymaps.pdf.

Linie
Utilizaţi o vizualizare linie pentru a afişa tendinţele în timp.
O vizualizare linie poate compara tendinţele şi ciclurile, poate deduce relaţiile dintre variabile sau poate
afişa modul în care o singură variabilă funcţionează în timp.
Pentru o vizualizare linie efectivă, utilizaţi o coloană de timp pe axa x, cum ar fi ani, trimestre, luni sau zile.
Dacă axa x afişează altceva, cum ar fi Canada, Olanda, Regatul Unit şi SUA, utilizaţi o diagramă bară sau
coloană.
De exemplu, această vizualizare linie afişează tendinţa costurilor în curs după departament în tot anul.

28 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Linie şi coloană
Utilizaţi o vizualizare linie şi coloană pentru a evidenţia relaţiile dintre mai multe serii de date prin
combinarea liniilor şi barelor cu o vizualizare.
De exemplu, această vizualizare linie şi coloană afişează relaţia dintre costul cursului şi totalul cheltuit
după departament.

Capitolul 3. Visualizations 29
Listă
Folosiţi o vizualizare listă pentru a crea o imagine de ansamblu a datelor într-un mod ierarhic.
O altă utilizare a vizualizării listă vizualizare este de a crea widget-ul de filtrare. Următorul exemplu arată
cum puteţi folosi vizualizarea listă ca un widget de filtrare.

Hartă
Folosiţi o hartă atunci când vreţi să vedeţi modele în datele dumneavoastră în funcţie de zona geografică.
Activele dumneavoastră de date trebuie să conţină date geografice, cum ar fi ţări, state, provincii sau
continente.
Notă: Hărţile nu afişează animaţii dacă setările dumneavoastră de sistem privind simplitatea accesului
sunt configurate pentru a nu fi afişate animaţiile.
Hărţile din Cognos Analytics suportă următoarele continente:
• America de Nord
• America de Sud
• Africa
• Asia
• Europa
• Antarctica
• Oceania
Pentru a stabili dacă o coloană poate fi transpusă în hartă, Cognos Analytics analizează un eşantion de
2000 de valori din coloana de locaţie, căutând nume de locuri ce pot fi recunoscute. Dacă 80% sau mai
multe sunt recunoscute ca valori de hartă, Cognos Analytics produce o hartă.

30 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


De exemplu, aveţi patru ţări în coloana de locaţie: Brazilia, China, Indiea şi Rusia. Deoarece India este
scrisă greşit, înseamnă că numai 75% din valori pot fi recunoscute ca nume de loc şi nu veţi vedea o hartă
ca punct de pornire. Dar dacă aveţi cinci ţări şi una este scrisă greşit, vedeţi o hartă.
De exemplu, această vizualizare hartă prezintă venitul după ţara vânzătorului cu amănuntul, culorile mai
închise indicând un venit mai mare.

Marimekko
O vizualizare Marimekko este similară cu o vizualizare coloană stivuită. Arată datele prin diferite înălţimi şi
include o dimensiune de date adăugată prin variaţia lăţimii de coloană. Lăţimea coloanelor se bazează pe
valoarea care este atribuită câmpului de lăţime. Înălţimea segmentului individual este un procent din
valoarea totală a coloanei respective.
Puteţi observa imediat segmentele mari, cum ar fi o anumită bară verticală ce reprezintă o porţiune mare
a regiunii. De asemenea, identifica spaţiul alb, cum ar fi bara verticală cu reprezentare insuficientă într-o
anumită regiune.
Vizualizarea Marimekko este utilă pentru comparaţiile parte-întreg, în care trebuie să arătaţi o măsură/
variabilă suplimentară.
Vizualizarea Marimekko permite datelor să fie evidenţiate de-a lungul a două dimensiuni simultan. De
exemplu, segmentele de piaţă sunt adesea dispuse de-a lungul axei x, lăţimea fiecărei coloane
corespunzând valorii financiare a segmentului. Folosiţi vizualizări Marimekko atunci când, de exemplu,
vreţi să arătaţi contribuţia la venit a fiecărei linii de produse. Sau produs intern brut pentru fiecare ţară.
Vizualizarea Marimekko poate afişa numărul total sau parţial. Dacă vreţi să folosiţi procentaje stivuite în
loc de numere, selectaţi opţiunea Afişare diagramă procentaj stivuit.

Capitolul 3. Visualizations 31
Următorul exemplu arată contribuţia la valoarea de durată de viaţă client şi statusul de angajat în
diferitele clase de vehicul cu opţiunea Afişare diagramă procentaj stivuit activată.

Vizualizarea Marimekko a fost creată prin tragerea următoarele articole de date din panoul Surse:
• Trageţi tipul Vehicle Class în câmpul Bare .
• Trageţi Customer Lifetime Value în câmpul Lungime .
• Trageţi Employment Status în câmpul Culoare.

Eşantioane
Puteţi vedea un exemplu de vizualizare nor de cuvinte în raportul eşantion Customer lifetime value
analysis. Puteţi găsi eşantionul aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime
value analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.

Reţea
Folosiţi o vizualizare reţea atunci când vreţi să vedeţi conexiunile între coloanele din activele
dumneavoastră de date. O vizualizare reţea este o bună alegere pentru a prezenta conexiunile, reţelele şi
punctele de intersecţie.
Vizualizările reţea afişează un set de noduri, reprezentate prin simboluri, şi legături, reprezentate prin căi,
pentru a arăta relaţia dintre entităţi sau articole.
Utilizaţi câmpurile De la şi La pentru a defini relaţia pe care doriţi să o investigaţi.
De exemplu, o vizualizare reţea poate arăta acceptarea ofertei după Clasa de vehicul

32 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Creaţi vizualizarea reţea prin tragerea următoarelor articole de date din secţiunea Offers din panoul

Surse :
• Trageţi Offer în câmpul De la.
• Trageţi Vehicle Class în câmpul La .
• Trageţi Accepted în câmpul Lăţime linie.
În continuare, setaţi mărimea şi proprietăţile nodului.
1. Faceţi clic pe . Setaţi următoarele opţiuni în panoulProprietăţi:
• Mărime - Lăţime: 500 px, Înălţime: 300 px
• Mărime minimă nod: 20
• Mărime maximă nod: 100
2. Faceţi clic pe pentru a închide panoul Proprietăţi.

Eşantioane
Puteţi vedea exemple de vizualizări în raportul eşantion Customer lifetime value analysis. Puteţi găsi
eşantioanele aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime value analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.

Bule grupate
Folosiţi o vizualizare cu bule grupate atunci când vreţi să arătaţi relaţiile dintre coloanele care conţin
valori numerice, cum ar fi venitul. Este similară cu vizualizarea bulă, dar bulele sunt strâns lipite în loc să
fie distribuite peste o grilă. O vizualizare cu bule grupate prezintă o cantitate mare de date într-un spaţiu
mic.
Bulele au diferite mărimi şi culori.
De exemplu, această vizualizare cu bule grupate prezintă angajările externe pe departamente. Fiecare
bulă reprezintă un departament diferit. Mărimea fiecărei bule este determinată de numărul de angajări
externe pentru departamentul respectiv.

Capitolul 3. Visualizations 33
Radială
Utilizaţi o vizualizare radială pentru a evidenţia proporţiile. Fiecare felie afişează relaţia relativă dintre
fiecare parte şi întreg.
De exemplu, această vizualizare radială fişează numărul de zile de curs pentru fiecare departament.

Punct
Utilizaţi o vizualizare punct pentru a arăta tendinţele în timp.
O vizualizare punct poate compara tendinţele şi ciclurile, infera relaţiile dintre variabile sau afişa modul în
care o singură variabilă se comportă în timp.

34 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


O vizualizare punct este asemănătoare cu o vizualizare linie, însă fără liniile de conectare.
Pentru o vizualizare linie efectivă, axa x ar trebui să afişeze timpul, cum ar fi anii, trimestrele, lunile sau
zilele. Dacă axa x afişează altceva, cum ar fi Canada, Olanda, UK şi US, utilizaţi o vizualizare bară.
Valorile de date sunt trasate vertical.
De exemplu, această vizualizare linie afişează venitul pe trimestru după tipul de metodă de comandă.
Comenzile Web au crescut dramatic în această perioadă.

Circulară
Într-o vizualizare circulară, fiecare bară apare dispusă pe un cerc, barele mai lungi reprezentând valori
mai mari. Treceţi cu cursorul mouse-ului peste o bară pentru a vedea detalii despre ea, cum ar fi valoarea
exactă pe care o reprezintă bara respectivă. Fiecare bară începe la poziţia orei 12 (prânz) şi continuă în
sensul acelor de ceasornic pentru valorile pozitive şi în sens invers acelor de ceasornic pentru valorile
negative.
Vizualizările circulare, numite şi diagrame cadran sau diagrame vitezometru, prezintă informaţiile la fel ca
la citirea cadranului unui aparat de măsură. Vizualizarea circulară este validă doar cu o categorie.
De exemplu, această vizualizare arată reînnoirile după tipul de ofertă şi sex.

Capitolul 3. Visualizations 35
Creaţi vizualizarea circulară prin tragerea următoarele articole de date din secţiunea Analiză clienţi în

panoul Surse :
• Trageţi Renew Offer Type în câmpul Bare.
• Trageţi Number of Policies în câmpul Lungime.
• Trageţi Gender în câmpul Culoare .
Următorul pas este să setaţi proprietăţile de sortare pentru Renew Offer Type şi Gender.
1. Faceţi clic pe vizualizare şi apoi în panoul Date, faceţi clic pe articolul de date <Renew Offer Type>.
2. Faceţi clic pe
3. În panoul Proprietăţi, pentru Ordine de sortare, selectaţi Crescător.
4. În panoul Date, faceţi clic pe articolul de date <Gender>.
5. În panoul Proprietăţi, pentru Ordine de sortare, selectaţi Descrescător.
6. Faceţi clic pe pentru a închide panoul Proprietăţi.

Eşantioane
Puteţi vedea exemple de vizualizări în raportul eşantion Customer lifetime value analysis. Puteţi găsi
eşantioanele aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime value analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.

Prin puncte
Vizualizările prin puncte folosesc punctele de date pentru a desena două măsuri oriunde de-a lungul unei
scale, nu numai la gradaţiile regulate.
Vizualizările prin puncte sunt utile pentru explorarea corelărilor între diferitele seturi de date.
Exemplul următor arată corelaţia dintre venitul şi profitul brut pentru fiecare linie de produse.

36 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Spirală
O vizualizare spirală vă arată driver-ele cheie (predictorii) pentru o anumită ţintă. Cu cât un driver este mai
aproape de centru, cu atât driver-ul respectiv este mai puternic.
IBM Cognos Analytics utilizează algoritmi complecşi pentru a furniza insight-uri ci nivel înalt de
semnificaţie, bazate pe o modelare complexă. Nu trebuie să ştiţi ce teste statistice trebuie să fie rulate
pentru datele dumneavoastră. Cognos Analytics alege teste corespunzătoare pentru date.
Driver-ele cheie, atât pentru ţinte continue, cât şi pentru cele categoriale, sunt disponibile în vizualizarea
spirală în tablouri de bord şi explorări.
Pentru informaţii suplimentare, consultaţi documentaţia Testele statistice în Ghidul utilizatorului pentru
tablouri de bord şi poveşti IBM Cognos Analytics.
De exemplu, această vizualizare spirală arată că combinaţia dintre clasa de vehicul, tipul de locaţie,
acoperire, starea civilă şi situaţia profesională reprezintă cele mai puternice driver-e ale ţintei, suma
totală revendicată.
Puteţi să excludeţi unele driver-e din analiză. Faceţi clic-dreapta pe un driver şi apoi faceţi clic pe

pictograma Editare driver-e . Selectaţi driver-ele pe care vreţi să le includeţi în analiză.

Pentru a edita sau adăuga driver-e cheie, faceţi clic pe pe slotul de date ţintă.
Pentru a îmbunătăţi performanţa, din cauza numărului mare de rânduri din sursa de date, analiza se
bazează pe un eşantion reprezentativ din toate datele.

Capitolul 3. Visualizations 37
Notă: Filtrele nu sunt suportate pentru vizualizările spirală.

Bară stivuită
Utilizaţi o vizualizare bară stivuită pentru a compara contribuţiile proporţionale pentru fiecare articol la
total, cum ar fi vânzările de produse şi vânzările de produse în fiecare lună.
O vizualizare bară stivuită poate afişa modificarea într-o anumită perioadă de timp sau compara
contribuţiile proporţionale pentru fiecare articol la total. Dacă există multe bare astfel încât etichetele
sunt imposibil de citit, filtraţi datele pentru a focaliza un subset de date sau utilizaţi o hartă arbore.

Coloană stivuită
Utilizaţi o vizualizare coloană stivuită pentru a compara contribuţiile proporţionale pentru fiecare articol la
total, cum ar fi vânzările de produse şi vânzările de produse în fiecare lună.

38 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


O vizualizare coloană stivuită poate afişa modificarea într-o anumită perioadă de timp sau poate compara
contribuţiile proporţionale pentru fiecare articol la total. Dacă există multe bare astfel încât etichetele
sunt imposibil de citit, filtraţi datele pentru a focaliza un subset de date sau utilizaţi o hartă arbore.

Sumar
Utilizaţi o vizualizare sumar când doriţi să vedeţi totalul pentru o măsură sau numărul pentru o coloană pe
categorii.
De exemplu, această vizualizare sumar afişează venitul total pentru toate tipurile de produse.

De exemplu, această vizualizare sumar afişează numărul de departamente din organizaţia


dumneavoastră.

Capitolul 3. Visualizations 39
Explozie solară
O vizualizare explozie solară este folosită pentru a ilustra modul în care datele subiacente prevăd o ţintă
aleasă şi evidenţiază insight-urile cheie.
Pentru mai multe informaţii despre vizualizarea explozie solară, consultaţi “Explorarea unei vizualizări de
arbore de decizie” la pagina 19.

Tabel
Utilizaţi un tabel pentru a afişa informaţii detaliate din baza dumneavoastră de date, cum ar fi listele de
produse sau listele de clienţi. Un tabel afişează datele pe rânduri şi coloane. În fiecare coloană sunt
afişate toate valorile unui articol de date din baza de date sau ale unui calcul bazat pe articolele de date
din baza de date.
De exemplu, acest tabel afişează costul cursului pentru fiecare departament.

Adăugarea mai multor coloane la un tabel


Puteţi focaliza pe puncte de interes pentru dumneavoastră prin adăugarea mai multor date la vizualizare .
1. Trageţi altă coloană în câmpul în care doriţi date suplimentare.
2. Plasaţi coloana lângă coloana existentă.
Începând cu Cognos Analytics versiunea 11.1.4, puteţi trage date din panoul Surse selectate şi să le
inseraţi într-o coloană sau rând sau să le plasaţi peste date existente pentru a le înlocui.

40 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Hartă arbore
Utilizaţi o vizualizare de hartă arbore pentru a identifica tipare şi excepţii într-un activ cu multe date
complexe.
Hărţile arbore arată relaţiile dintre un număr mare de componente utilizând codarea cu culori şi mărimea
într-un set de dreptunghiuri imbricate.
Într-o hartă arbore care este colorată în funcţie de categorie, categoria de nivel 1 este identificată după
culoare. Mărimile dreptunghiurilor reprezintă valorile. Într-o hartă arbore care este colorată în funcţie de
valoare, mărimile dreptunghiurilor reprezintă una dintre valori, iar culoarea reprezintă un al doilea set de
valori. Nu utilizaţi date care includ numere negative. O hartă arbore ignoră numerele negative.
Multe active de date au o structură ierarhică. De exemplu, aveţi date despre marja de profit pentru
articolele alimentare dintr-o băcănie. Sub categoria generală de fructe, există o categorie pentru citrice.
Diverse fructe citrice sunt listate, cum ar fi grepfruturile, portocalele sau lămâile. O hartă arbore vă arată
performanţa pentru fiecare fruct citric, comparându-le unul cu altul şi cu alte tipuri de alimente.
De exemplu, această vizualizare hartă arbore arată costul cursului pentru fiecare organizaţie.

Pentru a deselecta o casetă pe care aţi selectat-o, faceţi Ctrl+clic pe caseta selectată.

Cascadă
Folosiţi o vizualizare cascadă pentru a înţelege efectul cumulativ al unei serii de valori pozitive şi negative
asupra unei valori iniţiale. Barele din vizualizarea cascadă nu sunt totaluri.
O vizualizare cascadă arată cum este crescută sau descrescută o valoare iniţială de o serie de valori
intermediare, conducând la o valoare finală cumulativă, afişată în coloana din extremitatea dreaptă.
Valorile intermediare pot fi bazate pe timp sau bazate pe categorie.
Următoarele sunt exemple de vizualizări cascadă:
• Vizualizarea venitului net după ce adăugaţi creşterile şi descreşterile de venit şi costurile pentru o
întreprindere, de-a lungul unui trimestru.
• Vânzările cumulative pentru produse de-a lungul unui an, cu un total anual.
Această vizualizare cascadă arată diferenţa pentru deţinătorul de poliţă pentru fiecare lună.

Capitolul 3. Visualizations 41
Crearea unei vizualizări cascadă
1. Creaţi o nouă explorare. Pentru informaţii suplimentare, consultaţi “Pornirea unei explorări noi de la
meniul Nou” la pagina 1.
2. Deschideţi modulul de date eşantion: Select o sursă > Conţinut de echipă > Eşantioane > Date >
Customer analysis.
3. Faceţi clic pe Vizualizări şi faceţi clic pe Cascadă pentru a adăuga vizualizarea cascadă la explorare.
4. Faceţi clic pe Surse

5. Trageţi următoarele articole de date din secţiunea Policy Holders:


• Trageţi Month pe axa x.
• Trageţi Delta pe axa y.

Nor de cuvinte
Folosiţi o vizualizare nor de cuvinte atunci când vreţi să vedeţi o vizualizare bazată pe text pentru o
coloană. Înălţimea coloanei reprezintă scala. Numele în sine reprezintă diferiţi membri ai coloanei.
Indiciu: Activul de date ar trebui să conţină cel puţin 15 coloane şi cel puţin 100 de rânduri pentru a crea
un nor de cuvinte eficient.
De exemplu, această vizualizare nor de cuvinte prezintă valoarea duratei de viaţă pentru client, după
mărimea şi clasa vehiculului.

42 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Norul de cuvinte a fost creat prin tragerea următoarele articole de date din panoul Surse:
• Trageţi tipul Mărime vehicul în câmpul Cuvinte .
• Trageţi Average CLTV în câmpul Mărime.
• Trageţi Vehicle class în câmpul Culoare.

Eşantioane
Puteţi vedea un exemplu de vizualizare nor de cuvinte în raportul eşantion Customer lifetime value
analysis. Puteţi găsi eşantionul aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime
value analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.

Insight-urile în vizualizări
IBM Cognos Analytics furnizează insight-uri analitice care vă ajută să detectaţi şi să validaţi relaţii
importante şi diferenţe semnificative pe baza datelor prezentate de vizualizare.

Insight-urile sunt disponibile făcând clic pe pictograma Insight-uri din vizualizările eligibile. Când
activaţi insight-urile, apare sumarul în caseta Insight-uri, sunt evidenţiate elementele de vizualizare
înrudite şi sunt furnizate detalii în mesajul tooltip corespondent. Puteţi să controlaţi fiecare insight
disponibil în mod separat.

Procedură

1. Într-o vizualizare care suportă insight-uri, faceţi clic pe pictograma Insight-uri .


2. În funcţie de vizualizare, sunt afişate următoarele insight-uri:
• Medie Furnizează media valorii ţintă afişate.
• Putere predictivă Afişează puterea de predicţie a relaţiei dintre câmpurile ţintă şi explicative.
• Linia de ajustare Arată dacă există o relaţie liniară sau pătratică între câmpurile ţintă şi explicative.
• Diferenţe semnificative Afişează valorile care sunt cel mai semnificativ mai mari sau mai mici faţă
de medie sau tendinţă.

Capitolul 3. Visualizations 43
• Cele mai frecvente Afişează valorile care sunt raportate cel mai frecvent.

Alegerea insight-urilor corelate


În funcţie de vizualizarea dumneavoastră vi se prezintă insight-uri corelate, bazate pe statistici.

Despre acest task


Dacă sunt disponibile insight-uri corelate care sunt asociate vizualizării principale, este arătată o

pictogramă verde cu un număr fie pe axa x, fie pe axa y. Numărul indică insight-urile corelate
disponibile.
Pentru a accesa vizualizările corelate, finalizaţi următorii paşi:

Procedură

1. Din vizualizare, faceţi clic pe pictograma verde .


2. Faceţi clic pe oricare din insight-urile bazate pe statistici care sunt prezentate în meniu.
Este creat un nou card.

Alegerea vizualizărilor recomandate


Vizualizările recomandate sunt miniaturi care reprezintă vizualizări care ar putea fi corespunzătoare
pentru dumneavoastră.

Procedură
1. Din panoul Carduri, selectaţi cardul care reprezintă vizualizarea pe care vreţi să o deschideţi.

2. Faceţi clic pe Alegere tip de vizualizare din bara de unelte.


Sunt afişate vizualizările recomandate.
3. Faceţi clic pe miniatura vizualizării recomandate cu care doriţi să lucraţi.

Alegerea vizualizărilor înrudite


Când o vizualizare este în focalizare într-o explorare, sistemul recomandă unele vizualizări înrudite care
nu tocmai cea ce aţi cerut. Pe baza analizei datelor, aceste vizualizări înrudite pot să vă intereseze.

Despre acest task


Vizualizările înrudite înlocuiesc unul din elementele de date din vizualizare sau adaugă un alt element de
date pentru a crea o vizualizare nouă. Vizualizările înrudite utilizează o combinaţie de interacţiuni învăţate
ale utilizatorului, între statistici şi "gradul de interes" pentru a sugera paşi ulteriori care să vă ajute.
Pentru a accesa vizualizările înrudite, finalizaţi următorii paşi:

Procedură
1. Din panoul Carduri, selectaţi cardul care reprezintă vizualizarea pe care vreţi să o deschideţi.

2. Faceţi clic pe pictograma Înrudit în bara de unelte.

44 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Capitolul 4. Forecasting

Previzionarea
Utilizaţi previzionarea în IBM Cognos Analytics pentru a descoperi şi modela tendinţa, sezonalitatea şi
dependenţa de timp a datelor.
Puteţi realiza o previziune în IBM Cognos Analytics folosind unelte automate, care modelează datele
dependente de timp. Automatizarea selecţiei şi ajustării modelelor simplifică utilizarea previzionării, chiar
dacă nu sunteţi familiarizat cu modelarea seriilor temporale.
Previziunile şi limitele de încredere sunt afişate în vizualizări ca o continuare a datelor istorice. De
asemenea, puteţi să vizualizaţi detaliile statistice pentru modelele generate, dacă vreţi să vedeţi fundalul
tehnic.
Specificarea seriilor temporale în previziuni necesită adesea manipularea datelor. Cognos Analytics are
inclus suport pentru o gamă largă de serii temporale fără necesitatea manipulării, care variază de la
tipurile de dată calendaristică şi de oră standard la câmpuri de oră periodice şi ciclice imbricate. Când
datele sunt organizate ca serii temporale, pregătirea datelor este automatizată. Sunt detectate tendinţele
şi perioadele sezoniere corespunzătoare şi sunt selectate modelele dintr-un set de nouă tipuri de model
diferite.
Puteţi realiza previziunea în vizualizările linie, bară şi coloană. Previzionarea permite analiza a sute de
serii temporale per vizualizare. Sunt calculate previziunile şi limitele de încredere pentru fiecare serie
temporală şi acestea sunt afişate în vizualizare ca extensii ale datelor curente. Puteţi să inspectaţi fiecare
serie temporală separat şi să adaptaţi previziunea şi rezultatele la datele şi cerinţele dumneavoastră.
Dacă sunteţi familiarizat cu modelele de previzionare, puteţi să vizualizaţi informaţii privind tipul de model
selectat, parametrii de model estimaţi, măsurile de acurateţe standard şi sumarul procesării.

Caracteristici de previzionare
Previzionarea furnizează modelarea datelor seriilor temporale şi previziuni bazate pe datele din
vizualizări.
Pentru a folosi previzionarea, vizualizarea trebuie să fie de tip linie, bară sau coloană, datele trebuie să fie
suportate pentru previzionare şi trebuie să fie activată previzionarea. Când este activată previzionarea,
este disponibilă o casetă de dialog Previziune în colţul din dreapta sus al unei vizualizări, unde puteţi
modifica setările de model şi de previziune, precum şi limitele de încredere. Sunt estimate modelele de
serii temporale corespunzătoare pentru vizualizare şi sunt afişate previziunile în vizualizare. De
asemenea, puteţi să vedeţi specificaţia de model de serii temporale şi sumarul procesării datelor în tava
de date.
În următorul exemplu, sunt afişate valorile de previzionare şi limitele de încredere într-o vizualizare.

© Copyright IBM Corp. 2018, 2020 45


Opţiunile de previzionare
Puteţi modifica previziunile prin setarea unui număr de opţiuni de perioadă şi nivel de încredere în caseta
de dialog Previziune .

46 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


O perioadă este cel mai mic interval de timp între două puncte învecinate din date.
Sunt disponibile următoarele opţiuni.
Perioade de previziune
Numărul de paşi înainte ai previziunii.
Valoarea implicită este Automat, ceea ce înseamnă 20% din lungimea datelor istorice. Vor fi
previzionate şi valorile lipsă de la sfârşitul unei serii particulare, dar acestea nu vor conta pentru
numărul specificat de perioade de previziune.
Ultimele perioade ignorate
Se ignoră un număr specificat de puncte de date la sfârşitul unei serii temporale atunci când este
construit modelul şi sunt calculate previziunile. Vor fi previzionate şi valorile lipsă de la sfârşitul unei
porţiuni neignorate a seriei. Valoarea Ultimele perioade ignorate trebuie să fie specificată ca un întreg
care nu este negativ, cum ar fi: 0, 1, 2, 3.
Valoarea implicită este 0. Dacă nu lipsesc valori, toate datele din istoric sunt utilizate pentru
generarea modelului şi primul punct al previziunii se află după ultimul punct de date din istoric. Pot fi
ignorate până la 100 de puncte de date.
Ignorarea ultimei perioade de date poate fi utilă atunci când datele sunt incomplete. De exemplu, aţi
putea realiza o previziune la mijlocul unei luni. Puteţi exclude luna respectivă setând Ignorare
ultimele perioade la 1.
Următoarea vizualizare prezintă o previziune pentru care sunt ignorate rezultatele din septembrie prin
setarea opţiunii Ignorare ultimele perioade la 1.

Capitolul 4. Forecasting 47
Nivel de încredere
Certitudinea că valoarea reală este de aşteptat să fie în intervalul dat. Puteţi vedea intervalul de
încredere într-un tooltip atunci când plasaţi cursorul mouse-ului pe una dintre valorile previziunii.
Intervalul de încredere este indicat prin afişarea limitei superioare şi a limitei inferioare.
Puteţi selecta trei niveluri de încredere diferite: 90%, 95% şi 99%. Valoarea implicită este 95%, iar
limita inferioară şi cea superioară definesc plaja pentru care puteţi avea o încredere de 95% că
valoarea reală aparţine intervalului respectiv.
Perioadă sezonieră
Sezonalitatea cu care construiţi modelul. Sezonalitatea apare atunci când o serie temporală are o
variaţie ciclică predictibilă. De exemplu, în timpul perioadei de vacanţă din fiecare an.
Valoarea implicită este Automat. Cu valoarea Automat, se detectează automat sezonalitatea prin
construirea mai multor modele cu perioade sezoniere diferite şi alegerea celui mai bun dintre acestea.
Puteţi specifica sezonalitatea prin introducerea unui întreg care nu este negativ, cum ar fi 0, 1, 2, 3, ca
perioadă sezonieră.
Pentru a specifica un model nesezonier, setaţi Perioadă sezonieră la 0 sau 1. Un model cu
sezonalitatea specificată de utilizator este afişat numai dacă modelul sezonier este mai precis decât
toate modelele nesezoniere.

Insight-uri
Când vizualizările au activate şi disponibile atât insight-urile, cât şi previziunile, apare caseta de dialog
Insight-uri dialog în dreptul casetei de dialog Previziuni. Fiecare caracteristică furnizează un set
independent de rezultate analitice. Pentru informaţii suplimentare, consultaţi “Insight-urile în vizualizări”
la pagina 65.

48 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Tipurile de vizualizare care suportă previzionarea
Previzionarea este suportată în vizualizările linie, bară şi coloană.
În următorul tabel, sunt comparate caracteristicile de afişare a previzionării pentru fiecare aplicaţie.

Caracteristici de Diagramă linie Diagramă bară Diagramă coloană


previzionare
Puncte de previziune Cerc deschis Bară cu dungi Coloană cu dungi
Afişare interval de Regiune umbrită Linie compactă Linie compactă
încredere
Activare interval de Clic în orice punct Clic pe o bară din Clic pe o coloană din
încredere previziune previziune
Număr de intervale de Toate 1 1
încredere afişate

Următoarea imagine prezintă o previziune pe vizualizări linie şi bară cu intervale de bară activate.

Insight-urile şi previzionarea
Insight-urile din vizualizări furnizează insight-uri analitice care pot ajuta utilizatorii să detecteze şi să
valideze orice relaţii importante şi diferenţe semnificative, pe baza datelor prezentate de vizualizare.
Insight-urile funcţionează împreună cu previzionarea în vizualizările suportate. Insight-urile furnizează un
set separat de rezultate analitice, iar rezultatele sunt numai pentru valorile istorice. Pentru informaţii
suplimentare, consultaţi “Insight-urile în vizualizări” la pagina 65.

Previzionarea datelor
Datele care sunt potrivite pentru previzionare au valori de măsură care corespund unor puncte de timp
plasate la o distanţă regulată. Specificaţi timpul şi măsurile în vizualizări prin tragerea câmpurilor de timp
şi câmpurilor de măsuri în sloturile vizualizării. Opţional, puteţi de asemenea să specificaţi câmpuri de
grup care divizează valorile de măsură după categorii.
Tabelul următor este un sumar al tipurilor de câmp şi sloturilor de vizualizare potrivite care sunt suportate
în previzionare:

Slot Câmpuri de timp Câmpuri de măsură Câmpuri de grup


(necesare) (necesare) (opţionale)
Slot diagramă linie Axa x Axa y Culoare
Slot diagramă bară Bare Lungime Culoare

Capitolul 4. Forecasting 49
Slot Câmpuri de timp Câmpuri de măsură Câmpuri de grup
(necesare) (necesare) (opţionale)
Slot diagramă coloană Bare Lungime Culoare

Nu sunt suportate ale vizualizări sau sloturi de vizualizare, cu excepţia slotului Filtre locale.

Câmpurile de timp în datele previzionării


Un câmp timp este identificat de o pictogramă de timp în faţa etichetei de câmp, în panoul Date.
Puteţi specifica proprietăţi de câmp de timp folosind următoarele proprietăţi: Tip de date sau Reprezintă
timp.

Tip de date
Un câmp este recunoscut ca un câmp timp dacă are unul dintre următoarele tipuri de date: Dată, Timp
sau Amprentă de timp Timestamp. Tipul de date este moştenit de la sursa de date şi nu poate fi modificat.
Tipurile de date Dată, Oră şi Amprentă de timp sunt proiectate pentru a suporta întreaga gamă de formate
de dată şi oră care sunt acoperite de formatele ISO 8601 de bază şi extinse. Următorul tabel prezintă
tipurile de date suportate, împreună cu un exemplu de format şi un exemplu de date pentru fiecare.

Tip de date Exemplu de format Exemplu de date


Dată yyyy-mm-dd 2019-07-01
Timp hh:mm:ss 12:34:56
Amprentă de timp yyyy-mm-dd’T’hh:mm:ss 2019-07-01T12:34:56

Reprezintă timp
Un câmp este recunoscut ca un câmp timp dacă proprietatea de date Reprezintă este setată la Timp. Şi
câmpurile de tip Text şi Întreg care conţin date de timp sunt recunoscute ca fiind câmpuri de timp.
Câmpurile de timp sunt definite automat în timpul importului sau îmbogăţirii datelor. Definiţiile posibile
sunt Dată, An, Trimestru, Anotimp, Lună, Săptămână, Zi, Oră, Minut sau Secundă.
Dacă câmpurile de timp nu sunt recunoscute automat, puteţi să le specificaţi ca fiind câmpuri de timp.
Asiguraţi-vă că valorile de câmp sunt într-unul dintre formatele suportate, altfel aţi putea primi o eroare
Format de date nesuportat.

Câmpuri de timp imbricate


Puteţi trage mai multe câmpuri de timp în acelaşi slot de vizualizare, pentru a specifica un câmp de timp
imbricat. De exemplu, un câmp Săptămână poate fi tras în slot împreună cu un câmp Zi, pentru a crea o
previzionare după zilele din săptămână.

Câmpurile imbricate din slot trebuie să fie în ordinea ierarhiei temporale. De exemplu, câmpul Săptămână
trebuie să fie plasat deasupra câmpului Zi.
Câmpurile imbricate nu pot sări niveluri din ierarhia temporală care ar avea ca rezultat ambiguitatea.
Tabelul următor prezintă ierarhiile acceptabile.

Câmp de timp Câmpuri inferioare acceptabile


An Trimestru, Lună, Săptămână, Zi

50 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Câmp de timp Câmpuri inferioare acceptabile
Trimestru Lună
Lună Zi
Săptămână Zi
Zi (din An, Lună sau Săptămână) Oră, Timp
Oră Minut
Minut Secundă

Dacă An este absent în ierarhia de timp, atunci sistemul are anul curent ca implicit. Acest lucru poate
cauza probleme din cauza diferenţelor dintre anii bisecţi şi anii non-bisecţi. Luaţi în considerare furnizarea
anului în astfel de instanţe.

Ordinea cronologică a datelor


Câmpurile de timp specificate definesc o ordine cronologică pentru punctele de timp din vizualizare.
Acestea sunt utilizate pentru a sorta în ordine cronologică punctele din vizualizare atunci când este
activată previzionarea. Ordinea cronologică include punctele din istoric, împreună cu punctele
previzionate. Orice alte criteriu de sortare specificat pentru vizualizare este ignorat atunci când este
activată previzionarea.
Etichetele de timp invalide sunt mutate la începutul secvenţei şi nu sunt incluse la construirea modelului
şi calcularea previziunii.

Detectarea intervalului de timp


Detectarea intervalului de timp este posibilă atunci când datele sunt ordonate cronologic. Intervalul de
timp este mărimea celui mai mic interval dintre două puncte de timp adiacente, cum ar fi “2 săptămâni”.
Dacă sunt detectate intervale de timp care variază, toate acestea trebuie să fie multipli întregi ai celui mai
mic interval. Altfel, acestea sunt considerate neregulate şi nu se poate realiza previziunea. Pentru
intervalul de timp detectat, sunt completate punctele de timp lipsă cauzate de intervalele multiple.
Valorile de măsură corespondente sunt setate la lipsă. Dacă numărul valorilor lipsă depăşeşte 33% din
lungimea seriei, este raportată o eroare Prea multe valori lipsă.

Câmpurile de măsură
Unul sau mai multe câmpuri de orice tip pot fi specificate ca fiind câmpuri de măsură pentru analiza
previzionării, prin adăugarea lor într-un slot de vizualizare corespondent. Fiecare câmp de măsură este
analizat separat. De asemenea, pot fi specificate mai multe serii temporale prin adăugarea unui câmp în
slotul Culoare, divizând valorile de măsură după categoriile câmpului specificat.
Toate valorile câmpului de măsură care corespund aceluiaşi punct de timp sunt sumarizate utilizând unul
dintre următoarele niveluri de sumarizare: Sumă, Minimum, Maximum, Medie, Număr şi Număr
distincte. Câmpul trebuie să fie numeric pentru a suporta sumarizarea Sumă, Minimum, Maximum sau
Medie. Toate tipurile de date şi nivelurile de sumarizare posibile sunt suportate pentru previzionare. Însă
trebuie să ţineţi cont de următoarele puncte:
• Un număr mic de valori de măsură diferite poate avea ca rezultat previziuni neaşteptate sau lipsite de
valoare informativă. De exemplu, atunci când este utilizat sumarul Număr distincte.
• În cazul în care numărul valorilor de măsurare este zero, rezultatele pot fi influenţate nejustificat, în
special atunci când ele reprezintă măsuri lipsă.

Interpolarea valorilor lipsă


Valorile lipsă sunt calculate şi completate cu algoritmul Interpolare liniară. Calculul este bazat pe vecinii
cei mai apropiaţi dintr-o serie temporală ordonată cronologic cu interval de timp detectat. Noua valoare
este (valoarea anterioară + valoarea următoare)/2. De exemplu, cu valorile [3, 6, lipsă, 12],

Capitolul 4. Forecasting 51
valoarea interpolată care va înlocui valoarea lipsă este (6 + 12) / 2, adică 9. Algoritmul de interpolare
poate trata şi valori lipsă contigue.
Punctele de date cu valori lipsă la primele şi ultimele puncte de timp istorice sunt excluse din serie înainte
de a construi un model. Valorile lipsă la ultimele puncte de timp istorice sunt de asemenea previzionate.

Detaliile statistice ale previzionării


O previzionare generează previziuni şi detaliile statistice ale previzionării. Detaliile statistice ale
previzionării sunt plasate în tava de date din partea de jos fiecărei vizualizări. Aici există un rând singular
cu detalii statistice pentru fiecare serie temporală din vizualizare. Detaliile previzionării sunt generate atât
timp cât punctele de timp sunt plasate la distanţe egale.
Informaţiile de previziune conţin Starea previziunii pentru seriile temporale date. Când starea este
Succes, celelalte câmpuri furnizează detalii privind modelul şi datele utilizate pentru previziune. Când
starea este Eşec, o parte dintre celelalte câmpuri, cum ar fi Note, furnizează detalii privind cauza
eşecului. Întotdeauna sunt furnizate sumare ale eşecurilor în avertismentele vizualizării.

Informaţiile Model specifică tipul de Tendinţă şi Sezonalitate selectat pentru estimarea datelor seriei
temporale în cazul unui succes. Tabelul următor prezintă diferitele tipuri disponibile.

Componenta de Componenta sezonieră


tendinţă

N A M
NONE ADDITIVE MULTIPLICATIVE

N (N, N) (N, A) (N, M)


NONE

A (A, N) (A, A) (A, M)

ADDITIVE

52 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Componenta de Componenta sezonieră
tendinţă

Ad (Ad, N) (Ad, A) (Ad, M)


ADDITIVE_DAMPED

Măsurile de acurateţe
Măsurile de acurateţe ale modelului Eroarea medie absolută (Mean Absolute Error - MAE), Eroarea medie
absolută scalată (Mean Absolute Scaled Error - MASE), Procentul de acurateţe, Rădăcina pătrată a erorii
medii pătratice (Root Mean Squared Error - RMSE), Eroarea medie absolută procentuală (Mean Absolute
Percent Error - MAPE) şi Criteriul informaţional Akaike (Akaike Information Criterion - AIC), sunt bazate pe
datele seriei temporale utilizate pentru a genera modelul. Toate măsurile de acurateţe sunt bazate pe
datele din istoric. Măsurile de acurateţe pot fi utilizate şi ca un indicator al preciziei previziunii, dar ele nu
se reportează la valorile viitoare.
Eroarea medie absolută (Mean Absolute Error - MAE)
Este calculată ca diferenţa medie absolută între valorile ajustate de model (un pas înainte în
previziunea in-sample) şi datele de istoric observate.
Eroarea medie absolută scalată (Mean Absolute Scaled Error - MASE)
Măsura erorii este utilizată pentru acurateţea modelului. Se obţine împărţind MAE la valoarea MAE a
modelului naiv. Modelul naiv este un model care prognozează valoarea la punctul de timp t ca fiind
valoarea din istoric anterioară. Această eroare vă permite să evaluaţi cât de bun este modelul
comparativ cu modelul naiv. Dacă valoarea MASE este mai mare decât 1, modelul este mai rău decât
modelul naiv. Cu cât scade valoarea MASE, cu atât este mai bun modelul comparativ cu modelul naiv.
Procentul de acurateţe (% acurateţe)
Indicatorul primar al acurateţei modelului, bazat pe valorile ajustate. Este specificat ca procentul de
reducere a erorii medii absolute relativ la modelul naiv. Se calculează scăzând MASE din 1 şi
exprimând valoarea obţinută ca procentaj. Dacă valoarea MASE este mai mare sau egală cu 1,
acurateţea este setată la 0%, deoarece modelul nu aduce o îmbunătăţire faţă de modelul naiv. O
acurateţe mai mare indică o eroare de model mai mică relativ la modelul naiv.
Eroarea medie pătratică (Mean Squared Error - MSE)
Suma pătratului diferenţei dintre valorile ajustate de model şi valorile observate, împărţite la numărul
de puncte de istoric, minus numărul de parametri din model. Numărul parametrilor din model este
scăzut din numărul punctelor de istoric pentru coerenţa cu o estimare de model nepărtinitor.
Rădăcina pătrată a erorii medii pătratice (Root Mean Squared Error - RMSE)
Rădăcina pătrată a valorii MSE. Este pe aceeaşi scală cu valorile de date observate.
Eroarea medie absolută procentuală (Mean Absolute Percent Error - MAPE)
Diferenţa medie procentuală absolută dintre valorile ajustate de model şi valorile de date observate.
Criteriul informaţional Akaike (Akaike Information Criterion - AIC)
O măsură pentru selecţia modelului. Valoarea AIC penalizează modelele cu mulţi parametri, prin
aceasta încercându-se favorizarea modelelor mai simple la alegerea celui mai bun model. AIC este
suma logaritmului valorii MSE neajustate înmulţite cu numărul de puncte istorice şi numărul de
parametri de model şi stări de netezire iniţiale înmulţit cu 2.

Parametri
Sunt disponibile perioada sezonieră detectată şi estimările pentru alţi parametri care sunt folosiţi în
modelul de netezire exponenţială selectat.
Perioadă sezonieră
Numărul paşilor de timp utilizaţi într-o perioadă sezonieră în modelul de netezire exponenţială.
Alfa
Factorul de netezire pentru stările de nivel în modelul de netezire exponenţială. Valorile mai mici ale
parametrului alfa determină creşterea gradului de netezire, cu alte cuvinte, atunci când valoarea alfa
este mică este luată în considerare o parte mai mare a istoricului. Dacă valorile alfa sunt mai mari, se

Capitolul 4. Forecasting 53
reduce gradul de netezire, ceea ce înseamnă că se atribuie o pondere mai mare observaţiilor mai
recente. Când valoarea alfa este 1, observaţiei curente îi este alocată întreaga pondere.
Beta
Factorul de netezire pentru stările de tendinţă în modelul de netezire exponenţială. Acest parametru
are un comportament similar cu al parametrului alfa, deosebirea fiind că este destinat stărilor de
tendinţă, nu stărilor de nivel.
Gama
Factorul de netezire pentru stările de sezonalitate în modelul de netezire exponenţială. Are acelaşi rol
ca alfa, numai că este destinat componentei de sezonalitate a modelului.
Fi
Coeficientul de atenuare din modelul de netezire exponenţială. Previziunile lungi pot conduce la
rezultate nerealiste, astfel că este utilă existenţa unui factor de atenuare, pentru a atenua tendinţa
de-a lungul timpului şi a produce previziuni mai moderate.

Diagnostice
Informaţiile includ Număr lipsă, Lungime serie, Perioade ignorate, Putere tendinţă, Putere sezonalitate şi
Interval de date/ore.
Număr lipsă
Indică numărul de rânduri de date în care fie lipsesc valori, fie lipsesc puncte de timp şi sunt
poziţionate între prima şi ultima valoare validă din serie. Nu sunt incluse punctele de timp invalide, şi
nici punctele cu valori lipsă la primul şi ultimul dintre punctele de timp istorice.
Lungime serie
Indică numărul de puncte de date utilizate pentru modelarea seriei temporale. Sunt incluse numai
punctele dintre prima şi ultima valoare validă din validă din serie.
Perioade ignorate
Un întreg, m, care determină ignorarea ultimelor m puncte de date ale seriei atunci când este
construit modelul de netezire exponenţială şi sunt calculate previziunile. Vor fi previzionate şi valorile
lipsă de la sfârşitul unei porţiuni neignorate a seriei. Valoarea implicită pentru acest parametru este 0,
ceea ce înseamnă că sunt utilizate toate datele din istoric pentru generarea modelului atunci când nu
lipsesc valori. Pot fi ignorate maximum 100 de puncte. Perioade ignorate exclud punctele de date
atunci când este construit un model, astfel că previzionarea poate eşua din cauza unor factori cum ar
fi cerinţele privind lungimea de date minimă şi proporţia valorilor lipsă ce depăşeşte 33%.
Putere tendinţă
Comparaţi modelul original, M, cu acelaşi model, dar cu componenta de tendinţă înlăturată. Puterea
tendinţei pentru M diferă ca acurateţe la modelul M şi modelul M cu componenta de tendinţă
înlăturată.
Putere sezonalitate
Comparaţi modelul original , M , cu acelaşi model având componenta de sezonalitate înlăturată.
Puterea sezonalităţii pentru M diferă ca acurateţe la modelul M şi modelul M cu componenta de
sezonalitate înlăturată.
Interval de date/ore
Intervalul de date/ore reprezintă intervalul de timp detectat al datelor sortate cronologic. Intervalul
de timp este identificat ca fiind cea mai mică diferenţă între punctele învecinate din datele sortate în
ordine cronologică.

Modelele de previzionare
Modelele de netezire exponenţială sunt clase utilizate pe larg ale modelelor de serii temporale.
Modelele de netezire exponenţială sunt aplicabile pentru un singur set de valori, care sunt înregistrate
numai pe incremente de timp egale. Însă ele suportă proprietăţi de date găsite frecvent în aplicaţiile de
afaceri, cum ar fi tendinţa, sezonalitatea şi dependenţa de timp. Toate caracteristicile de model
specificate sunt estimate pe baza datelor observate disponibile. Un model estimat poate fi utilizat apoi
pentru a previziona valorile viitoare şi a furniza limitele de încredere superioare şi inferioare pentru
valorile previziunii.

54 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Fiecare tip de model este potrivit pentru modelarea unei combinaţii diferite de proprietăţi care sunt găsite
în date. Tipul de model care poate furniza cea mai bună potrivire pentru datele observate este selectat
pentru modelarea datelor observate şi este utilizat pentru previzionarea datelor viitoare.

Algoritmii de estimare a modelelor


Modelele sunt specificate prin ecuaţii de netezire care includ parametrii de model şi stările de netezire
iniţiale. Parametrii de model sunt estimaţi cu valori care minimizează eroarea de model.

Ecuaţiile de netezire
Numele modelelor de netezire exponenţială derivă din ecuaţiile de netezire care specifică modelul.
Acestea furnizează formule pentru calcularea stărilor de netezire pentru fiecare punct observat, utilizând
valoarea observată curentă şi stările de netezire anterioare. Ecuaţiile de netezire furnizează mediile
ponderate ale valorii curente şi stărilor anterioare din seriile temporale. Ponderea pentru stare sau
valoarea curentă este dată de un parametru de model între 0 şi 1, iar ponderile pentru valorile anterioare
descresc exponenţial.

Ecuaţiile de netezire de nivel


Toate tipurile de model calculează o stare de nivel pentru fiecare punct al seriilor temporale utilizând
ecuaţia de netezire de nivel corespunzătoare. Stările de nivel pentru modelul fără componentele de
tendinţă şi sezoniere sunt calculate ca media ponderată a valorii seriei temporale la punctul curent şi
starea de nivel la punctul anterior. Ponderea asociată cu valoarea curentă este un parametru, alfa, care
are valoarea restricţionată între 0 şi 1. Pentru alte modele, în ecuaţia de netezire de nivel sunt incluse de
asemenea tendinţa anterioară şi stările sezoniere.

Ecuaţiile de netezire de tendinţă


Tipuri de model cu tendinţă aditivă sau aditivă temperată calculează o stare de tendinţă pentru fiecare
punct al seriilor temporale utilizând ecuaţia de netezire de tendinţă corespondentă. Starea de tendinţă
pentru punctul curent este bazată pe diferenţa stărilor de nivel la punctul curent şi cel anterior şi pe
starea de tendinţă la punctul anterior. Ponderea asociată cu diferenţa stărilor de nivel la punctul curent şi
cel anterior este un parametru numit beta, care are valoarea restricţionată între 0 şi 1. Pentru ecuaţiile
de netezire de tendinţă atenuată este adăugat un parametru suplimentar, fi. Parametru fi se înmulţeşte
cu contribuţia stării de tendinţă din punctul precedent şi valoarea sa este de asemenea restricţionată
între 0 şi 1. Scopul acestui parametru este estimarea gradului de atenuare a tendinţei de la un punct la
următorul.

Ecuaţiile de netezire sezonieră


Tipurile de model care suportă sezonalitatea aditivă sau multiplicativă calculează o stare sezonieră pentru
fiecare punct din seria temporală. Stările sezoniere sunt calculate utilizând ecuaţii de netezire sezonieră.
Starea curentă pentru punctul curent include diferenţa valorii seriei temporale şi stării de nivel curente
pentru sezonalitatea aditivă sau raportul acestor două valori pentru sezonalitatea multiplicativă.
Ponderea asociată cu acest termen este un parametru, gama, care are valoarea restricţionată între 0 şi 1.
Restul contribuţiei provine de la starea sezonieră corespondentă din perioada sezonieră anterioară.
Observaţi că perioada sezonieră are o lungime fixă şi, în timp ce starea sezonieră se poate modifica
pentru fiecare punct, numai indicii sezonieri care se potrivesc din perioade diferite sunt luaţi în
considerare împreună în ecuaţiile de netezire sezonieră.

Stările de netezire iniţiale


Trebuie să fie specificate valori pentru stările de nivel, de tendinţă şi de sezonalitate, pentru punctele care
precedă seria temporală. Aceste valori sunt necesare pentru ecuaţiile de netezire. Pentru a calcula
diversele stări la primul punct al seriei temporale sunt necesare valorile de stare la punctele anterioare
corespondente.

Capitolul 4. Forecasting 55
Parametrii de model
Fiecare ecuaţie de netezire utilizează parametri de model corespondenţi:
alfa
Controlează stările de nivel.
beta
Controlează stările de tendinţă.
gama
Controlează indicii sezonieri de-a lungul perioadelor sezoniere.
fi
Un parametru suplimentar care este utilizat pentru specificarea tendinţei atenuate.
Toţi aceşti patru parametri au valori între 0 şi 1. Valorile mai mari ale parametrilor alfa, beta şi gama
înseamnă că observaţiile mai recente au pondere mai mare, în timp ce valorile mai mici înseamnă că
observaţiile mai vechi au ponderi mai mari. O valoare mai mare a parametrului fi corespunde unui grad
mai mare de atenuare pentru tendinţa previziunii.

Estimarea modelului
Parametrii de model din ecuaţiile de netezire sunt estimate pe baza datelor seriei temporale. Parametrii
nu pot fi estimaţi direct prin utilizarea unei formule. Ei sunt estimaţi prin utilizarea unui proces iterativ,
care caută valorile de parametri ce minimizează eroarea de model. Eroarea de model este calculată ca
eroare medie absolută scalată. Iteraţiile se opresc atunci când nu se mai poate obţine o reducere
suplimentară a erorii de model. Valorile de parametru corespondente, împreună cu stările de netezire
iniţiale, specifică complet modelul estimat. Acestea sunt utilizate pentru la calcularea stărilor de model
pentru toate celelalte puncte de date şi generarea previziunilor de model prin utilizarea unei ecuaţii de
previziune corespondente.

Algoritmii previzionării
Există mai mulţi algoritmi care sunt utilizaţi pentru previzionare.

Un pas înainte
Fiecare model suportă previziuni de tip un pas înainte bazate pe ecuaţia de previziune corespunzătoare.
Previziunile un pas înainte sunt necesare pentru a calcula erorile de model în timpul procesului de
estimare a modelului.
Previziunile un pas înainte sunt calculate secvenţial pentru fiecare punct de date utilizând nivelul calculat
şi stările de tendinţă pentru punctul curent, şi stările sezoniere pentru ultima perioadă sezonieră.
Eroarea de previziune este calculată prin scăderea valorii previziunii la punctul anterior din valoare
observată la punctul curent. Eroarea de model generală, care este utilizată pentru estimarea modelului,
este calculată ca fiind valoarea medie a erorilor de previziune absolute. Erorile mai mici corespund unui
model ajustat mai bine. Măsurile de acurateţe afişate Detalii statistice previziune furnizează mai multe
sumare ale modelului cu erori ale previziuni un pas înainte.

K paşi înainte
Previziunile k paşi înainte sunt utilizate pentru a face predicţii pentru orice număr de valori viitoare, după
datele seriei temporale observate. Acestea sunt bazate pe aceleaşi ecuaţii de previziune ca în cazul
previziunilor Un pas înainte pentru modelul specificat.
Implicit, numărul valorilor previziunii generate reprezintă 20% din lungimea seriei de date istorice. Puteţi
specifica un număr exact de valori pentru previzionare, în caseta de dialog Previziune. Vor fi previzionate
şi valorile lipsă de la sfârşitul unei serii particulare, dar acestea nu vor conta pentru numărul specificat de
perioade de previziune.

56 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Limite de încredere
Limitele de încredere reprezintă nivelul de certitudine asociat cu fiecare valoare a previziunii. De obicei,
limitele devin mai largi în viitor, deoarece previziunile mai îndepărtate sunt mai puţin fiabile. Limitele de
încredere furnizează insight-uri relevante privind comportamentul viitor al seriilor temporale observate.
Calculul limitelor de încredere este bazat pe variaţia generală a erorilor de previziune care sunt estimate
pentru datele observate şi un factor care depinde de modelul specificat şi pe numărul de paşi din ultimul
punct observat.

Selecţia automatizată a modelelor în previziuni


Sunt utilizate mai multe tipuri de model pentru a crea modele candidat pentru fiecare serie temporală. În
mod normal, sunt utilizate toate cele nouă tipuri de model, cu excepţia cazului în care este absentă o
componentă sezonieră. Sunt disponibile doar trei tipuri de model care nu contează pentru sezonalitate în
date.
Valoarea implicită, Automat, pentru opţiunea perioadei sezoniere detectează perioada sezonieră prin
compararea mai multor modele, fiecare cu o perioadă sezonieră diferită.
Sunt comparate mai multe modele utilizând eroarea unui model şi numărul parametrilor de model. De
exemplu, când erorile de model sunt egale pentru două modele, este preferat modelul cu mai puţini
parametri. Acest model furnizează o reprezentare mai condensată a datelor observate şi, de asemenea,
are tendinţa de a genera previziuni mai fiabile.

Capitolul 4. Forecasting 57
58 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări
Capitolul 5. Principles of advanced data analytics

Principiile analizei de date avansate


IBM Cognos Analytics este o unealtă business intelligence pentru gestionarea şi analizarea datelor.
Include caracteristici de autoservire pentru utilizatori pentru a pregăti, explora şi partaja date. Cognos
Analytics include tehnici predictive, descriptive şi de explorare, cunoscute şi ca inteligenţă numerică.
Cognos Analytics utilizează numeroase teste statistice pentru a vă analiza datele.
Este important să înţelegeţi definiţiile acestor teste deoarece ele se aplică la Cognos Analytics.
Ca parte a fluxului de lucru, sunt utilizaţi algoritmi numerici pentru a-i furniza utilizatorului caracteristici
care comunică informaţii despre proprietăţile numerice şi relaţiile dintre date.

Orientare către afaceri


Spre deosebire de software-ul statistic tradiţional, care este destinat analiştilor de date experimentaţi,
algoritmii din Cognos Analytics sunt concepuţi pentru utilizatori familiarizaţi cu analiza datelor, dare care
nu sunt neapărat experţi. Aceasta înseamnă că, atunci când trebuie realizat un compromis, Cognos
Analytics pune accentul pe utilitate faţă de complexitate.

De încredere
Datele de afacere sunt mult mai complicate decât exemplele din cărţi, utilizate la cursurile de statistică
sau în modelele de căutare pe web. Cognos Analytics utilizează algoritmi care sunt robuşti şi acoperă o
paletă diversă de date neobişnuite. S-a ales această soluţie pentru Cognos Analytics deoarece, chiar dacă
există algoritmi nai fragili care furnizează rezultate un pic mai bune decât algoritmii robuşti, aceştia
necesită să vă asiguraţi că sunt aplicabili şi că aţi construit transformări de date corecte pentru ca
rezultatele să fie semnificative. Chiar dacă acurateţea suferă o diminuare minoră, este de preferat un
algoritm sigur, care nu furnizează rezultate eronate atunci când datele nu sunt cele aşteptate.

Inteligenţă
Aproape toţi algoritmii necesită luarea unor decizii: nivelurile de încredere, ce combinaţii de câmpuri să
fie explorate, transformările de date. Detaliile privind aceste decizii pot fi găsite în descrieri.
Cognos Analytics alege automat valorile corespunzătoare, prin examinarea proprietăţilor datelor. Ca
utilizator, este posibil să nu observaţi toate deciziile care sunt luate.

Sumar
Concepţia algoritmilor numerici şi procedurilor din Cognos Analytics are la bază necesitatea de a produce
automat rezultate de încredere. Pentru a obţine cele mai bune predicţii, clasificări sau analize posibile, un
statistician profesionist analizează datele utilizând IBM SPSS Statistics sau IBM SPSS Modeler. Cognos
Analytics are ca scop furnizarea unor insight-uri de calitate, care să vă ajute să înţelegeţi datele şi relaţiile
dintre ele, şi să facă acest lucru în mod automat, pentru o mare varietate de tipuri de date. Cognos
Analytics urmăreşte furnizarea unor rezultate similare cu cele ale unui statistician expert, dar fără a crea
dificultăţi utilizatorului profesional.

Pregătirea datelor
Pregătirea datelor este o etapă de pre-analiză, utilizată de majoritatea algoritmilor de analiză a datelor,
pentru a se asigura că datele sunt potrivite pentru utilizarea instrumentelor analitice.

© Copyright IBM Corp. 2018, 2020 59


Privire generală
Pregătirea datelor este esenţială în IBM Cognos Analytics. Numai datele pregătite sunt introduse în
analiza privind driver-ele cheie, arborii de decizie şi relaţiile şi relaţiile care sunt afişate în vizualizările
Analytics avansate: Spirală, Analiză driver-e, Arbore de decizii, Explozie solară şi Explorare relaţii. Datele
nu sunt pregătite automat pentru alte vizualizări şi insight-urile lor corespondente.

Algoritmi
Toţi algoritmii aplicaţi se bazează pe valorile unui singur câmp la un moment dat. Valorile lipsă sunt
înlăturate sau tratate pentru fiecare câmp şi pentru toate câmpurile de driver predictor se face binning.
Toate câmpurile categoriale sunt ajustate pentru număr mare de categorii şi punctele aberante tratate în
câmpurile ţintă. Pregătirea tuturor datelor influenţează rezultatele analizei, dar sumarele privind
pregătirea datelor corespondente nu vă sunt raportate.

Detalii
Pregătirea datelor şi driver-ele cheie ulterioare, arborii de decizie şi relaţiile sunt bazate pe un eşantion de
date de aproximativ 10.000 de rânduri, în timp ce datele originala sunt mai voluminoase. Se aplică
eşantionarea Bernoulli aleatorie, eşantionare aleatorie cu probabilitate egală fără înlocuire, pentru datele
încărcate şi orice surse de date conectate care susţin eşantionare aleatorie. Altfel, este utilizată
eşantionarea sistematică.

Pregătirea datelor pentru câmpurile numerice


Un câmp este tratat ca fiind numeric atunci când conţine informaţii numerice şi proprietatea sa de
utilizare este setată la măsură.

Privire generală
Deoarece datele numerice pot fi variate în distribuţia lor, IBM Cognos Analytics transformă câmpurile
numerice non-ţintă în bin-uri ordinale, reducând dependenţa de algoritmii analitici în ceea ce priveşte
formatul datelor numerice.

Algoritmi
Algoritmul de bază folosit este binning-ul de frecvenţă. Datele numerice sunt divizate într-un număr fix de
bin-uri şi se încearcă punerea unui număr egal de rânduri de date în fiecare bin. Valorile lipsă sunt plasate
în propriul bin. Cognos Analytics încearcă să utilizeze cunoştinţele despre valorile lipsă în câmpurile
predictor, pentru a construi un model mai bun. De exemplu, atunci când un câmp de date arată dacă a
fost testat un articol, Cognos Analytics utilizează valorile lipsă (care indică faptul că articolul nu a fost
testat niciodată) pentru a ajuta la predicţia valorilor din alte câmpuri.

Detalii
Pentru câmpurile numerice, sunt aplicate anumite criterii privind excluderea câmpului. Un câmp numeric
este exclus din analiză dacă are o singură valoare, incluzând şi valorile lipsă. Altfel, se aplică binning-ul
pentru câmpul numeric, iar numărul implicit de bin-uri este 5. Dacă un câmp nu are mai mult de 10 valori
numerice unice, nu se încearcă aplicarea binning-ului şi fiecărei valori unice i se acordă propria sa
categorie. Dacă apare zero în peste 40% din rânduri, i se acordă întotdeauna o categorie separată.
Valorile lipsă sunt plasate în propriul bin şi nu afectează procedura de binning.

Pregătirea datelor pentru câmpurile categoriale


Un câmp este tratat ca fiind categorial atunci când proprietatea sa de utilizare este setată la atribut sau
identificator.

Privire generală
Principala informaţie care este extrasă din câmpurile categoriale este frecvenţa observată pentru fiecare
categorie unică. Pentru câmpurile categoriale sunt aplicate metode analitice corespunzătoare, dar

60 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


acurateţea şi performanţa acestora pot fi afectate atunci când numărul diferitelor categorii devine mare.
Principalul pas în pregătirea datelor este începerea explorării categoriilor când numărul lor devine mare.

Algoritmi
Algoritmul de bază folosit este combinarea categoriilor. Categoriile sunt sortate după frecvenţa lor, în
ordine descrescătoare, iar categoriile care depăşesc numărul implicit sunt combinate într-o singură
categorie. Valorile lipsă sunt tratate ca o singură categorie, separată. Cu alte cuvinte, IBM Cognos
Analytics utilizează valorile lipsă într-un mod similar cu cel pentru câmpuri numerice. Câmpurile
categoriale sunt tratate ca nominale. Ordinea intrinsecă nu este asumată între categorii.

Detalii
Pentru câmpurile categoriale, sunt aplicate anumite criterii privind excluderea câmpului. Un câmp
categorial este exclus din analiză dacă are o singură valoare sau dacă numărul de categorii unice,
necombinate, depăşeşte 50% din numărul rândurilor de date valide.
Altfel, câmpul categorial este combinat, numărul implicit al categoriilor necombinate fiind 49. Restul
categoriilor sunt combinate într-o singură categorie suplimentară. De asemenea, sunt combinate toate
categoriile cu un număr de rânduri mai mic decât 3. Un câmp categorial este de asemenea exclus dacă
procentul de rânduri de date valide care corespunzător categoriei combinate depăşeşte 25%.
Valorile lipsă sunt tratate ca o categorie separată şi sunt considerate ca atare în pasul de combinare.

Pregătirea datelor pentru câmpurile ţintă


Specificarea câmpului ţintă este necesară pentru vizualizările de driver-e cheie şi arbore de decizie.

Privire generală
Întotdeauna specificaţi câmpul ţintă şi cel puţin un câmp suplimentar. Modelele sunt instruite utilizând
valorile ţintă furnizate şi sunt folosite pentru a detecta relaţii predictive şi, în cele din urmă, pentru a
prognoza valorile ţintă pe baza valorilor câmpului de intrare. Pregătirea datelor pentru câmpul ţintă diferă
de pregătirea datelor pentru restul câmpurilor. Valorile lipsă din ţintă nu sunt utilizate pentru construirea
modelelor, dar celelalte informaţii sunt păstrate şi uneori ajustate pentru a obţine modele nepărtinitoare.

Algoritmi
Principalul pas al pregătirii datelor pentru câmpurile ţintă este înlăturarea tuturor rândurilor de date cu
valori ţintă lipsă. Acest pas este realizat înaintea oricărui alt pas ce ţine de pregătirea datelor. Acest pas
asigură faptul că numai informaţiile de încredere sunt utilizate pentru construirea modelului, dar numărul
rândurilor înlăturate poate fi substanţial. Într-o astfel de situaţie, modelul rezultat poate avea un scop
limitat. Nu se face binning pentru câmpurile ţintă numerice, dar punctele aberante extreme sunt
manipulate pentru a nu afecta modelele create ulterior. Câmpurile ţintă categoriale sunt tratate foarte
asemănător cu alte câmpuri categoriale. Singura diferenţă este că valorile lipsă au fost înlăturate pentru
ţintele categoriale.

Detalii
Punctele aberante extreme sunt detectate pe baza graniţei inferioare şi a celei superioare. Graniţa
superioară este construită utilizând o centilă superioară, astfel ca numai 2,5% din valorile ţintă să fie
găsite că au o valoare mai mare. Diferenţa între centila superioară şi mediană este înmulţită cu 2,5 şi
adăugată la mediană pentru a obţine graniţa superioară. Aplicând paşi similari, este obţinută graniţa
inferioară. Valorile ţintă găsite dincolo de graniţele calculate sunt înlocuite cu valori de graniţă
corespondente în toate analizele următoare.

Driver-ele cheie unifactoriale


Driver-ele cheie unifactoriale sunt o unealtă de explorare bazată pe model.

Capitolul 5. Principles of advanced data analytics 61


Privire generală
Dat fiind un câmp ţintă, această unealtă utilizează un model statistic pentru a analiza orice alt câmp de
date şi îi estimează puterea pentru predicţia valorii ţintă. Aceste câmpuri sunt numite predictori ţintă sau
driver-e. Fiecare câmp de date care ar putea fi relevant este analizat şi sunt afişate numai driver-ele de
nivel superior în ceea ce priveşte puterea de predicţie. Puteţi obţine insight-uri privind driver-ele
disponibile şi clasificarea lor în funcţie de puterea de predicţie pentru ţinte specificată în date. Rezultatele
analizei driver-elor unifactoriale sunt disponibile atât în vizualizări ale analizei driver-elor, cât şi în
vizualizări spirală. Se poate face drill-down vizual pentru fiecare driver separat numai pentru vizualizarea
analizei de driver-e din Explorare.

Algoritmi
Analiza pentru fiecare driver unifactorial este bazată pe un model statistic ce include ţinta şi un predictor
categorial singular. Acest model este aplicat după pasul de pregătire a datelor pentru câmpul ţintă şi
toate câmpurile predictor potenţiale. De exemplu, se aplică binning-ul pentru toate câmpurile predictor
numerice în pasul de pregătire a datelor şi acestea sunt tratate ca fiind categoriale în analiză. Se aplică
analiza ANOVA unifactorială pentru ţinte numerice şi testul hi pătrat de independenţă pentru ţinte
categoriale cu ajustare hi pătrat pentru date rarefiate.
Pentru fiecare câmp din lista de driver-e potenţiale, este realizat un test de ipoteză privind posibilitatea ca
respectivul câmp să aibă un impact semnificativ asupra ţintei. Numai câmpurile care trec acest test şi au
o putere de predicţie suficient de mare sunt selectate ca posibile driver-e cheie unifactoriale.

Detalii
În unele cazuri, o analiză preliminară bazată pe aptitudini inteligente poate reduce numărul driver-elor
potenţiale. Scopul este de a înlătura câmpuri irelevante sau redundante. Lista driver-elor utilizate este
disponibilă în UI şi puteţi adăuga pentru analiză orice driver-e care iniţial au fost excluse. Primele 20 de
driver-e rezultate, cu puterea de predicţie mai mare de 10%, sunt disponibile pentru afişare.
Sunt aplicate unele restricţii privind mărimea volumului de date, pentru a îmbunătăţi performanţa şi
viteza. În cazul în care datele conţin mai mult de 250 de câmpuri, câmpurile cel mai puţin relevante sunt
excluse înaintea analizei driver-elor. Puteţi adăuga înapoi în analiză câmpurile excluse, folosind interfaţa
de utilizator (UI), aşa cum este descris mai sus. Dacă datele specificate conţin mai mult de 10.000 de
rânduri, ar putea fi eşantionate în jos la aproximativ 10.000 de rânduri pentru scopurile analizei driver-
elor. În astfel de cazuri este afişat un avertisment: Pentru a îmbunătăţi performanţa, din cauza numărului
de rânduri din sursa de date, analiza se bazează pe un eşantion reprezentativ din toaste datele. Este de
aşteptat ca rezultatele să le aproximeze destul de exact pe cele obţinute utilizând toate rândurile din
datele originale.

Driver-ele cheie bifactoriale


Driver-ele bifactoriale se bazează pe modelarea şi clasificarea perechilor de predictori categoriali în
acelaşi timp.

Privire generală
Dat fiind un câmp ţintă, IBM Cognos Analytics utilizează un model statistic pentru a analiza o pereche de
alte câmpuri de date şi şi îi estimează puterea pentru predicţia valorii ţintă. De obicei, căutarea diferitelor
perechi de predictori nu este exhaustivă şi, de asemenea, pot fi filtrate unele perechi cu clasificare înaltă
din rezultatele finale. Scopul este de a oferi o privire generală şi o varietate de perechi de predictori care
să îmbunătăţească puterea de predicţie a modelelor cu un singur predictor, care sunt afişate ca driver-e
unifactoriale. Ca urmare, insight-urile obţinute din driver-e unifactoriale sunt extinse şi utilizatorul obţine
informaţii relevante privind perechea de câmpuri din date. În diagrama analizei de driver-e şi diagrama
spirală sunt disponibile atât rezultatele analizei driver-elor unifactoriale, cât şi cele ale analizei driver-elor
bifactoriale. Acestea pot fi vizualizate separat, selectând opţiunea de vizualizare pentru diagrama
corespunzătoare. Fiecare driver afişat, unifactorial sau bifactorial, poate fi extins într-o vizualizare nouă,
direct din vizualizarea Analiză driver-e din Explorare.

62 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Algoritmi
Analiza pentru fiecare driver bifactorial este bazată pe un model statistic ce include ţinta şi o pereche de
predictori categoriali. Modelul este aplicat după pregătirea datelor şi construirea tuturor driver-elor
unifactoriale. Primul predictor din pereche este selectat dintre primele 50 de driver-e unifactoriale, iar al
doilea este selectat dintre primele 25 de driver-e unifactoriale. Această strategie de căutare asigură
faptul că cei mai mulţi predictori cu clasificare înaltă sunt luaţi în considerare pentru modelare. Se aplică
analiza ANOVA (analiza de variaţie) bifactorială pentru ţinte numerice şi testul hi pătrat de independenţă
pentru ţinte categoriale cu ajustare hi pătrat pentru date rarefiate.
Pentru fiecare pereche de câmpuri luate în considerare, este realizat un test de ipoteză privind
posibilitatea ca respectiva pereche să aibă un impact semnificativ asupra ţintei. Numai perechile care trec
acest test şi au o putere de predicţie suficient de mare sunt selectate ca posibile driver-e cheie
bifactoriale.

Detalii
Restricţia driver-elor unifactoriale privind selecţia câmpurilor de date şi a rândurilor de date se aplică şi în
cazul driver-elor bifactoriale. Acest lucru este de aşteptat, deoarece câmpurile predictor potenţiale
pentru driver-e bifactoriale sunt selectate din driver-ele unifactoriale care se clasifică pe primele poziţii ca
putere de predicţie. Însă semnificaţia modelului driver-ului unifactorial şi puterea de predicţie minimă nu
sunt condiţii necesare pentru introducerea lor în modelul bifactorial. Un driver bifactorial rezultat trebuie
să aibă puterea de predicţie mai mare de 10% şi să asigure o îmbunătăţire relativă de peste 10% faţă de
puterea de predicţie a celor două driver-e unifactoriale conţinute. Îmbunătăţirea relativă este calculată ca
un procentaj al diferenţei între 100% şi puterea de predicţie a driver-ului unifactorial imbricat. Driver-ele
bifactoriale rezultate care satisfac aceste criterii sunt clasificate în funcţie de puterea lor de predicţie şi
primele 20 devin disponibile pentru afişare.

Arborele de decizie
Arborii de decizie sunt modele mai complexe decât driver-ele unifactoriale şi bifactoriale. Ei extind
secvenţa ca modele de combinaţie. Principala diferenţă este că arborii de decizie permit descoperirea
interacţiunii între mai mulţi predictori şi, ca urmare, furnizarea unor insight-uri mai profunde decât în
cazul driver-elor.

Privire generală
Dat fiind câmpul ţintă, algoritmul caută toate celelalte câmpuri de date şi le adaugă la model pentru a-i
îmbunătăţi puterea de predicţie privind valorile ţintă. Căutarea diferiţilor predictori este iterativă; în urma
căutării, este adăugat un predictor şi apoi căutarea continuă, pentru a fi adăugat următorul predictor care
asigură cea mai bună îmbunătăţire a modelului. Scopul este de a găsi cel mai bun set de predictori şi
modalitatea optimă de a-i combina, astfel încât să poată fi calculat modelul optim. Insight-urile obţinute
din arborii de decizie sunt prezentate sub forma unor reguli de decizie, în care combinaţia predictorilor cu
valorile corespondente furnizează o predicţie singulară pentru valoarea ţintă. Regulile de decizie sunt
clasificate după putere, astfel încât să puteţi găsi uşor regulile care sunt cele mai relevante şi interesante.
Regulile de decizie generate de arborele de decizie sunt mutual exclusive. În acelaşi timp, regulile de
decizie alcătuiesc un set de reguli complet, astfel că există o regulă corespondentă pentru fiecare
combinaţie de valori de predictor din date. De asemenea, este disponibilă puterea de predicţie totală a
arborelui de decizie, care asigură îmbunătăţirea relativă la modelul de bază. Rezultatele sunt disponibile
prin intermediul a trei vizualizări diferite: explozie solară, arbore şi reguli de decizie. Fiecare oferă anumite
avantaje în ceea ce priveşte afişarea arborelui de decizie şi a conţinutului regulilor de decizie
corespondente. De asemenea, în vizualizarea analizei driver-elor este disponibilă puterea de predicţie
totală a arborelui de decizie.

Algoritmi
Modelul arborelui de decizie este calculat după pregătirea datelor şi construirea tuturor driver-elor
unifactoriale. Primul predictor al arborelui este selectat ca driver-ul unifactorial de nivel superior.
Categoriile predictorului sunt combinate atunci când impactul negativ asupra puterii de predicţie este mai
mică decât un anumit prag. Următorul pas este găsirea celui mai bun predictor pentru divizarea fiecărui

Capitolul 5. Principles of advanced data analytics 63


nod al arborelui care este alcătuit din categorii combinate. Procesul este continuat până când se aplică o
regulă de oprire pentru un nod de arbore. Printre posibilele opţiuni pentru oprire se numără situaţia în
care toate categoriile pentru fiecare predictor candidat sunt combinate într-un singur nod sau numărul de
noduri depăşeşte numărul maxim de noduri. Categoriile care nu au numărul minim de rânduri sunt
întotdeauna combinate cu altă categorie. Aceasta înseamnă că niciunul dintre nodurile din arbore nu
poate conţine mai puţine rânduri decât numărul minim de rânduri. Aceeaşi procedură este folosită pentru
ţintele continue şi categoriale, numai că funcţia de impuritate este diferită.

Detalii
Funcţii de impuritate
Valorile funcţiilor de impuritate sunt utilizate ca principal criteriu pentru divizarea şi combinarea
nodurilor de arbore potenţiale. Totalul funcţiei de impuritate pentru arborii continui este suma
pătratelor per nod, în timp ce măsura de impuritate Gini este folosită pentru ţinte categoriale. Totalul
impurităţii Gini este calculat ca suma pătratelor rapoartelor numerelor tuturor categoriilor ţintă per
nod, care este scăzută din unu, iar rezultatul este înmulţit cu numărul de rânduri. Îmbunătăţirea
valorii funcţiei de impuritate este altă informaţie.
Când este divizat fiecare nod, IBM Cognos Analytics caută câmpul predictor cu cel mai mare câştig de
informaţii calculat ca impuritatea totală pentru toate nodurile copil potenţiale, scăzută din impuritatea
nodului părinte. Înainte ca Cognos Analytics să selecteze predictorul, Cognos Analytics încearcă să
combine unele dintre nodurile copil potenţiale care iniţial corespundeau fiecărei categorii de
predictor. Pierderea de informaţii este calculată prin scăderea impurităţii nodurilor necombinate din
impuritatea nodurilor combinate. Dacă pierderea de informaţii este mai mică decât un prag, nodurile
sunt combinate. Acest proces ajută la crearea unor arbori relativ mici, care sunt uşor de vizualizat şi
de înţeles, în timp ce este păstrată puterea totală a arborelui.
Regulile de oprire
Nodurile candidat sunt întotdeauna oprite dacă sunt bazate pe mai puţin de 25 de rânduri. Dacă toate
categoriile unui predictor sunt combinate, aceasta nu poate fi utilizat pentru divizarea unui anumit
nod. Când niciunul dintre predictori nu poate diviza un anumit nod, procesul se opreşte pentru nodul
respectiv. Procesul general de generare a arborelui se opreşte când niciunul dintre noduri nu poate fi
divizat sau când numărul nodurilor generate depăşeşte 36.
Importanţa variabilei
Importanţa variabilei corespunde unei reduceri relative a erorii arborelui când predictorul
corespondent este inclus în arbore. Este calculată prin compararea erorilor arborelui iniţial şi ale unui
arbore restricţionat, care este generat de restul predictorilor din arborele iniţial. Eroarea arborelui
iniţial este scăzută din eroarea arborelui restricţionat şi rezultatul este împărţit la eroarea arborelui
restricţionat. Variabilele cu importanţă zero sau negativă sunt înlăturate din arbore. Eroarea arborelui
este calculată ca suma pătratelor pentru ţintele continue şi ca eroarea de clasificare pentru ţintele
categoriale.
Putere predictivă
Puterea de predicţie pentru un arbore cu ţintă continuă este calculată similar ca la driver-ele cheie.
Conţinutul nodurilor frunză este luat în considerare. Este adăugată contribuţia la variaţie a fiecărui nod
frunză şi se împarte la variaţia totală pentru date. Aceasta este eroarea relativă a arborelui. Este
scăzută din unu pentru a obţine puterea de predicţie care este compatibilă cu măsura R pătrat care
este utilizată de driver-ele cheie.
Pentru ţintele categoriale, Cognos Analytics calculează acurateţea clasificării pe baza erorii de
clasificare care este adăugată de la toate nodurile frunză. Îmbunătăţirea relativă privind acurateţea
clasificării faţă de modelul de bază, numită şi R pătrat pentru număr ajustat, este raportată ca fiind
puterea de predicţie a arborelui. Este calculată scăzând eroarea arborelui din eroarea modelului de
bază şi împărţind rezultatul la eroarea modelului de bază. De exemplu, acurateţea clasificării
modelului de bază poate fi de 95%, dar dacă clasa majoritară apare în date pentru 90% din rânduri,
puterea de predicţie a arborelui este raportată ca fiind numai 50%. Aceasta este paralelă cu cazul
ţintei continue, în care modelul de bază este reprezentat prin valoare medie generală. Puterea de

64 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


predicţie măsurată cu R pătrat este bazată pe îmbunătăţirea relativă a arborelui în ceea ce priveşte
reducerea variaţiei totale.
Cognos Analytics afişează numai arborii care au puterea de predicţie mai mare de 10%. Un arbore
pentru ţintă continuă este afişat într-o vizualizare de analiză a driver-elor sau o vizualizare spirală
dacă puterea sa de predicţie este mai mare decât puterea de predicţie a celui mai puternic driver
cheie. Altfel, nu este afişat în aceste diagrame, deoarece driver-ele cheie furnizează deja toate
insight-urile relevante.
Puterea de predicţie a unui arbore de decizie este calculată utilizând aceleaşi date care sunt utilizate
pentru generarea arborelui de decizie. Se ştie că prin aceasta se introduce o anumită părtinire şi că
sunt furnizate estimări optimiste privind performanţa arborelui de decizie pentru date similare din
aceeaşi sursă de date. Cognos Analytics a redus discrepanţa prin reglarea algoritmului, astfel încât să
fie minimizată supra-ajustarea datelor de instruire.

Insight-urile în vizualizări
Insight-urile din vizualizări furnizează insight-uri analitice care pot ajuta utilizatorii să detecteze şi să
valideze orice relaţii importante şi diferenţe semnificative, pe baza datelor prezentate de vizualizare.

Privire generală
Insight-urile sunt controlate şi sumarizate de caseta Insight-uri, disponibilă în toate vizualizările eligibile.
Când activaţi insight-urile, apare sumarul în caseta Insight-uri şi sunt evidenţiate elementele de
vizualizare conexe. Detaliile sunt furnizate în mesajul tooltip corespondent. Puteţi să controlaţi fiecare
insight disponibil în mod separat.

Algoritmi
Tipul insight-urilor depinde de datele afişate de vizualizare. Tipurile de insight-uri disponibile sunt Medie,
Putere de predicţie, Diferenţe semnificative, Linie de ajustare şi Cele mai frecvente. Tipul Medie
furnizează media sumarelor afişate şi categoria cea mai frecventă sau categoria care apare cel mai des în
date. Celelalte insight-uri au la bază o analiză mai avansată şi teste statistice. Scopul este de a furniza
informaţii de încredere, pe care să le puteţi folosi pentru o descriere îmbunătăţită a datelor vizualizate şi
pentru descoperirea relaţiilor pe care vă aşteptaţi să le găsiţi în populaţia reprezentată de datele
respective.

Detalii
Analiza insight-urilor este întotdeauna bazată pe aceleaşi rânduri de date care sunt utilizate pentru a crea
sumarele afişate în vizualizare. Aceasta înseamnă că pentru insight-uri sunt utilizate toate datele, cu
excepţia cazului în care se aplică un filtru pentru datele originale.
Unele teste statistice şi analize utilizate în insight-uri necesită, pe lângă sumarele datelor afişate în
vizualizare, şi unele sumarizări suplimentare. De exemplu, testul diferenţelor semnificative pentru mai
multe categorii ale unui câmp explicativ necesită, pe lângă datele afişate, numere şi variaţii pentru fiecare
categorie. Aceste sumare suplimentare sunt obţinute dintr-o bază de date, împreună cu sumarele
necesare pentru vizualizare. Toate sumarele sunt procesate de insight-uri, dar numai sumarele necesare
sunt disponibile în vizualizare. Analiza insight-urilor este întotdeauna bazată pe aceleaşi rânduri de date
care sunt utilizate pentru a crea sumarele afişate în vizualizare.
Restricţii
Dacă insight-urile nu sunt disponibile imediat într-o vizualizare, motivul ar putea fi unul dintre
următoarele:
• Tipul de vizualizare propriu-zis nu suportă insight-uri.
• Datele din vizualizare ar putea să fi fost decupate.
• Combinaţia de nivel de sumarizare, tip de câmp şi rol de câmp pentru câmpul selectat nu se
potriveşte cu cerinţele oricăreia dintre insight-urile disponibile.

Capitolul 5. Principles of advanced data analytics 65


Tipurile de vizualizare suportate pentru insight-uri
Următoarele tipuri de vizualizare acceptă insight-uri:
• Suprafaţă
• Bară
• Bulă
• Coloană
• Harta termică
• Bulă ierarhie
• Linie
• Linie şi coloană
• Hartă
• Bule grupate
• Radială
• Punct
• Circulară
• Prin puncte
• Bară stivuită
• Coloană stivuită
• Hartă arbore
• Nor de cuvinte
Pentru unele insight-uri, cum ar fi Cele mai frecvente şi Diferenţe semnificative, sunt suportate mai
multe extensii mici.
Niveluri de sumarizare
Nivelurile de sumarizare suportate sunt Număr, Medie, Sump, Minimum şi Maximum. Orice alte
valori, cum ar fi Număr distincte, ar putea împiedica prezentarea insight-urilor. Anumiţi algoritmi
acceptă numai niveluri de sumarizare specifice. Modificarea nivelului de sumarizare implicit la una
dintre valorile suportate ar putea ajuta la activarea insight-urilor.
Tipuri de câmp
Tipurile de câmp pot fi desemnate intern ca fiind continue sau categoriale, în funcţie de valorile
câmpului selectat.

Tip de câmp Descriere


Categorial O variabilă ce poate avea un număr limitat de valori posibile, de obicei
fixate. O variabilă categorială atribuie fiecare persoană sau altă unitate de
observaţie unui grup particular sau unei unităţi nominale pe baza unei
anumite proprietăţi calitative. De exemplu, ţara în care locuieşte o
persoană.
Continuă O variabilă care este utilizată pentru a descrie valori numerice, cum ar fi
intervalul 0 - 100 sau 0,75 - 1,25. O valoare continuă poate fi un întreg, un
număr real sau data şi ora.

Roluri de câmp
IBM Cognos Analytics alocă un rol fiecăruia dintre sloturile câmpurilor dintr-o vizualizare suportată.
Un rol de câmp poate fi desemnat ca unul dintre următoarele în funcţie de slotul de vizualizare.

66 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Rol câmp Descriere
Răspuns O variabilă ce poate fi prognozată, numită şi ţintă sau variabilă
dependentă. De obicei se află pe axa Y.
Explicativ O variabilă ce ajută la explicarea modificărilor din răspuns, numită şi
predictor sau variabilă independentă. De obicei se află pe axa X.
Grup O variabilă ce este tratată ca un factor explicativ sau ca un factor grupat
opţional ce ajută la determinarea numărului de modele încorporate în
algoritm. De exemplu, poate corespunde slotului Culoare al unei vizualizări
Coloană.
Pondere O variabilă ce defineşte ponderile de regresie opţionale, care sunt utilizate
pentru a calcula modelul de regresie. De exemplu, poate corespunde
slotului Mărime al unei vizualizări Bulă.
Repetare O variabilă ce creează multipli mici, vizualizarea fiind repetată o dată
pentru fiecare valoare distinctă a variabilei. De exemplu, poate corespunde
slotului Repetare (rânduri) dintr-o vizualizare Radială.
Puncte O variabilă ce defineşte formarea datelor şi punctelor de date utilizate
pentru a calcula modelul. De exemplu, poate corespunde slotului Puncte al
unei vizualizări Prin puncte.

Ca un exemplu general, într-o vizualizare bară cu următoarele sloturi, mapările de rol ale vizualizării
sunt definite ca:
• Bare (axa y), explicativ
• Lungime (axa x), răspuns
• Culoare, grup

Insight-urile în vizualizări pentru numere


Insight-urile pentru numere sunt disponibile de fiecare dată când este afişat numărul pentru fiecare
categorie a unui câmp categorial singular.
De asemenea, sunt disponibile atunci când este afişat numărul pentru fiecare combinaţie de categorii a
unei perechi de câmpuri categoriale din vizualizare. În acest caz, perechea poate fi alcătuită din două
câmpuri explicative, ca pentru rândurile şi coloanele unei hărţi termice, sau dintr-un câmp explicativ şi un
câmp de repetare, ca pentru bare şi repetare (coloană) într-o diagramă bară.
Insight-urile pentru numerele categoriilor combinate alcătuite din trei câmpuri categoriale sunt suportate
pentru un câmp explicativ şi două câmpuri de repetare, ca pentru segmente, repetare (coloană) şi
repetare (rând) într-o vizualizare radială.

Privire generală
Utilizaţi astfel de vizualizări atunci când vă interesează compararea numărului de articole din diferite
categorii sau o combinaţie de categorii.

Algoritmi
IBM Cognos Analytics raportează numărul mediu pentru toate categoriile câmpului de răspuns specificat
şi aplică teste statistice pentru a detecta categoriile pentru care numerele sunt, din punct de vedere
statistic, cele mai diferite faţă de medie.
Vizualizările cu două sau trei câmpuri categoriale şi numere pentru fiecare combinaţie de categorii sunt
tratate diferit. Cognos Analytics nu numai că compară numerele pentru categorii, dar şi detectează orice
relaţie între câmpurile categoriale. Cognos Analytics tratează un câmp ca fiind câmp de răspuns şi pe
celelalte ca fiind câmpuri explicative.

Capitolul 5. Principles of advanced data analytics 67


Cognos Analytics raportează categoria cea mai frecventă din vizualizări cu un câmp explicativ categorial,
unul sau două câmpuri de repetare categoriale şi un câmp de răspuns pentru număr.

Detalii
Câmp categorial singular
Primul test aplicat este testul hi pătrat al frecvenţelor egale, pentru a stabili dacă sunt disponibile
numere care sunt diferite semnificativ faţă de medie. Dacă rezultatul testului este semnificativ,
Cognos Analytics aplică testul hi pătrat de influenţă pentru fiecare categorie separat. Cognos
Analytics calculează mărimea efectului pentru categoriile la care testul de influenţă este semnificativ
din punct de vedere statistic şi raportează categoriile cu cea mai mare mărime a efectului în cadrul
diferenţelor semnificative.
Restricţii
Următorul tabel prezintă condiţiile care determină dacă insight-urile sunt sugerate pentru acest
algoritm.

Răspuns Explicativ Grup Pondere Puncte Insight


Exact 1 - - - - Medie
Nivel de sumarizare = Număr Diferenţe semnificative

Două câmpuri categoriale


Cognos Analytics tratează un câmp categorial ca fiind câmpul de răspuns şi pe celălalt ca fiind câmpul
explicativ. Câmpul de număr original este utilizat ca intrare pentru algoritmi.
Este utilizat testul hi pătrat de independenţă cu ajustare pentru date rarefiate pentru a se stabili dacă
există o relaţie între câmpul de răspuns şi câmpul explicativ. Dacă rezultatul testului este semnificativ,
Cognos Analytics calculează puterea de predicţie pentru acest model ca R pătrat pentru număr
ajustat, cu categoriile cu frecvenţă mică filtrate. Relaţia este declarată de încredere şi este raportată
puterea de predicţie dacă depăşeşte 10%.
Dacă rezultatul testului de mai sus este semnificativ, sunt analizate în continuare toate combinaţiile
de câmpuri explicative şi de răspuns, prin aplicarea testului hi pătrat de influenţă pentru fiecare
combinaţie. Combinaţiile de categorii explicative şi de răspuns pentru care testul de influenţă este
semnificativ sunt considerate că au influenţă. Este calculată mărimea efectului pentru fiecare
combinaţie de categorii cu influenţă şi combinaţiile cu cea mai mare mărime a efectului sunt raportate
în cadrul diferenţelor semnificative.
Dacă rolurile celor două câmpuri categoriale sunt de explicaţie şi de repetare, este aplicat algoritmul
pentru cele mai frecvente. Sunt adunate numerele pentru fiecare categorie distinctă a câmpului
explicativ. Este raportată cea mai mare sumă, împreună cu numărul de categorii care au respectiva
sumă. Reţineţi că pentru acest algoritm nu este utilizat câmpul de repetare, ci doar declanşatoare
când este aplicat algoritmul.
Restricţii
Următorul tabel prezintă condiţiile care determină dacă insight-urile sunt sugerate pentru acest
algoritm.

Răspuns Explicativ Grup Pondere Puncte Repetare Insight


Exact 1 Exact 2 - - - - Putere de predicţie
Nivel de sumarizare = Categorial Diferenţe semnificative
Număr

Exact 1 Exact 1 - - - Exact 1 Putere de predicţie


Categorial Categorial Diferenţe semnificative

68 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Răspuns Explicativ Grup Pondere Puncte Repetare Insight

Nivel de sumarizare = Cele mai frecvente


Număr

Trei câmpuri categoriale


Aceşti algoritmi sunt aplicaţi numai atunci când există un câmp explicativ şi două câmpuri de repetare.
Combinaţia celor două câmpuri de repetare este tratată ca şi cum ar fi un singur câmp categorial, în care
categoriile sunt perechi de categorii din cele două câmpuri de repetare.
Puterea de predicţie este calculată exact la fel ca în cazul cu două câmpuri categoriale, perechea de
câmpuri de repetare fiind utilizată ca predictorul câmpului explicativ. Se utilizează testul hi pătrat de
independenţă cu ajustare pentru date rarefiate pentru a verifica semnificaţia relaţiei şi R pătrat pentru
număr ajustat cu categoriile cu frecvenţă mică filtrate pentru a afla puterea de predicţie.
Diferenţele semnificative sunt calculate exact ca în cazul cu două câmpuri categoriale, fiind identificate
combinaţiile de câmp explicativ şi pereche de câmpuri de repetare pentru care numărul este neobişnuit.
Este utilizat testul hi pătrat de influenţă pentru a verifica semnificaţia fiecărei combinaţii şi sunt raportate
combinaţiile cu cea mai mare mărime a efectului.
Este aplicat algoritmul pentru cele mai frecvente exact la fel ca în cazul cu două câmpuri categoriale, fiind
adunate numerele pentru fiecare categorie distinctă a câmpului explicativ. Este raportată cea mai mare
sumă, împreună cu numărul de categorii care au respectiva sumă. Reţineţi că pentru acest algoritm nu
sunt utilizate câmpurile de repetare, ci doar declanşatoare când este aplicat algoritmul.

Răspuns Explicativ Grup Pondere Puncte Repetare Insight


Exact 1 Exact 1 - - - Exact 2 Putere de predicţie
Nivel de sumarizare = Număr Categorial Categorial Diferenţe semnificative

Cele mai frecvente

Diferenţe între Cognos Analytics versiunea 11.1 R2 şi R3


Pentru vizualizările cu două câmpuri categoriale, când câmpul de răspuns are o categorie ce reprezintă
date lipsă (categoria "(nicio valoare)"):
• În Cognos Analytics versiunea 11.1 R2, calculul R pătrat pentru număr ajustat pentru puterea de
predicţie omitea valorile de date pentru categoria cu date lipsă. În Cognos Analytics versiunea 11.1 R3,
aceste valori sunt incluse. Aceasta poate afecta puterea de predicţie raportată pentru hărţi termice
atunci când slotul pentru datele de căldură conţine date agregate după număr şi rândurile şi coloanele
sunt două câmpuri categoriale.
• În Cognos Analytics versiunea 11.1 R2, diferenţele semnificative nu raportau celulele neobişnuite
asociate cu categoria cu date lipsă. În Cognos Analytics versiunea 11.1 R3, aceste celule sunt raportate.
Aceasta poate afecta diferenţele semnificative afişate pentru hărţi termice atunci când slotul pentru
datele de căldură conţine date agregate după număr şi rândurile şi coloanele sunt două câmpuri
categoriale.

Insight-uri în vizualizări pentru sumare după unul sau mai multe câmpuri explicative
Insight-urile pentru sumare sunt disponibile atunci când nivelul de sumarizare este medie, sumă,
minimum sau maximum pentru un câmp de răspuns continuu. Insight-urile sunt calculate şi afişate la
fiecare categorie a unui câmp explicativ categorial singular sau fiecare combinaţie de categorii a unei
perechi de câmpuri explicative categoriale din vizualizare.

Privire generală
Utilizaţi astfel de vizualizări atunci când vă interesează compararea valorilor unui câmp de răspuns din
diferite categorii sau din combinaţii de categorii ale câmpurilor categoriale.

Capitolul 5. Principles of advanced data analytics 69


Algoritmi
Dacă nivelul de sumarizare este mediu, IBM Cognos Analytics detectează orice relaţie dintre câmpul de
răspuns şi câmpurile explicative şi calculează puterea de predicţie a modelului corespondent. Dacă
diferenţele valorilor medii din categoriile explicative sunt semnificative din punct de vedere statistic,
Cognos Analytics identifică cele mai diferite categorii explicative sau combinaţii de categorii în cadrul
diferenţelor semnificative.
Când nivelul de sumarizare este suma, Cognos Analytics calculează suma medie a categoriilor explicative
sau a combinaţiilor de categorii. Dacă diferenţele de sume ale categoriilor sunt semnificative din punct de
vedere statistic, Cognos Analytics identifică cele mai diferite categorii explicative în cadrul diferenţelor
semnificative.
Pentru toate diagramele aplicabile, insight-ul mediu afişează valoarea medie a răspunsului sumarizat
pentru toate categoriile explicative. Când nivelul de sumarizare pentru răspuns este media, media este
calculată utilizând valoarea afişată şi numărul pentru fiecare categorie explicativă.

Detalii
Medie după un singur câmp explicativ
Când nivelul de sumarizare pentru câmpul de răspuns este media şi este disponibil un singur câmp
explicativ categorial, Cognos Analytics aplică analiza ANOVA unifactorială. Cognos Analytics utilizează
statistica F pentru a testa dacă valorile medii ale categoriilor explicative sunt egale. Dacă există
diferenţe semnificative, Cognos Analytics calculează R pătrat ajustat ca putere de predicţie a relaţiei
dintre câmpul răspuns şi câmpul explicativ. Relaţia de încredere şi puterea sa de predicţie sunt
raportate utilizatorului dacă puterea de predicţie depăşeşte 10%.
Dacă diferenţa între medii este semnificativă, Cognos Analytics realizează un test t de influenţă pentru
a detecta categoriile care sunt cele mai diferite faţă de media generală. Aceasta implică calcularea
erorii standard pentru fiecare medie de categorie şi compararea mediei cu media generală utilizând
statistica testului t. Pentru categoriile cu diferenţe semnificative, Cognos Analytics calculează de
asemenea mărime efectului corespondent şi raportează categoriile cu cea mai mare mărime a
efectului în cadrul diferenţelor semnificative.
Restricţii
Următorul tabel prezintă condiţiile care determină dacă sunt sugerate insight-uri pentru acest
algoritm.

Răspuns Explicativ Grup Pondere Puncte Insight


Exact 1 Exact 1 - Opţional - Medie
Nivel de sumarizare = Medie Categorial Orice Putere de predicţie
Continuă Diferenţe semnificative

Medie după două câmpuri explicative


Pentru diagramele în care nivelul de sumarizare pentru câmpul de răspuns este media şi sunt
disponibile două câmpuri explicative categoriale, Cognos Analytics aplică analiza ANOVA bifactorială.
Cognos Analytics utilizează statistica F pentru a testa dacă valorile medii ale combinaţiilor de categorii
explicative sunt egale. Dacă diferenţele sunt semnificative, Cognos Analytics calculează R pătrat
ajustat ca putere de predicţie a relaţiei dintre câmpul de răspuns şi cele două câmpuri explicative.
Cognos Analytics calculează de asemenea R pătrat ajustat pentru modelele unifactoriale care includ
un singur câmp explicativ fiecare. Dacă puterea de predicţie a unui model bifactorial este mai mare de
10% şi îmbunătăţirea sa relativă a puterii de predicţie faţă de modelele unifactoriale corespondente
este de peste 10%, Cognos Analytics afişează puterea de predicţie a modelului bifactorial şi
raportează o relaţie de încredere între câmpul răspuns şi cele două câmpuri explicative. Altfel, dacă
puterea de predicţie maximă a modelelor unifactoriale depăşeşte 10%, Cognos Analytics raportează o
relaţie de încredere între câmpul răspuns şi câmpul explicativ singular corespondent, împreună cu

70 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


puterea sa de predicţie. Dacă puterea de predicţie maximă a modelelor unifactoriale nu depăşeşte
10%, Cognos Analytics nu raportează nicio relaţie între câmpul răspuns şi câmpurile explicative.
Când diferenţa între mediile pentru combinaţiile de categorii este semnificativă, Cognos Analytics
realizează de asemenea un test t de influenţă pentru a detecta combinaţiile de categorii care sunt cele
mai diferite faţă de media generală. Acest test este similar cu cel pentru un singur câmp explicativ.
Principala diferenţă este că în loc să ia în considerare categorii ale unui singur câmp explicativ, Cognos
Analytics ia în considerare combinaţii de categorii din cele două câmpuri explicative. Combinaţiile de
categorii cu cea mai mare mărime a efectului sunt raportate în cadrul diferenţelor semnificative.
Restricţii
Următorul tabel prezintă condiţiile care determină dacă sunt sugerate insight-uri pentru acest
algoritm.

Răspuns Explicativ Grup Pondere Puncte Insight


Exact 1 Exact 2 Opţional (tratare Opţional - Medie
Nivel de sumarizare = Categorial ca Explicativ) Putere de predicţie
Medie Categorial
Diferenţe semnificative
Continuă

Sumă după unul sau două câmpuri explicative


Pentru diagramele în care nivelul de sumarizare pentru câmpul de răspuns este sumă şi este
disponibil un câmp explicativ categorial sau sunt disponibile două, Cognos Analytics aplică testul de
comparare a sumei. Acest test detectează dacă oricare dintre sume este diferită faţă de valoarea de
sumă medie pentru toate categoriile explicative sau combinaţii de categorii. Dacă acest test este
semnificativ, Cognos Analytics continuă cu realizarea testului pentru influenţa sumei, care compară
suma pentru fiecare categorie sau combinaţie de categorii cu suma medie. Pentru fiecare test
semnificativ, Cognos Analytics calculează de asemenea mărimea corespondentă a efectului.
Categoriile sau combinaţiile de categorii cu cele mai mari mărimi ale efectului sunt raportate în cadrul
diferenţelor semnificative.
Restricţii
Următorul tabel prezintă condiţiile care determină dacă sunt sugerate insight-uri pentru acest
algoritm.

Răspuns Explicativ Grup Pondere Puncte Insight


Exact 1 1 sau 2 Opţional (tratare ca - - Medie
Nivel de sumarizare = Categorial Explicativ) Diferenţe
Sumă Categorial semnificative
Continuă

Minimum sau maximum după unul sau două câmpuri explicative


Pentru nivelul de sumarizare minimum sau maximum, este disponibil doar insight-ul mediu. Este
calculat ca valoarea medie a minimului sau maximului răspunsului din toate categoriile explicative sau
combinaţiile de categorii.
Restricţii
Următorul tabel prezintă condiţiile care determină dacă sunt sugerate insight-uri pentru acest
algoritm.

Răspuns Explicativ Grup Pondere Puncte Insight


Exact 1 1 sau 2 - - - Medie

Capitolul 5. Principles of advanced data analytics 71


Răspuns Explicativ Grup Pondere Puncte Insight

Nivel de sumarizare = Min sau Max Categorial


Continuă

Insight-uri în vizualizări pentru două câmpuri continue


Insight-urile pentru două câmpuri continue sunt disponibile atunci când o vizualizare implică două
câmpuri continue şi un câmp de grup categorial opţional sau de puncte.

Privire generală
Utilizaţi vizualizările cum ar fi trasarea prin puncte a celor două câmpuri continue, posibil feliate după
categoriile câmpului de grup. Principalul scop este de a detecta orice relaţie între câmpurile continue şi
de a include şi câmpul de grup categorial. Rezultatele conţin puterea de predicţie a relaţiei descoperite,
descrierea relaţiei furnizate de liniile de ajustare şi orice puncte cu o discrepanţă mare faţă de liniile de
ajustare, ca diferenţe semnificative.

Algoritmi
IBM Cognos Analytics calculează mai multe modele de regresie care implică unul din câmpurile continue
ca răspuns şi celălalt câmp continuu ca şi câmp explicativ predictori. Câmpul grupului categorial opţional
este folosit ca un factor de model . În plus faţă de contribuţiile de model suplimentare corespunzătoarea
câmpului explicativ, Cognos Analytics ia în considerare pătratul câmpului explicativ şi orice termeni de
interacţiune care includ un factor. Dintr-un număr de posibile modele, este selectat un model de regresie,
care asigură ajustarea optimă pentru date. Linia de ajustare corespondentă este derivată din modelul
liniar sau pătratic. În cazul că a fost furnizat un câmp de grup categorial opţional, poate produce o linie
sau curbă pătratică diferită pentru fiecare categorie a factorului. Un factor cu până la trei categorii este
luat în considerare pentru a nu supraîncărca vizualizarea.
Fiecare punct dintr-o vizualizare reprezintă un număr de rânduri din date şi este definit de câmpul
Puncte. Numerele de rânduri corespondente care se bazează pe câmpul răspuns definesc ponderile de
frecvenţă care sunt folosite pentru construirea modelului de regresie. Ponderile de regresie sunt utilizate
independent de ponderea de frecvenţă când Cognos Analytics calculează modelele de regresie.

Detalii
Două câmpuri continue
Când Cognos Analytics aplică regresia liniară multiplă pentru două câmpuri continue, unul este ales ca
şi câmp răspuns şi celălalt ca explicativ în model. Cognos Analytics ia în considerare termenii de
model atât pentru modelul liniar, cât şi pentru cel pătratic. Dacă modelul pătratic este semnificativ pe
baza testului F şi îmbunătăţirea sa relativă a puterii de predicţie este mai mare de 10% faţă de
modelul liniar, Cognos Analytics raportează puterea sa de predicţie şi afişează curba pătratică, bazată
pe modelul calculat. Această curbă afişează valorile prognozate ale răspunsului pe baza valorilor
corespondente ale câmpului explicativ. Altfel, este luat în considerare modelul de predictor liniar.
Dacă este semnificativ şi puterea sa de predicţie este mai mare de 10%, Cognos Analytics raportează
puterea sa de predicţie şi afişează o linie ce reprezintă valorile prognozate ale răspunsului pe baza
valorilor corespondente ale câmpului explicativ. Dacă modelul liniar nu se califică, este raportată
media ca linie de ajustare şi nu este raportată nicio relaţie între cele două câmpuri continue.
De asemenea, când este detectată o relaţie liniară sau pătratică, Cognos Analytics inspectează
diferenţele între valorile prognozate şi observate ale răspunsului. Aceste diferenţe sunt numite
reziduuri şi Cognos Analytics realizează un test al reziduurilor studentizate pentru a detecta punctele
aberante. Punctele cu o abatere mare faţă de relaţiile descoperite sunt afişate sub diferenţele
semnificative în diagrama corespunzătoare.
Restricţii
Următorul tabel prezintă condiţiile care determină dacă sunt sugerate insight-uri pentru acest
algoritm.

72 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Răspuns Explicativ Grup Pondere Puncte Insight
Exact 1 Exact 1 - Opţional Opţional Putere de predicţie
Nivel de sumarizare = orice Continuă Continuă Orice Linie de ajustare
Continuă Diferenţe semnificative

Câmp de grup categorial


Când este specificat un câmp de grup categorial pe lângă cele două câmpuri continue, acesta este
utilizat ca factor în regresia liniară multiplă unde unul dintre câmpurile continue este ales ca şi câmp
de răspuns şi celălalt ca şi câmp explicativ. Cognos Analytics ia în considerare termenii de model
linear şi pătratic pentru câmpul explicativ continue combinat cu contribuţii de la factor. Dacă modelul
pătratic sau modelul liniar care include factorul este semnificativ în baza testului F şi îmbunătăţirea sa
relativă a puterii de predicţie este mai mare de 10% faţă de modelul liniar cu explicativ continuu,
Cognos Analytics generează patru modele suplimentare. Aceste modele includ toate interacţiunile
posibile ale explicativului continuu şi factor. Ca model final este ales modelul cu R pătrat ajustat
maxim care este şi semnificativ. Acesta este utilizat pentru a crea o linie de ajustare pentru fiecare
categorie a predictorului categorial. Altfel, modelul liniar cu explicativ continuu este testat pentru
semnificaţie şi este raportat dacă puterea sa de predicţie este mai mare de 10%. Dacă modelul liniar
nu se califică, nu este stabilită nicio relaţie de încredere între câmpuri şi este raportată media
generală ca linie de ajustare.
Când este detectată o relaţie de încredere, Cognos Analytics verifică de asemenea diferenţa între
valorile prognozate şi observate ale câmpului răspuns. Cognos Analytics realizează un test al
reziduurilor studentizate pentru a detecta punctele aberante şi le afişează în cadrul diferenţelor
semnificative, în diagrama corespondentă.
Restricţii
Următorul tabel prezintă condiţiile care determină dacă sunt sugerate insight-uri pentru acest
algoritm.

Răspuns Explicativ Grup Pondere Puncte Insight


Exact 1 Exact 1 Exact 1 Opţional Opţional Putere de predicţie
Nivel de sumarizare = orice Continuă Categorial Orice Orice Linie de ajustare
Continuă Diferenţe semnificative

Câmp cu ponderi de regresie


Poate fi utilizat un câmp continuu opţional pentru a specifica ponderi de regresie pentru model.
Ponderea de regresie pentru o valoare disponibilă corespunde influenţei observaţiei asupra
parametrilor modelului calculat.

Detaliile limbajului natural


Detaliile limbajului natural reprezintă o caracteristică text, care augmentează vizualizările afişate cu
sumare suplimentare. Detaliile furnizează insight-uri obţinute printr-o analiză corespunzătoare a datelor,
care este relevantă pentru dumneavoastră.

Privire generală
Această caracteristică este disponibilă pentru vizualizările care sunt create într-o explorare, iar detaliile
text sunt afişate în panoul cu detalii corespunzător. Astfel, puteţi obţine informaţiile cele mai relevante
pentru datele vizualizate, într-un format ce utilizează limbajul natural. De asemenea, sunt afişate şi alte
sumare şi detalii, care nu sunt disponibile în vizualizare.

Capitolul 5. Principles of advanced data analytics 73


Algoritmi
Detaliile de bază furnizează sumare simple, cu date care nu pot fi văzute uşor în vizualizarea afişată. În
timp ce aceste informaţii le puteţi obţine prin specificarea altor vizualizări înrudite, asemenea paşi de
explorare devin nenecesari deoarece sumarele asociate sunt făcute disponibile ca detalii text.
Detaliile bazate pe insight-uri în vizualizări furnizează o descriere text a detaliilor ce pot fi obţinute cu
caseta de dialog Insight-uri din vizualizarea afişată sau din vizualizările conexe. Acestea asigură o
claritate mai mare pentru insight-urile afişatee şi, de asemenea, permit adăugarea unor insight-uri
suplimentare, care nu sunt disponibile în vizualizarea afişată.

Detalii
Detaliile sunt bazate pe câmpuri afişate în vizualizarea corespunzătoare. Analiza asociată poate extrage
sumare suplimentare, dar nu include niciun câmp care nu este specificat în vizualizare. Sumarele şi
detaliile sunt convertite în text traductibil prin utilizarea unor şabloane, nu cu o facilitate completă de
generare a limbajului natural. Aceasta conduce la secvenţe de limbaj care se repetă în textul randat, dar
care nu diminuează cantitatea sau calitatea informaţiilor afişate.

Detaliile de bază ale limbajului natural


Detaliile de bază ale limbajului natural furnizează sumare suplimentare ale datelor afişate în vizualizare
sau evidenţiază informaţiile disponibile cu detalii suplimentare.

Privire generală
Aceste informaţii vă asigură o vizualizare mai completă a datelor, fiind în acelaşi timp relevante pentru
sumarele afişate pe care le luaţi în considerare. Dacă modificaţi nivelul de sumarizare specificat pentru
câmpul de răspuns, se schimbă unele sau toate detaliile de bază, deoarece se modifică focalizarea
vizualizării. Sunt furnizate informaţii suplimentare în contextul taskului principal.

Algoritmi
Detaliile bază calculate depind de nivelul de sumarizare specificat pentru câmpul de răspuns din
vizualizarea corespondentă. Nivelurile de sumarizare posibile pentru răspuns sunt număr distincte şi
număr pentru orice câmp şi sumă, medie, minimum şi maximum pentru câmpurile numerice. În timp ce
pentru majoritatea nivelurilor de sumarizare a răspunsului sunt utilizate detalii bazate pe număr, sunt
furnizate sumare corespunzătoare suplimentare pentru nivelurile de sumarizare a răspunsului sumă,
medie, minimum şi maximum. Sumarele bazate pe număr sunt generate atât pentru nivelurile de
sumarizare a răspunsului număr, cât şi pentru număr distincte.

Detalii
Număr general
Numărul total este afişat pentru răspuns şi orice câmp explicativ din vizualizare. Numărul nu include
valorile lipsă ale răspunsului şi este calculat în afara cazului în care nivelul de sumarizare pentru
răspuns este sumă sau medie. Toate câmpurile categoriale specificate în vizualizare sunt tratate ca
fiind câmpuri explicative pentru scopurile detaliilor.
Numărul pentru câmpuri explicative
Numărul este de asemenea calculat pentru fiecare categorie a câmpului explicativ afişat, în afara
cazului în care nivelul de sumarizare pentru răspuns este sumă. Algoritmul selectează şi raportează
categoriile superioare, numerele corespondente şi procentajele numerelor relativ la numărul total
pentru câmpul explicativ. Această procedură este aplicată pentru fiecare câmp explicativ din
diagramă.
Sumă
Când nivelul de sumarizare afişat este sumă pentru un câmp de răspuns numeric, IBM Cognos
Analytics sumarizează suma totală corespondentă pentru câmpul de răspuns. Dacă vizualizarea
conţine mai multe câmpuri categoriale explicative, suma este calculată pentru fiecare categorie şi

74 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


fiecare câmp explicativ. Algoritmul selectează şi raportează categoriile superioare, sumele
corespondente şi procentajele sumelor relativ la suma totală pentru fiecare câmp explicativ.
Medie
Când nivelul de sumarizare afişat este media pentru un câmp de răspuns numeric, Cognos Analytics
sumarizează media totală corespondentă pentru câmpul de răspuns.
Interval
Sumarele interval sunt date de minimum şi maximum când nivelul de sumarizare este sumă sau
medie şi sunt calculate pentru un câmp de răspuns numeric pentru combinaţiile de categorii ale
câmpurilor explicative. Dacă este specificat un singur câmp explicativ, sunt afişate şi categoriile în
care apar valorile minime şi maxime.
Minimum şi maximum
Când nivelul de sumarizare afişat este un minimum sau maximum pentru un câmp numeric, Cognos
Analytics afişează valoarea minimă sau maximă pentru toate categoriile din câmpul categorial
explicativ. Dacă sunt specificate mai multe câmpuri categoriale explicative, valoarea minimă sau
maximă este calculată pentru toate combinaţiile de categorii posibile.

Detaliile de bază ale limbajului natural bazate pe insight-uri


Detaliile care se bazează pe insight-uri furnizează descrierea text a insight-urilor care poate fi obţinută
prin intermediul casetei de dialog Insight-uri din vizualizare.

Privire generală
Detaliile care se bazează pe insight-uri furnizează insight-uri din vizualizările asociate, care sunt
informative şi uşor de înţeles în contextul diagramei curente. Aceasta permite furnizarea unor detalii mai
cuprinzătoare, care sunt asociate vizualizării curente.

Algoritmi
Detaliile bazate pe insight-uri utilizează direct calculele şi testele statistice care sunt suportate de insight-
uri. De asemenea, detaliile obţin rezultatele pentru vizualizările asociate şi le compilează împreună într-
un mesaj semnificativ. Detaliile furnizează şi o analiză suplimentară, bazată pe ieşirea insight-urilor, prin
producerea unor detalii suplimentare, adecvate pentru o ieşire de tip text.

Detalii
Câmp explicativ singular
Date fiind un câmp de răspuns şi un câmp explicativ categorial, detaliile utilizează insight-urile pentru
a detecta relaţia dintre răspuns şi câmpul explicativ. Este aplicată o analiză dacă nivelul de sumarizare
al răspunsului este mediu sau sunt raportate numărul şi puterea de predicţie dacă este descoperită o
relaţie relevantă.
În cazul în care câmpul explicativ este numeric şi insight-urile generează o linie de ajustare, IBM
Cognos Analytics raportează o pantă pozitivă sau negativă pentru ajustarea liniară şi indică dacă a fost
detectată o relaţie pătratică. Dacă relaţia este pătratică, Cognos Analytics raportează de asemenea
punctul extrem. Cognos Analytics calculează valoarea minimă sau maximă a răspunsului şi valoarea
explicativă pentru locul unde apare punctul extrem al răspunsului.
Două câmpuri explicative
Când sunt disponibile două câmpuri explicative, Cognos Analytics detectează relaţia dintre răspuns şi
ambele câmpuri explicative şi relaţia dintre răspuns şi fiecare câmp explicativ în parte. Dacă puterea
de predicţie pentru relaţia cu ambele câmpuri explicative furnizează o îmbunătăţire relativă mai mare
de 10% faţă de fiecare relaţie separată, Cognos Analytics raportează că răspunsul este afectat de
ambele câmpuri explicative. Altfel, este afectat de un singur câmp explicativ sau de fiecare câmp
explicativ separat, dar nu de ele împreună.

Capitolul 5. Principles of advanced data analytics 75


Diferenţe semnificative
Detaliile raportează toate diferenţele semnificative care sunt descoperite de insight-uri pentru datele
utilizate atunci când nivelul de sumarizare al răspunsului este număr, medie sau sumă. Ele sunt
raportate pentru categoriile fiecărui câmp explicativ separat, precum şi pentru combinaţiile de
categorii pentru două câmpuri explicative. De asemenea, sunt furnizate indicaţii privind valorile
neobişnuit de mari sau de mici.
Arbori de decizie
Detaliile raportează puterea de predicţie pentru un arbore de decizie şi o listă de câmpuri predictor
care sunt utilizate pentru divizarea nodurilor arborelui. Este raportat câmpul predictor cu cea mai
mare importanţă de variabilă şi îmbunătăţirea sa de raport a importanţei variabilei faţă de alte
câmpuri din arborii de decizie, dacă raportul este mai mare decât doi. Un detaliu similar poate fi afişat
pentru un câmp cu cea mai mică importanţă de variabilă.

Detalii în limbaj natural pentru seriile temporale


Detaliile pentru seriile temporale furnizează insight-uri de text bazate pe analiza datelor seriei temporale
şi a modelelor de previzionare corespunzătoare.

Privire generală
IBM Cognos Analytics raportează detalii pentru serii temporale pentru o vizualizare care este creată într-o
explorare oricând datele de vizualizare conţin o singură serie temporală şi este calculat un model de
previzionare. Dacă datele sunt potrivite, insight-urile de serii temporale sunt generate chiar dacă pe
vizualizare nu este prezentă caseta de dialog Previzionare. Când caseta de dialog Previzionare este
prezentă, după activare produce acelaşi model implicit ca insight-urile de serie temporală. Punctele seriei
temporale sunt sortate automat în ordine cronologică pentru scopul detectării insight-urilor, dar, spre
deosebire de caracteristica de previzionare, punctele de timp afişate în vizualizare nu sunt sortate.

Algoritmi
Detaliile pentru seriile temporale sunt bazate pe un model de netezire exponenţială pentru datele seriei
temporale observate. Valorile seriilor temporale observate şi componentele modelului calculat sunt
utilizate pentru a crea insight-uri pentru seriile temporale: valori neobişnuite, efecte sezoniere şi insight-
uri de tendinţă. Fiecare tip de insight-uri depinde de o combinaţie diferită de date şi de componentele
modelului de netezire exponenţială corespunzătoare.

Detalii
Valori neobişnuite
Un model de netezire exponenţială furnizează o valoare prognozată pentru fiecare punct de timp
observat. O valoare prognozată la un moment dat este o previziune cu un pas înainte la punctul de timp
anterior. Este calculat un interval de încredere pentru fiecare valoare prognozată, care utilizează variaţia
de valoare prognozată corespunzătoare care depinde de model. O valoare de serie temporală observată
care este găsită în afara intervalului de încredere pentru valoarea prognozată corespondentă bazată pe
model este considerată ca fiind o valoare neobişnuită.
Valorile neobişnuite sunt detectate pe baza modelului de netezire exponenţială selectat pentru seriile
temporale. Nivelul de încredere care este utilizat pentru calcularea intervalelor de încredere predicţie
este de 99,74%. Până la cinci valori neobişnuite sunt raportate prin listarea punctelor de timp
corespunzătoare. Cognos Analytics nu listează punctele în ordine cronologică, ci mai degrabă în ordinea
descrescătoare a distanţei faţă de intervalul de încredere. Sunt listate mai întâi punctele cele mai
neobişnuite. Valorile neobişnuite sunt specificate ca fiind neobişnuit de mari sau neobişnuit de mici atunci
când este posibil.
O valoare neobişnuită care este detectată la ultimul punct de timp este raportată separat. Aceasta ar
putea indica faptul că datele sunt incomplete. De exemplu, valoarea sumarizată pentru ultima lună ar
putea reflecta datele zilnice doar până la jumătatea lunii.
Efecte sezoniere

76 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Insight-urile efecte sezoniere dezvăluie lungimea sezonieră pentru o serie temporală care este identificată
de model. Lungimea sezonieră corespunde unei durate fixe a unui model sezonier stabilit în seriile
temporale. De exemplu, variaţia medie a temperaturii pe 12 luni stabileşte un model anual. Acest insight
oferă, de asemenea, puterea efectelor sezoniere şi a perioadele rapoartelor cu cele mai mari şi cele mai
mici valori sezoniere.
Lungimea sezonieră este obţinută din modelul selectat. Aceasta este derivată din perioada sezonieră şi
intervalul de date calendaristice sau de timp care este raportat la detaliile statistice ale previzionării. Un
model sezonier este selectat doar dacă furnizează o potrivire superioară tuturor modelelor non-sezoniere.
Perioada sezonieră pentru modelul sezonier selectat este obţinută prin compararea modelelor cu mai
multe perioade sezoniere ca şi candidat.
Efectele sezoniere sunt raportate ca fiind slabe, moderate sau puternice, în funcţie de valoarea puterii
calculate. Puterea efectelor sezoniere este calculată ca o reducere a erorii de model de către modelul
sezonier în comparaţie cu modelul nesezonier corespunzător şi este împărţită la eroarea de model non-
sezonieră. Acest lucru este diferit faţă de puterea sezonalităţii raportată în detaliile statistice previzionării,
în care este raportată diferenţa de acurateţe între cele două modele.
Cele mai mari şi cele mai mici valori sezoniere sunt calculate pe baza mediilor de componente ale
modelului sezonier subiacent în toate modelele sezoniere din seriile temporale. Perioadele
corespunzătoare sunt raportate dacă valorile medii sunt în mod constant cele mai mari, sau cele mai mici,
faţă de majoritatea modelelor sezoniere.
Tendinţă
Insight-ul tendinţă raportează o direcţie general pozitivă sau negativă a valorilor seriei temporale, dacă ea
există. De asemenea, raportează puterea tendinţei.
Ambele componente de nivel şi tendinţă sunt extrase din modelul de netezire exponenţială
corespunzător. Doar componenta de nivel este utilizată dacă modelul nu are o componentă de tendinţă.
Aceasta defineşte o curbă de tendinţă pentru datele seriei temporale. Măsura de asociere Tau a lui
Kendall şi testul statistic corespunzător sunt apoi calculate pentru curba tendinţei. Ele detectează o
direcţie general pozitivă sau negativă a valorilor seriei temporale. Intervalele de valori Tau diferite
definesc gradul de putere raportat pentru tendinţă: slabă, moderată sau puternică.
Pentru mai multe informaţii despre modelele de netezire exponenţială, consultaţi “Modelele de
previzionare” la pagina 54.

Relaţiile
Vizualizările de relaţii dintr-o explorare sunt afişate iniţial când specificaţi datele pentru explorare.

Privire generală
IBM Cognos Analytics furnizează o scurtă trecere în revistă a relaţiilor dintre perechi de câmpuri care sunt
focalizate pe un singur câmp de interes. Vizualizarea conţine mai multe file, fiecare pentru alt câmp de
interes. Aceste informaţii sunt foarte utile pentru a vă orienta cu privire la multitudinea de relaţii
relevante, disponibile în datele care urmează să fie explorate în continuare, după cum este necesar.

Algoritmi
Câmpul de interes iniţial este determinat pe baza unei analize semantice a datelor, dar puteţi specifica alt
câmp de interes. Fiecare filă furnizează un grafic de reţea cu câmpuri ca noduri şi legături între perechi de
noduri care reprezintă puterea relativă a relaţiei dintre noduri. Legăturile de la câmpul de interes domină
graficul, dar sunt afişate şi alte perechi de câmpuri înrudite, cu relaţii puternice. Puteţi ajusta un glisor
pentru a vedea un număr mai mare sau mai mic de noduri din reţea.

Detalii
Date pentru analiză
Utilizând date nesumarizate, este calculată puterea relaţiei între toate perechile de câmpuri luate în
considerare. Pentru a standardiza măsura puterii relaţiei şi a o face comparabilă pentru toate

Capitolul 5. Principles of advanced data analytics 77


perechile de câmpuri, în primul pas se face binning pentru toate câmpurile numerice. Toate câmpurile
din date sunt tratate ca fiind categoriale. Binning-ul aplicat este un binning de frecvenţă egală, are
generează cinci bin-uri. Puteţi găsi mai multe detalii în secţiunea privind pregătirea datelor pentru
câmpuri numerice.
Putere relaţie
Mai întâi sunt tabulate datele pentru fiecare pereche de câmpuri categoriale, pentru toate
combinaţiile de categorii de câmp găsite în date. Pe baza datelor tabulate, IBM Cognos Analytics
aplică testul hi pătrat de independenţă pentru a se evalua dacă câmpurile sunt independente. Dacă
abaterea de independenţă este semnificativă, Cognos Analytics calculează mărimea efectului pe baza
statisticii hi pătrat. Acesta este coeficientul V Cramer, care este utilizat pe scară largă pentru a măsura
asocierea între două câmpuri categoriale. Valorile acestei măsuri variază în intervalul 0 - 1 şi Cognos
Analytics raportează valoarea puterii relaţiei exprimată ca procentaj. Relaţiile cu puterea mai mică de
10% nu sunt raportate, deoarece acestea sunt considerate prea slabe pentru a avea o valoare
practică.
Limitări de performanţă
Calcularea puterii relaţiei între toate perechile de câmpuri din setul de date este prohibitivă în cazul
unui volum mare de date. Cognos Analytics limitează numărul de câmpuri procesate la 100, pentru a
putea să furnizeze un răspuns rapid. Însă aceste câmpuri sunt selectate de alt proces şi posibila
pierdere de relaţii relevante este minimizată. Dacă datele conţin mai mult de 10.000 de rânduri,
Cognos Analytics obţine un eşantion aleator cu această mărime, din motive care ţin de performanţă.
Această mărime a volumului de date asigură o pierdere minimă în ceea ce priveşte acurateţea
estimării puterii relaţiei.

Diferenţe între Cognos Analytics şi Watson Analytics privind analiza de date avansată
Metodele de analiză avansată de la Watson Analytics au fost adaptate şi îmbunătăţite în IBM Cognos
Analytics. Ca rezultat, poate fi observat un număr de diferenţe.

Pregătirea datelor
Pregătirea datelor este o etapă critică atât pentru Cognos Analytics, cât şi pentru IBM Watson Analytics,
deoarece numai datele pregătite sunt introduse în analizele pentru driver-e cheie şi arbori de decizie.
Pregătirea datelor diferă între cele două pachete, în privinţa mai multor aspecte importante.

Diferenţă Cognos Analytics Watson Analytics


Valorile lipsă Valorile lipsă din câmpul ţintă sunt Alocate pe baza relaţiei dintre ţintă şi un
manipulate la fel în ambele produse; predictor.
rândurile cu valoare lipsă din câmpul
Watson Analytics exclude câmpurile
ţintă sunt excluse din toate analizele
predictor cu mai mult de 25% valori
următoare. Însă valorile lipsă sunt
lipsă.
tratate diferit pentru câmpurile
predictor.
O categorie separată pentru predictorii
categoriali.
Pentru predictorii numerici se face
întotdeauna binning şi valorile lipsă sunt
tratate ca un bin separat.

Combinarea Cognos Analytics ordonează categoriile Combinarea categoriilor pentru


categoriilor după frecvenţa apariţiei lor în date şi predictori depinde de valorile ţintă. Sunt
grupează toate categoriile care încep cu combinate numai categoriile care au
a 50-a într-o singură categorie. De suficient valori în câmpul ţintă similar.
asemenea, sunt combinate toate
categoriile cu frecvenţa sub 3.

78 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Diferenţă Cognos Analytics Watson Analytics

Categoriile combinate trebuie să


reprezinte sub 25% din rândurile de
date. Altfel, câmpul nu este utilizat
pentru analiză. Şi categoriile ţintă sunt
combinate.

Tratarea punctelor Punctele aberante din câmpurile ţintă Nu este disponibilă tratarea automată a
aberante continue sunt tratate prin setarea punctelor aberante.
valorilor de graniţă extremă şi înlocuirea
valorilor care depăşesc graniţele cu
valorile de graniţă corespondente pentru
scopurile legate de analiză. Aceasta
îmbunătăţeşte analiza atât pentru
driver-e cheie, cât şi pentru arbori de
decizie, deoarece relaţiile cu ţinta devin
mai uşor de detectat. Punctele aberante
tratate în pregătirea datelor predictive
nu sunt raportate în vizualizare.

Eşantionarea Cognos Analytics analizează eşantionul Watson Analytics utilizează setul


de date care conţine aproximativ 10.000 complet de rânduri din date pentru a
de rânduri dacă datele originale genera driver-e cheie şi arbori de
depăşesc această mărime. Este afişat un decizie. Aceasta poate cauza o reducere
avertisment de fiecare dată când este a performanţei.
realizată analiza corespondentă pe un
eşantion de date, dar puterea de
predicţie a driver-elor cheie şi arborilor
de decizie generaţi este de aşteptat să
fie mai apropiată de puterea de predicţie
a modelelor obţinute pentru datele
corespondente complete.

Driver-ele cheie

Diferenţă Cognos Analytics Watson Analytics


Driver-ele cheie Cognos Analytics furnizează driver-ele Driver-ele cheie, atât pentru ţinte
cheie atât pentru ţinte continue, cât şi continue, cât şi pentru cele categoriale,
pentru ţinte categoriale, în vizualizarea sunt disponibile în vizualizarea spirală.
spirală şi de analiză a driver-elor.
În timp ce paşii de pregătire a datelor
afectează atât driver-ele cheie
unifactoriale, cât şi pe cele bifactoriale,
analiza Cognos Analytics pentru driver-
ele cheie bifactoriale diferă de analiza
Watson Analytics prin criteriul utilizat
pentru selectarea driver-elor de afişat
pentru utilizator.

Testele statistice Pentru ţintele categoriale, Cognos Watson Analytics utilizează testul
Analytics utilizează testul de raportului de verosimilitate pentru
independenţă hi pătrat pentru a ţintele categoriale.
determina dacă două câmpuri
categoriale sunt independente.

Capitolul 5. Principles of advanced data analytics 79


Diferenţă Cognos Analytics Watson Analytics
Criteriul de selecţie Cognos Analytics necesită ca puterea de Watson Analytics utilizează
predicţie a driver-ului cheie bifactorial interacţiunea bifactorială drept criteriu
să asigure o îmbunătăţire relativă de de selecţie pentru driver-ele cheie
peste 10% comparativ cu puterea de bifactoriale. Pentru a fi selectat, un
predicţie a driver-elor unifactoriale driver cheie bifactorial trebuie să aibă
corespondente. Îmbunătăţirea relativă a mărimea efectului de interacţiune peste
puterii de predicţie este măsurată prin un anumit prag.
procentajul reducerii erorii driver-ului
cheie bifactorial relativ la eroarea
minimă pentru driver-ele cheie
unifactoriale corespondente. Acest
criteriu asigură prezentarea doar a
driver-elor cheie bifactoriale relevante.
Putere de predicţie Puterea de predicţie pentru analizele Puterea de predicţie pentru ţintă
spirală şi de driver-e cu ţintă continuă continuă este calculată ca R pătrat.
este calculată ca R pătrat ajustat.
Puterea de predicţie pentru ţinta
Puterea de predicţie pentru ţinta categorială este calculată ca fiind
categorială este calculată ca R pătrat acurateţea clasificării.
pentru număr ajustat. Este obţinută prin
calcularea îmbunătăţirii acurateţei
arborelui de clasificare peste un model
constant şi împărţirea ei cu eroarea de
clasificare a modelului constant.
Modelul constant prezice modul ţintă şi
acurateţea sa de clasificare este
estimată de frecvenţa modului. Este
raportată o relaţie de încredere pentru
predicţie când puterea de predicţie a
modelului este mai mare decât un prag
implicit de 10%.
Ca rezultat, puterea de predicţie pentru
o vizualizare spirală cu o ţintă
categorială poate fi diferită în Watson
Analytics şi Cognos Analytics, chiar şi
pentru ţintă şi intrări comparabile.

Arborele de decizie

Diferenţă Cognos Analytics Watson Analytics


Arborele de decizie În plus faţă de vizualizările arbore şi Sunt disponibile vizualizări pentru
reguli de decizie, Cognos Analytics arborele de decizie şi regulile de decizie.
furnizează şi noua vizualizare explozie Puterea de predicţie a arborelui este
solară. Diferenţele privind generarea întotdeauna disponibilă în vizualizarea
unui arbore de decizie în Cognos spirală.
Analytics sau Watson Analytics depind
de ţinta continuă sau categorială.
Puterea de predicţie pentru arborii de
decizie este afişată în vizualizarea
spirală şi de analiză a driver-elor în
Cognos Analytics, dar numai atunci când
este mai mare decât puterea de
predicţie a driver-ului cheie superior.

80 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Diferenţă Cognos Analytics Watson Analytics
Ţinta continuă Arborii de decizie pentru ţintă continuă Watson Analytics utilizează algoritmul
sunt generaţi pe baza sumei pătratelor, CHAID şi testele F corespondente la
atât în Watson Analytics, cât şi în combinarea şi divizarea nodurilor de
Cognos Analytics. arbore. Aceasta furnizează divizări cu
mai multe căi pentru nodurile arborelui
Cognos Analytics utilizează direct
de decizie.
câştigul de informaţii asociat cu
mărimea efectului pentru testul F în
Watson Analytics, la combinarea şi
divizarea nodurilor de arbore. Aceasta
furnizează divizări cu mai multe căi
pentru nodurile arborelui de decizie.

Regulile de oprire Cognos Analytics limitează numărul Watson Analytics limitează mărimea
nodurilor de arbore la 36. arborelui, prin limitarea numărului de
niveluri de arbore la 5.
Numărul minim al rândurilor
corespondente nodurilor de arbore este Numărul minim al rândurilor
25. corespondente nodurilor de arbore este
50.
Câmpurile care nu contribuie la puterea
de predicţie sunt înlăturate din arborii Arborii din Watson Analytics tind să aibă
Cognos Analytics. Cognos Analytics un nivel mai mare de acurateţe numai
produce arbori mai mici, care sunt mai atunci când conţin un număr mult mai
potriviţi pentru vizualizare şi insight-uri, mare de noduri.
cu o acurateţe comparabilă şi uneori mai
mare decât a arborilor generaţi de
Watson Analytics.

Importanţa Importanţa variabilei este calculată ca Importanţa variabilei este calculată


variabilei fiind îmbunătăţirea relativă a puterii de sensibilităţii rezultatelor atunci când
predicţie când variabila este adăugată variabila ia diferite valori.
arborelui de decizie. Predictorii cu
importanţa variabilei la acelaşi nivel sau
sub prag sunt excluşi din arborele de
decizie. Pragul este setat la zero pentru
majoritatea arborilor. Pragul este
crescut puţin pentru arborii bazaţi pe un
număr mai mic de rânduri de date şi
care au puteri de predicţie mai mici,
pentru a reduce posibilele efecte de
supra-ajustare.
Putere de predicţie Puterea de predicţie pentru arborii de Puterea de predicţie pentru arborii de
decizie cu ţintă continuă este calculată decizie cu ţintă continuă este calculată
ca R pătrat. ca R pătrat.
Puterea de predicţie pentru ţinta Puterea de predicţie pentru ţinta
categorială este calculată ca R pătrat categorială este calculată ca fiind
pentru număr ajustat. acurateţea clasificării.
R pătrat pentru număr ajustat scade
eroarea de clasificare a arborelui din
eroarea de clasificare de bază, care este
obţinută prin selectarea întotdeauna a
cele mai frecvente categorii ţintă, şi
împarte rezultatul la eroarea de
clasificare de bază. Reprezintă

Capitolul 5. Principles of advanced data analytics 81


Diferenţă Cognos Analytics Watson Analytics

îmbunătăţirea relativă a arborelui de


decizie. Ca rezultat, puterea de predicţie
pentru arborii de decizie cu ţintă
categorială poate fi diferită în Watson
Analytics şi Cognos Analytics, chiar şi în
cazul arborilor de decizie comparabili.

Controalele de utilizator

Diferenţă Cognos Analytics Watson Analytics


Controalele de Specificaţi un câmp ca fiind continuu Specificaţi câmpurile care urmează să
utilizator setând proprietăţile de date Utilizare la fie utilizate ca fiind continue, nominale
Măsură sau ca fiind categorial (nominal) sau ordinale setând proprietăţile de date
setând Utilizare la Identificator sau corespunzătoare în Rafinare.
Atribut.
Permite excluderea şi includerea
Permite excluderea şi includerea predictorilor din modele prin intermediul
predictorilor direct din vizualizările altei proprietăţi de date Rafinare.
corespondente, prin editarea în caseta
de dialog pentru driver-e.

82 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Capitolul 6. Assistant

Asistentul
IBM Cognos Analytics include un asistent înglobat, care suportă intrări bazate pe text, pentru a vă ajută să
obţineţi rapid insight-uri din datele dumneavoastră şi să vă simplificaţi analizele. În doar câţiva paşi,
puteţi să accesaţi surse de date cheie, să creaţi vizualizări şi să le trageţi pe canavaua unei explorări sau a
unui tablou de bord. Intrarea de tip text este acceptată doar în limba engleză.
Puteţi folosi două interfeţe:
1. Panoul de asistent complet
2. Panoul de asistent compact

Panoul de asistent complet


Panoul de asistent complet este alcătuit din trei secţiuni: bară de unelte, ieşire şi câmp de intrare. Puteţi
rula acţiuni din bara de unelte, cum ar fi resetarea istoriei dumneavoastră. Ieşirea este afişată într-o zonă
ce poate fi derulată şi care include toate răspunsurile anterioare. Câmpul de intrare, etichetat ca Puneţi o
întrebare în mod implicit, este locul în care puteţi introduce o intrare conversaţională bazată pe text.

Deschideţi vizualizarea de panou complet făcând clic pe pictograma Asistent . Dacă folosiţi panoul
compact, doar în Explorare, puteţi comuta la panoul complet făcând clic pe Deschidere în vizualizarea
completă.

Panoul de asistent compact


Panoul compact este disponibil doar în interfaţa Explorare. Puteţi deschide panoul compact făcând clic
pe Puneţi o întrebare în zona panoului compact.
Panoul compact arată numai ultima intrare şi ultimul răspuns. Pentru a vizualiza toată istoria, faceţi clic pe
legătura Deschidere în vizualizare completă din panoul compact sau pe pictograma Asistent .
În câmpul Puneţi o întrebare, puteţi folosi săgeata în sus sau săgeata în jos de pe tastatură pentru a
vedea o listă cu comenzi recomandate. Pe măsură ce introduceţi textul, caracteristica de anticipare
tastare vă furnizează sugestii pentru posibile întrebări. Această facilitate vă ajută să formulaţi întrebări
corecte şi vă scuteşte de o tastare suplimentară.
Pentru a repeta ultima întrebare, faceţi clic pe bula de răspuns sau folosiţi scurtătura de la tastatură (Shift
+ săgeată sus) şi apoi apăsaţi Enter. Puteţi să derulaţi prin întrebările dumneavoastră anterioare apăsând
Shift + săgeată sus/jos.
Vizualizările care apar în panoul Asistent sunt condensate, astfel că anumite informaţii pot fi excluse.
Puteţi vedea detaliile complete ale vizualizării în Explorare sau Tablou de bord. Din Asistent, puteţi trage
vizualizările pe o canava Explorare sau Tablou de bord.

© Copyright IBM Corp. 2018, 2020 83


Pentru a curăţa istoria conversaţiei şi a o readuce la starea sa iniţială, faceţi clic pe pictograma Resetare
în bara de unelte. Acelaşi rezultat îl puteţi obţine introducând reset sau clear. Pictograma Reset
apare numai în panoul complet; ea nu este disponibilă în panoul compact.
Important: Reîmprospătarea filei de browser Cognos Analytics resetează de asemenea istoricul.

Aptitudinile asistentului
Asistentul de este o caracteristică puternică, ce vă permite să puneţi întrebări folosind limbajul natural. În
acest subiect, sunt prezentate câteva întrebări pe care le puteţi folosi cu Asistentul.
Pune întrebări folosind limbajul natural. De exemplu, show Profit este sinonim cu list Profit,
what is Profit?, tell me about Profit şi Profit.
Iată câteva întrebări uzuale cu care puteţi începe:
help
Afişează o prezentare generală şi informaţiile de utilizare generale.
show data
Listează toate sursele de date suportate la care aveţi acces în Conţinutul meu şi Conţinut de echipă.
Sursele de date suportate includ:
• Fişiere încărcate (csv, tsv, xls, xlsx şi zip)
• Module de date
• Set de date
• Pachete Framework Manager
Notă: Vedeţi Îmbogăţirea pachetelor în documentul Gestionarea.

84 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


Atunci când rezultatele depăşesc numărul de articole afişate, faceţi clic pe Mai mult pentru a vizualiza
până la 100 de surse de date. Derulaţi până la sfârşitul listei şi faceţi clic pe Mai puţin pentru a
restrânge lista.
show source <nume-sursă>
Afişează o listă de câmpuri şi detalii relevante pentru sursa de date specificată. Bara de unelte
afişează valoarea <nume-sursă utilizată în context. Implicit, Cognos Analytics utilizează sursa activă
din panoul cu tabloul de bord sau explorarea dumneavoastră. Puteţi să faceţi clic pe numele
câmpurilor din rezultate pentru a obţine informaţii suplimentare privind câmpurile respective. Un clic
pe numele câmpului este echivalent cu întrebarea show column <nume-coloană>.
Atunci când rezultatele depăşesc numărul de articole afişate, faceţi clic pe Mai mult pentru a vizualiza
până la 100 de surse de date. Derulaţi până la sfârşitul listei şi faceţi clic pe Mai puţin pentru a
restrânge lista.
show column <nume-coloană>
Sunt afişate informaţii şi câmpurile asociate cu coloana specificată. Un clic pe un câmp asociat este
echivalent cu întrebarea show chart <coloană1> and <coloană2>. Dacă se determină că există factori
de influenţă pentru coloana specificată, puteţi introduce what influences <nume-coloană> pentru a
vedea lista cu factorii de influenţă.
what influences column <nume-coloană>
Afişează o listă de câmpuri care influenţează rezultatele în coloana specificată.
show chart <coloană1> and <coloană2>
Afişează vizualizări care arată relaţia între <coloană1> şi <coloană2>. Derulaţi prin vizualizări
făcând clic pe săgeţile la stânga şi la dreapta. Fiecare vizualizare include o pictogramă de informaţii în
colţul dreapta-sus. Treceţi peste pictogramă pentru a vedea descrierile despre datele subiacente.
Opţional, puteţi introduce mai multe coloane, dar un număr prea mare de coloane poate avea ca
rezultat vizualizări mai puţin eficiente.
Când faceţi clic pe Show related visualizations, sunt returnate vizualizări bazate pe câmpuri
de influenţă şi înrudite.
Când faceţi clic pe Create dashboard from the charts, este creat un tablou de bord nou, bazat
pe diagramele generate cel mai recent. Când tastaţi Create related dashboard, este generat
acelaşi tablou de bord. Dacă diagramele conţin agregări superior sau inferior, aceşti modificatori sunt
aplicaţi tabloului de bord generat.
Aplicarea agregărilor şi filtrelor poate ajuta la adăugarea focalizării şi crearea unor vizualizări mai
riguroase. Printre agregările utilizate de obicei se numără totalul, media, numărul, maximum/
minimum, superior/inferior, cel mai bun/cel mai rău şi aşa mai departe. Iată câteva exemple de
agregare:
show top <num> <coloană1> by <coloană2>
Afişează valorile superioare din <coloană1>, în funcţie de contextul din <coloană2>. De
exemplu, show top 5 Sales by Region. Dacă nu se specifică <num>, este utilizată valoarea
implicită 10.
<coloană1> este o măsură agregată sau neagregată, iar <coloană2> este o coloană categorială.
show average <nume-coloană>
Afişează media pentru toate valorile găsite în <nume-coloană>.
how many <nume-coloană>
Dacă <nume-coloană> este o categorie, este returnat numărul de articole distincte. Dacă
<nume-coloană> este o măsură, este returnată suma totală.
show maximum <nume-coloană>
Afişează cea mai mare valoare găsită în <nume-coloană>.
show minimum <nume-coloană>
Afişează cea mai mică valoare găsită în <nume-coloană>.
show total <nume-coloană>
Afişează suma totală pentru toate valorile găsite în <nume-coloană>.

Capitolul 6. Assistant 85
Puteţi adăuga filtre pentru şiruri geografice (cum ar fi Country sau State) sau şiruri temporale (cum
ar fi Month sau Year). Filtrarea după data calendaristică nu este suportată în prezent. Agregările şi
filtrele pot fi combinate, pentru a produce rezultate cu un nivel mai mare de granularitate. Iată câteva
exemple, bazate pe date eşantion:
• show Education by Income where Income is less than 1000
• show Education by Income where Income > 100K
Opţional, folosiţi K (pentru a indica mii) sau M (pentru a indica milioane).
• show Revenue in 2017 and 2018
• show Income by Month for New York City
• what are the top 5 States by average Inventory, excluding California

Vizualizările filtrate includ o pictogramă de filtru ( ), plasată în colţul din dreapta-sus al diagramei.
Plasaţi cursorul mouse-ului pe această pictogramă pentru a afişa filtrarea aplicată.
create dashboard
Generează un nou tablou de bord pe baza sursei de date selectate curent. Puteţi să modificaţi
vizualizările, filele, ordinea etc. şi să vă salvaţi noul tablou de bord. În mod implicit, tabloul de bord
generat va include diagrame analitice şi predictive avansate.
Generarea automată a tablourilor de bord pentru surse de date mari poate crea probleme privind
performanţa. Pentru a le evita, puteţi introduce create simple dashboard, pentru a genera un
tablou de bord de bază. Apoi puteţi să modificaţi tabloul de bord, înlocuind diagramele cu vizualizări
mai complexe, cum ar fi diagramele de analiză a driver-elor sau spirală.

86 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări


IBM®

S-ar putea să vă placă și