Documente Academic
Documente Profesional
Documente Cultură
Versiunea 11.1.0
IBM
Cuprins
Capitolul 3. Visualizations..................................................................................... 9
Vizualizările.................................................................................................................................................. 9
Vizualizarea cardurilor în panoul de navigare ....................................................................................... 9
Crearea unei singure vizualizări............................................................................................................. 9
Crearea unei vizualizări utilizând căutarea în câmpurile de date....................................................... 10
Compararea a două vizualizări............................................................................................................. 11
Compararea a două puncte de date pe o vizualizare.......................................................................... 12
Analiza de date avansată..................................................................................................................... 12
Alegerea unui alt tip de vizualizare...................................................................................................... 13
Insight-urile în vizualizări.....................................................................................................................43
Alegerea insight-urilor corelate........................................................................................................... 44
Alegerea vizualizărilor recomandate................................................................................................... 44
Alegerea vizualizărilor înrudite............................................................................................................ 44
Capitolul 4. Forecasting....................................................................................... 45
Previzionarea............................................................................................................................................. 45
Caracteristici de previzionare.............................................................................................................. 45
Opţiunile de previzionare..................................................................................................................... 46
Tipurile de vizualizare care suportă previzionarea..............................................................................49
Previzionarea datelor........................................................................................................................... 49
Detaliile statistice ale previzionării...................................................................................................... 52
Modelele de previzionare..................................................................................................................... 54
Capitolul 6. Assistant...........................................................................................83
iii
Asistentul................................................................................................................................................... 83
Aptitudinile asistentului....................................................................................................................... 84
iv
Capitolul 1. Getting started with Explorations
Explorările
Explorarea este un spaţiu de lucru flexibil unde puteţi descoperi şi analiza date. De asemenea, puteţi
explora o vizualizare existentă dintr-un tablou de bord sau poveste. Dezvăluiţi relaţii ascunse şi
identificaţi tipare care transformă datele dumneavoastră în insight-uri. Insight-urile corelate sunt
reprezentate de o pictogramă verde cu un număr, pe axa x, axa y sau titlul unei diagrame.
Pornirea explorărilor
Puteţi folosi câteva metode pentru a porni explorările.
Încărcarea datelor
Încărcaţi un activ de date în folderul Conţinutul meu pentru a-l folosi în explorare.
Procedură
1. Faceţi clic pe pictograma Nou şi apoi faceţi clic pe Încărcare fişiere.
Procedură
1. Deschideţi un tablou de bord sau o poveste existentă.
2. Selectaţi o vizualizare.
Procedură
Procedură
În diagrama de relaţii, coloana cu care începeţi este focalizarea principală şi este reprezentată de un nod
albastru închis. Câmpurile asociate sunt reprezentate de nodurile violete. Liniile conectează nodurile şi
reprezintă relaţiile. Grosimea liniei indică puterea relaţiei.
Procedură
1. Faceţi clic pe pictograma Explorări din panoul lateral.
Indiciu: Cardul Relaţii date este disponibil şi din meniul Card nou, pe bara de unelte.
Vizualizările
Puteţi schimba tipul de vizualizare sau modifica coloanele care sunt utilizate în vizualizare.
Procedură
1. Faceţi clic pe pictograma Explorări din panoul lateral.
Dacă nu vedeţi fila Detalii şi fila Câmpuri, faceţi clic pe Afişare detalii şi câmpuri .
Dacă nu vedeţi panoul de explorare, faceţi clic pe pictograma Afişare detalii şi câmpuri .
Detalii vizualizare
Fila Detalii afişează textul care este generat pentru a descrie aspectele datelor reprezentate în vizualizări.
Aceste detalii nu sunt evidente doar privind la vizualizare. De exemplu, detaliile pot afişa o medie a
valorilor în timp.
Câmpuri
Fila Câmpuri este locul în care puteţi adăuga coloane pentru a construi şi modifica vizualizări. Adăugaţi o
coloană la fiecare câmp obligatoriu.
Proprietăţi
Fila Proprietăţi este locul în care puteţi modifica proprietăţile care se aplică vizualizărilor dumneavoastră.
Procedură
1. Faceţi clic pe pictograma Explorări din panoul lateral.
Capitolul 3. Visualizations 11
Procedură
Procedură
Înainte de a începe
Pentru informaţii suplimentare despre tipurile de vizualizare, consultaţi documentaţia despre vizualizare
din Ghidul utilizatorului pentru tablouri de bord şi poveşti IBM Cognos Analytics.
Procedură
1. Din panoul Carduri, selectaţi cardul care reprezintă vizualizarea pe care vreţi să o deschideţi.
Suprafaţă
Utilizaţi o vizualizare suprafaţă pentru a evidenţia magnitudinea modificării în timp.
Diagramele suprafaţă sunt la fel ca diagramele linie, dar suprafeţele de sub linii sunt umplute cu modele
sau culori. Diagramele stivuite sunt utile pentru a compara proporţional contribuţiile într-o categorie.
Acestea trasează valoarea relativă cu care contribuie la total fiecare serie de date.
Deoarece o vizualizare suprafaţă cuprinde rezultatele pentru fiecare coloană sau articol, este uşor de
văzut totalul tuturor rezultatelor.
De exemplu, o vizualizare suprafaţă este excelentă pentru a vă uita la venit în timp, peste mai multe
produse.
De exemplu, această vizualizare suprafaţă arată valoarea de durată de viaţă client pentru fiecare clasă de
autovehicul pe lună. Deoarece vizualizarea suprafaţă stivuieşte rezultatele, vedeţi totalurile pentru fiecare
lună.
Capitolul 3. Visualizations 13
Vizualizarea suprafaţă a fost creată prin tragerea următoarele articole de date din panoul Surse:
• Trageţi tipul Expiry Month pe câmpul axa x .
• Trageţi Vehicle Class în câmpul Culoare .
• Trageţi Customer Lifetime Value pe câmpul axa y
Eşantioane
Puteţi vedea un exemplu de vizualizare nor de cuvinte în raportul eşantion Customer lifetime value
analysis. Puteţi găsi eşantionul aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime
value analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.
Bară
Utilizaţi o vizualizare bară pentru a compara valorile uneia sau a mai multor coloane, cum ar fi vânzările de
produse sau vânzările de produse pentru fiecare lună.
Utilizaţi câmpul Ţintă pentru a afişa măsurile care trebuie comparate cu o valoare ţintă.
Utilizaţi câmpul Pornire y pentru a defini unde trebuie să înceapă măsura.
Bulă
Folosiţi o vizualizare bulă pentru a arăta relaţiile dintre coloanele care conţin valori numerice, cum ar fi
venitul şi profitul.
O vizualizare bulă utilizează puncte de date şi bule pentru a trasa măsurile oriunde de-a lungul unei scale.
De-a lungul fiecărei axe este trasată câte o măsură. Mărimea bulei reprezintă o a treia măsură. Folosiţi
vizualizări bulă pentru a reprezenta date financiare sau orice date pentru care valorile de măsură sunt
înrudite.
Bulele au diferite mărimi şi culori. Pe axa x este reprezentată o măsură. Pe axa y este reprezentată altă
măsură, iar mărimea bulelor reprezintă a treia măsură. În exemplul de mai jos, culoarea este reprezentată
de un identificator.
Exemplu arătat reprezintă lunile de la începutul poliţei.
Creaţi diagrama cu bule prin tragerea următoarelor articole de date de la Customer Analysis din panoul
Sources :
• Trageţi Months Since Policy Incention în câmpul axa x .
• Trageţi Total Claim Amount în câmpul axa y .
Capitolul 3. Visualizations 15
• Trageţi Customer Lifetime Value în câmpul Mărime .
• Trageţi Employment Status în Color.
Puteţi personaliza diagrama cu bule. De exemplu, pentru a face axa x a diagramei cu bule să apară ca în
eşantion, efectuaţi următorii paşi:
1. faceţi clic pe vizualizare şi apoi în panoul Date, faceţi clic pe articolul de date <Total Claim Amount>.
2. Faceţi clic pe
Eşantioane
Puteţi vedea exemple de vizualizări în raportul eşantion Customer lifetime value analysis. Puteţi găsi
eşantioanele aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime value analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.
Marcator
Folosiţi diagrame marcator pentru a arăta măsurile care trebuie să fie comparate cu o valoare ţintă.
Într-un centru de apel, o diagramă marcator poate fi folosită pentru a măsura indici de măsurare cum ar fi
numărul de apeluri, timpul de răspuns la apel şi procentajul apelurilor abandonate.
În producţie, o diagramă marcator pot fi folosită pentru a urmări indici de măsurare cum ar fi numărul de
defecte şi comenzile livrate.
Într-un centru de fitness, o diagramă marcator poate fi folosită pentru a măsura indici de măsurare cum
ar fi numărul de paşi parcurşi şi caloriile arse.
Vizualizările marcator compară o măsură reală (marcatorul) cu măsura vizată (ţinta). De asemenea,
vizualizările marcator asociază măsurile comparate cu regiuni colorate din fundal, pentru a furniza mai
multe măsuri calitative, cum ar fi bine, satisfăcător şi nesatisfăcător. Vizualizările marcator pot să aibă
mărimi mici şi totuşi să furnizeze eficient informaţii.
O vizualizare marcator prezintă o singură măsură primară. De exemplu, venitul la zi pe anul curent. Şi
compară această măsură cu una sau mai multe măsuri, pentru o semnificaţie mai bogată. De exemplu,
comparată cu măsura ţintă, măsura primară este afişată în contextul unui interval calitativ privind
performanţa, cum ar fi nesatisfăcător, satisfăcător şi bine.
Dacă selectaţi o vizualizare marcator, specificaţi următoarele câmpuri:
• Câmpul Bară reală specifică măsura reală.
• Câmpul Ţintă specifică măsura ţintă.
• Câmpul Interval minim specifică intervalul calitativ minim.
• Câmpul Interval mediu specifică intervalul calitativ mijlociu.
• Câmpul Interval maxim specifică intervalul calitativ superior.
Vizualizarea marcator a fost creată prin tragerea următoarele articole de date din panoul Surse:
• Trageţi Minimum Range în câmpul Interval minim .
• Trageţi Minimum Range în câmpul Interval minim .
• Trageţi Maximum Range în câmpul Interval maxim
• Trageţi Maximum Range în câmpul Bară reală
• Trageţi Target în câmpul Ţintă.
• Trageţi Vehicle class în câmpul Date suplimentare.
Eşantioane
Puteţi vedea un exemplu de vizualizare marcator în raportul eşantion Customer lifetime value analysis.
Puteţi găsi eşantionul aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime value
analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.
Coloană
Utilizaţi o vizualizare coloană pentru a compara valorile uneia sau a mai multor coloane, cum ar fi
vânzările de produse sau vânzările de produse pentru fiecare lună.
Vizualizările coloană utilizează repere de date verticale care sunt aranjate în grupuri, pentru a compara
valori individuale. Folosiţi vizualizări coloană pentru a compara date discrete sau pentru a afişa tendinţele
în timp.
O vizualizare coloană arată modificarea într-un anumit interval de timp sau poate compara şi pune în
opoziţie două sau mai multe coloane într-un interval de timp sau de-a lungul timpului. Dacă există multe
bare astfel încât etichetele sunt imposibil de citit, filtraţi datele pentru a focaliza un subset de date sau
utilizaţi o hartă arbore.
De exemplu, venitul pentru fiecare linie de produse este grupat pe trimestre, ceea ce evidenţiază
performanţa din fiecare trimestru.
Capitolul 3. Visualizations 17
Utilizaţi câmpul Ţintă pentru a afişa măsurile care trebuie comparate cu o valoare ţintă.
Utilizaţi câmpul Pornire y pentru a defini unde trebuie să înceapă măsura.
Tabel încrucişat
Utilizaţi un tabel încrucişat atunci când doriţi să afişaţi relaţiile dintre trei sau mai multe coloane. Tabele
încrucişate afişează datele în rânduri şi coloane, cu informaţiile sumarizate în punctele de intersecţie.
De exemplu, acest tabel încrucişat afişează costurile cursului pentru fiecare departament după
organizaţie.
Începând cu Cognos Analytics versiunea 11.1.4, puteţi trage date din panoul Surse selectate şi să le
inseraţi într-o coloană sau rând sau să le plasaţi peste date existente pentru a le înlocui.
Arborele de decizie
Un arbore de decizie arată o ierarhie conectată de casete pentru a reprezenta valorile înregistrărilor.
Înregistrările sunt segmentate în grupuri, care sunt numite noduri. Fiecare nod conţine înregistrări, care
sunt similare din punct de vedere statistic una cu alta în ceea ce priveşte câmpul ţintă. De exemplu, un
nod poate conţine înregistrările cu bărbaţii care au mai mult de 18 ani de studii. Nodurile pot fi apoi
folosite pentru a face o predicţie referitoare la câmpul ţintă. De exemplu, nodul despre bărbaţi şi educaţie
poate fi folosit pentru o predicţie privitoare la salariu.
Fiecare ramură din arborele de decizie corespunde unei reguli de decizie. Pentru informaţii suplimentare
despre regulile de decizie, vedeţi “Vizualizarea regulilor de decizie” la pagina 22
Pentru a îmbunătăţi performanţa, din cauza numărului mare de rânduri din sursa de date, analiza se
bazează pe un eşantion reprezentativ din toate datele.
De exemplu, o vizualizare arbore de decizie poate arăta aşa:
Capitolul 3. Visualizations 19
Pentru a îmbunătăţi performanţa, din cauza numărului mare de rânduri din sursa de date, analiza se
bazează pe un eşantion reprezentativ din toate datele.
Când examinaţi un arbore de decizie:
• Dacă vreţi să vedeţi toate driver-ele, utilizaţi fila Diagramă arbore sau fila Reguli.
• Dacă vreţi să vă focalizaţi pe driver-ele cheie, utilizaţi fila Explozie solară arbore.
Pentru a edita sau adăuga driver-e cheie, faceţi clic pe de pe câmpul ţintă.
Insight-urile sunt diferite în funcţie de tipul de ţintă. Dacă faceţi predicţia unei măsuri continue, de
exemplu venitul, vârsta sau profitul, atunci arborele de decizie arată în cadrul nodurilor valoarea medie a
ţintei în condiţiile date până acum în grupul care este reprezentat de nod. De exemplu, dacă aveţi un
arbore care face predicţia venitului şi aveţi o ramură care are genul şi apoi oraşul. Dacă urmaţi calea de la
bărbat la Chicago, atunci valoarea care este în nodul Chicago, este venitul mediu al bărbaţilor în Chicago.
Procedură
1. Dacă aveţi o măsură continuă, următorul exemplu ilustrează un arbore de decizie.
Culoarea arată dacă valoarea nodului este asociată cu valorile mare, mediu şi mică ale ţintei. Culoarea
nodului se bazează pe media ţintei pentru măsură. Cu cât este mai mare media pentru un nod, cu atât
este mai închisă culoarea.
De exemplu, mai jos este arătată o vizualizare detaliată pentru Cheltuieli la restaurant (Restaurant
Spending). Terminalul internaţional este un predictor puternic pentru cheltuieli mari la restaurant ale
celor care călătoresc pentru afaceri. O curăţenie precară la aeroport este un predictor de cheltuieli
mici pentru călătorii care participă la conferinţe/convenţii.
Mini-harta vă ajuta să vă mişcaţi în jurul arborelui. Mini-harta este de ajutor în special când sunt multe
noduri.
În acest exemplu, primele cinci cele mai mari valori ţintă sunt indicate cu un număr. Puteţi alege dintre
următoarele opţiuni:
• Arbore complet. Nu sunt indicate în mod specific valorile cele mai mari şi cele mai mici.
• Primele cinci cele mai mari valori ţintă. Sunt arătate primele cinci cele mai mari valori ţintă.
• Primele cinci cele mai mici valori ţintă. Sunt arătate primele cinci cele mai mici valori ţintă.
Dacă aveţi o măsură categorială, selectaţi categoria pentru care vreţi să vedeţi primele cinci sau
ultimele cinci din meniul Primele 5 noduri pentru: sau meniul Ultimele 5 noduri pentru:.
În cazul în care măriţi prea mult, primele cinci şi ultimele cinci noduri nu sunt vizibile.
În fila Diagramă arbore, nodurile prezintă vizual distribuţia persoanelor în funcţie de starea civilă.
Capitolul 3. Visualizations 21
Vizualizarea regulilor de decizie
O regulă de decizie face predicţia unui rezultat în câmpul ţintă. Vizualizarea regulilor de decizie vă ajută să
determinaţi ce condiţii par să ducă la un anumit rezultat.
De exemplu, luaţi în considerare câteva reguli de decizie ipotetice care are putea prognoza migrarea
clienţilor. Aceste reguli pot identifica clasificări bazate pe intervalul de vârstă al clienţilor şi numărul de
cereri de revendicare anterioare. Din aceste reguli, puteţi observa că este mai probabil să pierdeţi clienţii
care au o cerere sau niciuna şi au vârsta peste 50 de ani.
Fiecare ramură din arborele de decizie corespunde unei reguli de decizie.
Procedură
1. Într-un arbore de decizie, apăsaţi Reguli.
2. Examinaţi regulile de decizie.
3. Pentru a reveni la vizualizare, apăsaţi Diagramă arbore.
Analiză driver-e
O vizualizare de analiză a driver-elor vă arată driver-ele cheie (predictorii) pentru o ţintă. Cu cât un driver
este plasat mai spre dreapta, cu atât driver-ul respectiv este mai puternic.
IBM Cognos Analytics utilizează algoritmi complecşi pentru a furniza insight-uri ci nivel înalt de
semnificaţie, bazate pe o modelare complexă. Nu trebuie să ştiţi ce teste statistice trebuie să fie rulate
pentru datele dumneavoastră. Cognos Analytics alege teste corespunzătoare pentru date.
În vizualizarea de analiză a driver-elor din tablouri de bord şi explorări sunt disponibile driver-ele cheie,
atât pentru ţinte continue, cât şi pentru cele categoriale.
Pentru informaţii suplimentare, consultaţi documentaţia Teste statistice în Ghidul utilizatorului pentru
tablouri de bord şi poveşti IBM Cognos Analytics.
De exemplu această vizualizare de analiză a driver-elor arată că o combinaţie dintre satisfacţia generală,
nivelul de semnalizare, nivelul de securitate şi impresia artistică reprezintă cele mai puternice driver-e
pentru evaluarea aeroportului ţintă.
Pentru a edita sau adăuga driver-e cheie, faceţi clic pe pe slotul de date ţintă.
Pentru a îmbunătăţi performanţa, din cauza numărului mare de rânduri din sursa de date, analiza se
bazează pe un eşantion reprezentativ din toaste datele.
Dacă faceţi clic pe un punct de date din arbore, sunt afişate alte vizualizări recomandate.
Harta termică
Folosiţi o vizualizare hartă termică pentru a vedea relaţia dintre coloanele reprezentate într-o vizualizare
de tip matrice.
O vizualizare hartă termică utilizează culoarea şi intensitatea culorii pentru a afişa relaţia dintre două
coloane.
De exemplu, această vizualizare hartă termică arată valoarea pe durata de viaţă client după gen şi
educaţie.
Capitolul 3. Visualizations 23
Creaţi vizualizarea hartă termică prin tragerea următoarelor articole de date din panoul Surse :
• Trageţi Gender în câmpul Rânduri .
• Trageţi Education în câmpul Coloane .
• Trageţi Customer Lifetime Value în câmpul Căldură .
Eşantioane
Puteţi vedea exemple de vizualizări în raportul eşantion Customer lifetime value analysis. Puteţi găsi
eşantioanele aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime value analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.
Ierarhie
Utilizaţi o ierarhie când doriţi să vedeţi datele în rânduri şi coloane.
De exemplu, această ierarhie afişează tipurile de produse.
Capitolul 3. Visualizations 25
Vizualizarea cu bule grupate ierarhică a fost creată prin tragerea următoarele articole de date din panoul
Surse:
• Trageţi Vehicle Class şi Vehicle Class în câmpul Bule .
• Trageţi Customer Lifetime Value în câmpul Mărime .
• Trageţi Dimensiune vehicul în câmpul Culoare
Eşantioane
Puteţi vedea un exemplu de vizualizare nor de cuvinte în raportul eşantion Customer lifetime value
analysis. Puteţi găsi eşantionul aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime
value analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.
KPI
Folosiţi o vizualizare KPI pentru a afişa un indicator de performanţă cheie (KPI) ce conţine două măsuri
conexe, cum ar fi venitul real şi venitul ţintă. Opţional, puteţi afişa o diagramă sparkline şi o formă cu
semnificaţie în vizualizările dumneavoastră KPI.
O vizualizare KPI compară o valoare de bază cu o valoare ţintă şi arată variaţia între cele două măsuri.
Creaţi o vizualizare KPI prin tragerea măsurilor din sursa de date proprie la sloturile de date la câmpurile
dintr-o vizualizare KPI goală:
1. Pe bara de unelte, selectaţi Card nou.
2. Selectaţi cardul blanc Singular.
3. Faceţi clic pe Alegeţi un tip şi selectaţi tipul de vizualizare KPI. Apoi, adăugaţi un articol de date în
fiecare câmp.
4. Trageţi o măsură în câmpul Valoare de bază. Această valoare este ţinta reală.
5. Trageţi o măsură în câmpul Valoare ţintă.
6. Trageţi o altă măsură în câmpul Timp. Această valoare creează o diagramă sparkline pentru
vizualizarea dumneavoastră KPI. Puteţi adăuga mai multe măsuri, de exemplu Ani şi Luni, la câmpul
Timp.
Folosiţi proprietăţile pentru a personaliza o vizualizare KPI. De exemplu, proprietăţile sunt setate implicit
pentru afişarea culorii condiţionale verde atunci când este atinsă ţinta şi a culorii condiţionale roşu atunci
când nu este îndeplinit obiectivul. Pentru a afişa ţinta reală cu altă culoare, sub proprietăţi, expandaţi
regula şi apoi selectaţi altă Culoare text.
Finalizaţi următorii paşi pentru a edita o regulă de culoare condiţională şi selectaţi o culoare
personalizată:
1. Selectaţi vizualizarea KPI pe explorarea dumneavoastră.
2. Faceţi clic pe fila Proprietăţi.
3. Sub Reguli, expandaţi regula pe care vreţi să o editaţi.
4. Din Culoare text, selectaţi o culoare.
Informaţiile următoare explică proprietăţile KPI de sub Stil regulă:
• Culoare text
Setaţi culoarea pentru valoare, diagrama sparkline şi forma de indicator.
• Indicator
Selectaţi o formă pentru afişarea pe vizualizarea KPI când este îndeplinită regula. De exemplu, aţi putea
afişa o săgeată în jos atunci când valoarea de bază scade sub un anumit prag comparativ cu valoarea
ţintă.
Capitolul 3. Visualizations 27
Hartă moştenită
Folosiţi o hartă moştenită atunci când vreţi să vedeţi modele în datele dumneavoastră în funcţie de zona
geografică. Puteţi folosi o hartă moştenită când nu sunteţi conectat la internet.
De exemplu, această vizualizare hartă moştenită prezintă venitul după ţara vânzătorului cu amănuntul,
culorile mai închise indicând un venit mai mare.
Linie
Utilizaţi o vizualizare linie pentru a afişa tendinţele în timp.
O vizualizare linie poate compara tendinţele şi ciclurile, poate deduce relaţiile dintre variabile sau poate
afişa modul în care o singură variabilă funcţionează în timp.
Pentru o vizualizare linie efectivă, utilizaţi o coloană de timp pe axa x, cum ar fi ani, trimestre, luni sau zile.
Dacă axa x afişează altceva, cum ar fi Canada, Olanda, Regatul Unit şi SUA, utilizaţi o diagramă bară sau
coloană.
De exemplu, această vizualizare linie afişează tendinţa costurilor în curs după departament în tot anul.
Capitolul 3. Visualizations 29
Listă
Folosiţi o vizualizare listă pentru a crea o imagine de ansamblu a datelor într-un mod ierarhic.
O altă utilizare a vizualizării listă vizualizare este de a crea widget-ul de filtrare. Următorul exemplu arată
cum puteţi folosi vizualizarea listă ca un widget de filtrare.
Hartă
Folosiţi o hartă atunci când vreţi să vedeţi modele în datele dumneavoastră în funcţie de zona geografică.
Activele dumneavoastră de date trebuie să conţină date geografice, cum ar fi ţări, state, provincii sau
continente.
Notă: Hărţile nu afişează animaţii dacă setările dumneavoastră de sistem privind simplitatea accesului
sunt configurate pentru a nu fi afişate animaţiile.
Hărţile din Cognos Analytics suportă următoarele continente:
• America de Nord
• America de Sud
• Africa
• Asia
• Europa
• Antarctica
• Oceania
Pentru a stabili dacă o coloană poate fi transpusă în hartă, Cognos Analytics analizează un eşantion de
2000 de valori din coloana de locaţie, căutând nume de locuri ce pot fi recunoscute. Dacă 80% sau mai
multe sunt recunoscute ca valori de hartă, Cognos Analytics produce o hartă.
Marimekko
O vizualizare Marimekko este similară cu o vizualizare coloană stivuită. Arată datele prin diferite înălţimi şi
include o dimensiune de date adăugată prin variaţia lăţimii de coloană. Lăţimea coloanelor se bazează pe
valoarea care este atribuită câmpului de lăţime. Înălţimea segmentului individual este un procent din
valoarea totală a coloanei respective.
Puteţi observa imediat segmentele mari, cum ar fi o anumită bară verticală ce reprezintă o porţiune mare
a regiunii. De asemenea, identifica spaţiul alb, cum ar fi bara verticală cu reprezentare insuficientă într-o
anumită regiune.
Vizualizarea Marimekko este utilă pentru comparaţiile parte-întreg, în care trebuie să arătaţi o măsură/
variabilă suplimentară.
Vizualizarea Marimekko permite datelor să fie evidenţiate de-a lungul a două dimensiuni simultan. De
exemplu, segmentele de piaţă sunt adesea dispuse de-a lungul axei x, lăţimea fiecărei coloane
corespunzând valorii financiare a segmentului. Folosiţi vizualizări Marimekko atunci când, de exemplu,
vreţi să arătaţi contribuţia la venit a fiecărei linii de produse. Sau produs intern brut pentru fiecare ţară.
Vizualizarea Marimekko poate afişa numărul total sau parţial. Dacă vreţi să folosiţi procentaje stivuite în
loc de numere, selectaţi opţiunea Afişare diagramă procentaj stivuit.
Capitolul 3. Visualizations 31
Următorul exemplu arată contribuţia la valoarea de durată de viaţă client şi statusul de angajat în
diferitele clase de vehicul cu opţiunea Afişare diagramă procentaj stivuit activată.
Vizualizarea Marimekko a fost creată prin tragerea următoarele articole de date din panoul Surse:
• Trageţi tipul Vehicle Class în câmpul Bare .
• Trageţi Customer Lifetime Value în câmpul Lungime .
• Trageţi Employment Status în câmpul Culoare.
Eşantioane
Puteţi vedea un exemplu de vizualizare nor de cuvinte în raportul eşantion Customer lifetime value
analysis. Puteţi găsi eşantionul aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime
value analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.
Reţea
Folosiţi o vizualizare reţea atunci când vreţi să vedeţi conexiunile între coloanele din activele
dumneavoastră de date. O vizualizare reţea este o bună alegere pentru a prezenta conexiunile, reţelele şi
punctele de intersecţie.
Vizualizările reţea afişează un set de noduri, reprezentate prin simboluri, şi legături, reprezentate prin căi,
pentru a arăta relaţia dintre entităţi sau articole.
Utilizaţi câmpurile De la şi La pentru a defini relaţia pe care doriţi să o investigaţi.
De exemplu, o vizualizare reţea poate arăta acceptarea ofertei după Clasa de vehicul
Surse :
• Trageţi Offer în câmpul De la.
• Trageţi Vehicle Class în câmpul La .
• Trageţi Accepted în câmpul Lăţime linie.
În continuare, setaţi mărimea şi proprietăţile nodului.
1. Faceţi clic pe . Setaţi următoarele opţiuni în panoulProprietăţi:
• Mărime - Lăţime: 500 px, Înălţime: 300 px
• Mărime minimă nod: 20
• Mărime maximă nod: 100
2. Faceţi clic pe pentru a închide panoul Proprietăţi.
Eşantioane
Puteţi vedea exemple de vizualizări în raportul eşantion Customer lifetime value analysis. Puteţi găsi
eşantioanele aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime value analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.
Bule grupate
Folosiţi o vizualizare cu bule grupate atunci când vreţi să arătaţi relaţiile dintre coloanele care conţin
valori numerice, cum ar fi venitul. Este similară cu vizualizarea bulă, dar bulele sunt strâns lipite în loc să
fie distribuite peste o grilă. O vizualizare cu bule grupate prezintă o cantitate mare de date într-un spaţiu
mic.
Bulele au diferite mărimi şi culori.
De exemplu, această vizualizare cu bule grupate prezintă angajările externe pe departamente. Fiecare
bulă reprezintă un departament diferit. Mărimea fiecărei bule este determinată de numărul de angajări
externe pentru departamentul respectiv.
Capitolul 3. Visualizations 33
Radială
Utilizaţi o vizualizare radială pentru a evidenţia proporţiile. Fiecare felie afişează relaţia relativă dintre
fiecare parte şi întreg.
De exemplu, această vizualizare radială fişează numărul de zile de curs pentru fiecare departament.
Punct
Utilizaţi o vizualizare punct pentru a arăta tendinţele în timp.
O vizualizare punct poate compara tendinţele şi ciclurile, infera relaţiile dintre variabile sau afişa modul în
care o singură variabilă se comportă în timp.
Circulară
Într-o vizualizare circulară, fiecare bară apare dispusă pe un cerc, barele mai lungi reprezentând valori
mai mari. Treceţi cu cursorul mouse-ului peste o bară pentru a vedea detalii despre ea, cum ar fi valoarea
exactă pe care o reprezintă bara respectivă. Fiecare bară începe la poziţia orei 12 (prânz) şi continuă în
sensul acelor de ceasornic pentru valorile pozitive şi în sens invers acelor de ceasornic pentru valorile
negative.
Vizualizările circulare, numite şi diagrame cadran sau diagrame vitezometru, prezintă informaţiile la fel ca
la citirea cadranului unui aparat de măsură. Vizualizarea circulară este validă doar cu o categorie.
De exemplu, această vizualizare arată reînnoirile după tipul de ofertă şi sex.
Capitolul 3. Visualizations 35
Creaţi vizualizarea circulară prin tragerea următoarele articole de date din secţiunea Analiză clienţi în
panoul Surse :
• Trageţi Renew Offer Type în câmpul Bare.
• Trageţi Number of Policies în câmpul Lungime.
• Trageţi Gender în câmpul Culoare .
Următorul pas este să setaţi proprietăţile de sortare pentru Renew Offer Type şi Gender.
1. Faceţi clic pe vizualizare şi apoi în panoul Date, faceţi clic pe articolul de date <Renew Offer Type>.
2. Faceţi clic pe
3. În panoul Proprietăţi, pentru Ordine de sortare, selectaţi Crescător.
4. În panoul Date, faceţi clic pe articolul de date <Gender>.
5. În panoul Proprietăţi, pentru Ordine de sortare, selectaţi Descrescător.
6. Faceţi clic pe pentru a închide panoul Proprietăţi.
Eşantioane
Puteţi vedea exemple de vizualizări în raportul eşantion Customer lifetime value analysis. Puteţi găsi
eşantioanele aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime value analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.
Prin puncte
Vizualizările prin puncte folosesc punctele de date pentru a desena două măsuri oriunde de-a lungul unei
scale, nu numai la gradaţiile regulate.
Vizualizările prin puncte sunt utile pentru explorarea corelărilor între diferitele seturi de date.
Exemplul următor arată corelaţia dintre venitul şi profitul brut pentru fiecare linie de produse.
Pentru a edita sau adăuga driver-e cheie, faceţi clic pe pe slotul de date ţintă.
Pentru a îmbunătăţi performanţa, din cauza numărului mare de rânduri din sursa de date, analiza se
bazează pe un eşantion reprezentativ din toate datele.
Capitolul 3. Visualizations 37
Notă: Filtrele nu sunt suportate pentru vizualizările spirală.
Bară stivuită
Utilizaţi o vizualizare bară stivuită pentru a compara contribuţiile proporţionale pentru fiecare articol la
total, cum ar fi vânzările de produse şi vânzările de produse în fiecare lună.
O vizualizare bară stivuită poate afişa modificarea într-o anumită perioadă de timp sau compara
contribuţiile proporţionale pentru fiecare articol la total. Dacă există multe bare astfel încât etichetele
sunt imposibil de citit, filtraţi datele pentru a focaliza un subset de date sau utilizaţi o hartă arbore.
Coloană stivuită
Utilizaţi o vizualizare coloană stivuită pentru a compara contribuţiile proporţionale pentru fiecare articol la
total, cum ar fi vânzările de produse şi vânzările de produse în fiecare lună.
Sumar
Utilizaţi o vizualizare sumar când doriţi să vedeţi totalul pentru o măsură sau numărul pentru o coloană pe
categorii.
De exemplu, această vizualizare sumar afişează venitul total pentru toate tipurile de produse.
Capitolul 3. Visualizations 39
Explozie solară
O vizualizare explozie solară este folosită pentru a ilustra modul în care datele subiacente prevăd o ţintă
aleasă şi evidenţiază insight-urile cheie.
Pentru mai multe informaţii despre vizualizarea explozie solară, consultaţi “Explorarea unei vizualizări de
arbore de decizie” la pagina 19.
Tabel
Utilizaţi un tabel pentru a afişa informaţii detaliate din baza dumneavoastră de date, cum ar fi listele de
produse sau listele de clienţi. Un tabel afişează datele pe rânduri şi coloane. În fiecare coloană sunt
afişate toate valorile unui articol de date din baza de date sau ale unui calcul bazat pe articolele de date
din baza de date.
De exemplu, acest tabel afişează costul cursului pentru fiecare departament.
Pentru a deselecta o casetă pe care aţi selectat-o, faceţi Ctrl+clic pe caseta selectată.
Cascadă
Folosiţi o vizualizare cascadă pentru a înţelege efectul cumulativ al unei serii de valori pozitive şi negative
asupra unei valori iniţiale. Barele din vizualizarea cascadă nu sunt totaluri.
O vizualizare cascadă arată cum este crescută sau descrescută o valoare iniţială de o serie de valori
intermediare, conducând la o valoare finală cumulativă, afişată în coloana din extremitatea dreaptă.
Valorile intermediare pot fi bazate pe timp sau bazate pe categorie.
Următoarele sunt exemple de vizualizări cascadă:
• Vizualizarea venitului net după ce adăugaţi creşterile şi descreşterile de venit şi costurile pentru o
întreprindere, de-a lungul unui trimestru.
• Vânzările cumulative pentru produse de-a lungul unui an, cu un total anual.
Această vizualizare cascadă arată diferenţa pentru deţinătorul de poliţă pentru fiecare lună.
Capitolul 3. Visualizations 41
Crearea unei vizualizări cascadă
1. Creaţi o nouă explorare. Pentru informaţii suplimentare, consultaţi “Pornirea unei explorări noi de la
meniul Nou” la pagina 1.
2. Deschideţi modulul de date eşantion: Select o sursă > Conţinut de echipă > Eşantioane > Date >
Customer analysis.
3. Faceţi clic pe Vizualizări şi faceţi clic pe Cascadă pentru a adăuga vizualizarea cascadă la explorare.
4. Faceţi clic pe Surse
Nor de cuvinte
Folosiţi o vizualizare nor de cuvinte atunci când vreţi să vedeţi o vizualizare bazată pe text pentru o
coloană. Înălţimea coloanei reprezintă scala. Numele în sine reprezintă diferiţi membri ai coloanei.
Indiciu: Activul de date ar trebui să conţină cel puţin 15 coloane şi cel puţin 100 de rânduri pentru a crea
un nor de cuvinte eficient.
De exemplu, această vizualizare nor de cuvinte prezintă valoarea duratei de viaţă pentru client, după
mărimea şi clasa vehiculului.
Eşantioane
Puteţi vedea un exemplu de vizualizare nor de cuvinte în raportul eşantion Customer lifetime value
analysis. Puteţi găsi eşantionul aici: Conţinut de echipă > Eşantioane > Rapoarte > Customer lifetime
value analysis.
Dacă lipseşte unul dintre obiectele eşantion, contactaţi administratorul.
Insight-urile în vizualizări
IBM Cognos Analytics furnizează insight-uri analitice care vă ajută să detectaţi şi să validaţi relaţii
importante şi diferenţe semnificative pe baza datelor prezentate de vizualizare.
Insight-urile sunt disponibile făcând clic pe pictograma Insight-uri din vizualizările eligibile. Când
activaţi insight-urile, apare sumarul în caseta Insight-uri, sunt evidenţiate elementele de vizualizare
înrudite şi sunt furnizate detalii în mesajul tooltip corespondent. Puteţi să controlaţi fiecare insight
disponibil în mod separat.
Procedură
Capitolul 3. Visualizations 43
• Cele mai frecvente Afişează valorile care sunt raportate cel mai frecvent.
pictogramă verde cu un număr fie pe axa x, fie pe axa y. Numărul indică insight-urile corelate
disponibile.
Pentru a accesa vizualizările corelate, finalizaţi următorii paşi:
Procedură
Procedură
1. Din panoul Carduri, selectaţi cardul care reprezintă vizualizarea pe care vreţi să o deschideţi.
Procedură
1. Din panoul Carduri, selectaţi cardul care reprezintă vizualizarea pe care vreţi să o deschideţi.
Previzionarea
Utilizaţi previzionarea în IBM Cognos Analytics pentru a descoperi şi modela tendinţa, sezonalitatea şi
dependenţa de timp a datelor.
Puteţi realiza o previziune în IBM Cognos Analytics folosind unelte automate, care modelează datele
dependente de timp. Automatizarea selecţiei şi ajustării modelelor simplifică utilizarea previzionării, chiar
dacă nu sunteţi familiarizat cu modelarea seriilor temporale.
Previziunile şi limitele de încredere sunt afişate în vizualizări ca o continuare a datelor istorice. De
asemenea, puteţi să vizualizaţi detaliile statistice pentru modelele generate, dacă vreţi să vedeţi fundalul
tehnic.
Specificarea seriilor temporale în previziuni necesită adesea manipularea datelor. Cognos Analytics are
inclus suport pentru o gamă largă de serii temporale fără necesitatea manipulării, care variază de la
tipurile de dată calendaristică şi de oră standard la câmpuri de oră periodice şi ciclice imbricate. Când
datele sunt organizate ca serii temporale, pregătirea datelor este automatizată. Sunt detectate tendinţele
şi perioadele sezoniere corespunzătoare şi sunt selectate modelele dintr-un set de nouă tipuri de model
diferite.
Puteţi realiza previziunea în vizualizările linie, bară şi coloană. Previzionarea permite analiza a sute de
serii temporale per vizualizare. Sunt calculate previziunile şi limitele de încredere pentru fiecare serie
temporală şi acestea sunt afişate în vizualizare ca extensii ale datelor curente. Puteţi să inspectaţi fiecare
serie temporală separat şi să adaptaţi previziunea şi rezultatele la datele şi cerinţele dumneavoastră.
Dacă sunteţi familiarizat cu modelele de previzionare, puteţi să vizualizaţi informaţii privind tipul de model
selectat, parametrii de model estimaţi, măsurile de acurateţe standard şi sumarul procesării.
Caracteristici de previzionare
Previzionarea furnizează modelarea datelor seriilor temporale şi previziuni bazate pe datele din
vizualizări.
Pentru a folosi previzionarea, vizualizarea trebuie să fie de tip linie, bară sau coloană, datele trebuie să fie
suportate pentru previzionare şi trebuie să fie activată previzionarea. Când este activată previzionarea,
este disponibilă o casetă de dialog Previziune în colţul din dreapta sus al unei vizualizări, unde puteţi
modifica setările de model şi de previziune, precum şi limitele de încredere. Sunt estimate modelele de
serii temporale corespunzătoare pentru vizualizare şi sunt afişate previziunile în vizualizare. De
asemenea, puteţi să vedeţi specificaţia de model de serii temporale şi sumarul procesării datelor în tava
de date.
În următorul exemplu, sunt afişate valorile de previzionare şi limitele de încredere într-o vizualizare.
Capitolul 4. Forecasting 47
Nivel de încredere
Certitudinea că valoarea reală este de aşteptat să fie în intervalul dat. Puteţi vedea intervalul de
încredere într-un tooltip atunci când plasaţi cursorul mouse-ului pe una dintre valorile previziunii.
Intervalul de încredere este indicat prin afişarea limitei superioare şi a limitei inferioare.
Puteţi selecta trei niveluri de încredere diferite: 90%, 95% şi 99%. Valoarea implicită este 95%, iar
limita inferioară şi cea superioară definesc plaja pentru care puteţi avea o încredere de 95% că
valoarea reală aparţine intervalului respectiv.
Perioadă sezonieră
Sezonalitatea cu care construiţi modelul. Sezonalitatea apare atunci când o serie temporală are o
variaţie ciclică predictibilă. De exemplu, în timpul perioadei de vacanţă din fiecare an.
Valoarea implicită este Automat. Cu valoarea Automat, se detectează automat sezonalitatea prin
construirea mai multor modele cu perioade sezoniere diferite şi alegerea celui mai bun dintre acestea.
Puteţi specifica sezonalitatea prin introducerea unui întreg care nu este negativ, cum ar fi 0, 1, 2, 3, ca
perioadă sezonieră.
Pentru a specifica un model nesezonier, setaţi Perioadă sezonieră la 0 sau 1. Un model cu
sezonalitatea specificată de utilizator este afişat numai dacă modelul sezonier este mai precis decât
toate modelele nesezoniere.
Insight-uri
Când vizualizările au activate şi disponibile atât insight-urile, cât şi previziunile, apare caseta de dialog
Insight-uri dialog în dreptul casetei de dialog Previziuni. Fiecare caracteristică furnizează un set
independent de rezultate analitice. Pentru informaţii suplimentare, consultaţi “Insight-urile în vizualizări”
la pagina 65.
Următoarea imagine prezintă o previziune pe vizualizări linie şi bară cu intervale de bară activate.
Insight-urile şi previzionarea
Insight-urile din vizualizări furnizează insight-uri analitice care pot ajuta utilizatorii să detecteze şi să
valideze orice relaţii importante şi diferenţe semnificative, pe baza datelor prezentate de vizualizare.
Insight-urile funcţionează împreună cu previzionarea în vizualizările suportate. Insight-urile furnizează un
set separat de rezultate analitice, iar rezultatele sunt numai pentru valorile istorice. Pentru informaţii
suplimentare, consultaţi “Insight-urile în vizualizări” la pagina 65.
Previzionarea datelor
Datele care sunt potrivite pentru previzionare au valori de măsură care corespund unor puncte de timp
plasate la o distanţă regulată. Specificaţi timpul şi măsurile în vizualizări prin tragerea câmpurilor de timp
şi câmpurilor de măsuri în sloturile vizualizării. Opţional, puteţi de asemenea să specificaţi câmpuri de
grup care divizează valorile de măsură după categorii.
Tabelul următor este un sumar al tipurilor de câmp şi sloturilor de vizualizare potrivite care sunt suportate
în previzionare:
Capitolul 4. Forecasting 49
Slot Câmpuri de timp Câmpuri de măsură Câmpuri de grup
(necesare) (necesare) (opţionale)
Slot diagramă coloană Bare Lungime Culoare
Nu sunt suportate ale vizualizări sau sloturi de vizualizare, cu excepţia slotului Filtre locale.
Tip de date
Un câmp este recunoscut ca un câmp timp dacă are unul dintre următoarele tipuri de date: Dată, Timp
sau Amprentă de timp Timestamp. Tipul de date este moştenit de la sursa de date şi nu poate fi modificat.
Tipurile de date Dată, Oră şi Amprentă de timp sunt proiectate pentru a suporta întreaga gamă de formate
de dată şi oră care sunt acoperite de formatele ISO 8601 de bază şi extinse. Următorul tabel prezintă
tipurile de date suportate, împreună cu un exemplu de format şi un exemplu de date pentru fiecare.
Reprezintă timp
Un câmp este recunoscut ca un câmp timp dacă proprietatea de date Reprezintă este setată la Timp. Şi
câmpurile de tip Text şi Întreg care conţin date de timp sunt recunoscute ca fiind câmpuri de timp.
Câmpurile de timp sunt definite automat în timpul importului sau îmbogăţirii datelor. Definiţiile posibile
sunt Dată, An, Trimestru, Anotimp, Lună, Săptămână, Zi, Oră, Minut sau Secundă.
Dacă câmpurile de timp nu sunt recunoscute automat, puteţi să le specificaţi ca fiind câmpuri de timp.
Asiguraţi-vă că valorile de câmp sunt într-unul dintre formatele suportate, altfel aţi putea primi o eroare
Format de date nesuportat.
Câmpurile imbricate din slot trebuie să fie în ordinea ierarhiei temporale. De exemplu, câmpul Săptămână
trebuie să fie plasat deasupra câmpului Zi.
Câmpurile imbricate nu pot sări niveluri din ierarhia temporală care ar avea ca rezultat ambiguitatea.
Tabelul următor prezintă ierarhiile acceptabile.
Dacă An este absent în ierarhia de timp, atunci sistemul are anul curent ca implicit. Acest lucru poate
cauza probleme din cauza diferenţelor dintre anii bisecţi şi anii non-bisecţi. Luaţi în considerare furnizarea
anului în astfel de instanţe.
Câmpurile de măsură
Unul sau mai multe câmpuri de orice tip pot fi specificate ca fiind câmpuri de măsură pentru analiza
previzionării, prin adăugarea lor într-un slot de vizualizare corespondent. Fiecare câmp de măsură este
analizat separat. De asemenea, pot fi specificate mai multe serii temporale prin adăugarea unui câmp în
slotul Culoare, divizând valorile de măsură după categoriile câmpului specificat.
Toate valorile câmpului de măsură care corespund aceluiaşi punct de timp sunt sumarizate utilizând unul
dintre următoarele niveluri de sumarizare: Sumă, Minimum, Maximum, Medie, Număr şi Număr
distincte. Câmpul trebuie să fie numeric pentru a suporta sumarizarea Sumă, Minimum, Maximum sau
Medie. Toate tipurile de date şi nivelurile de sumarizare posibile sunt suportate pentru previzionare. Însă
trebuie să ţineţi cont de următoarele puncte:
• Un număr mic de valori de măsură diferite poate avea ca rezultat previziuni neaşteptate sau lipsite de
valoare informativă. De exemplu, atunci când este utilizat sumarul Număr distincte.
• În cazul în care numărul valorilor de măsurare este zero, rezultatele pot fi influenţate nejustificat, în
special atunci când ele reprezintă măsuri lipsă.
Capitolul 4. Forecasting 51
valoarea interpolată care va înlocui valoarea lipsă este (6 + 12) / 2, adică 9. Algoritmul de interpolare
poate trata şi valori lipsă contigue.
Punctele de date cu valori lipsă la primele şi ultimele puncte de timp istorice sunt excluse din serie înainte
de a construi un model. Valorile lipsă la ultimele puncte de timp istorice sunt de asemenea previzionate.
Informaţiile Model specifică tipul de Tendinţă şi Sezonalitate selectat pentru estimarea datelor seriei
temporale în cazul unui succes. Tabelul următor prezintă diferitele tipuri disponibile.
N A M
NONE ADDITIVE MULTIPLICATIVE
ADDITIVE
Măsurile de acurateţe
Măsurile de acurateţe ale modelului Eroarea medie absolută (Mean Absolute Error - MAE), Eroarea medie
absolută scalată (Mean Absolute Scaled Error - MASE), Procentul de acurateţe, Rădăcina pătrată a erorii
medii pătratice (Root Mean Squared Error - RMSE), Eroarea medie absolută procentuală (Mean Absolute
Percent Error - MAPE) şi Criteriul informaţional Akaike (Akaike Information Criterion - AIC), sunt bazate pe
datele seriei temporale utilizate pentru a genera modelul. Toate măsurile de acurateţe sunt bazate pe
datele din istoric. Măsurile de acurateţe pot fi utilizate şi ca un indicator al preciziei previziunii, dar ele nu
se reportează la valorile viitoare.
Eroarea medie absolută (Mean Absolute Error - MAE)
Este calculată ca diferenţa medie absolută între valorile ajustate de model (un pas înainte în
previziunea in-sample) şi datele de istoric observate.
Eroarea medie absolută scalată (Mean Absolute Scaled Error - MASE)
Măsura erorii este utilizată pentru acurateţea modelului. Se obţine împărţind MAE la valoarea MAE a
modelului naiv. Modelul naiv este un model care prognozează valoarea la punctul de timp t ca fiind
valoarea din istoric anterioară. Această eroare vă permite să evaluaţi cât de bun este modelul
comparativ cu modelul naiv. Dacă valoarea MASE este mai mare decât 1, modelul este mai rău decât
modelul naiv. Cu cât scade valoarea MASE, cu atât este mai bun modelul comparativ cu modelul naiv.
Procentul de acurateţe (% acurateţe)
Indicatorul primar al acurateţei modelului, bazat pe valorile ajustate. Este specificat ca procentul de
reducere a erorii medii absolute relativ la modelul naiv. Se calculează scăzând MASE din 1 şi
exprimând valoarea obţinută ca procentaj. Dacă valoarea MASE este mai mare sau egală cu 1,
acurateţea este setată la 0%, deoarece modelul nu aduce o îmbunătăţire faţă de modelul naiv. O
acurateţe mai mare indică o eroare de model mai mică relativ la modelul naiv.
Eroarea medie pătratică (Mean Squared Error - MSE)
Suma pătratului diferenţei dintre valorile ajustate de model şi valorile observate, împărţite la numărul
de puncte de istoric, minus numărul de parametri din model. Numărul parametrilor din model este
scăzut din numărul punctelor de istoric pentru coerenţa cu o estimare de model nepărtinitor.
Rădăcina pătrată a erorii medii pătratice (Root Mean Squared Error - RMSE)
Rădăcina pătrată a valorii MSE. Este pe aceeaşi scală cu valorile de date observate.
Eroarea medie absolută procentuală (Mean Absolute Percent Error - MAPE)
Diferenţa medie procentuală absolută dintre valorile ajustate de model şi valorile de date observate.
Criteriul informaţional Akaike (Akaike Information Criterion - AIC)
O măsură pentru selecţia modelului. Valoarea AIC penalizează modelele cu mulţi parametri, prin
aceasta încercându-se favorizarea modelelor mai simple la alegerea celui mai bun model. AIC este
suma logaritmului valorii MSE neajustate înmulţite cu numărul de puncte istorice şi numărul de
parametri de model şi stări de netezire iniţiale înmulţit cu 2.
Parametri
Sunt disponibile perioada sezonieră detectată şi estimările pentru alţi parametri care sunt folosiţi în
modelul de netezire exponenţială selectat.
Perioadă sezonieră
Numărul paşilor de timp utilizaţi într-o perioadă sezonieră în modelul de netezire exponenţială.
Alfa
Factorul de netezire pentru stările de nivel în modelul de netezire exponenţială. Valorile mai mici ale
parametrului alfa determină creşterea gradului de netezire, cu alte cuvinte, atunci când valoarea alfa
este mică este luată în considerare o parte mai mare a istoricului. Dacă valorile alfa sunt mai mari, se
Capitolul 4. Forecasting 53
reduce gradul de netezire, ceea ce înseamnă că se atribuie o pondere mai mare observaţiilor mai
recente. Când valoarea alfa este 1, observaţiei curente îi este alocată întreaga pondere.
Beta
Factorul de netezire pentru stările de tendinţă în modelul de netezire exponenţială. Acest parametru
are un comportament similar cu al parametrului alfa, deosebirea fiind că este destinat stărilor de
tendinţă, nu stărilor de nivel.
Gama
Factorul de netezire pentru stările de sezonalitate în modelul de netezire exponenţială. Are acelaşi rol
ca alfa, numai că este destinat componentei de sezonalitate a modelului.
Fi
Coeficientul de atenuare din modelul de netezire exponenţială. Previziunile lungi pot conduce la
rezultate nerealiste, astfel că este utilă existenţa unui factor de atenuare, pentru a atenua tendinţa
de-a lungul timpului şi a produce previziuni mai moderate.
Diagnostice
Informaţiile includ Număr lipsă, Lungime serie, Perioade ignorate, Putere tendinţă, Putere sezonalitate şi
Interval de date/ore.
Număr lipsă
Indică numărul de rânduri de date în care fie lipsesc valori, fie lipsesc puncte de timp şi sunt
poziţionate între prima şi ultima valoare validă din serie. Nu sunt incluse punctele de timp invalide, şi
nici punctele cu valori lipsă la primul şi ultimul dintre punctele de timp istorice.
Lungime serie
Indică numărul de puncte de date utilizate pentru modelarea seriei temporale. Sunt incluse numai
punctele dintre prima şi ultima valoare validă din validă din serie.
Perioade ignorate
Un întreg, m, care determină ignorarea ultimelor m puncte de date ale seriei atunci când este
construit modelul de netezire exponenţială şi sunt calculate previziunile. Vor fi previzionate şi valorile
lipsă de la sfârşitul unei porţiuni neignorate a seriei. Valoarea implicită pentru acest parametru este 0,
ceea ce înseamnă că sunt utilizate toate datele din istoric pentru generarea modelului atunci când nu
lipsesc valori. Pot fi ignorate maximum 100 de puncte. Perioade ignorate exclud punctele de date
atunci când este construit un model, astfel că previzionarea poate eşua din cauza unor factori cum ar
fi cerinţele privind lungimea de date minimă şi proporţia valorilor lipsă ce depăşeşte 33%.
Putere tendinţă
Comparaţi modelul original, M, cu acelaşi model, dar cu componenta de tendinţă înlăturată. Puterea
tendinţei pentru M diferă ca acurateţe la modelul M şi modelul M cu componenta de tendinţă
înlăturată.
Putere sezonalitate
Comparaţi modelul original , M , cu acelaşi model având componenta de sezonalitate înlăturată.
Puterea sezonalităţii pentru M diferă ca acurateţe la modelul M şi modelul M cu componenta de
sezonalitate înlăturată.
Interval de date/ore
Intervalul de date/ore reprezintă intervalul de timp detectat al datelor sortate cronologic. Intervalul
de timp este identificat ca fiind cea mai mică diferenţă între punctele învecinate din datele sortate în
ordine cronologică.
Modelele de previzionare
Modelele de netezire exponenţială sunt clase utilizate pe larg ale modelelor de serii temporale.
Modelele de netezire exponenţială sunt aplicabile pentru un singur set de valori, care sunt înregistrate
numai pe incremente de timp egale. Însă ele suportă proprietăţi de date găsite frecvent în aplicaţiile de
afaceri, cum ar fi tendinţa, sezonalitatea şi dependenţa de timp. Toate caracteristicile de model
specificate sunt estimate pe baza datelor observate disponibile. Un model estimat poate fi utilizat apoi
pentru a previziona valorile viitoare şi a furniza limitele de încredere superioare şi inferioare pentru
valorile previziunii.
Ecuaţiile de netezire
Numele modelelor de netezire exponenţială derivă din ecuaţiile de netezire care specifică modelul.
Acestea furnizează formule pentru calcularea stărilor de netezire pentru fiecare punct observat, utilizând
valoarea observată curentă şi stările de netezire anterioare. Ecuaţiile de netezire furnizează mediile
ponderate ale valorii curente şi stărilor anterioare din seriile temporale. Ponderea pentru stare sau
valoarea curentă este dată de un parametru de model între 0 şi 1, iar ponderile pentru valorile anterioare
descresc exponenţial.
Capitolul 4. Forecasting 55
Parametrii de model
Fiecare ecuaţie de netezire utilizează parametri de model corespondenţi:
alfa
Controlează stările de nivel.
beta
Controlează stările de tendinţă.
gama
Controlează indicii sezonieri de-a lungul perioadelor sezoniere.
fi
Un parametru suplimentar care este utilizat pentru specificarea tendinţei atenuate.
Toţi aceşti patru parametri au valori între 0 şi 1. Valorile mai mari ale parametrilor alfa, beta şi gama
înseamnă că observaţiile mai recente au pondere mai mare, în timp ce valorile mai mici înseamnă că
observaţiile mai vechi au ponderi mai mari. O valoare mai mare a parametrului fi corespunde unui grad
mai mare de atenuare pentru tendinţa previziunii.
Estimarea modelului
Parametrii de model din ecuaţiile de netezire sunt estimate pe baza datelor seriei temporale. Parametrii
nu pot fi estimaţi direct prin utilizarea unei formule. Ei sunt estimaţi prin utilizarea unui proces iterativ,
care caută valorile de parametri ce minimizează eroarea de model. Eroarea de model este calculată ca
eroare medie absolută scalată. Iteraţiile se opresc atunci când nu se mai poate obţine o reducere
suplimentară a erorii de model. Valorile de parametru corespondente, împreună cu stările de netezire
iniţiale, specifică complet modelul estimat. Acestea sunt utilizate pentru la calcularea stărilor de model
pentru toate celelalte puncte de date şi generarea previziunilor de model prin utilizarea unei ecuaţii de
previziune corespondente.
Algoritmii previzionării
Există mai mulţi algoritmi care sunt utilizaţi pentru previzionare.
Un pas înainte
Fiecare model suportă previziuni de tip un pas înainte bazate pe ecuaţia de previziune corespunzătoare.
Previziunile un pas înainte sunt necesare pentru a calcula erorile de model în timpul procesului de
estimare a modelului.
Previziunile un pas înainte sunt calculate secvenţial pentru fiecare punct de date utilizând nivelul calculat
şi stările de tendinţă pentru punctul curent, şi stările sezoniere pentru ultima perioadă sezonieră.
Eroarea de previziune este calculată prin scăderea valorii previziunii la punctul anterior din valoare
observată la punctul curent. Eroarea de model generală, care este utilizată pentru estimarea modelului,
este calculată ca fiind valoarea medie a erorilor de previziune absolute. Erorile mai mici corespund unui
model ajustat mai bine. Măsurile de acurateţe afişate Detalii statistice previziune furnizează mai multe
sumare ale modelului cu erori ale previziuni un pas înainte.
K paşi înainte
Previziunile k paşi înainte sunt utilizate pentru a face predicţii pentru orice număr de valori viitoare, după
datele seriei temporale observate. Acestea sunt bazate pe aceleaşi ecuaţii de previziune ca în cazul
previziunilor Un pas înainte pentru modelul specificat.
Implicit, numărul valorilor previziunii generate reprezintă 20% din lungimea seriei de date istorice. Puteţi
specifica un număr exact de valori pentru previzionare, în caseta de dialog Previziune. Vor fi previzionate
şi valorile lipsă de la sfârşitul unei serii particulare, dar acestea nu vor conta pentru numărul specificat de
perioade de previziune.
Capitolul 4. Forecasting 57
58 IBM Cognos Analytics Versiunea 11.1.0 : Ghidul utilizatorului pentru explorări
Capitolul 5. Principles of advanced data analytics
De încredere
Datele de afacere sunt mult mai complicate decât exemplele din cărţi, utilizate la cursurile de statistică
sau în modelele de căutare pe web. Cognos Analytics utilizează algoritmi care sunt robuşti şi acoperă o
paletă diversă de date neobişnuite. S-a ales această soluţie pentru Cognos Analytics deoarece, chiar dacă
există algoritmi nai fragili care furnizează rezultate un pic mai bune decât algoritmii robuşti, aceştia
necesită să vă asiguraţi că sunt aplicabili şi că aţi construit transformări de date corecte pentru ca
rezultatele să fie semnificative. Chiar dacă acurateţea suferă o diminuare minoră, este de preferat un
algoritm sigur, care nu furnizează rezultate eronate atunci când datele nu sunt cele aşteptate.
Inteligenţă
Aproape toţi algoritmii necesită luarea unor decizii: nivelurile de încredere, ce combinaţii de câmpuri să
fie explorate, transformările de date. Detaliile privind aceste decizii pot fi găsite în descrieri.
Cognos Analytics alege automat valorile corespunzătoare, prin examinarea proprietăţilor datelor. Ca
utilizator, este posibil să nu observaţi toate deciziile care sunt luate.
Sumar
Concepţia algoritmilor numerici şi procedurilor din Cognos Analytics are la bază necesitatea de a produce
automat rezultate de încredere. Pentru a obţine cele mai bune predicţii, clasificări sau analize posibile, un
statistician profesionist analizează datele utilizând IBM SPSS Statistics sau IBM SPSS Modeler. Cognos
Analytics are ca scop furnizarea unor insight-uri de calitate, care să vă ajute să înţelegeţi datele şi relaţiile
dintre ele, şi să facă acest lucru în mod automat, pentru o mare varietate de tipuri de date. Cognos
Analytics urmăreşte furnizarea unor rezultate similare cu cele ale unui statistician expert, dar fără a crea
dificultăţi utilizatorului profesional.
Pregătirea datelor
Pregătirea datelor este o etapă de pre-analiză, utilizată de majoritatea algoritmilor de analiză a datelor,
pentru a se asigura că datele sunt potrivite pentru utilizarea instrumentelor analitice.
Algoritmi
Toţi algoritmii aplicaţi se bazează pe valorile unui singur câmp la un moment dat. Valorile lipsă sunt
înlăturate sau tratate pentru fiecare câmp şi pentru toate câmpurile de driver predictor se face binning.
Toate câmpurile categoriale sunt ajustate pentru număr mare de categorii şi punctele aberante tratate în
câmpurile ţintă. Pregătirea tuturor datelor influenţează rezultatele analizei, dar sumarele privind
pregătirea datelor corespondente nu vă sunt raportate.
Detalii
Pregătirea datelor şi driver-ele cheie ulterioare, arborii de decizie şi relaţiile sunt bazate pe un eşantion de
date de aproximativ 10.000 de rânduri, în timp ce datele originala sunt mai voluminoase. Se aplică
eşantionarea Bernoulli aleatorie, eşantionare aleatorie cu probabilitate egală fără înlocuire, pentru datele
încărcate şi orice surse de date conectate care susţin eşantionare aleatorie. Altfel, este utilizată
eşantionarea sistematică.
Privire generală
Deoarece datele numerice pot fi variate în distribuţia lor, IBM Cognos Analytics transformă câmpurile
numerice non-ţintă în bin-uri ordinale, reducând dependenţa de algoritmii analitici în ceea ce priveşte
formatul datelor numerice.
Algoritmi
Algoritmul de bază folosit este binning-ul de frecvenţă. Datele numerice sunt divizate într-un număr fix de
bin-uri şi se încearcă punerea unui număr egal de rânduri de date în fiecare bin. Valorile lipsă sunt plasate
în propriul bin. Cognos Analytics încearcă să utilizeze cunoştinţele despre valorile lipsă în câmpurile
predictor, pentru a construi un model mai bun. De exemplu, atunci când un câmp de date arată dacă a
fost testat un articol, Cognos Analytics utilizează valorile lipsă (care indică faptul că articolul nu a fost
testat niciodată) pentru a ajuta la predicţia valorilor din alte câmpuri.
Detalii
Pentru câmpurile numerice, sunt aplicate anumite criterii privind excluderea câmpului. Un câmp numeric
este exclus din analiză dacă are o singură valoare, incluzând şi valorile lipsă. Altfel, se aplică binning-ul
pentru câmpul numeric, iar numărul implicit de bin-uri este 5. Dacă un câmp nu are mai mult de 10 valori
numerice unice, nu se încearcă aplicarea binning-ului şi fiecărei valori unice i se acordă propria sa
categorie. Dacă apare zero în peste 40% din rânduri, i se acordă întotdeauna o categorie separată.
Valorile lipsă sunt plasate în propriul bin şi nu afectează procedura de binning.
Privire generală
Principala informaţie care este extrasă din câmpurile categoriale este frecvenţa observată pentru fiecare
categorie unică. Pentru câmpurile categoriale sunt aplicate metode analitice corespunzătoare, dar
Algoritmi
Algoritmul de bază folosit este combinarea categoriilor. Categoriile sunt sortate după frecvenţa lor, în
ordine descrescătoare, iar categoriile care depăşesc numărul implicit sunt combinate într-o singură
categorie. Valorile lipsă sunt tratate ca o singură categorie, separată. Cu alte cuvinte, IBM Cognos
Analytics utilizează valorile lipsă într-un mod similar cu cel pentru câmpuri numerice. Câmpurile
categoriale sunt tratate ca nominale. Ordinea intrinsecă nu este asumată între categorii.
Detalii
Pentru câmpurile categoriale, sunt aplicate anumite criterii privind excluderea câmpului. Un câmp
categorial este exclus din analiză dacă are o singură valoare sau dacă numărul de categorii unice,
necombinate, depăşeşte 50% din numărul rândurilor de date valide.
Altfel, câmpul categorial este combinat, numărul implicit al categoriilor necombinate fiind 49. Restul
categoriilor sunt combinate într-o singură categorie suplimentară. De asemenea, sunt combinate toate
categoriile cu un număr de rânduri mai mic decât 3. Un câmp categorial este de asemenea exclus dacă
procentul de rânduri de date valide care corespunzător categoriei combinate depăşeşte 25%.
Valorile lipsă sunt tratate ca o categorie separată şi sunt considerate ca atare în pasul de combinare.
Privire generală
Întotdeauna specificaţi câmpul ţintă şi cel puţin un câmp suplimentar. Modelele sunt instruite utilizând
valorile ţintă furnizate şi sunt folosite pentru a detecta relaţii predictive şi, în cele din urmă, pentru a
prognoza valorile ţintă pe baza valorilor câmpului de intrare. Pregătirea datelor pentru câmpul ţintă diferă
de pregătirea datelor pentru restul câmpurilor. Valorile lipsă din ţintă nu sunt utilizate pentru construirea
modelelor, dar celelalte informaţii sunt păstrate şi uneori ajustate pentru a obţine modele nepărtinitoare.
Algoritmi
Principalul pas al pregătirii datelor pentru câmpurile ţintă este înlăturarea tuturor rândurilor de date cu
valori ţintă lipsă. Acest pas este realizat înaintea oricărui alt pas ce ţine de pregătirea datelor. Acest pas
asigură faptul că numai informaţiile de încredere sunt utilizate pentru construirea modelului, dar numărul
rândurilor înlăturate poate fi substanţial. Într-o astfel de situaţie, modelul rezultat poate avea un scop
limitat. Nu se face binning pentru câmpurile ţintă numerice, dar punctele aberante extreme sunt
manipulate pentru a nu afecta modelele create ulterior. Câmpurile ţintă categoriale sunt tratate foarte
asemănător cu alte câmpuri categoriale. Singura diferenţă este că valorile lipsă au fost înlăturate pentru
ţintele categoriale.
Detalii
Punctele aberante extreme sunt detectate pe baza graniţei inferioare şi a celei superioare. Graniţa
superioară este construită utilizând o centilă superioară, astfel ca numai 2,5% din valorile ţintă să fie
găsite că au o valoare mai mare. Diferenţa între centila superioară şi mediană este înmulţită cu 2,5 şi
adăugată la mediană pentru a obţine graniţa superioară. Aplicând paşi similari, este obţinută graniţa
inferioară. Valorile ţintă găsite dincolo de graniţele calculate sunt înlocuite cu valori de graniţă
corespondente în toate analizele următoare.
Algoritmi
Analiza pentru fiecare driver unifactorial este bazată pe un model statistic ce include ţinta şi un predictor
categorial singular. Acest model este aplicat după pasul de pregătire a datelor pentru câmpul ţintă şi
toate câmpurile predictor potenţiale. De exemplu, se aplică binning-ul pentru toate câmpurile predictor
numerice în pasul de pregătire a datelor şi acestea sunt tratate ca fiind categoriale în analiză. Se aplică
analiza ANOVA unifactorială pentru ţinte numerice şi testul hi pătrat de independenţă pentru ţinte
categoriale cu ajustare hi pătrat pentru date rarefiate.
Pentru fiecare câmp din lista de driver-e potenţiale, este realizat un test de ipoteză privind posibilitatea ca
respectivul câmp să aibă un impact semnificativ asupra ţintei. Numai câmpurile care trec acest test şi au
o putere de predicţie suficient de mare sunt selectate ca posibile driver-e cheie unifactoriale.
Detalii
În unele cazuri, o analiză preliminară bazată pe aptitudini inteligente poate reduce numărul driver-elor
potenţiale. Scopul este de a înlătura câmpuri irelevante sau redundante. Lista driver-elor utilizate este
disponibilă în UI şi puteţi adăuga pentru analiză orice driver-e care iniţial au fost excluse. Primele 20 de
driver-e rezultate, cu puterea de predicţie mai mare de 10%, sunt disponibile pentru afişare.
Sunt aplicate unele restricţii privind mărimea volumului de date, pentru a îmbunătăţi performanţa şi
viteza. În cazul în care datele conţin mai mult de 250 de câmpuri, câmpurile cel mai puţin relevante sunt
excluse înaintea analizei driver-elor. Puteţi adăuga înapoi în analiză câmpurile excluse, folosind interfaţa
de utilizator (UI), aşa cum este descris mai sus. Dacă datele specificate conţin mai mult de 10.000 de
rânduri, ar putea fi eşantionate în jos la aproximativ 10.000 de rânduri pentru scopurile analizei driver-
elor. În astfel de cazuri este afişat un avertisment: Pentru a îmbunătăţi performanţa, din cauza numărului
de rânduri din sursa de date, analiza se bazează pe un eşantion reprezentativ din toaste datele. Este de
aşteptat ca rezultatele să le aproximeze destul de exact pe cele obţinute utilizând toate rândurile din
datele originale.
Privire generală
Dat fiind un câmp ţintă, IBM Cognos Analytics utilizează un model statistic pentru a analiza o pereche de
alte câmpuri de date şi şi îi estimează puterea pentru predicţia valorii ţintă. De obicei, căutarea diferitelor
perechi de predictori nu este exhaustivă şi, de asemenea, pot fi filtrate unele perechi cu clasificare înaltă
din rezultatele finale. Scopul este de a oferi o privire generală şi o varietate de perechi de predictori care
să îmbunătăţească puterea de predicţie a modelelor cu un singur predictor, care sunt afişate ca driver-e
unifactoriale. Ca urmare, insight-urile obţinute din driver-e unifactoriale sunt extinse şi utilizatorul obţine
informaţii relevante privind perechea de câmpuri din date. În diagrama analizei de driver-e şi diagrama
spirală sunt disponibile atât rezultatele analizei driver-elor unifactoriale, cât şi cele ale analizei driver-elor
bifactoriale. Acestea pot fi vizualizate separat, selectând opţiunea de vizualizare pentru diagrama
corespunzătoare. Fiecare driver afişat, unifactorial sau bifactorial, poate fi extins într-o vizualizare nouă,
direct din vizualizarea Analiză driver-e din Explorare.
Detalii
Restricţia driver-elor unifactoriale privind selecţia câmpurilor de date şi a rândurilor de date se aplică şi în
cazul driver-elor bifactoriale. Acest lucru este de aşteptat, deoarece câmpurile predictor potenţiale
pentru driver-e bifactoriale sunt selectate din driver-ele unifactoriale care se clasifică pe primele poziţii ca
putere de predicţie. Însă semnificaţia modelului driver-ului unifactorial şi puterea de predicţie minimă nu
sunt condiţii necesare pentru introducerea lor în modelul bifactorial. Un driver bifactorial rezultat trebuie
să aibă puterea de predicţie mai mare de 10% şi să asigure o îmbunătăţire relativă de peste 10% faţă de
puterea de predicţie a celor două driver-e unifactoriale conţinute. Îmbunătăţirea relativă este calculată ca
un procentaj al diferenţei între 100% şi puterea de predicţie a driver-ului unifactorial imbricat. Driver-ele
bifactoriale rezultate care satisfac aceste criterii sunt clasificate în funcţie de puterea lor de predicţie şi
primele 20 devin disponibile pentru afişare.
Arborele de decizie
Arborii de decizie sunt modele mai complexe decât driver-ele unifactoriale şi bifactoriale. Ei extind
secvenţa ca modele de combinaţie. Principala diferenţă este că arborii de decizie permit descoperirea
interacţiunii între mai mulţi predictori şi, ca urmare, furnizarea unor insight-uri mai profunde decât în
cazul driver-elor.
Privire generală
Dat fiind câmpul ţintă, algoritmul caută toate celelalte câmpuri de date şi le adaugă la model pentru a-i
îmbunătăţi puterea de predicţie privind valorile ţintă. Căutarea diferiţilor predictori este iterativă; în urma
căutării, este adăugat un predictor şi apoi căutarea continuă, pentru a fi adăugat următorul predictor care
asigură cea mai bună îmbunătăţire a modelului. Scopul este de a găsi cel mai bun set de predictori şi
modalitatea optimă de a-i combina, astfel încât să poată fi calculat modelul optim. Insight-urile obţinute
din arborii de decizie sunt prezentate sub forma unor reguli de decizie, în care combinaţia predictorilor cu
valorile corespondente furnizează o predicţie singulară pentru valoarea ţintă. Regulile de decizie sunt
clasificate după putere, astfel încât să puteţi găsi uşor regulile care sunt cele mai relevante şi interesante.
Regulile de decizie generate de arborele de decizie sunt mutual exclusive. În acelaşi timp, regulile de
decizie alcătuiesc un set de reguli complet, astfel că există o regulă corespondentă pentru fiecare
combinaţie de valori de predictor din date. De asemenea, este disponibilă puterea de predicţie totală a
arborelui de decizie, care asigură îmbunătăţirea relativă la modelul de bază. Rezultatele sunt disponibile
prin intermediul a trei vizualizări diferite: explozie solară, arbore şi reguli de decizie. Fiecare oferă anumite
avantaje în ceea ce priveşte afişarea arborelui de decizie şi a conţinutului regulilor de decizie
corespondente. De asemenea, în vizualizarea analizei driver-elor este disponibilă puterea de predicţie
totală a arborelui de decizie.
Algoritmi
Modelul arborelui de decizie este calculat după pregătirea datelor şi construirea tuturor driver-elor
unifactoriale. Primul predictor al arborelui este selectat ca driver-ul unifactorial de nivel superior.
Categoriile predictorului sunt combinate atunci când impactul negativ asupra puterii de predicţie este mai
mică decât un anumit prag. Următorul pas este găsirea celui mai bun predictor pentru divizarea fiecărui
Detalii
Funcţii de impuritate
Valorile funcţiilor de impuritate sunt utilizate ca principal criteriu pentru divizarea şi combinarea
nodurilor de arbore potenţiale. Totalul funcţiei de impuritate pentru arborii continui este suma
pătratelor per nod, în timp ce măsura de impuritate Gini este folosită pentru ţinte categoriale. Totalul
impurităţii Gini este calculat ca suma pătratelor rapoartelor numerelor tuturor categoriilor ţintă per
nod, care este scăzută din unu, iar rezultatul este înmulţit cu numărul de rânduri. Îmbunătăţirea
valorii funcţiei de impuritate este altă informaţie.
Când este divizat fiecare nod, IBM Cognos Analytics caută câmpul predictor cu cel mai mare câştig de
informaţii calculat ca impuritatea totală pentru toate nodurile copil potenţiale, scăzută din impuritatea
nodului părinte. Înainte ca Cognos Analytics să selecteze predictorul, Cognos Analytics încearcă să
combine unele dintre nodurile copil potenţiale care iniţial corespundeau fiecărei categorii de
predictor. Pierderea de informaţii este calculată prin scăderea impurităţii nodurilor necombinate din
impuritatea nodurilor combinate. Dacă pierderea de informaţii este mai mică decât un prag, nodurile
sunt combinate. Acest proces ajută la crearea unor arbori relativ mici, care sunt uşor de vizualizat şi
de înţeles, în timp ce este păstrată puterea totală a arborelui.
Regulile de oprire
Nodurile candidat sunt întotdeauna oprite dacă sunt bazate pe mai puţin de 25 de rânduri. Dacă toate
categoriile unui predictor sunt combinate, aceasta nu poate fi utilizat pentru divizarea unui anumit
nod. Când niciunul dintre predictori nu poate diviza un anumit nod, procesul se opreşte pentru nodul
respectiv. Procesul general de generare a arborelui se opreşte când niciunul dintre noduri nu poate fi
divizat sau când numărul nodurilor generate depăşeşte 36.
Importanţa variabilei
Importanţa variabilei corespunde unei reduceri relative a erorii arborelui când predictorul
corespondent este inclus în arbore. Este calculată prin compararea erorilor arborelui iniţial şi ale unui
arbore restricţionat, care este generat de restul predictorilor din arborele iniţial. Eroarea arborelui
iniţial este scăzută din eroarea arborelui restricţionat şi rezultatul este împărţit la eroarea arborelui
restricţionat. Variabilele cu importanţă zero sau negativă sunt înlăturate din arbore. Eroarea arborelui
este calculată ca suma pătratelor pentru ţintele continue şi ca eroarea de clasificare pentru ţintele
categoriale.
Putere predictivă
Puterea de predicţie pentru un arbore cu ţintă continuă este calculată similar ca la driver-ele cheie.
Conţinutul nodurilor frunză este luat în considerare. Este adăugată contribuţia la variaţie a fiecărui nod
frunză şi se împarte la variaţia totală pentru date. Aceasta este eroarea relativă a arborelui. Este
scăzută din unu pentru a obţine puterea de predicţie care este compatibilă cu măsura R pătrat care
este utilizată de driver-ele cheie.
Pentru ţintele categoriale, Cognos Analytics calculează acurateţea clasificării pe baza erorii de
clasificare care este adăugată de la toate nodurile frunză. Îmbunătăţirea relativă privind acurateţea
clasificării faţă de modelul de bază, numită şi R pătrat pentru număr ajustat, este raportată ca fiind
puterea de predicţie a arborelui. Este calculată scăzând eroarea arborelui din eroarea modelului de
bază şi împărţind rezultatul la eroarea modelului de bază. De exemplu, acurateţea clasificării
modelului de bază poate fi de 95%, dar dacă clasa majoritară apare în date pentru 90% din rânduri,
puterea de predicţie a arborelui este raportată ca fiind numai 50%. Aceasta este paralelă cu cazul
ţintei continue, în care modelul de bază este reprezentat prin valoare medie generală. Puterea de
Insight-urile în vizualizări
Insight-urile din vizualizări furnizează insight-uri analitice care pot ajuta utilizatorii să detecteze şi să
valideze orice relaţii importante şi diferenţe semnificative, pe baza datelor prezentate de vizualizare.
Privire generală
Insight-urile sunt controlate şi sumarizate de caseta Insight-uri, disponibilă în toate vizualizările eligibile.
Când activaţi insight-urile, apare sumarul în caseta Insight-uri şi sunt evidenţiate elementele de
vizualizare conexe. Detaliile sunt furnizate în mesajul tooltip corespondent. Puteţi să controlaţi fiecare
insight disponibil în mod separat.
Algoritmi
Tipul insight-urilor depinde de datele afişate de vizualizare. Tipurile de insight-uri disponibile sunt Medie,
Putere de predicţie, Diferenţe semnificative, Linie de ajustare şi Cele mai frecvente. Tipul Medie
furnizează media sumarelor afişate şi categoria cea mai frecventă sau categoria care apare cel mai des în
date. Celelalte insight-uri au la bază o analiză mai avansată şi teste statistice. Scopul este de a furniza
informaţii de încredere, pe care să le puteţi folosi pentru o descriere îmbunătăţită a datelor vizualizate şi
pentru descoperirea relaţiilor pe care vă aşteptaţi să le găsiţi în populaţia reprezentată de datele
respective.
Detalii
Analiza insight-urilor este întotdeauna bazată pe aceleaşi rânduri de date care sunt utilizate pentru a crea
sumarele afişate în vizualizare. Aceasta înseamnă că pentru insight-uri sunt utilizate toate datele, cu
excepţia cazului în care se aplică un filtru pentru datele originale.
Unele teste statistice şi analize utilizate în insight-uri necesită, pe lângă sumarele datelor afişate în
vizualizare, şi unele sumarizări suplimentare. De exemplu, testul diferenţelor semnificative pentru mai
multe categorii ale unui câmp explicativ necesită, pe lângă datele afişate, numere şi variaţii pentru fiecare
categorie. Aceste sumare suplimentare sunt obţinute dintr-o bază de date, împreună cu sumarele
necesare pentru vizualizare. Toate sumarele sunt procesate de insight-uri, dar numai sumarele necesare
sunt disponibile în vizualizare. Analiza insight-urilor este întotdeauna bazată pe aceleaşi rânduri de date
care sunt utilizate pentru a crea sumarele afişate în vizualizare.
Restricţii
Dacă insight-urile nu sunt disponibile imediat într-o vizualizare, motivul ar putea fi unul dintre
următoarele:
• Tipul de vizualizare propriu-zis nu suportă insight-uri.
• Datele din vizualizare ar putea să fi fost decupate.
• Combinaţia de nivel de sumarizare, tip de câmp şi rol de câmp pentru câmpul selectat nu se
potriveşte cu cerinţele oricăreia dintre insight-urile disponibile.
Roluri de câmp
IBM Cognos Analytics alocă un rol fiecăruia dintre sloturile câmpurilor dintr-o vizualizare suportată.
Un rol de câmp poate fi desemnat ca unul dintre următoarele în funcţie de slotul de vizualizare.
Ca un exemplu general, într-o vizualizare bară cu următoarele sloturi, mapările de rol ale vizualizării
sunt definite ca:
• Bare (axa y), explicativ
• Lungime (axa x), răspuns
• Culoare, grup
Privire generală
Utilizaţi astfel de vizualizări atunci când vă interesează compararea numărului de articole din diferite
categorii sau o combinaţie de categorii.
Algoritmi
IBM Cognos Analytics raportează numărul mediu pentru toate categoriile câmpului de răspuns specificat
şi aplică teste statistice pentru a detecta categoriile pentru care numerele sunt, din punct de vedere
statistic, cele mai diferite faţă de medie.
Vizualizările cu două sau trei câmpuri categoriale şi numere pentru fiecare combinaţie de categorii sunt
tratate diferit. Cognos Analytics nu numai că compară numerele pentru categorii, dar şi detectează orice
relaţie între câmpurile categoriale. Cognos Analytics tratează un câmp ca fiind câmp de răspuns şi pe
celelalte ca fiind câmpuri explicative.
Detalii
Câmp categorial singular
Primul test aplicat este testul hi pătrat al frecvenţelor egale, pentru a stabili dacă sunt disponibile
numere care sunt diferite semnificativ faţă de medie. Dacă rezultatul testului este semnificativ,
Cognos Analytics aplică testul hi pătrat de influenţă pentru fiecare categorie separat. Cognos
Analytics calculează mărimea efectului pentru categoriile la care testul de influenţă este semnificativ
din punct de vedere statistic şi raportează categoriile cu cea mai mare mărime a efectului în cadrul
diferenţelor semnificative.
Restricţii
Următorul tabel prezintă condiţiile care determină dacă insight-urile sunt sugerate pentru acest
algoritm.
Insight-uri în vizualizări pentru sumare după unul sau mai multe câmpuri explicative
Insight-urile pentru sumare sunt disponibile atunci când nivelul de sumarizare este medie, sumă,
minimum sau maximum pentru un câmp de răspuns continuu. Insight-urile sunt calculate şi afişate la
fiecare categorie a unui câmp explicativ categorial singular sau fiecare combinaţie de categorii a unei
perechi de câmpuri explicative categoriale din vizualizare.
Privire generală
Utilizaţi astfel de vizualizări atunci când vă interesează compararea valorilor unui câmp de răspuns din
diferite categorii sau din combinaţii de categorii ale câmpurilor categoriale.
Detalii
Medie după un singur câmp explicativ
Când nivelul de sumarizare pentru câmpul de răspuns este media şi este disponibil un singur câmp
explicativ categorial, Cognos Analytics aplică analiza ANOVA unifactorială. Cognos Analytics utilizează
statistica F pentru a testa dacă valorile medii ale categoriilor explicative sunt egale. Dacă există
diferenţe semnificative, Cognos Analytics calculează R pătrat ajustat ca putere de predicţie a relaţiei
dintre câmpul răspuns şi câmpul explicativ. Relaţia de încredere şi puterea sa de predicţie sunt
raportate utilizatorului dacă puterea de predicţie depăşeşte 10%.
Dacă diferenţa între medii este semnificativă, Cognos Analytics realizează un test t de influenţă pentru
a detecta categoriile care sunt cele mai diferite faţă de media generală. Aceasta implică calcularea
erorii standard pentru fiecare medie de categorie şi compararea mediei cu media generală utilizând
statistica testului t. Pentru categoriile cu diferenţe semnificative, Cognos Analytics calculează de
asemenea mărime efectului corespondent şi raportează categoriile cu cea mai mare mărime a
efectului în cadrul diferenţelor semnificative.
Restricţii
Următorul tabel prezintă condiţiile care determină dacă sunt sugerate insight-uri pentru acest
algoritm.
Privire generală
Utilizaţi vizualizările cum ar fi trasarea prin puncte a celor două câmpuri continue, posibil feliate după
categoriile câmpului de grup. Principalul scop este de a detecta orice relaţie între câmpurile continue şi
de a include şi câmpul de grup categorial. Rezultatele conţin puterea de predicţie a relaţiei descoperite,
descrierea relaţiei furnizate de liniile de ajustare şi orice puncte cu o discrepanţă mare faţă de liniile de
ajustare, ca diferenţe semnificative.
Algoritmi
IBM Cognos Analytics calculează mai multe modele de regresie care implică unul din câmpurile continue
ca răspuns şi celălalt câmp continuu ca şi câmp explicativ predictori. Câmpul grupului categorial opţional
este folosit ca un factor de model . În plus faţă de contribuţiile de model suplimentare corespunzătoarea
câmpului explicativ, Cognos Analytics ia în considerare pătratul câmpului explicativ şi orice termeni de
interacţiune care includ un factor. Dintr-un număr de posibile modele, este selectat un model de regresie,
care asigură ajustarea optimă pentru date. Linia de ajustare corespondentă este derivată din modelul
liniar sau pătratic. În cazul că a fost furnizat un câmp de grup categorial opţional, poate produce o linie
sau curbă pătratică diferită pentru fiecare categorie a factorului. Un factor cu până la trei categorii este
luat în considerare pentru a nu supraîncărca vizualizarea.
Fiecare punct dintr-o vizualizare reprezintă un număr de rânduri din date şi este definit de câmpul
Puncte. Numerele de rânduri corespondente care se bazează pe câmpul răspuns definesc ponderile de
frecvenţă care sunt folosite pentru construirea modelului de regresie. Ponderile de regresie sunt utilizate
independent de ponderea de frecvenţă când Cognos Analytics calculează modelele de regresie.
Detalii
Două câmpuri continue
Când Cognos Analytics aplică regresia liniară multiplă pentru două câmpuri continue, unul este ales ca
şi câmp răspuns şi celălalt ca explicativ în model. Cognos Analytics ia în considerare termenii de
model atât pentru modelul liniar, cât şi pentru cel pătratic. Dacă modelul pătratic este semnificativ pe
baza testului F şi îmbunătăţirea sa relativă a puterii de predicţie este mai mare de 10% faţă de
modelul liniar, Cognos Analytics raportează puterea sa de predicţie şi afişează curba pătratică, bazată
pe modelul calculat. Această curbă afişează valorile prognozate ale răspunsului pe baza valorilor
corespondente ale câmpului explicativ. Altfel, este luat în considerare modelul de predictor liniar.
Dacă este semnificativ şi puterea sa de predicţie este mai mare de 10%, Cognos Analytics raportează
puterea sa de predicţie şi afişează o linie ce reprezintă valorile prognozate ale răspunsului pe baza
valorilor corespondente ale câmpului explicativ. Dacă modelul liniar nu se califică, este raportată
media ca linie de ajustare şi nu este raportată nicio relaţie între cele două câmpuri continue.
De asemenea, când este detectată o relaţie liniară sau pătratică, Cognos Analytics inspectează
diferenţele între valorile prognozate şi observate ale răspunsului. Aceste diferenţe sunt numite
reziduuri şi Cognos Analytics realizează un test al reziduurilor studentizate pentru a detecta punctele
aberante. Punctele cu o abatere mare faţă de relaţiile descoperite sunt afişate sub diferenţele
semnificative în diagrama corespunzătoare.
Restricţii
Următorul tabel prezintă condiţiile care determină dacă sunt sugerate insight-uri pentru acest
algoritm.
Privire generală
Această caracteristică este disponibilă pentru vizualizările care sunt create într-o explorare, iar detaliile
text sunt afişate în panoul cu detalii corespunzător. Astfel, puteţi obţine informaţiile cele mai relevante
pentru datele vizualizate, într-un format ce utilizează limbajul natural. De asemenea, sunt afişate şi alte
sumare şi detalii, care nu sunt disponibile în vizualizare.
Detalii
Detaliile sunt bazate pe câmpuri afişate în vizualizarea corespunzătoare. Analiza asociată poate extrage
sumare suplimentare, dar nu include niciun câmp care nu este specificat în vizualizare. Sumarele şi
detaliile sunt convertite în text traductibil prin utilizarea unor şabloane, nu cu o facilitate completă de
generare a limbajului natural. Aceasta conduce la secvenţe de limbaj care se repetă în textul randat, dar
care nu diminuează cantitatea sau calitatea informaţiilor afişate.
Privire generală
Aceste informaţii vă asigură o vizualizare mai completă a datelor, fiind în acelaşi timp relevante pentru
sumarele afişate pe care le luaţi în considerare. Dacă modificaţi nivelul de sumarizare specificat pentru
câmpul de răspuns, se schimbă unele sau toate detaliile de bază, deoarece se modifică focalizarea
vizualizării. Sunt furnizate informaţii suplimentare în contextul taskului principal.
Algoritmi
Detaliile bază calculate depind de nivelul de sumarizare specificat pentru câmpul de răspuns din
vizualizarea corespondentă. Nivelurile de sumarizare posibile pentru răspuns sunt număr distincte şi
număr pentru orice câmp şi sumă, medie, minimum şi maximum pentru câmpurile numerice. În timp ce
pentru majoritatea nivelurilor de sumarizare a răspunsului sunt utilizate detalii bazate pe număr, sunt
furnizate sumare corespunzătoare suplimentare pentru nivelurile de sumarizare a răspunsului sumă,
medie, minimum şi maximum. Sumarele bazate pe număr sunt generate atât pentru nivelurile de
sumarizare a răspunsului număr, cât şi pentru număr distincte.
Detalii
Număr general
Numărul total este afişat pentru răspuns şi orice câmp explicativ din vizualizare. Numărul nu include
valorile lipsă ale răspunsului şi este calculat în afara cazului în care nivelul de sumarizare pentru
răspuns este sumă sau medie. Toate câmpurile categoriale specificate în vizualizare sunt tratate ca
fiind câmpuri explicative pentru scopurile detaliilor.
Numărul pentru câmpuri explicative
Numărul este de asemenea calculat pentru fiecare categorie a câmpului explicativ afişat, în afara
cazului în care nivelul de sumarizare pentru răspuns este sumă. Algoritmul selectează şi raportează
categoriile superioare, numerele corespondente şi procentajele numerelor relativ la numărul total
pentru câmpul explicativ. Această procedură este aplicată pentru fiecare câmp explicativ din
diagramă.
Sumă
Când nivelul de sumarizare afişat este sumă pentru un câmp de răspuns numeric, IBM Cognos
Analytics sumarizează suma totală corespondentă pentru câmpul de răspuns. Dacă vizualizarea
conţine mai multe câmpuri categoriale explicative, suma este calculată pentru fiecare categorie şi
Privire generală
Detaliile care se bazează pe insight-uri furnizează insight-uri din vizualizările asociate, care sunt
informative şi uşor de înţeles în contextul diagramei curente. Aceasta permite furnizarea unor detalii mai
cuprinzătoare, care sunt asociate vizualizării curente.
Algoritmi
Detaliile bazate pe insight-uri utilizează direct calculele şi testele statistice care sunt suportate de insight-
uri. De asemenea, detaliile obţin rezultatele pentru vizualizările asociate şi le compilează împreună într-
un mesaj semnificativ. Detaliile furnizează şi o analiză suplimentară, bazată pe ieşirea insight-urilor, prin
producerea unor detalii suplimentare, adecvate pentru o ieşire de tip text.
Detalii
Câmp explicativ singular
Date fiind un câmp de răspuns şi un câmp explicativ categorial, detaliile utilizează insight-urile pentru
a detecta relaţia dintre răspuns şi câmpul explicativ. Este aplicată o analiză dacă nivelul de sumarizare
al răspunsului este mediu sau sunt raportate numărul şi puterea de predicţie dacă este descoperită o
relaţie relevantă.
În cazul în care câmpul explicativ este numeric şi insight-urile generează o linie de ajustare, IBM
Cognos Analytics raportează o pantă pozitivă sau negativă pentru ajustarea liniară şi indică dacă a fost
detectată o relaţie pătratică. Dacă relaţia este pătratică, Cognos Analytics raportează de asemenea
punctul extrem. Cognos Analytics calculează valoarea minimă sau maximă a răspunsului şi valoarea
explicativă pentru locul unde apare punctul extrem al răspunsului.
Două câmpuri explicative
Când sunt disponibile două câmpuri explicative, Cognos Analytics detectează relaţia dintre răspuns şi
ambele câmpuri explicative şi relaţia dintre răspuns şi fiecare câmp explicativ în parte. Dacă puterea
de predicţie pentru relaţia cu ambele câmpuri explicative furnizează o îmbunătăţire relativă mai mare
de 10% faţă de fiecare relaţie separată, Cognos Analytics raportează că răspunsul este afectat de
ambele câmpuri explicative. Altfel, este afectat de un singur câmp explicativ sau de fiecare câmp
explicativ separat, dar nu de ele împreună.
Privire generală
IBM Cognos Analytics raportează detalii pentru serii temporale pentru o vizualizare care este creată într-o
explorare oricând datele de vizualizare conţin o singură serie temporală şi este calculat un model de
previzionare. Dacă datele sunt potrivite, insight-urile de serii temporale sunt generate chiar dacă pe
vizualizare nu este prezentă caseta de dialog Previzionare. Când caseta de dialog Previzionare este
prezentă, după activare produce acelaşi model implicit ca insight-urile de serie temporală. Punctele seriei
temporale sunt sortate automat în ordine cronologică pentru scopul detectării insight-urilor, dar, spre
deosebire de caracteristica de previzionare, punctele de timp afişate în vizualizare nu sunt sortate.
Algoritmi
Detaliile pentru seriile temporale sunt bazate pe un model de netezire exponenţială pentru datele seriei
temporale observate. Valorile seriilor temporale observate şi componentele modelului calculat sunt
utilizate pentru a crea insight-uri pentru seriile temporale: valori neobişnuite, efecte sezoniere şi insight-
uri de tendinţă. Fiecare tip de insight-uri depinde de o combinaţie diferită de date şi de componentele
modelului de netezire exponenţială corespunzătoare.
Detalii
Valori neobişnuite
Un model de netezire exponenţială furnizează o valoare prognozată pentru fiecare punct de timp
observat. O valoare prognozată la un moment dat este o previziune cu un pas înainte la punctul de timp
anterior. Este calculat un interval de încredere pentru fiecare valoare prognozată, care utilizează variaţia
de valoare prognozată corespunzătoare care depinde de model. O valoare de serie temporală observată
care este găsită în afara intervalului de încredere pentru valoarea prognozată corespondentă bazată pe
model este considerată ca fiind o valoare neobişnuită.
Valorile neobişnuite sunt detectate pe baza modelului de netezire exponenţială selectat pentru seriile
temporale. Nivelul de încredere care este utilizat pentru calcularea intervalelor de încredere predicţie
este de 99,74%. Până la cinci valori neobişnuite sunt raportate prin listarea punctelor de timp
corespunzătoare. Cognos Analytics nu listează punctele în ordine cronologică, ci mai degrabă în ordinea
descrescătoare a distanţei faţă de intervalul de încredere. Sunt listate mai întâi punctele cele mai
neobişnuite. Valorile neobişnuite sunt specificate ca fiind neobişnuit de mari sau neobişnuit de mici atunci
când este posibil.
O valoare neobişnuită care este detectată la ultimul punct de timp este raportată separat. Aceasta ar
putea indica faptul că datele sunt incomplete. De exemplu, valoarea sumarizată pentru ultima lună ar
putea reflecta datele zilnice doar până la jumătatea lunii.
Efecte sezoniere
Relaţiile
Vizualizările de relaţii dintr-o explorare sunt afişate iniţial când specificaţi datele pentru explorare.
Privire generală
IBM Cognos Analytics furnizează o scurtă trecere în revistă a relaţiilor dintre perechi de câmpuri care sunt
focalizate pe un singur câmp de interes. Vizualizarea conţine mai multe file, fiecare pentru alt câmp de
interes. Aceste informaţii sunt foarte utile pentru a vă orienta cu privire la multitudinea de relaţii
relevante, disponibile în datele care urmează să fie explorate în continuare, după cum este necesar.
Algoritmi
Câmpul de interes iniţial este determinat pe baza unei analize semantice a datelor, dar puteţi specifica alt
câmp de interes. Fiecare filă furnizează un grafic de reţea cu câmpuri ca noduri şi legături între perechi de
noduri care reprezintă puterea relativă a relaţiei dintre noduri. Legăturile de la câmpul de interes domină
graficul, dar sunt afişate şi alte perechi de câmpuri înrudite, cu relaţii puternice. Puteţi ajusta un glisor
pentru a vedea un număr mai mare sau mai mic de noduri din reţea.
Detalii
Date pentru analiză
Utilizând date nesumarizate, este calculată puterea relaţiei între toate perechile de câmpuri luate în
considerare. Pentru a standardiza măsura puterii relaţiei şi a o face comparabilă pentru toate
Diferenţe între Cognos Analytics şi Watson Analytics privind analiza de date avansată
Metodele de analiză avansată de la Watson Analytics au fost adaptate şi îmbunătăţite în IBM Cognos
Analytics. Ca rezultat, poate fi observat un număr de diferenţe.
Pregătirea datelor
Pregătirea datelor este o etapă critică atât pentru Cognos Analytics, cât şi pentru IBM Watson Analytics,
deoarece numai datele pregătite sunt introduse în analizele pentru driver-e cheie şi arbori de decizie.
Pregătirea datelor diferă între cele două pachete, în privinţa mai multor aspecte importante.
Tratarea punctelor Punctele aberante din câmpurile ţintă Nu este disponibilă tratarea automată a
aberante continue sunt tratate prin setarea punctelor aberante.
valorilor de graniţă extremă şi înlocuirea
valorilor care depăşesc graniţele cu
valorile de graniţă corespondente pentru
scopurile legate de analiză. Aceasta
îmbunătăţeşte analiza atât pentru
driver-e cheie, cât şi pentru arbori de
decizie, deoarece relaţiile cu ţinta devin
mai uşor de detectat. Punctele aberante
tratate în pregătirea datelor predictive
nu sunt raportate în vizualizare.
Driver-ele cheie
Testele statistice Pentru ţintele categoriale, Cognos Watson Analytics utilizează testul
Analytics utilizează testul de raportului de verosimilitate pentru
independenţă hi pătrat pentru a ţintele categoriale.
determina dacă două câmpuri
categoriale sunt independente.
Arborele de decizie
Regulile de oprire Cognos Analytics limitează numărul Watson Analytics limitează mărimea
nodurilor de arbore la 36. arborelui, prin limitarea numărului de
niveluri de arbore la 5.
Numărul minim al rândurilor
corespondente nodurilor de arbore este Numărul minim al rândurilor
25. corespondente nodurilor de arbore este
50.
Câmpurile care nu contribuie la puterea
de predicţie sunt înlăturate din arborii Arborii din Watson Analytics tind să aibă
Cognos Analytics. Cognos Analytics un nivel mai mare de acurateţe numai
produce arbori mai mici, care sunt mai atunci când conţin un număr mult mai
potriviţi pentru vizualizare şi insight-uri, mare de noduri.
cu o acurateţe comparabilă şi uneori mai
mare decât a arborilor generaţi de
Watson Analytics.
Controalele de utilizator
Asistentul
IBM Cognos Analytics include un asistent înglobat, care suportă intrări bazate pe text, pentru a vă ajută să
obţineţi rapid insight-uri din datele dumneavoastră şi să vă simplificaţi analizele. În doar câţiva paşi,
puteţi să accesaţi surse de date cheie, să creaţi vizualizări şi să le trageţi pe canavaua unei explorări sau a
unui tablou de bord. Intrarea de tip text este acceptată doar în limba engleză.
Puteţi folosi două interfeţe:
1. Panoul de asistent complet
2. Panoul de asistent compact
Deschideţi vizualizarea de panou complet făcând clic pe pictograma Asistent . Dacă folosiţi panoul
compact, doar în Explorare, puteţi comuta la panoul complet făcând clic pe Deschidere în vizualizarea
completă.
Aptitudinile asistentului
Asistentul de este o caracteristică puternică, ce vă permite să puneţi întrebări folosind limbajul natural. În
acest subiect, sunt prezentate câteva întrebări pe care le puteţi folosi cu Asistentul.
Pune întrebări folosind limbajul natural. De exemplu, show Profit este sinonim cu list Profit,
what is Profit?, tell me about Profit şi Profit.
Iată câteva întrebări uzuale cu care puteţi începe:
help
Afişează o prezentare generală şi informaţiile de utilizare generale.
show data
Listează toate sursele de date suportate la care aveţi acces în Conţinutul meu şi Conţinut de echipă.
Sursele de date suportate includ:
• Fişiere încărcate (csv, tsv, xls, xlsx şi zip)
• Module de date
• Set de date
• Pachete Framework Manager
Notă: Vedeţi Îmbogăţirea pachetelor în documentul Gestionarea.
Capitolul 6. Assistant 85
Puteţi adăuga filtre pentru şiruri geografice (cum ar fi Country sau State) sau şiruri temporale (cum
ar fi Month sau Year). Filtrarea după data calendaristică nu este suportată în prezent. Agregările şi
filtrele pot fi combinate, pentru a produce rezultate cu un nivel mai mare de granularitate. Iată câteva
exemple, bazate pe date eşantion:
• show Education by Income where Income is less than 1000
• show Education by Income where Income > 100K
Opţional, folosiţi K (pentru a indica mii) sau M (pentru a indica milioane).
• show Revenue in 2017 and 2018
• show Income by Month for New York City
• what are the top 5 States by average Inventory, excluding California
Vizualizările filtrate includ o pictogramă de filtru ( ), plasată în colţul din dreapta-sus al diagramei.
Plasaţi cursorul mouse-ului pe această pictogramă pentru a afişa filtrarea aplicată.
create dashboard
Generează un nou tablou de bord pe baza sursei de date selectate curent. Puteţi să modificaţi
vizualizările, filele, ordinea etc. şi să vă salvaţi noul tablou de bord. În mod implicit, tabloul de bord
generat va include diagrame analitice şi predictive avansate.
Generarea automată a tablourilor de bord pentru surse de date mari poate crea probleme privind
performanţa. Pentru a le evita, puteţi introduce create simple dashboard, pentru a genera un
tablou de bord de bază. Apoi puteţi să modificaţi tabloul de bord, înlocuind diagramele cu vizualizări
mai complexe, cum ar fi diagramele de analiză a driver-elor sau spirală.