Sunteți pe pagina 1din 42

IV.2.

SAS Enterprise Guide - Descriere generală


SAS Enterprise Guide este o aplicaţie client pentru Microsoft Windows uşor de utilizat, pentru
accesarea şi analiza datelor utilizând modulele SAS care oferă utilizatorului următoarele
facilităţi:
 interfaţă vizuală intuitivă şi personalizabilă;

 acces la cele mai multe dintre modulele SAS;

 acces transparent la date;

 proceduri predefinite pentru analiză şi raportare;

 exportul facil al datelor şi al rezultatelor în alte aplicaţii;

 editor de programe cu facilităţi de completare de sintaxă şi de construire automată a help-


ului funcţiilor;

 facilităţi de scripting şi automatizare.

Trebuie menţionat faptul că SAS Enterprise Guide nu este o alternativă a SAS, ci poate fi
considerat o extensie a acestuia care permite un mod alternativ de lucru şi care nu poate
funcţiona în absenţa unui motor SAS.
Utilizatorii având diverse niveluri de experienţă (de la începători până la experţi) pot utiliza SAS
Enterprise Guide pentru a obţine rapid rezultate semnificative.
Interfaţa de ultimă generaţie a SAS Enterprise Guide oferă: funcţionalitate de tip drag-and-drop;
ferestre de dialog pentru introducerea parametrilor prelucrărilor şi efectuarea de setări prin
instrumente de tip wizard; editor de sintaxă pentru scrierea programelor, cu evidenţierea în culori
diferite a elementelor codului; facilităţi de Help Online, help senzitiv la context şi tutorial de
iniţiere.
Utilizând SAS Enterprise Guide, se pot accesa modulele SAS fără să fie nevoie să se înveţe
limbajul de programare în SAS. Dacă utilizatorul este programator SAS, el poate utiliza editorul
de cod al pachetului de programe pentru a crea cod nou sau pentru a modifica programe SAS
existente (figura IV.2.1.).
Figura IV.2.1. Exemplu de cod SAS

Utilizatorul poate modifica codul SAS generat de pachet (din fereastra Code) pentru a
personaliza rezultatele şi pentru a accesa facilităţile SAS care nu sunt disponibile în cadrul
interfeţei grafice. De asemenea, utilizatorul poate salva codul şi apoi să îl execute într-un mediu
de tip batch (un fişier de tip batch reuneşte într-un singur fişier un set de comenzi care altfel ar fi
fost prezentate în mod interactiv, pe rând, sistemului de operare, folosind tastatura sau mouse-ul.
Un astfel de fişier este, de obicei, creat pentru a încapsula o secvenţă de comenzi pe care
utilizatorul o execută în mod repetat).
Pentru a lucra cu SAS Enterprise Guide, trebuie parcurşi următorii paşi: crearea unui proiect
nou, adăugarea de date la proiect, executarea de prelucrări asupra datelor, personalizarea
rezultatelor şi automatizarea procesului.
Pe măsură ce se accesează date şi se realizează prelucrări, SAS Enterprise Guide generează cod
SAS. Atunci când se rulează o prelucrare, codul generat este trimis motorului SAS pentru
procesare, iar rezultatele, precum în figura IV.2.2 sunt retransmise către SAS Enterprise Guide
(EG). Pachetul software se poate conecta la motorul SAS pe calculatorul local sau pe un alt
calculator numit server SAS.

SAS
pe Windows

SAS
Figura IV.2.2. Procesarea datelor între SAS pe Mainframe EG
şi motorul SAS Rezu
ltate

Când informaţiile despre obiecte sunt stocate, SAS


SAS
Enterprise Guide se conectează, de asemenea, pe UNIX la un
SAS Enterprise
depozit de metadate SAS. În figura IV.2.3. Guide SAS
Enterprise Guide este conectat la un server SAS
la distanţă şi la un depozit de metadate SAS.
SAS
pe Windows

SAS
pe Mainframe
Cod
SAS
pe UNIX

SAS Enterprise Guide

Figura IV.2.3. Conectarea SAS Enterprise Guide la un server SAS la distanţă şi la un


depozit de metadate SAS

La lansarea în execuţie a produsului SAS Enterprise Guide, ferestrele sunt aranjate în mod
implicit ca în figura IV.2.4.

Arborele proiectului
Fereastra principala/spaţiul de lucru unde se vizualizează fluxul de proces

Fereastra de resurse

Prelucrări în execuţie

Figura IV.2.4. Interfaţa implicită SAS Enterprise Guide

Interfaţa implicită constă din patru ferestre principale şi anume: fereastra arborelui proiectului
(Project Tree), fereastra principală sau spaţiul de lucru unde se vizualizează fluxul de proces
(Process Flow), fereastra prelucrărilor (Task Status) şi fereastra resurselor (formată din mai
multe ferestre).
Dacă utilizatorul îşi personalizează interfaţa, prin închiderea, deschiderea sau schimbarea poziţiei
ferestrelor, modificările sunt salvate la ieşirea din SAS Enterprise Guide. Dacă se doreşte să se
restaureze modul de vizualizare implicit, din meniul principal se vor selecta opţiunile Tools
Options General şi de acolo Restore Window Layout. Dacă una dintre ferestre a fost
închisă şi se doreşte restaurarea ei, din meniul View se va selecta numele ei.
Fereastra de resurse (Resources pane) şi spaţiul de lucru (Process Flow) constituie
elemente ale interfeţei în care sunt rezidente mai multe ferestre. Implicit, se poate vizualiza o
sigură fereastră în aceste zone (opţiunea Show One), dar este posibilă divizarea lor pentru a
permite vizualizări multiple prin selectarea butonului săgeată în jos, opţiunea Show Multiple şi
selectarea ferestrelor dorite. Pentru vizualizarea secvenţială a ferestrelor din fereastra aferentă
resurselor se apasă pictogramele corespunzătoare, respectiv Tasks, SAS Folders, Server
List, Prompt Manager sau Data Exploration History. Totodată, în interiorul spaţiului de
lucru, sunt aplicate mare parte din funcţiile SAS Enterprise Guide aflate la dispoziţia
utilizatorului. De aceea, înainte de a diviza acest spaţiu, este utilă o maximizare a sa, folosind
opţiunea View„Maximize Workspace din bara de meniu. Odată cu această maximizare,
ferestra arborelui proiectului şi zona resurselor sunt minimizate şi fixate pe marginea din stânga a
interfeţei. Se revine la starea iniţială tot prin opţiunea View„Maximize Workspace.
În SAS Enterprise Guide, toată activitatea desfăşurată este salvată în proiecte. Un proiect este o
colecţie de date aferente, sarcini, programe şi rezultate.
Ferestra Project Tree afişează o structură ierarhică a proiectului activ. Atunci când se crează un
nou proiect, ferestra Project Tree este goală. Pe măsură ce se adaugă date, se execută prelucrări sau
se generează rezultate, în ferestră vor fi adăugate pictograme pentru fiecare dintre aceste obiecte.
Ele sunt văzute ca obiecte ale unui proiect. Se poate reveni la o prelucrare a datelor în arborele
proiectului, modifica şi rula din nou pentru a obţine un set nou de rezultate ce pot fi salvate separat
sau pot fi suprascrise peste rezultatele prelucrării anterioare.
Pentru deschiderea unui nou proiect, dacă SAS Enterprise Guide nu este deja deschis, se
lansează în execuţie şi din fereastra principală se selectează opţiunea New Project, în caz
contrar, se vor selecta opţiunile File New Project. În acest moment noul proiect va fi
deschis, având ferestrele Project Tree şi Process Flow goale.
Un proiect şi conţinutul acestuia poate fi salvat în orice locaţie, inclusiv într-un alt server, ca un
singur fişier. În acest scop se vor parcurge următorii paşi:
1. Se selectează opţiunile File Save Project As;
2. La deschiderea ferestrei Save se va stabili şi selecta dacă proiectul va fi salvat
în calculatorul local sau pe server, după care se selectează opţiunea My Computer;
3. În fereastra Save se selectează locaţia pentru proiect, în câmpul File name se
introduce numele proiectului (care se va salva cu extensia .egp).
4. Se efectuează clik pe butonul Save.
Fereastra fluxului de proces (Process Flow) este formată din mai multe ferestre, putând
fi deschisă fie selectând-o din meniul View, făcând dublu clic pe numele său în ferestra arborelui
proiectului (Project Tree), selectând din lista care apare deasupra spaţiului de lucru, din lista de
pe bara de meniu sau apăsând tasta F4. Ferestra fluxului de proces este formată din ferestre ce
conţin datele, rezultatele, programele SAS (codul), informaţii privind execuţia (engl. logs) sau
note, existând un tip special de pictogramă pentru fiecare tip de document. Spre exemplu, în
figura IV.2.5. fluxul de proces conţine date, rezultate, prelucări şi programe SAS.

Figura IV.2.5. Interfaţa implicită SAS Enterprise Guide

Exemple de pictograme utilizate de SAS Enterprise Guide sunt prezentate în tabelul IV.1.
Tabelul III.1. Exemple de pictograme din arborele proiectului
Datele dintr-un proiect pot fi tabele de date SAS, fişiere flat care conţin date sau
alte fişiere de date ale unor Sisteme de Gestiune a Bazelor de Date sau aplicaţii.
Proiectele conţin referinţe la date şi nu datele propriu-zise. Pictograma reprezintă
un set de date SAS.
Prelucrările reprezintă analize sau rapoarte specifice care pot fi executate, cum ar
fi rapoarte listă (List Data) sau grafice cu bare verticale (Bar Chart). Atunci când
se rulează o prelucrare, SAS Enterprise Guide adaugă o pictogramă reprezentând
prelucrarea respectivă în feresatra fluxului de proces şi a arborelui proiectului.
Pictograma reprezintă o prelucrare de tip grafic cu bare verticale.
Rezultatele sunt rapoarte sau grafice produse în urma execuţiei prelucrărilor.
Rezultatele sunt reprezentate prin pictograme diferite în funcţie de tipul fişierului
rezultat (raport SAS, HTML, PDF, RTF sau text). Pictograma reprezintă un rezultat
în formatul raport SAS.
Notele sunt fişiere text opţionale folosite pentru documentarea unui proiect sau
pentru a consemna comentarii sau instrucţiuni pentru utilizările ulterioare.
Programele sunt fişiere care conţin cod SAS.

Arborele proiectului (Project Tree) afişează o vizualizare ierarhică a proiectului activ şi date
asociate, programe, note şi rezultate (a se vedea figura IV.2.4). Fereastra Project Tree poate fi
folosită pentru a gestiona obiectele din proiect. Într-un proiect se pot crea noi fluxuri de proces şi
se pot muta sau copia obiecte între fluxurile de proces. De asemenea, se poate executa doar o
porţiune a unui flux de proces, sau întregul flux, imediat sau poate fi programat pentru o execuţie
ulterioară. Fereastra Task Status este o parte a interfeţei SAS Enterprise Guide utilizată pentru a
afişa date, cod, informaţii privind execuţia (log-uri), rezultatele activităţilor şi a fluxurilor de
proces.
Înainte de rulare, fereastra aferentă fluxului de proces este singura fereastră deschisă în zona de lucru.
Când se generează rapoarte sau se deschid fişiere de date, în spaţiul de lucru de deschid mai multe
ferestre, ce pot fi accesate cu uşurinţă.
În SAS Enterprise Guide, task-urile sunt utilizate pentru realizarea oricărei activităţi, de la
manipularea datelor, la derularea procedurilor analitice specifice sau la crearea de rapoarte. Multe
task-uri sunt, de asemenea disponibile ca wizard-uri, care conţin un număr limitat de opţiuni şi care
pot oferi o modalitate rapidă şi uşoară de a utiliza o parte dintre aceste task-uri. Task-urile şi wizard-
urile pot fi alese utilizând lista de activităţi (Tasks) sau prin utilizarea meniului principal.
În mod implicit Tasks este ascunsă, dar ea poate fi vizualizată apăsând butonul Tasks din
fereastra de resurse aflat în colţul din stânga jos al spaţiului de lucru. Tasks permite mai multe
moduri de vizualizare (figura IV.2.6) vizualizează task-rile în ordine alfabetică, recente, favorite,
filtrate etc.

Figura IV.2.6. Fereastra Tasks din fereastra de resurse

Fereastra de stare a activităţulor (Task Status) afişează mesaje despre starea task-urilor aşa
cum acestea sunt prelucrate (figura IV.2.6). Fereastră Task Status nu este afişată în mod
implicit, dar ea poate fi vizualizată prin selectarea opţiunilor View Task Status. Fereastra
Process Flow afişează, de asemenea, o culoare de fundal diferită în jurul task-ului activ, pentru
fiecare fază de prelucrare.

Figura IV.2.6. Fereastra Task Status

IV.3. Accesarea datelor


Înainte de a realiza prelucrarea şi analiza datelor în SAS Enterprise Guide, este necesar ca datele
să fie adăugate (importate) în proiect. Utilizatorul are posibilitatea să deschidă date care se află
pe calculatorul local sau pe orice alt server pe care este autorizat să îl acceseze. Pe lângă fişierele
de date SAS (date locale sau la distanţă), SAS Enterprise Guide poate citi majoritatea tipurilor de
fişiere de date ca HTML (date locale), tabele Microsoft Access, foi de calcul Microsoft Excel şi
foi de calcul Lotus (date locale), baze de date dBASE2, Oracle şi Sybase (locale sau la distanţă,
cu precizarea că este necesară o licenţă pentru motorul SAS database), cuburi OLAP (locale sau
la distanţă şi cu conectare la un server OLAP) şi altele (figura IV.3.1).

Tabele SAS

Figura IV.3.1. Formate de date suportate de SAS Enterprise Guide

În esenţă, formatele de fişiere suportate de SAS Enterprise Guide pot fi clasificate în trei
categorii:
1. Tabele de date SAS, care sunt formate specifice ale pachetului de programe SAS. Pentru a
putea fi supuse prelucrărilor, toate celelalte tipuri de formate suportate de pachetul SAS
trebuie tranformate în tabele de date SAS.
2. Fişiere flat conţin înregistrări între care nu există nici o inter-relaţionare. Avantajul este acela
că ocupă mai puţin spaţiu decât fişierele structurate. Totuşi, necesită ca aplicaţia care le
foloseşte să cunoască modul în care datele sunt organizate în fişier. Exemple de fişiere flat
sunt fişiere text, fişiere ASCII sau fişiere secvenţiale.
3. Fişiere ale altor aplicaţii software cum ar fi Microsoft Access sau Paradox. Nu este nevoie
să se instaleze software adiţional pentru a citi date în următoarele formate: dBASE, HTML,
IBM Lotus 1-2-3, Microsoft Access, Microsoft Excel, Microsoft Exchange, Paradox.
Totuşi, pentru fişiere de dimensiuni mari, se pot îmbunătăţi performanţele aplicaţiei prin
utilizarea software-ului SAS/ACCESS. În acest sens, în funcţie de tipul de fişier care va fi citit,
interfeţete SAS/ACCESS to PC Files sau SAS/ACCESS to ODBC trebuie instalate pe acelaşi
calculator pe care este instalat şi SAS.
Deşi se pot deschide şi rula task-uri pe diverse tipuri de date, dacă se doreşte editarea acestor
date, ele trebuie deschise ca un set de date SAS. În acest scop SAS Enterprise Guide permite
importul a diverse tipuri de fişiere de date pentru crearea seturilor de date SAS.

IV.3.1 Formate de date suportate de SAS Enterprise Guide


SAS Enterprise Guide poate citi şi utiliza date dintr-o variatate de formate:
 Fişierele text conţin înregistrări între care nu există nici o inter-relaţionare. Avantajul
este acela că ocupă mai puţin spaţiu decât fişierele structurate. Totuşi, necesită ca
aplicaţia care le foloseşte să cunoască modul în care datele sunt organizate în fişier.
Fişiere text cu laţime fixă - Un fişier text cu lăţime fixă are un format specific care permite
salvarea datelor/informaţiilor textuale într-o manieră organizată. Este un tip special de fişier
în care formatul este definit de lăţimea coloanei, de caracterele folosite pentru spaţiere şi de
alinierea la stânga sau dreapta. Lăţimea coloanei este specificată sub forma unui număr de
caractere. Spaţierea datelor se face folosind caracterul spaţiu (sau orice caracter se doreşte) în
cazul în care datele ocupă mai puţine caractele decât lăţimea specificată pentru coloana
respectivă.
Mai jos este prezentat un exemplu de fişier text în care lăţimea primei coloane este de 25
de caractere, celei de-a doua de 10 caractere şi cea de-a treia de 12 caractere.
Nume Judeţ Telefon
Popescu Maria VL 0250277189
Ionescu Damian DJ 0251767868
Diamandescu DB 0245876590
Victor

Într-un fişier text delimitat fiecare linie de text reprezintă o înregistrare, iar câmpurile sunt
separate prin caractere cunoscute. Delimitatorii frecvent utilizaţi sunt caracterul tab (\t) sau
diferite caractere de punctuaţie. Delimitatorul trebuie întotdeuna să fie un caracter care nu
se regăseşte în date. Astfel de fişiere se pot crea facil folosind aplicaţii de calcul tabelar sau
pentru baze de date (ex. Microsoft Excel, Microsoft Access, în Excel: File à Save AS, Text
(Tab delimited)). Un astfel de fişier poate conţine numele, prenumele şi vârsta persoanelor,
delimitate prin simbolul linie verticală (|):
Popescu|Maria|35
Ionescu|Damian|42
Diamandescu|Victor|29
 Date compatibile cu standardul ODBC şi OLE DB . ODBC (Open DataBase Connectivity)
este o metodă standard de accesare a bazelor de date care permite accesul la orice date din
cadrul oricărei aplicaţii, indiferent de sistemul de gestiune a bazelor de date care gestionează
datele. ODBC realizează acest lucru prin inserarea unui strat de mijloc (middle layer), numit
driver de baze de date, între aplicaţie şi SGBD. Scopul acestui strat este de a transforma
interogările aplicaţiei în comenzi pe care un SGBD le înţelege. În acest sens, atât aplicaţia,
cât şi SGBD-ul trebuie să fie compatibile cu standardul ODBC, adică aplicaţia trebuie să fie
capabilă să genereze comenzi ODBC, iar SGBD-ul trebuie să fie capabil să răspundă la
acestea. OLE DB (Object Linking and Embedding, Database) este o interaţă API proiectată
de Microsoft pentru accesarea diferitelor tipuri de date stocate într-o manieră uniformă. OLE
DB include şi capabilităţile ODBC.
 Datele în format SAS (sau tabele SAS), Foi de calcul Microsoft Excel, Fişiere dBase,
Tabele HTML, Tabele Microsoft Access. Pentru a putea fi accesate de SAS EG, datele
trebuie să fie reprezentate în format tabelar (ca o mulţime de linii şi coloane). O linie (rând)
reprezintă o instanţă a unei entităţi. Entitatea poate fi un produs, un client, o comandă sau
orice alt lucru. Fiecare coloană (variabilă) descrie caracteristicile entităţii, cum ar fi codul de
identificare al unui produs, numele clientului sau cantitatea vândută (figura IV.3.2.)

Figura IV.3.2. Exemplu de tabelă

Toate coloanele trebuie să aibă un nume, un tip şi o lungime. Numele pot avea o lungime de la 1 la
32 de caractere, iar eticheta ataşată unei coloane poate avea lungimea de maxim 265 de caractere.
Unul dintre cele mai importante lucruri care trebuie ştiute despre date este ce tip de date conţine
fiecare coloană (sau variabilă). SAS priveşte datele ca fiind fie de tip caracter, fie de tip numeric.
În cazul în care datele dintr-o coloană conţin doar litere, aceasta are date de tip caracter. Valorile
de tip caracter pot avea lungimea între 1 si 32,767 caractere (octeţi). În cazul în care datele dintr-
o coloană conţin numere, aceasta poate fi de tip caracter sau numeric.
Datele numerice sunt grupate în patru categorii de date, în funcţie de modul în care acestea sunt
afişate. Figura IV.3.3 arată ce simbol este asociat fiecărui tip de dată precum şi pictogramele
asociate lor. Pictogramele apar în titlurile de coloană ale tabelei de date şi de asemenea, se pot
vedea atunci când se rulează o prelucrare. Aceste simboluri constituie un indiciu despre modul în
care pot fi folosite coloanele sau varibilele în prelucrări.

Figura IV.3.3. Tipuri de date şi pictogramele lor

IV.3.2. Formate de introducere şi afişare a datelor

Formatele de intrare (Informat) sunt, de obicei, folosite pentru a citi într-o variabilă date din
surse externe numite fişiere flat (fişiere text, fişiere ASCII sau fişiere secvenţiale).
Formatele de intrare instruiesc aplicaţiile SAS asupra modului în care trebuie să citească datele
într-o variabilă SAS. Sunt, de obicei, grupate în trei categorii: caracter, numeric şi dată/timp
(figura IV.3.4).

Figura IV.3.4. Formate de intrare


Formatele de intrare au următoarea sintaxă:
- Formate de intrare caracter: $INFORMATw.
- Formate de intrare numerice: INFORMATw.d
- Formate de intare dată/timp: INFORMATw.
Semnificaţia simbolurilor folosite de formatele de intrare este următoarea:
$ indică prezenţa unui caracter
w semnifică lăţimea unei variabile (în octeţi sau număr de coloane)
INFORMAT este un nume opţional de format de intrare SAS
d este folosit în cazul datelor numerice pentru a specifica numărul de cifre ale
părţii zecimale.
Toate formatele de intare trebuie să conţină punctul zecimal (.), astfel încât să se poată face
diferenţa între un format de intrare şi o variabilă SAS.
Formatul de afişare (Format) este folosit pentru a controla modul în care sunt afişate valorile. Un
format de afişare (Format) este o „instrucţiune” care se aplică unei coloane, indicând produsului
SAS Enterprise Guide cum să afişeze valorile datelor (figura IV.3.5). Trebuie reţinut faptul că
formatul de afişare nu afectează modul de stocare a valorilor.

Figura IV.3.5. Formate de afişare

IV.3.3. Valori lipsă


Dacă într-o coloană, valoarea unei date nu există pentru un anumit rând, ea este considerată lipsă.
O valoare lipsă de tip caracter este afişată ca spaţiu. O valoare lipsă de tip numeric este afişată ca
virgulă sau punct (figura IV.3.6).

Figura IV.3.6. Reprezentare valori lipsă


În SAS Enterprise Guide sunt multe funcţii care furnizează opţiuni pentru modul de manipulare a
valorilor lipsă, în scopul raportării sau analizei.

IV.3.4. Metadate

Multe formate de fişiere care memorează date sub formă tabelară includ metadate ca parte a
tabelei (figura IV.3.7.). Metadatele reprezintă informaţii despre datele în sine, cum ar fi
originea/sursa datelor, dimensiunea sau formatul lor. Tabelele SAS, Microsoft Access sau
dBASE sunt exemple de fişiere care conţin metadate stocate în interiorul lor.
Fişierul conţine metadate.

Fişierul nu conţine metadate.

Figura IV.3.7. Exemple de fişiere cu şi fără metadate

Atunci când accesează un astfel de fişier, SAS EG poate accesa metadatele pentru a determina
numele unei coloane, tipul (caracter sau numeric) şi lungimea (dimensiunea). Există şi cîteva
formate de fişiere, cum ar fi foile de calcul Microsoft Excel, tabelele HTML sau fişierele text
care nu conţin metadate. Pentru aceste tipuri de fişiere, SAS EG trebuie să facă anumite deducţii
referitoare la atributele fiecărei coloane. Implicit, SAS EG caută numele coloanei în primul rând al
fişierului şi analizează valorile stocate în câmpuri sau celule pentru a stabili dacă o anumită
coloană trebuie memorată ca şir de caractere sau ca număr. Dacă se stabileşte că o coloană este de
tip caracter, atunci lungimea ei este setată în mod automat ca fiind 255 (octeţi), care este numărul
maxim de caractere permis de motorul de baze de date Microsoft Jet.

IV.3.5. Date locale şi date la distanţă

Când utilizatorul deschide date în SAS Enterprise Guide, el trebuie să selecteze dacă doreşte să
le preia din computerul local, dintr-un server SAS, sau dintr-un folder SAS (figura IV.3.8).
Figura IV.3.8. Surse de date în SAS Enterprise Guide

Dacă utilizatorul efectuează clic pe opţiunea My Computer, el poate parcurge structura de


directoare a calculatorului local şi poate să deschidă orice tip de fişier de date pe care SAS
Enterprise Guide îl poate citi.
Dacă se selectează opţiunea Servers, utilizatorul va putea să caute datele pe un server. Acest
server poate să fie un server local, dacă pe calculatorul local este instalat software-ul SAS, sau
poate fi un server la distanţă dacă software-ul SAS este instalat pe un alt calculator. Serverele pe
care le poate vedea utilizatorul depind de mediul la care acesta este conectat.
În cadrul fiecărui server există pictograme care pot fi selectate, pentru biblioteci (Libraries) şi
fişiere (Files) (figura IV.3.9). Unele biblioteci sunt definite de SAS, iar altele de SAS Enterprise
Guide. Bibliotecile conţin numai seturi de date SAS. Directorul Files dintr-un server permite
utilizatorului să acceseze fişiere de date dintr-o structură de director aflată pe calculatorul pe care
funcţionează serverul SAS.

Figura IV.3.9. Biblioteci şi fişiere


Deschiderea fişierelor dintr-un server se poate face şi prin dublu clic pe fişier, în fereastra
Server List. Această fereastră este deschisă implicit în fetreastra de resurse, în colţul din stânga
jos a spaţiului de lucru. În cazul în care fereastra Server List este închisă, pentru a o deschide
se selectează opţiunea View Server List.
Dacă utilizatorul selectează SAS Folders, el poate naviga prin lista de directoare SAS la care
are acces. Directoarele SAS sunt definite în SAS Metadata Server şi pot fi utilizate
pentru a furniza o locaţie centrală pentru stocarea proceselor, harţilor de informaţii (information
maps) şi a proiectelor, astfel încât ele să poată fi partajate cu alte aplicaţii SAS. Directoarele SAS
pot stoca, de asemenea şi conţinut care nu se găseşte în SAS Metadata Server, cum ar fi
fişierele de date.

IV.3.6. Adăugarea datelor SAS într-un proiect

Adăugarea datelor SAS din calculatorul local


Pentru adăugarea datelor se va parcurge următoarea secvenţă de paşi: Se selectează opţiunile
File Open Data. În fereastra Open Data se selectează opţiunea My Computer. În câmpul
Look In se selectează opţiunea Data, fişierul dorit şi apoi se efectuează clik pe butonul Open
(figura IV.3.10). În mod implicit, în fereastră vor fi afişate fişierele de toate tipurile. Fişierele cu
pictograma sunt seturi de date în format SAS.

Figura IV.3.10. Fereastra Open

În acest moment, setul de date este adăugat în proiect şi deschis în grila de date. În mod implicit
tabela este deschisă în modul citire (Protect Data din Edit). În acest mod, utilizatorul poate
parcurge datele, redimensiona lăţimea coloanelor, ascunde coloane şi rânduri şi poate copia
coloane şi rânduri într-un nou fişier, dar nu poate edita datele decât dacă va trece în modul editare
(Update Mode). Este de remarcat faptul că atunci când se inserează date într-un proiect se
crează referinţe la date, dar SAS Enterprise Guide nu realizează o nouă copie a fişierului.
Pentru a vizualiza proprietăţile unui set de date, în arborele proiectului se selectează fişierul de
date, clic dreapta şi apoi opţiunea Properties. Se va deschide fereastra Properties, în care se
vor putea vedea informaţii referitoare la propietăţile generale, cum ar fi locaţia fizică a datelor şi
data ultimei lor modificări (figura IV.3.11).
Figura IV.3.11. Fereastra Properties
Dacă, în zona de selecţie se optează pentru opţiunea Columns, se va putea vedea lista
coloanelor setului de date precum şi atributele acestor coloane (figura IV.3.12).

Figura IV.3.12. Vizualizarea atributelor coloanelor setului de date

Adăugarea datelor dintr-o bibliotecă SAS

În cadrul unui proiect, pentru a adăuga date dintr-o bibliotecă SAS, se vor selecta opţiunile File
Open Data. În fereastra Open Data se va selecta opţiunea Servers (figura IV.3.13). Se
poate ca în fereastră să fie afişate mai multe servere. Server-ul la care este conectat SAS
Enterprise Guide este marcat distinct. Se deschide prin dublu-clic. Dacă SAS Enterprise Guide
nu este conectat la un server se va efectua dublu-clic pe server-ul adecvat pentru a-l conecta şi
deschide. După deschiderea server-ului se va selecta opţiunea Libraries, apoi directorul dorit (în
biblioteci sunt stocate numai seturi de date SAS) şi de acolo setul de date dorit, care va fi adăugat
în proiect şi deschis în fereastra principală.
Figura IV.3.13. Adăugarea datelor dintr-o bibliotecă SAS

IV.3.7. Importul datelor dintr-un fişier text.


Facilitatea de import de date (Import Data) permite să se creeze seturi de date SAS din
fişiere text, HTML, Microsoft Excel sau fişiere de baze de date (inclusiv Microsoft Access şi
alte formate populare). Se pot specifica opţiuni pentru a controla modul în care fişierul de
intrare este importat şi modul în care este salvat ca un set de date SAS. În acest scop se:
- Selectează fişierul text şi se specifică setul de date de ieşire – se începe procedura de
import date din meniul File. În plus, dacă se doreşte adăugarea de date care sunt într-
un format pe care SAS Enterprise Guide îl poate importa, task-ul Import Data îl
deschide automat. Implicit, SAS Enterprise Guide selecteaze pentru setul de date şi îl
stochează în prima bibliotecă disponibilă la care are acces. Pentru acest lucru se
selectează opţiunile File Import Data şi se selectează fişierul text care va fi importat.
Odată ce procedura Import Data a fost deschisă, în pagina Specify Data (figura IV.3.14) se
pot observa, în zona Output SAS data set, numele bibliotecii şi al setului de date. În mod
implicit, tabela este salvată în biblioteca Work (totuşi, se poate ca serverul să fie setat astfel
încât, în mod implicit, datele să fie salvate în biblioteca Sasuser). În continuare se va
efectua clic pe butonul Browse, în câmpul File name se va introduce numele dorit pentru
fişierul importat şi se va activa butonul Save. Apoi, se va efectua clic pe butonul Next
pentru a specifica formatul de text şi pentru a vedea modul în care sunt definite
câmpurile.
Figura IV.3.14. Specificarea sursei / destinaţiei datelor

- Selectează formatul textului şi lăţimea câmpurilor – în zona Text format se


selectează opţiunea Fixed columns. Se specifică delimitatorii de coloane prin clic pe riglă
la începutul fiecărei coloane. Pentru a indica sfârşitul primei coloane şi începutul celei de-a
doua se va efectua din nou clic pe riglă bifând poziţia dorită, obţinându-se astfel o linie de
demarcaţie, procedându-se identic pentru celelalte coloane (figura IV.3.15). Se va efectua
clic pe butonul Next pentru a specifica artibutele fiecărui câmp.

Figura IV.3.15. Specificarea lăţimii coloanelor

- Specifică atributele câmpurilor – în tabela care conţine atributele câmpurilor este selectat
implicit câmpul F1. Se va efectua clic pe butonul Modify pentru a deschide fereastra Field
Attributes pentru câmpul F1. În zonele Name, Label şi Type se vor introduce numele,
etichetă şi tipul pentru acest câmp, apoi se va apăsa butonul OK. Pentru selecţia celorlalte
câmpuri se va efectua dublu clic pe numele lor (respectiv F2, F3 etc.), procedându-se similar
(figura IV.3.16). În final se va apăsa butonul Next pentru a vedea opţiunile avansate şi pentru a
executa procesul de import de date.
Figura IV.3.16. Specificarea atributelor coloanelor

Pentru a elimina din procesul de importare preluarea unui anumit câmp se va deselecta bifa din
box-ul de control aferent câmpului respectiv (figura IV.3.17).

Figura IV.3.17. Eliminarea importului unei coloane


- Importă datele – în pagina Advanced Options se pot seta opţiunile respective sau se pot
accepta selecţiile implicite. În fereastra Import Data se va efectua clic pe butonul Finish. Când
procesul de import va fi finalizat, datele importate vor fi afişate în fereastra principală (figura
IV.3.18).

Figura IV.3.18. Setul de date importat


IV.4. Pregătirea datelor pentru analiză - interogări
Pregătirea datelor este activitatea cea mai importantă şi mai mare consumatoare de timp în orice
activitate de analiză economică. În cadrul unei organizaţii, apar frecvent noi probleme pentru
rezolvarea cărora este necesară o analiză ad-hoc a datelor, dar de cele mai multe ori, acestea nu
sunt în forma cerută de procesul de analiză.
Activitatea de pregătire a datelor include colectarea datelor corespunzătoare, extragerea
subseturilor de date necesare analizei dorite, precum şi agregarea lor. La nivelul unei unităţi
organizaţionale, datele trebuiesc reunite din diverse surse dispersate. Aceste surse de date pot să
includă date tranzacţionale (de exemplu, privind facturarea şi plata), cifre demografice sau date
financiare. Ulterior, pentru a le aduce în forma cerută de analiză, asupra acestor date trebuie să
fie aplicate diverse transformări.
Sistemele software care procesează date pot fi clasificate în două categorii principale: sisteme
operaţionale şi sisteme pentru depozite de date. Deşi, după cum a fost precizat în capitolul unu,
există şi alte criterii de clasificare ale produselor software, această clasificare este importantă din
perspectiva pregătirii datelor.
Caracteristicile principale ale sistemelor operaţionale sunt următoarele:
 sunt proiectate pentru a oferi suport proceselor operaţionale ale unei organizaţii;
 sunt sisteme care trebuie să fie integrate cu procesele de afaceri şi fluxurile de lucru ale
companiilor sau organizaţiilor care le folosesc;
 sunt specializate în preluarea, stocarea şi prelucrarea datelor privitoare la tranzacţiile zilnice,
de rutină (de accea mai poartă şi numele de sisteme tranzacţionale).
Sistemele pentru depozite de date sunt proiectate pentru a furniza informaţii utilizatorilor, cu
facilităţi pentru raportare, pentru regăsirea informaţiilor sau pentru depozitarea datelor.
Tabelul IV.2 prezentată o comparaţie între cele două categori de sisteme.
Tabelul IV.2. Comparaţie între sistemele operaţionale
şi sistemele pentru depozite de date
Sistemele operaţionale Sistemele pentru depozite de date
Se adresează conducerii departamentelor Constituie o bază pentru procesul decizional
funcţionale de la diferite nivele ale conducerii.
Conţin date curente, primare privind Conţine date istorice. Acestea pot fi
tranzacţiile. Corectitudinea acestor date este disponibile ca atare sau pot fi create pornind
foarte importantă. de la fişierele istorice de log asociate tabelelor.
Au o orientare tranzacţională. Furnizează date pentru raportare, monitorizare
şi analiză.
Este de preferat ca produsul final care rezultă din procesul de pregătire a datelor să fie o
singurătabelă (care va fi folosită pentru analiză) tabelă care va fi numită în continuare tabelă de
analizăsau tabelă analitică. Figura IV.4.1 prezintă susele datelor incluse în tabela analitică.

Tabelă Analitică

Depozit de Date

Sistem Operaţional Alte Date, Date Externe

Figura IV.4.1. Intrări pentru tabela analitică din perspectivă logică

În figura de mai sus se poate observa că există două surse principale pentru datele de analiză:
- Datele tranzacţionale;
- Alte date, cum ar fi date externe, date obţinute din sondaje, date ad-hoc, tabele asociative
(lookup tables), foi de calcul sau fişiere text.
Ambele tipuri de date pot intra direct în tabela analitică sau pot fi regăsite prin intermediul
depozitului de date.

IV.4.1. Interogarea datelor

O interogare (“query”) se poate utiliza dacă se doreşte să se analizeze date care sunt localizate în mai
multe tabele sau doar o parte a datelor dintr-o tabelă.
O interogare poate fi utilizată pentru:
 Selectarea rândurilor pornind de la una sau mai multe condiţii. Rândurile pot fi
selectate pe baza uneia sau mai multor condiţii. În cadrul rezultatului interogării, rândurile
pot fi ordonate pe baza valorilor din una sau mai multe coloane (figura IV.4.2.).

Figura IV.4.2. Ordonarea rândurilor unei interogări


 Selectarea, ordonarea şi sortarea coloanelor. După selectarea sursei sau surselor de date,
utilizatorul poate să aleagă numai acele coloane pe care doreşte să le obţină în rezultate şi
poate să specifice şi ordinea de apariţie a acestora. De asemenea el poate să creeze şi să
calculeze noi coloane precum şi să înlocuiască valori în coloanele existente (figura IV.4.3.).

Figura IV.4.3. Selectarea coloanelor aferente unei interogări


 Definirea de variabile calculate. În cadrul unei interogări pot fi create noi coloane ale căror
valori pot fi calculate pe baza valorilor din coloane deja existente.
 Examinarea relaţiilor dintre valorile datelor.
 Înlocuirea valorilor datelor. Prin intermediul interogării, utilizatorul poate să
înlocuiască, în mod automat, anumite valori dintr-o coloană cu alte valori.
 Joncţiunea (unirea) tabelelor cu scopul de a combina date din diverse surse. Pentru a
obţine date din mai mult de o singură sursă de date, tabelele pot fi reunite, pe baza unor
coloane commune, în diferite moduri (figura IV.4.4.).

Figura IV.4.4. Joncţiunea tabelelor

 Gruparea şi agregarea datelor. Datele pot fi împărţite în grupuri pe baza valorilor dintr-o
coloană. În plus, în oricare dintre coloanele unei interogări pot fi introduse funcţii de agregare
(însumare) – figura IV.4.5.

Figura IV.4.5. Gruparea datelor


 Specificarea unui parametru pentru interogare.
Dacă se doreşte ca rândurile să poată fi selectate în mod dinamic, în timp ce se execută
interogarea, se pot defini interogări care să accepte parametrii şi să permită utilizatorului să
selecteze sau să introducă de la tastatură valorile dorite pentru aceştia. Tehnic vorbind, o
interogare este o cerere de regăsire a datelor din una mai mai multe surse de date. În
contextul SAS, o interogare este o colecţie de specificaţii care ne permit să aducem datele în
forma dorită de utilizator.
În funcţie de necesităţi, utilizatorul poate selecta între mai multe tipuri de ieşiri ale unei
interogări, şi anume: tabela fizică (data table – opţiunea implicită), tabela virtuală (data view)
sau raport (report).
În SAS Enterprise Guide, instrumentul care permite să se construiască specificaţiile unei interogări
poartă denumirea de Query Builder. În Query Builder, interogările se fac pornind de la un
anumit set de date. Implicit, ele se deschid fără a avea selectată nici o coloană a tabelei. Înainte de a
rula o interogare, trebuie să se adauge cel puţin o coloană. Proprietăţile unei coloane pot fi
modificate, incluzând numele (alias-ul), eticheta sau formatul. Prin intermediul a trei tab-uri sunt
oferite diferite funcţionalităţi ale Query Builder: Selecta Data, Filter Data şi Sort Data.
În continuare vor fi prezentate facilităţile oferite de Query Builder. Ecranul principal al Query
Builder este prezentat în figura IV.4.6.

Figura IV.4.6. Ecran principal Query Builder

Query Builder se deschide având afişate, în fereastra de tabele, tabelele selectate în cadrul
interogării, oferindu-i utilizatorului şi posibilitatea de adăuga la acestea noi tabele (prin
intermediul opţiunii Add Tables) de a şterge tabele (cu opţiunea Delete) iar dacă se combină
date din surse diferite, cu ajutorul opţiunii Join se poate specifica tipul de joncţiune care se va
utilize (figura IV.4.7.)

Figura IV.4.7. Opţiunea Join

În mod implicit, în interogare nu este inclusă nici o coloană. Pentru a adăuga coloane, fie se
selectează coloana şi se trage (drag and drop) în tab-ul Select Data, fie se realizează dublu-clic
pe numele coloanei din listă (figura IV.4.8).

Figura IV.4.8. Opţiunea Select Data


Prin intermediul opţiunii Select Data:
 se pot selecta, ordona sau şterge coloane din interogare;
 se pot modifica proprietăţile coloanelor;
 se pot specifica alias-uri pentru coloane;
 se pot grupa datele;
 se pot calcula noi coloane;
 se pot defini parametri;
 se poate valida codul interogării;
 se poate vizualiza codul sau rezultatele interogării, utilizând butoanele din partea dreaptă
a zonei Select Data sau pe cele din partea de sus a ecranului (figura IV.4.9.).

Figura IV.4.9. Butoane Select Data

Într-o interogare se poate insera o nouă coloană care să fie coloană calculată pe baza altor
coloane sau valori. O coloană calculată poate fi folosită pentru a agrega valori, a înlocui valori
pornind de la o anumită condiţie sau a efectua calcule. După crearea unei coloane calculate,
aceasta poate fi folosită pentru sortarea sau gruparea rezultatelor.
Există posibilitatea aplicării unei funcţii de agregare pe oricare dintre coloanele interogrării.
După crearea unei coloane agregate sau a unei coloane calculate care conţine o funcţie de
agregare, pentru ca rezultatele să aibă o semnificaţie, datele pot fi grupate în funcţie de valorile
unei coloane. Această operaţie este echivalentă cu folosirea clauzei GROUP BY într-o
interogare SQL. De exemplu, dacă vrem să calculăm înalţimea medie a unui grup de elevi, vom
grupa rezultatele în funcţie de vârstă, pentru a vedea înălţimea medie pentru fiecare grupă de
vârstă. Implicit, atunci când rulăm o interogare, aceasta este grupată după toate coloanele pe
care trebuie să le afişeze, şi nu va calcula funcţiile de agregare pentru un anumit grup de valori.
Pentru a specifica variabila de grupare dorită se debifează opţiunea Automatically select
groups şi apoi Edit Groups (figura IV.4.10).
Figura IV.4.10. Gruparea rezultatelor după o anumită coloană

Prin intermediul facilităţii de recodificare a unei coloane se permite crearea unei coloane
calculate prin recodificarea unei valori individuale sau a unui domeniu de valori. Acesata mai
poartă şi denumirea de înlocuire a valorilor după anumite criterii. Recodificarea este o modalitate
eficientă de grupare a valorilor. Facilitatea de calculare efectivă a unei coloane permite folosirea
editorului avansat de expresii. Dacă în cadrul opţiunii Select Data se doreşte gruparea datelor, se
pot utiliza facilităţile din zona Summary pentru a realiza subseturi de date grupate pe baza unor
condiţii specificate de utilizator.
Prin intermediul opţiunii Filter Data, utilizatorul poate selecta numai acele rânduri care corespund
unui anumit criteriu bazat pe valorile din anumite coloane (figura IV.4.11). Pentru a realiza acest
lucru, fie se selectează numele coloanei şi se trage în zona filtrului, fie se realizează dublu-clic pe
numele coloanei din listă. Condiţiile de filtrare se definesc în fereastra New Filter.

Figura IV.4.11. Opţiunea Filter Data


Se pot defini două tipuri de filtre: filtre simple şi filtre avansate. Pentru un filtru simplu,
trebuie selectat operatorul de comparaţie şi introduse valorile sau valoarea de comparat. Aceste
valori pot fi preluate şi din valorile câmpului respectiv stocate în tabela SAS corespunzătoare.
Dacă în câmpul Value trebuie să introducem valori nenumerice, atunci acestea trebuie incluse
între ghilimele şi trebuie să se ţină cont de faptul că valorile sunt case-sensitive.
Pentru filtrele avansate, se pot crea expresii complexe prin intermediul unui editor de expresii
avansate. Operatorii de comparaţie disponibili includ operatori standard, dar şi operatori avansaţi
ca cei din tabelul IV.4.1.

Tabel IV.4.1. Operatorii de comparaţie

Operator Exemplu
In a list of values IN ("DB","IL")
Between venit BETWEEN 1200 AND 2000
Is null | Is missing Realizează un test pentru valorile lipsă
nume =* "smith"
Sounds like
găseşte Smythe, Smith etc.
ţara contains "US"
Contains
găseşte "USA", "RUSIA" etc.
Realizează o căutare bazată pe caractere speciale.
Semnul procent (%) înlocuieşte oricâte caractere.
Matches pattern Semnul underscore (_) înlocuieşte un caracter.
nume like "R_D%"
găseşte RADULESCU, RADU, RODICA etc.

Combinarea filtrelor - Atunci când se creează unul sau mai mai multe filtre asupra datelor, se
poate specifica dacă relaţiile dintre filtre sunt de tip AND sau OR. De asemenea, pentru condiţii
complexe, filtrele pot fi grupate.
Pentru a sorta datele în funcţie de valorile din una sau mai multe coloane se adaugă coloana în
tab-ul Sort Data, de selectează ordinea de sortare (ascendentă sau descendentă).
Ordinea de sortare va fi definită de ordinea în care sunt adăugate coloanele în tab-ul Sort Data
(figura IV.4.12.)
Figura IV.4.12. Opţiunea Sort Data

Când interogarea a fost finalizată, prin intermediul butonului Run ea va fi procesată. Pe ecran (în
fereastra principală) vor apărea rezultatele şi în proiect va fi adăugat un element specific
interogării. Aceasta va putea fi redeschisă efectuând dublu-clic pe elementul corespunzător din
fereastra Project Tree (figura IV.4.13.).

Figura IV.4.13. Rezultatele unei interogări

Pornind de la specificaţiile unei interogări, Query Builder generează cod SQL (Structured
Query Language), ceea ce înseamnă că, pentru a realiza o largă varietate de interogări de bază
sau avansate, nu este necesar ca utilizatorul să deţină cunoştinţe de informatică, dar dacă
utilizatorul este familiarizat cu limbajul SQL, el poate modifica cu uşurinţă codul generat. De
exemplu când se selectează anumite rânduri, prin intermediul opţiunii Filter Data, Query
Builder crează o clauză WHERE bazată pe informaţiile specificate de utilizator. În figura
IV.4.14. este prezentat un exemplu de cod generat (procedură SQL) de către Query Builder.

Figura IV.4.14. Exemplu de cod

IV.4.2.1. Setarea opţiunilor unei interogări

Meniul Options din Query Builder permite setarea opţiunilor pentru o anumită interogare sau
opţiuni implicite pentru toate interogările (figura IV.4.15.). Dacă s-a selectat Defaults for All
Queries, pe ecran va apărea fereastra Options. Opţiunile care vor fi setate prin intermediul
acestei ferestre vor fi aplicate tuturor interogărilor care vor fi procesate de aici înainte.
Dacă se selectează Options for This Query, pe ecran se va deschide fereastra Result
Options. Opţiunile care vor fi setate prin intermediul acestei ferestre vor rescrie opţiunile
implicite care au fost setate prin intermediul ferestrei Options (figura IV.4.14).

Figura IV.4.15. Setarea opţiunilor interogării

După ce interogarea a fost procesată, pot fi setate câteva opţiuni, prin intermediul ferestrei
Properties. Această fereastră poate fi deschisă realizând clic-dreapta pe icoana pentru
interogare din fereastra Project Tree şi apoi selectând Properties. Pentru a aplica
schimbările făcute, interogarea va trebui rulată, rezultatele putând fi suprascrise sau
salvate separat.
Setarea opţiunilor pentru o interogare specifică – utilizând fereastra Query Options à
Results, Server pot fi schimbate opţiuni ca tipul formatului rezultatului, numele datelor de
ieşire şi locul în care acestea vor fi salvate precum şi serverul unde va fi procesată interogarea
(figura IV.4.16.).

Figura IV.4.16. Setarea opţiunilor rezultatelor interogării

În zona Output data din Results pot fi văzute şi schimbate numele datelor de ieşire şi
biblioteca unde ele vor fi salvate. În mod implicit, SAS Enterprise Guide salvează datele de
ieşire ale unei interogări în prima bibliotecă în care se poate scrie: Egtask, Sasuser şi Work.
De asemenea, pot fi definite biblioteci adiţionale. Se poate utiliza opţiunea Change pentru a
specifica utilizarea unei biblioteci diferite pentru a salva datele de ieşire.
În zona SAS server for this query din Server, se poate vizualiza şi schimba serverul care va
fi utilizat pentru procesarea interogării. Dacă se doreşte schimbarea serverului utilizat, se
efectuează clic pe lista drop-down Server şi se selectează unul dintre serverele pentru care există
permisiunea de acces.
În mod implicit, SAS Enterprise Guide execută interogarea pe serverul pe care a fost rezidentă
prima tabelă inclusă în interogare.
Orice date din interogare care sunt rezidente pe alte servere sunt copiate temporar pe serverul pe
care se procesează interogarea. Deoarece este de preferat să se minimizeze volumul de date
copiate între servere, este bine ca cea mai mare tabelă să fie introdusă prima în înterogare.

IV.4.2.2. Specificarea formatului rezultatelor unei interogări

După terminarea introducerii în Query Builder a specificaţiilor interogării, se pot genera


rezultatele acesteia. În acest scop pot fi utilizate mai multe opţiuni de generare a ieşirilor.
Alegerea unui tip de rezultat înainte de rularea interogării este o garanţie a faptului că interogarea va
oferi informaţiile în formatul potrivit. De exemplu, dacă utilizatorul doreşte să vizualizeze rezultatele
interogării într-un browser Web, el poate genera rezultatele sub forma unui raport HTML.
Utilizatorul poate genera rezultatele interogarii în mai multe formate şi anume data table, data
view şi report, fiecare dintre acestea oferind diverse avantaje. Tabelul IV.4.2. prezintă
formatele de rezultate pentru o interogare şi caracteristicile lor.

Tabel IV.4.2. Formatele de rezultate pentru o interogare

Format Caracteristicele datei Rezultate interogare


rezultat
Data table Stocată permanent, putând O tabelă statică asupra căreia se pot realiza
fi utilizată şi în alte scopuri prelucrări. Rezultatele nu sunt actualizate până
la reexecutarea interogării.
Data view Actualizată  în permanenţă O viziune dinamică a datelor asupra căreia se
pot realiza prelucrări. De fiecare dată când
rezultatele interogării sunt deschise, acestea
sunt actualizate pentru a reflecta schimbările
care s-au realizat, între timp, asupra datelor
incluse în interogare.
Report Formatat pentru Un raport în formatul care este specificat ca
prezentare  implicit (HTML, PDF, RTF text sau raport
SAS). Rezultatele nu sunt actualizate până la
reexecutarea interogării. Nu se pot efectua
prelucrări asupra acestui format de rezultat.

Data view - Dacă o tabelă de date (data table) stochează datele efective, o tabelă virtuală (data
view) conţine numai logica necesară pentru regăsirea datelor care sunt stocate în alte locaţii.
Data view-urile permit citirea dinamică a datelor fără a folosi spaţiul fizic de stocare de pe disc
pentru crearea unei noi tabele.
Acest tip de format de ieşire pentru o interogare este util deoarece:
 Salvează spaţiul de memorie prin dimensiunile lor reduse;
 Asigură faptul că seturile de date de intrare sunt întotdeuna actualizate;
 Pot ascunde de utilizatori anumite coloane confidenţiale, pot conţine coloane calculate fără
să existe vizibilitate asupra coloanelor implicate în calcul, permiţându-le în acelaşi timp să
vadă alte coloane;
 Ascund utilizatorului joncţiuni sau interogări complexe.
Setarea opţiunilor unei interogări pentru a genera ieşiri într-un anumit format şi creşterea
numărului de rânduri afişate în fereastra Preview se realizează conform următorilor paşi
(figurile IV.4.17., IV.4.18, IV.4.19)
1. În fereastra Project Tree sunt afişate seturile de date care vor fi utilizate.
2. Se selectează Tools Options.

Figura IV.4.17. Setarea Options

3. În Query, se realizează clic în box-ul Number of rows to display in preview results


window în care sa va introduce valoarea dorită (numărul de rânduri care se doreşte să fie
afişate în fereastra Preview).

Figura IV.4.18. Setarea opţiunilor unei interogări pentru a creşte numărul de rânduri care
sunt afişate în fereastra Preview

4. Se realizează clic pe lista, de tip drop-down, Save query result set as şi se selectează
formatul dorit (Data table, Data view sau Report – HTML etc). Clic OK.
Figura III.4.19. Setarea opţiunilor unei interogări pentru a genera ieşiri într-un anumit
format

IV.4.2. Crearea unei interogări pe o anumită tabelă şi adăugarea de coloane

Pentru crearea unei interogări trebuie să se parcurgă următorii paşi:


1. În fereastra Project Tree, se selectează tabela dorită pentru a face ca datele ei să
devină active.
2. Se selectează Query Bulider.
3. Se realizează dublu-clic pe coloanele dorite sau vor fi trase direct cu mouse-ul (în
aceiaşi ordine), pentru a le adăuga în tab-ul Select Data. În acest moment interogarea va
conţine coloanele care vor fi introduse în raport – figura IV.4.20.

Figura IV.4.20. Crearea unei interogări pe o anumită tabelă şi adăugarea de coloane

Crearea unei coloane calculate prin construirea unei expresii de calcul

Query Builder permite crearea unei noi coloane pe baza valorilor datelor din alte coloane, prin
specificarea, în fereastra Build an advanced expression, a expresiei care va fi folosită pentru
calculul valorilor. Acest lucru se poate realiza fie tastând expresia direct în zona Enter an
expression aflată în partea de sus a ferestrei, fie construind expresia prin selectarea valorilor şi a
operatorilor. Pentru calcule, se poate selecta o coloană a unei tabele de date din lista talelelor
disponibile în lista Tables. De asemenea, se pot regăsi valorile unor coloane individuale apasând
butonul Get Values. Aceste valori pot fi folosite ulterior în cadrul expresiilor (figura IV.4.21).
Figura IV.4.21. Utilizarea ferestrei Build an advanced expression

În scopul calculului valorilor unei coloane se pot utiliza, de asemenea, şi funcţiile. O funcţie
preia o valoare şi o transformă în altă valoare, SAS Enterprise Guide dispunând de o multitudine
de funcţii predefinite.
O expresie poate fi creată prin intermediul funcţiilor, efectuând clic pe opţiunea Functions
(figura IV.4.22.) aflat în partea de jos a ferestrei Build an advanced expression. Aceasta
permite afişarea tuturor funcţiilor grupate în categorii, precum şi afişarea tuturor funcţiilor, în
ordine alfabetică. Odată selectată o funcţie, va fi afişată adiacent şi o descriere a sintaxei
acesteia. De exemplu funcţia QTR schimbă data calendaristică într-o valoare corespunzătoare
trimestrului (1-4). Multe dintre funcţii necesită un parametru, iar comentariul afişat în expresie
indică tipul valorii care va trebui utilizat. De exemplu, funcţia QTR necesită o valoare numerică
sau o coloană cu valori numerice.

Figura IV.4.22. Utilizarea funcţiilor predefinite


IV.4.3. Exemplu de creare a unei interogări

O să presupunem că a fost ales ca format de ieşire implicit raportul HTML. În continuare se va


crea o interogare referitoare la nivelul stocurilor pentru diverse produse din cadrul unei firme.
Raportul trebuie să arate, pentru fiecare produs, care este cantitatea existentă în stoc şi cantitatea
care a fost comandată pentru reaprovizionare. Raportul va arăta ca cel din figura IV.4.23.

Figura IV.4.23. Exemplu de raport


Pentru crearea raportului se va utiliza tabela Produse, care conţine următoarele tipuri de informaţii:
cod produs, nume produs, cod furnizor, cod categorie, cantitatea pe unitatea de ambalare, preţ
unitar, unităţi în stoc, unităţi în comandă, nivelul de aprovizionare, dacă produsul a fost sau nu
discontinuu.
O imagine parţială a tabelei Produse este prezentată în figura IV.4.24.

Figura IV.4.24. Tabela Produse


Pentru realizarea interogării se vor parcurge următorii paşi:
1. În fereastra Project Tree, se selectează tabela Produse pentru a face ca datele ei să
devină active.
2. Se apasă butonul Query Builder. În mod implicit, interogarea nu va include nici o
coloană. Pentru a se realiza raportul trebuie:
 să se selecteze coloane din coloanele existente ale tabelelor disponibile;
 să se calculeze noi coloane pe baza unora existente;
 să se sorteze rândurile pe baza unor criterii.
Utilizând tabela Produse, în raport vor fi afişate următoarele coloane: nume produs, unităţi în
stoc, unităţi în comandă şi nivelul de aprovizionare. De asemenea, se va calcula o coloană nouă
şi anume valoare stoc. Rândurile vor fi sortate după valoare stoc în ordine descendentă.
În continuare vor fi prezentaţi paşii pentru realizarea acestei interogări.
Selectarea coloanelor pentru rezultatele interogării.
3. Se realizează dublu-clic pe urmăroarele coloane sau vor fi trase direct cu mouse-ul (în
aceiaşi ordine): nume produs, unităţi în stoc, unităţi în comandă şi nivelul de aprovizionare,
pentru a le adăuga în tab-ul Select Data (figura IV.4.25.).

Figura IV.4.25. Selectarea coloanelor incluse în interogare

În acest moment interogarea va conţine coloanele care vor fi introduse în raport.


Adăugarea unei coloane calculate
În noua coloană adăugată se va calcula valoarea totală a stocului fiecărui produs. În
exemplul precedent a fost creată o interogare pe tabela Produse şi au fost adăugate în interogare
coloanele selectate din tabelă. În continuare va fi creată o nouă coloană calculată numită valoare
stoc. Valorile din această coloană vor fi obţinute prin înmulţirea valorilor coloanelor preţ unitar
şi unităţi în stoc.
a) Specificarea expresiei care va fi utilizată pentru crearea valorilor noii coloane.

1. În Query Builder, se realizează clic pe Computed Columns (figura IV.4.26.).

Figura IV.4.26. Computed Columns

2. În fereastra Computed Columns, se realizează clic pe New şi se selectează


Advanced expression (figura IV.4.27.).

Figura IV.4.27. Selectarea ecranului pentru construirea expresiei


3. În lista Tables, se realizează dublu-clic pe preţ unitar.

4. Se realizează clic pe operatorul de multiplicare (figura IV.4.28.).

Figura IV.4.28. Construirea expresiei

5. În lista Tables, se realizează dublu-clic pe unitaţi în stoc.


6. Se realizează clic pe butonul OK.

b) Specificarea numelui pentru noua coloană şi a formatului.


1. Se apasă butonul Next şi se redenumeşte coloana calculată (figura IV.4.29.).

Figura IV.4.29. Opţiuni pentru coloana calculată


2. Se tastează numele variabilei, respectiv Valoare stoc (figura IV.4.30.).

Figura IV.4.30. Redenumirea coloanei calculate

3. Se finalizează definirea coloanei calculate prin apăsarea butonului Finish şi se observă


că aceasta va fi adăugată la coloanele tabelei care va rezulta în urma interogării (figura
IV..4.31.).

Figura IV.4.31. Crearea coloanei calculate


4. În tab-ul Select Data, se selectează Valoare Stoc şi se realizează clic pe butonul

Properties . (figura IV.4.32.)

Figura IV.4.32. Vizualizarea butonului Properties

5. În mod implicit nu este specificat niciun format. Pentru a-l seta se va efectua clic pe
butonul Change (figura IV.4.33).

Figura IV.4.33. Modificarea proprietăţilor coloanei calculate


6. În lista Categories se selectează Currency. În lista Formats se selectează
EUROLw.d.
7. Se realizează clic în box-ul Overall width unde se introduce valoarea 12 (figura
IV.4.34.).

Figura IV.4.34. Setarea formatului valorilor coloanei calculate

8. Prin clic pe butonul OK se închide fereastra Formats.


9. Prin clic pe butonul OK se închide fereastra Properties.
Se vor repeta aceiaşi paşi pentru a crea coloana calculată valoare comandă.
c) Sortarea valorilor din coloană şi execuţia unei interogări
Pentru a completa interogarea se vor sorta datele în ordinea descendentă a valorilor din coloana
Valoare stoc, apoi se va executa interogarea şi se va obţine raportul.
Specificarea ordinii de sortare pentru ieşiri.
1. Se execută clic pe tab-ul Sort Data (figura IV.4.35.).
Figura IV.4.35.Tab-ul Sort Data

2. În zona Computed Columns, se realizează dublu-clic pe valoare stoc.


3. Se execută clic pe lista drop-down Sort Direction şi se selectează Descending (figura
IV.4.36).

Figura IV.4.36. Selecţia ordinii de sortare

Execuţia interogării şi vizualizarea rezultatelor se realizează în felul următor:


1. În fereastra Query Builder, se execută clic pe butonul Run.
2. În fereastra Project Tree, se realizează clic pe numele implicit al interogării,
Query_for_Products, pentru a-l redenumi Valoare Stoc şi pentru a o vizualiza (figurila
IV.4.37.).

Figura IV.4.37. Vizualizare interogare

S-ar putea să vă placă și