Documente Academic
Documente Profesional
Documente Cultură
SAS Enterprise Guide 1
SAS Enterprise Guide 1
Trebuie menţionat faptul că SAS Enterprise Guide nu este o alternativă a SAS, ci poate fi
considerat o extensie a acestuia care permite un mod alternativ de lucru şi care nu poate
funcţiona în absenţa unui motor SAS.
Utilizatorii având diverse niveluri de experienţă (de la începători până la experţi) pot utiliza SAS
Enterprise Guide pentru a obţine rapid rezultate semnificative.
Interfaţa de ultimă generaţie a SAS Enterprise Guide oferă: funcţionalitate de tip drag-and-drop;
ferestre de dialog pentru introducerea parametrilor prelucrărilor şi efectuarea de setări prin
instrumente de tip wizard; editor de sintaxă pentru scrierea programelor, cu evidenţierea în culori
diferite a elementelor codului; facilităţi de Help Online, help senzitiv la context şi tutorial de
iniţiere.
Utilizând SAS Enterprise Guide, se pot accesa modulele SAS fără să fie nevoie să se înveţe
limbajul de programare în SAS. Dacă utilizatorul este programator SAS, el poate utiliza editorul
de cod al pachetului de programe pentru a crea cod nou sau pentru a modifica programe SAS
existente (figura IV.2.1.).
SAS
SAS pe Windows
pe Windows
SAS
SAS pe
Mainframe
pe Mainframe
Cod Rezultate
SAS
pe UNIX
SAS
SAS Enterprise
pe UNIX
Guide
SAS Enterprise Guide
Când informaţiile despre obiecte sunt stocate, SAS Enterprise Guide se conectează, de asemenea,
la un depozit de metadate SAS. În figura IV.2.3. SAS Enterprise Guide este conectat la un server
SAS la distanţă şi la un depozit de metadate SAS.
Figura IV.2.3. Conectarea SAS Enterprise Guide la un server SAS la distanţă şi la un
depozit de metadate SAS
La lansarea în execuţie a produsului SAS Enterprise Guide, ferestrele sunt aranjate în mod
implicit ca în figura IV.2.4.
Arborele
proiectului Fereastra
principala/spaţiul de lucru
unde se vizualizează
fluxul de proces
Fereastra
de resurse
Prelucrări în execuţie
Interfaţa implicită constă din patru ferestre principale şi anume: fereastra arborelui proiectului
(Project Tree), fereastra principală sau spaţiul de lucru unde se vizualizează fluxul de proces
(Process Flow), fereastra prelucrărilor (Task Status) şi fereastra resurselor (formată din mai
multe ferestre).
Dacă utilizatorul îşi personalizează interfaţa, prin închiderea, deschiderea sau schimbarea poziţiei
ferestrelor, modificările sunt salvate la ieşirea din SAS Enterprise Guide. Dacă se doreşte să se
restaureze modul de vizualizare implicit, din meniul principal se vor selecta opţiunile Tools
Options General şi de acolo Restore Window Layout. Dacă una dintre ferestre a fost
închisă şi se doreşte restaurarea ei, din meniul View se va selecta numele ei.
Fereastra de resurse (Resources pane) şi spaţiul de lucru (Process Flow) constituie
elemente ale interfeţei în care sunt rezidente mai multe ferestre. Implicit, se poate vizualiza o
sigură fereastră în aceste zone (opţiunea Show One), dar este posibilă divizarea lor pentru a
permite vizualizări multiple prin selectarea butonului săgeată în jos, opţiunea Show Multiple şi
selectarea ferestrelor dorite. Pentru vizualizarea secvenţială a ferestrelor din fereastra aferentă
resurselor se apasă pictogramele corespunzătoare, respectiv Tasks, SAS Folders, Server
List, Prompt Manager sau Data Exploration History. Totodată, în interiorul spaţiului de
lucru, sunt aplicate mare parte din funcţiile SAS Enterprise Guide aflate la dispoziţia
utilizatorului. De aceea, înainte de a diviza acest spaţiu, este utilă o maximizare a sa, folosind
opţiunea ViewMaximize Workspace din bara de meniu. Odată cu această maximizare,
ferestra arborelui proiectului şi zona resurselor sunt minimizate şi fixate pe marginea din stânga a
interfeţei. Se revine la starea iniţială tot prin opţiunea ViewMaximize Workspace.
În SAS Enterprise Guide, toată activitatea desfăşurată este salvată în proiecte. Un proiect este o
colecţie de date aferente, sarcini, programe şi rezultate.
Ferestra Project Tree afişează o structură ierarhică a proiectului activ. Atunci când se crează un
nou proiect, ferestra Project Tree este goală. Pe măsură ce se adaugă date, se execută prelucrări sau
se generează rezultate, în ferestră vor fi adăugate pictograme pentru fiecare dintre aceste obiecte.
Ele sunt văzute ca obiecte ale unui proiect. Se poate reveni la o prelucrare a datelor în arborele
proiectului, modifica şi rula din nou pentru a obţine un set nou de rezultate ce pot fi salvate separat
sau pot fi suprascrise peste rezultatele prelucrării anterioare.
Pentru deschiderea unui nou proiect, dacă SAS Enterprise Guide nu este deja deschis, se
lansează în execuţie şi din fereastra principală se selectează opţiunea New Project, în caz
contrar, se vor selecta opţiunile File New Project. În acest moment noul proiect va fi
deschis, având ferestrele Project Tree şi Process Flow goale.
Un proiect şi conţinutul acestuia poate fi salvat în orice locaţie, inclusiv într-un alt server, ca un
singur fişier. În acest scop se vor parcurge următorii paşi:
1. Se selectează opţiunile File Save Project As;
2. La deschiderea ferestrei Save se va stabili şi selecta dacă proiectul va fi salvat în
calculatorul local sau pe server, după care se selectează opţiunea My Computer;
3. În fereastra Save se selectează locaţia pentru proiect, în câmpul File name se introduce numele
proiectului (care se va salva cu extensia .egp).
4. Se efectuează clik pe butonul Save.
Fereastra fluxului de proces (Process Flow) este formată din mai multe ferestre, putând
fi deschisă fie selectând-o din meniul View, făcând dublu clic pe numele său în ferestra arborelui
proiectului (Project Tree), selectând din lista care apare deasupra spaţiului de lucru, din lista de
pe bara de meniu sau apăsând tasta F4. Ferestra fluxului de proces este formată din ferestre ce
conţin datele, rezultatele, programele SAS (codul), informaţii privind execuţia (engl. logs) sau
note, existând un tip special de pictogramă pentru fiecare tip de document. Spre exemplu, în
figura IV.2.5. fluxul de proces conţine date, rezultate, prelucări şi programe SAS.
Exemple de pictograme utilizate de SAS Enterprise Guide sunt prezentate în tabelul IV.1.
Tabelul III.1. Exemple de pictograme din arborele proiectului
Datele dintr-un proiect pot fi tabele de date SAS, fişiere flat care conţin date sau alte
fişiere de date ale unor Sisteme de Gestiune a Bazelor de Date sau aplicaţii.
Proiectele conţin referinţe la date şi nu datele propriu-zise. Pictograma reprezintă un
set de date SAS.
Prelucrările reprezintă analize sau rapoarte specifice care pot fi executate, cum ar fi
rapoarte listă (List Data) sau grafice cu bare verticale (Bar Chart). Atunci când se
rulează o prelucrare, SAS Enterprise Guide adaugă o pictogramă reprezentând
prelucrarea respectivă în feresatra fluxului de proces şi a arborelui proiectului.
Pictograma reprezintă o prelucrare de tip grafic cu bare verticale.
Rezultatele sunt rapoarte sau grafice produse în urma execuţiei prelucrărilor.
Rezultatele sunt reprezentate prin pictograme diferite în funcţie de tipul fişierului
rezultat (raport SAS, HTML, PDF, RTF sau text). Pictograma reprezintă un rezultat în
formatul raport SAS.
Notele sunt fişiere text opţionale folosite pentru documentarea unui proiect sau
pentru a consemna comentarii sau instrucţiuni pentru utilizările ulterioare.
Programele sunt fişiere care conţin cod SAS.
Arborele proiectului (Project Tree) afişează o vizualizare ierarhică a proiectului activ şi date
asociate, programe, note şi rezultate (a se vedea figura IV.2.4). Fereastra Project Tree poate fi
folosită pentru a gestiona obiectele din proiect. Într-un proiect se pot crea noi fluxuri de proces şi se
pot muta sau copia obiecte între fluxurile de proces. De asemenea, se poate executa doar o porţiune
a unui flux de proces, sau întregul flux, imediat sau poate fi programat pentru o execuţie ulterioară.
Fereastra Task Status este o parte a interfeţei SAS Enterprise Guide utilizată pentru a afişa date,
cod, informaţii privind execuţia (log-uri), rezultatele activităţilor şi a fluxurilor de proces.
Înainte de rulare, fereastra aferentă fluxului de proces este singura fereastră deschisă în zona de lucru.
Când se generează rapoarte sau se deschid fişiere de date, în spaţiul de lucru de deschid mai multe
ferestre, ce pot fi accesate cu uşurinţă.
În SAS Enterprise Guide, task-urile sunt utilizate pentru realizarea oricărei activităţi, de la
manipularea datelor, la derularea procedurilor analitice specifice sau la crearea de rapoarte. Multe
task-uri sunt, de asemenea disponibile ca wizard-uri, care conţin un număr limitat de opţiuni şi care
pot oferi o modalitate rapidă şi uşoară de a utiliza o parte dintre aceste task-uri. Task-urile şi wizard-
urile pot fi alese utilizând lista de activităţi (Tasks) sau prin utilizarea meniului principal.
În mod implicit Tasks este ascunsă, dar ea poate fi vizualizată apăsând butonul Tasks din
fereastra de resurse aflat în colţul din stânga jos al spaţiului de lucru. Tasks permite mai multe
moduri de vizualizare (figura IV.2.6) vizualizează task-rile în ordine alfabetică, recente, favorite,
filtrate etc.
Fereastra de stare a activităţulor (Task Status) afişează mesaje despre starea task-urilor aşa
cum acestea sunt prelucrate (figura IV.2.6). Fereastră Task Status nu este afişată în mod
implicit, dar ea poate fi vizualizată prin selectarea opţiunilor View Task Status. Fereastra
Process Flow afişează, de asemenea, o culoare de fundal diferită în jurul task-ului activ, pentru
fiecare fază de prelucrare.
Figura IV.2.6. Fereastra Task Status
În esenţă, formatele de fişiere suportate de SAS Enterprise Guide pot fi clasificate în trei
categorii:
1. Tabele de date SAS, care sunt formate specifice ale pachetului de programe SAS. Pentru a
putea fi supuse prelucrărilor, toate celelalte tipuri de formate suportate de pachetul SAS
trebuie tranformate în tabele de date SAS.
2. Fişiere flat conţin înregistrări între care nu există nici o inter-relaţionare. Avantajul este acela
că ocupă mai puţin spaţiu decât fişierele structurate. Totuşi, necesită ca aplicaţia care le
foloseşte să cunoască modul în care datele sunt organizate în fişier. Exemple de fişiere flat
sunt fişiere text, fişiere ASCII sau fişiere secvenţiale.
3. Fişiere ale altor aplicaţii software cum ar fi Microsoft Access sau Paradox. Nu este nevoie
să se instaleze software adiţional pentru a citi date în următoarele formate: dBASE, HTML,
IBM Lotus 1-2-3, Microsoft Access, Microsoft Excel, Microsoft Exchange, Paradox.
Totuşi, pentru fişiere de dimensiuni mari, se pot îmbunătăţi performanţele aplicaţiei prin
utilizarea software-ului SAS/ACCESS. În acest sens, în funcţie de tipul de fişier care va fi citit,
interfeţete SAS/ACCESS to PC Files sau SAS/ACCESS to ODBC trebuie instalate pe acelaşi
calculator pe care este instalat şi SAS.
Deşi se pot deschide şi rula task-uri pe diverse tipuri de date, dacă se doreşte editarea acestor
date, ele trebuie deschise ca un set de date SAS. În acest scop SAS Enterprise Guide permite
importul a diverse tipuri de fişiere de date pentru crearea seturilor de date SAS.
Într-un fişier text delimitat fiecare linie de text reprezintă o înregistrare, iar câmpurile sunt
separate prin caractere cunoscute. Delimitatorii frecvent utilizaţi sunt caracterul tab (\t) sau
diferite caractere de punctuaţie. Delimitatorul trebuie întotdeuna să fie un caracter care nu
se regăseşte în date. Astfel de fişiere se pot crea facil folosind aplicaţii de calcul tabelar sau
pentru baze de date (ex. Microsoft Excel, Microsoft Access, în Excel: File Save AS,
Text (Tab delimited)). Un astfel de fişier poate conţine numele, prenumele şi vârsta
persoanelor, delimitate prin simbolul linie verticală (|):
Popescu|Maria|35
Ionescu|Damian|42
Diamandescu|Victor|29
Date compatibile cu standardul ODBC şi OLE DB. ODBC (Open DataBase Connectivity)
este o metodă standard de accesare a bazelor de date care permite accesul la orice date din
cadrul oricărei aplicaţii, indiferent de sistemul de gestiune a bazelor de date care gestionează
datele. ODBC realizează acest lucru prin inserarea unui strat de mijloc (middle layer), numit
driver de baze de date, între aplicaţie şi SGBD. Scopul acestui strat este de a transforma
interogările aplicaţiei în comenzi pe care un SGBD le înţelege. În acest sens, atât aplicaţia,
cât şi SGBD-ul trebuie să fie compatibile cu standardul ODBC, adică aplicaţia trebuie să fie
capabilă să genereze comenzi ODBC, iar SGBD-ul trebuie să fie capabil să răspundă la
acestea. OLE DB (Object Linking and Embedding, Database) este o interaţă API proiectată
de Microsoft pentru accesarea diferitelor tipuri de date stocate într-o manieră uniformă. OLE
DB include şi capabilităţile ODBC.
Datele în format SAS (sau tabele SAS), Foi de calcul Microsoft Excel, Fişiere dBase,
Tabele HTML, Tabele Microsoft Access. Pentru a putea fi accesate de SAS EG, datele
trebuie să fie reprezentate în format tabelar (ca o mulţime de linii şi coloane). O linie (rând)
reprezintă o instanţă a unei entităţi. Entitatea poate fi un produs, un client, o comandă sau
orice alt lucru. Fiecare coloană (variabilă) descrie caracteristicile entităţii, cum ar fi codul de
identificare al unui produs, numele clientului sau cantitatea vândută (figura IV.3.2.)
Toate coloanele trebuie să aibă un nume, un tip şi o lungime. Numele pot avea o lungime de la 1 la
32 de caractere, iar eticheta ataşată unei coloane poate avea lungimea de maxim 265 de caractere.
Unul dintre cele mai importante lucruri care trebuie ştiute despre date este ce tip de date conţine
fiecare coloană (sau variabilă). SAS priveşte datele ca fiind fie de tip caracter, fie de tip numeric.
În cazul în care datele dintr-o coloană conţin doar litere, aceasta are date de tip caracter. Valorile
de tip caracter pot avea lungimea între 1 si 32,767 caractere (octeţi). În cazul în care datele dintr-
o coloană conţin numere, aceasta poate fi de tip caracter sau numeric.
Datele numerice sunt grupate în patru categorii de date, în funcţie de modul în care acestea sunt
afişate. Figura IV.3.3 arată ce simbol este asociat fiecărui tip de dată precum şi pictogramele
asociate lor. Pictogramele apar în titlurile de coloană ale tabelei de date şi de asemenea, se pot
vedea atunci când se rulează o prelucrare. Aceste simboluri constituie un indiciu despre modul în
care pot fi folosite coloanele sau varibilele în prelucrări.
Formatele de intrare (Informat) sunt, de obicei, folosite pentru a citi într-o variabilă date din
surse externe numite fişiere flat (fişiere text, fişiere ASCII sau fişiere secvenţiale).
Formatele de intrare instruiesc aplicaţiile SAS asupra modului în care trebuie să citească datele
într-o variabilă SAS. Sunt, de obicei, grupate în trei categorii: caracter, numeric şi dată/timp
(figura IV.3.4).
Toate formatele de intare trebuie să conţină punctul zecimal (.), astfel încât să se poată face
diferenţa între un format de intrare şi o variabilă SAS.
Formatul de afişare (Format) este folosit pentru a controla modul în care sunt afişate valorile. Un
format de afişare (Format) este o „instrucţiune” care se aplică unei coloane, indicând produsului
SAS Enterprise Guide cum să afişeze valorile datelor (figura IV.3.5). Trebuie reţinut faptul că
formatul de afişare nu afectează modul de stocare a valorilor.
IV.3.4. Metadate
Multe formate de fişiere care memorează date sub formă tabelară includ metadate ca parte a
tabelei (figura IV.3.7.). Metadatele reprezintă informaţii despre datele în sine, cum ar fi
originea/sursa datelor, dimensiunea sau formatul lor. Tabelele SAS, Microsoft Access sau
dBASE sunt exemple de fişiere care conţin metadate stocate în interiorul lor.
Fişierul conţine
metadate.
Fişierul nu conţine
metadate.
Atunci când accesează un astfel de fişier, SAS EG poate accesa metadatele pentru a determina
numele unei coloane, tipul (caracter sau numeric) şi lungimea (dimensiunea). Există şi cîteva
formate de fişiere, cum ar fi foile de calcul Microsoft Excel, tabelele HTML sau fişierele text
care nu conţin metadate. Pentru aceste tipuri de fişiere, SAS EG trebuie să facă anumite deducţii
referitoare la atributele fiecărei coloane. Implicit, SAS EG caută numele coloanei în primul rând al
fişierului şi analizează valorile stocate în câmpuri sau celule pentru a stabili dacă o anumită
coloană trebuie memorată ca şir de caractere sau ca număr. Dacă se stabileşte că o coloană este de
tip caracter, atunci lungimea ei este setată în mod automat ca fiind 255 (octeţi), care este numărul
maxim de caractere permis de motorul de baze de date Microsoft Jet.
Când utilizatorul deschide date în SAS Enterprise Guide, el trebuie să selecteze dacă doreşte să
le preia din computerul local, dintr-un server SAS, sau dintr-un folder SAS (figura IV.3.8).
Figura IV.3.8. Surse de date în SAS Enterprise Guide
În acest moment, setul de date este adăugat în proiect şi deschis în grila de date. În mod implicit
tabela este deschisă în modul citire (Protect Data din Edit). În acest mod, utilizatorul poate
parcurge datele, redimensiona lăţimea coloanelor, ascunde coloane şi rânduri şi poate copia
coloane şi rânduri într-un nou fişier, dar nu poate edita datele decât dacă va trece în modul editare
(Update Mode). Este de remarcat faptul că atunci când se inserează date într-un proiect se
crează referinţe la date, dar SAS Enterprise Guide nu realizează o nouă copie a fişierului.
Pentru a vizualiza proprietăţile unui set de date, în arborele proiectului se selectează fişierul de
date, clic dreapta şi apoi opţiunea Properties. Se va deschide fereastra Properties, în care se
vor putea vedea informaţii referitoare la propietăţile generale, cum ar fi locaţia fizică a datelor şi
data ultimei lor modificări (figura IV.3.11).
Figura IV.3.11. Fereastra Properties
Dacă, în zona de selecţie se optează pentru opţiunea Columns, se va putea vedea lista
coloanelor setului de date precum şi atributele acestor coloane (figura IV.3.12).
În cadrul unui proiect, pentru a adăuga date dintr-o bibliotecă SAS, se vor selecta opţiunile File
Open Data. În fereastra Open Data se va selecta opţiunea Servers (figura IV.3.13). Se
poate ca în fereastră să fie afişate mai multe servere. Server-ul la care este conectat SAS
Enterprise Guide este marcat distinct. Se deschide prin dublu-clic. Dacă SAS Enterprise Guide
nu este conectat la un server se va efectua dublu-clic pe server-ul adecvat pentru a-l conecta şi
deschide. După deschiderea server-ului se va selecta opţiunea Libraries, apoi directorul dorit (în
biblioteci sunt stocate numai seturi de date SAS) şi de acolo setul de date dorit, care va fi adăugat
în proiect şi deschis în fereastra principală.
Figura IV.3.13. Adăugarea datelor dintr-o bibliotecă SAS
- Specifică atributele câmpurilor – în tabela care conţine atributele câmpurilor este selectat
implicit câmpul F1. Se va efectua clic pe butonul Modify pentru a deschide fereastra Field
Attributes pentru câmpul F1. În zonele Name, Label şi Type se vor introduce numele,
etichetă şi tipul pentru acest câmp, apoi se va apăsa butonul OK. Pentru selecţia celorlalte
câmpuri se va efectua dublu clic pe numele lor (respectiv F2, F3 etc.), procedându-se similar
(figura IV.3.16). În final se va apăsa butonul Next pentru a vedea opţiunile avansate şi pentru a
executa procesul de import de date.
Figura IV.3.16. Specificarea atributelor coloanelor
Pentru a elimina din procesul de importare preluarea unui anumit câmp se va deselecta bifa din
box-ul de control aferent câmpului respectiv (figura IV.3.17).
Tabelă Analitică
Depozit de Date
În figura de mai sus se poate observa că există două surse principale pentru datele de analiză:
- Datele tranzacţionale;
- Alte date, cum ar fi date externe, date obţinute din sondaje, date ad-hoc, tabele asociative
(lookup tables), foi de calcul sau fişiere text.
Ambele tipuri de date pot intra direct în tabela analitică sau pot fi regăsite prin intermediul
depozitului de date.
O interogare (“query”) se poate utiliza dacă se doreşte să se analizeze date care sunt localizate în mai
multe tabele sau doar o parte a datelor dintr-o tabelă.
O interogare poate fi utilizată pentru:
Selectarea rândurilor pornind de la una sau mai multe condiţii. Rândurile pot fi
selectate pe baza uneia sau mai multor condiţii. În cadrul rezultatului interogării, rândurile
pot fi ordonate pe baza valorilor din una sau mai multe coloane (figura IV.4.2.).
Gruparea şi agregarea datelor. Datele pot fi împărţite în grupuri pe baza valorilor dintr-o
coloană. În plus, în oricare dintre coloanele unei interogări pot fi introduse funcţii de agregare
(însumare) – figura IV.4.5.
Query Builder se deschide având afişate, în fereastra de tabele, tabelele selectate în cadrul
interogării, oferindu-i utilizatorului şi posibilitatea de adăuga la acestea noi tabele (prin
intermediul opţiunii Add Tables) de a şterge tabele (cu opţiunea Delete) iar dacă se combină
date din surse diferite, cu ajutorul opţiunii Join se poate specifica tipul de joncţiune care se va
utilize (figura IV.4.7.)
În mod implicit, în interogare nu este inclusă nici o coloană. Pentru a adăuga coloane, fie se
selectează coloana şi se trage (drag and drop) în tab-ul Select Data, fie se realizează dublu-clic
pe numele coloanei din listă (figura IV.4.8).
Într-o interogare se poate insera o nouă coloană care să fie coloană calculată pe baza altor
coloane sau valori. O coloană calculată poate fi folosită pentru a agrega valori, a înlocui valori
pornind de la o anumită condiţie sau a efectua calcule. După crearea unei coloane calculate,
aceasta poate fi folosită pentru sortarea sau gruparea rezultatelor.
Există posibilitatea aplicării unei funcţii de agregare pe oricare dintre coloanele interogrării.
După crearea unei coloane agregate sau a unei coloane calculate care conţine o funcţie de
agregare, pentru ca rezultatele să aibă o semnificaţie, datele pot fi grupate în funcţie de valorile
unei coloane. Această operaţie este echivalentă cu folosirea clauzei GROUP BY într-o
interogare SQL. De exemplu, dacă vrem să calculăm înalţimea medie a unui grup de elevi, vom
grupa rezultatele în funcţie de vârstă, pentru a vedea înălţimea medie pentru fiecare grupă de
vârstă. Implicit, atunci când rulăm o interogare, aceasta este grupată după toate coloanele pe
care trebuie să le afişeze, şi nu va calcula funcţiile de agregare pentru un anumit grup de valori.
Pentru a specifica variabila de grupare dorită se debifează opţiunea Automatically select
groups şi apoi Edit Groups (figura IV.4.10).
Figura IV.4.10. Gruparea rezultatelor după o anumită coloană
Prin intermediul facilităţii de recodificare a unei coloane se permite crearea unei coloane
calculate prin recodificarea unei valori individuale sau a unui domeniu de valori. Acesata mai
poartă şi denumirea de înlocuire a valorilor după anumite criterii. Recodificarea este o modalitate
eficientă de grupare a valorilor. Facilitatea de calculare efectivă a unei coloane permite folosirea
editorului avansat de expresii. Dacă în cadrul opţiunii Select Data se doreşte gruparea datelor, se
pot utiliza facilităţile din zona Summary pentru a realiza subseturi de date grupate pe baza unor
condiţii specificate de utilizator.
Prin intermediul opţiunii Filter Data, utilizatorul poate selecta numai acele rânduri care corespund
unui anumit criteriu bazat pe valorile din anumite coloane (figura IV.4.11). Pentru a realiza acest
lucru, fie se selectează numele coloanei şi se trage în zona filtrului, fie se realizează dublu-clic pe
numele coloanei din listă. Condiţiile de filtrare se definesc în fereastra New Filter.
Operator Exemplu
In a list of values IN ("DB","IL")
Between venit BETWEEN 1200 AND 2000
Is null | Is missing Realizează un test pentru valorile lipsă
nume =* "smith"
Sounds like
găseşte Smythe, Smith etc.
ţara contains "US"
Contains
găseşte "USA", "RUSIA" etc.
Realizează o căutare bazată pe caractere speciale.
Semnul procent (%) înlocuieşte oricâte caractere.
Matches pattern Semnul underscore (_) înlocuieşte un caracter.
nume like "R_D%"
găseşte RADULESCU, RADU, RODICA etc.
Combinarea filtrelor - Atunci când se creează unul sau mai mai multe filtre asupra datelor, se
poate specifica dacă relaţiile dintre filtre sunt de tip AND sau OR. De asemenea, pentru condiţii
complexe, filtrele pot fi grupate.
Pentru a sorta datele în funcţie de valorile din una sau mai multe coloane se adaugă coloana în
tab-ul Sort Data, de selectează ordinea de sortare (ascendentă sau descendentă).
Ordinea de sortare va fi definită de ordinea în care sunt adăugate coloanele în tab-ul Sort Data
(figura IV.4.12.)
Figura IV.4.12. Opţiunea Sort Data
Când interogarea a fost finalizată, prin intermediul butonului Run ea va fi procesată. Pe ecran (în
fereastra principală) vor apărea rezultatele şi în proiect va fi adăugat un element specific
interogării. Aceasta va putea fi redeschisă efectuând dublu-clic pe elementul corespunzător din
fereastra Project Tree (figura IV.4.13.).
Pornind de la specificaţiile unei interogări, Query Builder generează cod SQL (Structured
Query Language), ceea ce înseamnă că, pentru a realiza o largă varietate de interogări de bază
sau avansate, nu este necesar ca utilizatorul să deţină cunoştinţe de informatică, dar dacă
utilizatorul este familiarizat cu limbajul SQL, el poate modifica cu uşurinţă codul generat. De
exemplu când se selectează anumite rânduri, prin intermediul opţiunii Filter Data, Query
Builder crează o clauză WHERE bazată pe informaţiile specificate de utilizator. În figura
IV.4.14. este prezentat un exemplu de cod generat (procedură SQL) de către Query Builder.
Meniul Options din Query Builder permite setarea opţiunilor pentru o anumită interogare sau
opţiuni implicite pentru toate interogările (figura IV.4.15.). Dacă s-a selectat Defaults for All
Queries, pe ecran va apărea fereastra Options. Opţiunile care vor fi setate prin intermediul
acestei ferestre vor fi aplicate tuturor interogărilor care vor fi procesate de aici înainte.
Dacă se selectează Options for This Query, pe ecran se va deschide fereastra Result
Options. Opţiunile care vor fi setate prin intermediul acestei ferestre vor rescrie opţiunile
implicite care au fost setate prin intermediul ferestrei Options (figura IV.4.14).
După ce interogarea a fost procesată, pot fi setate câteva opţiuni, prin intermediul ferestrei
Properties. Această fereastră poate fi deschisă realizând clic-dreapta pe icoana pentru
interogare din fereastra Project Tree şi apoi selectând Properties. Pentru a aplica
schimbările făcute, interogarea va trebui rulată, rezultatele putând fi suprascrise sau
salvate separat.
Setarea opţiunilor pentru o interogare specifică – utilizând fereastra Query Options
Results, Server pot fi schimbate opţiuni ca tipul formatului rezultatului, numele datelor de
ieşire şi locul în care acestea vor fi salvate precum şi serverul unde va fi procesată interogarea
(figura IV.4.16.).
În zona Output data din Results pot fi văzute şi schimbate numele datelor de ieşire şi
biblioteca unde ele vor fi salvate. În mod implicit, SAS Enterprise Guide salvează datele de
ieşire ale unei interogări în prima bibliotecă în care se poate scrie: Egtask, Sasuser şi Work.
De asemenea, pot fi definite biblioteci adiţionale. Se poate utiliza opţiunea Change pentru a
specifica utilizarea unei biblioteci diferite pentru a salva datele de ieşire.
În zona SAS server for this query din Server, se poate vizualiza şi schimba serverul care va
fi utilizat pentru procesarea interogării. Dacă se doreşte schimbarea serverului utilizat, se
efectuează clic pe lista drop-down Server şi se selectează unul dintre serverele pentru care există
permisiunea de acces.
În mod implicit, SAS Enterprise Guide execută interogarea pe serverul pe care a fost rezidentă
prima tabelă inclusă în interogare.
Orice date din interogare care sunt rezidente pe alte servere sunt copiate temporar pe serverul pe
care se procesează interogarea. Deoarece este de preferat să se minimizeze volumul de date
copiate între servere, este bine ca cea mai mare tabelă să fie introdusă prima în înterogare.
Data table Stocată permanent, putând O tabelă statică asupra căreia se pot realiza
fi utilizată şi în alte scopuri prelucrări. Rezultatele nu sunt actualizate până
la reexecutarea interogării.
Data view - Dacă o tabelă de date (data table) stochează datele efective, o tabelă virtuală (data
view) conţine numai logica necesară pentru regăsirea datelor care sunt stocate în alte locaţii.
Data view-urile permit citirea dinamică a datelor fără a folosi spaţiul fizic de stocare de pe disc
pentru crearea unei noi tabele.
Acest tip de format de ieşire pentru o interogare este util deoarece:
Salvează spaţiul de memorie prin dimensiunile lor reduse;
Asigură faptul că seturile de date de intrare sunt întotdeuna actualizate;
Pot ascunde de utilizatori anumite coloane confidenţiale, pot conţine coloane calculate fără
să existe vizibilitate asupra coloanelor implicate în calcul, permiţându-le în acelaşi timp să
vadă alte coloane;
Ascund utilizatorului joncţiuni sau interogări complexe.
Setarea opţiunilor unei interogări pentru a genera ieşiri într-un anumit format şi creşterea
numărului de rânduri afişate în fereastra Preview se realizează conform următorilor paşi
(figurile IV.4.17., IV.4.18, IV.4.19)
1. În fereastra Project Tree sunt afişate seturile de date care vor fi utilizate.
2. Se selectează Tools Options.
Figura IV.4.18. Setarea opţiunilor unei interogări pentru a creşte numărul de rânduri care
sunt afişate în fereastra Preview
4. Se realizează clic pe lista, de tip drop-down, Save query result set as şi se selectează formatul
dorit (Data table, Data view sau Report – HTML etc). Clic OK.
Figura III.4.19. Setarea opţiunilor unei interogări pentru a genera ieşiri într-un anumit
format
Query Builder permite crearea unei noi coloane pe baza valorilor datelor din alte coloane, prin
specificarea, în fereastra Build an advanced expression, a expresiei care va fi folosită pentru
calculul valorilor. Acest lucru se poate realiza fie tastând expresia direct în zona Enter an
expression aflată în partea de sus a ferestrei, fie construind expresia prin selectarea valorilor şi a
operatorilor. Pentru calcule, se poate selecta o coloană a unei tabele de date din lista talelelor
disponibile în lista Tables. De asemenea, se pot regăsi valorile unor coloane individuale apasând
butonul Get Values. Aceste valori pot fi folosite ulterior în cadrul expresiilor (figura IV.4.21).
Figura IV.4.21. Utilizarea ferestrei Build an advanced expression
În scopul calculului valorilor unei coloane se pot utiliza, de asemenea, şi funcţiile. O funcţie
preia o valoare şi o transformă în altă valoare, SAS Enterprise Guide dispunând de o multitudine
de funcţii predefinite.
O expresie poate fi creată prin intermediul funcţiilor, efectuând clic pe opţiunea Functions
(figura IV.4.22.) aflat în partea de jos a ferestrei Build an advanced expression. Aceasta
permite afişarea tuturor funcţiilor grupate în categorii, precum şi afişarea tuturor funcţiilor, în
ordine alfabetică. Odată selectată o funcţie, va fi afişată adiacent şi o descriere a sintaxei
acesteia. De exemplu funcţia QTR schimbă data calendaristică într-o valoare corespunzătoare
trimestrului (1-4). Multe dintre funcţii necesită un parametru, iar comentariul afişat în expresie
indică tipul valorii care va trebui utilizat. De exemplu, funcţia QTR necesită o valoare numerică
sau o coloană cu valori numerice.
Utilizând tabela Produse, în raport vor fi afişate următoarele coloane: nume produs, unităţi în
stoc, unităţi în comandă şi nivelul de aprovizionare. De asemenea, se va calcula o coloană nouă
şi anume valoare stoc. Rândurile vor fi sortate după valoare stoc în ordine descendentă.
În continuare vor fi prezentaţi paşii pentru realizarea acestei interogări.
Selectarea coloanelor pentru rezultatele interogării.
3. Se realizează dublu-clic pe urmăroarele coloane sau vor fi trase direct cu mouse-ul (în
aceiaşi ordine): nume produs, unităţi în stoc, unităţi în comandă şi nivelul de aprovizionare,
pentru a le adăuga în tab-ul Select Data (figura IV.4.25.).
5. În mod implicit nu este specificat niciun format. Pentru a-l seta se va efectua clic pe butonul
Change (figura IV.4.33).