Sunteți pe pagina 1din 5

Pregtirea datelor pentru analiz Interogarea datelor Tehnic vorbind, o interogare este o cerere de regsire a datelor din una

mai mai multe surse de date. n contextul SAS, o interogare este o colecie de specificaii care ne permit s aducem datele n forma dorit de utilizator. Interogrile pot fi folosite pentru: Selectarea rndurilor pornind de la una sau mai multe condiii Selectarea, ordonarea i sortarea coloanelor Definirea de variabile calculate Jonciunea tabelelor prin diferite metode nlocuirea valorilor datelor Gruparea i agregarea datelor Specificarea unui parametru pentru interogare

n SAS EG, instrumentul care ne permite s construim specificaiile unei interogri poart denumirea de Query Builder. Pornind de la aceste specificaii, Query Builder genereaz cod SQL. Interogrile care au asociai parametri permit utilizatorului s furnizeze date de intrare pentru interogare, la momentul execuiei acesteia. Interogrile se fac pornind de la un set de date anume. Implicit, se deschid fr a avea selectat nici o coloan a tabelei. nainte de a rula o interogare, trebuie s adugm cel puin o coloan. Proprietile unei coloane pot fi modificate, incluznd Alias-ul (numele), Eticheta sau Formatul. Funcionaliti diferite ale Query Builder sunt oferite prin intermediul a trei tab-uri: Selecta Data, Filter Data i Sort Data. Tab-ul Select Data permite: crearea de coloane calculate; aplicarea de formate asupra datelor; folosirea funciilor de agregare; crearea de expresii condiionale. Filtrea datelor Se pot defini dou tipuri de filtre: filtre simple i filtre avansate. Pentru un filtru simplu, trebuie selectat operatorul de comparaie i introduse valorile sau valoarea de comparat. Aceste valori pot fi preluate i din valorile cmpului respectiv stocate n tabela SAS corespunztoare. Dac n cmpul Value trebuie s introducem valori nenumerice,
1

atunci acestea trebuie incluse ntre ghilimele i s se in cont de faptul c valorile sunt case sensitive. Pentru filtrele avansate, se pot crea expresii complexe prin intermediul unui editor de expresii avansate. Operatorii de comparaie disponibili includ operatori standard, dar i operatori avansai ca: Operator In a list of values Between Is null | Is missing Sounds like Contains Exemplu IN ("DB","IL") venit BETWEEN 1200 AND 2000 Realizeaz un test pentru valorile lips nume =* "smith" gsete "Smythe", "Smith" tara contains "US" gsete "USA", "RUSIA" Realizeaz o cutare bazat pe caractere speciale. Semnul procent (%) nlocuiete oricte caractere. Semnul underscore (_) nlocuiete un caracter. nume like R_D%" gsete RADULESCU", RADU", RODICA"

Matches pattern

Combinarea filtrelor Atunci cnd se creeaz unul mai mai multe filtre asupra datelor, se poate specifica dac relaiile dintre filtre sunt de tip AND sau OR. De asemenea, pentru condiii complexe, filtrele pot fi grupate. 1.1. Crearea unei noi coloane calculate

ntr-o interogare se poate insera o nou coloan care s fie calculat pe baza altor coloane sau valori. O coloan calculat poate fi folosit pentru a agrega valori, a nlocui valori pornind de la o anumit condiie sau a efectua calcule. Dup crearea unei coloane calculate, aceasta poate fi folosit pentru sortarea sau gruparea rezultatelor. a. Coloan agregat Prima opiune permite efectuarea unei funcii de agregare pe oricare dintre coloanele interogrrii. Dup crearea unei coloane agregate sau a unei coloane calculate care conine o funcie de agregare, pentru ca rezultatele s aib o semnificaie, datele pot fi grupate n funcie de valorile unei coloane. Aceast operaie este echivalent cu folosirea clauzei GROUP BY ntr-o interogare SQL. Spre exemplu, dac vrem s calculm nalimea medie a unui grup de elevi, vom grupa rezultatele n funcie de vrst, pentru a vedea nlimea medie pentru fiecare grup de vrst. Implicit, atunci cnd rulm o interogare, aceasta este grupat dup toate coloanele pe care trebuie s le afieze, i nu va calcula funciile de agregare pentru un anumit grup de valori. Debifai
2

opiunea Automatically select groups i apoi Edit groupspentru a specifica variabila de grupare dorit. b. Coloan recodificat A doua opiune permite crearea unei coloane calculate prin recodificarea unei valori individuale sau a unui domeniu de valori. Aceata mai poart i denumirea de nlocuirea valorilor. Recodificarea este o modalitate eficient de grupare a valorilor. c. Coloan calculat A treia opiune permite folosirea editorului avansat de expresii pentru definirea unei noi coloane pe baza unei formule de calcul. 2.3 Jonciunea tabelelor Folosim jonciunea tabelelor atunci cnd vrem s: Calculm o nou coloan folosind ca intrri date din coloane stocate n tabele diferite Adugm informaii dintr-o tabel asociativ pentru a le introduce n tabela de analiz Identificm dac valorile unei coloane se regsesc sau nu n alte tabele Tabelele care particip la jonciune trebuie s aib o coloan comun. Aceast coloan trebuie s conin valori care s se potriveasc exact sau care s poat fi cu uurin comparate ntre tabele. O jonciune creat ntre coloane ale cror valori au corespondent exact se numete inner joi i reprezint tipul de jonciune implicit in SAS Enterprise Guide. Pe lng aceasta, sunt suportate i alte tipuri de jonciuni, cum sunt jonciunile externe. ntr-o interogare se pot realiza jonciuni ntre maxim 32 de tabele diferite. Atunci cnd se adaug mai mult de o tabel ntr-o interogare, Query Builder ncearc automat s relizeze jonciunea ntre tabele, be baza coloanelor care au acelai nume i tip.

Tip jonciune Rnduri returnate de rezultatul interogrii inner Numai rndurile care au corespondent

Tabela1 left outer

Tabela 2

Toate rndurile (care au corespondent i care nu au corespondent) din prima tabel a interogrii, plus rndurile care au corespondent din cea de-a doua tabel

Tabela 1 right outer

Tabela 2

Toate rndurile (care au corespondent i care nu au corespondent) din cea de-a doua tabel a interogrii, plus rndurile care au corespondent din prima tabel

Tabela 1 full outer

Tabela 2

Toate rndurile din amndou tabelele

Tabela 1

Tabela 2

2.4 Setarea opiunilor interogrii Meniul Options din Query Builder permite setarea opiunilor pentru o anumit interogare sau a opiunilor implicite pentru toate interogrile. Pentru fiecare dintre acestea vor fi afiate ferestre de opiuni diferite. Alegerea unui tip de rezultat nainte de rularea interogrii este o garanie a faptului c interogarea va oferi informaiile n formatul potrivit. Spre exemplu, pentru a vizualiza rezultatele ntr-un browser Web, se poate genera un rezultat sub forma unui raport HTML. Tabelul de mai jos prezint formatele de rezultate pentru o interogare i caracteristicile acestora.

Format de rezultat Data table

Caracteristici ale datelor poate fi utilizat n alte scopuri

Rezultatele interogrii O tabel static asupra creia se pot realiza prelucrri. Rezultatele nu sunt actualizate pn la reexecutarea interogrii. O viziune dinamic a datelor asupra creia se pot realiza prelucrri. De fiecare dat cnd rezultatele interogrii

Data view

ntotdeuna actualizat

Raport

formatat pentru prezentare

sunt deschise, acestea sunt actualizate pentru a reflecta schimbrile care s-au realizat asupra datelor incluse n interogare. Un raport n formatul care este specificat ca implicit (HTML, PDF, RTF text sau raport SAS). Rezultatele nu sunt actualizate pn la reexecutarea interogrii. Nu se pot efectua prelucrri asupra acestui format de rezultat.

Data view Dac o tabel de date stocheaz datele efective, un data view conine doar logica necesar pentru regsirea datelor care sunt stocate n alte locaii. Acestea permit citirea dinamic a datelor fr a folosi spaiul fizic de stocare pentru crearea unei noi tabele. Avantaje: Salveaz spaiul de memorie prin dimensiunile lor reduse Asigur faptul c seturile de date de intrare sunt ntotdeuna actuale Pot ascunde de utilizatori anumite coloane confideniale, permindu-le n acelai timp s vad alte coloane Ascund utilizatorului jonciuni sau interogri complexe

S-ar putea să vă placă și