Sunteți pe pagina 1din 6

1.

Pachetul software integrat SAS SAS este un produs software integrat furnizat de SAS Institute Inc, care ofer utilizatorilor faciliti precum:

introducerea, accesarea i managementul datelor data mining (extragerea de informaii din date) realizarea de rapoarte i grafice analize statistice planificarea afacerilor, prognoz i suport de decizie cercetri operaionale i managementul proiectelor dezvoltarea de aplicaii data warehousing (lucrul cu depozite de date) lucrul independent de platforma hardware i de locaie

n plus, SAS ofer multe soluii de business i soluii software pentru domenii cum ar fi managementul IT, managementul resurselor umane, management financiar, business intelligence, managementul relaiilor cu clienii etc. Componentele produsului SAS SAS const dintr-un numr mare de componente, pe care organizaiile le pot achiziiona i instala separat, n funcie de necesiti. n centrul soluiilor SAS se afl produsul software Base SAS. Acesta este un mediu software integrat, avnd faciliti pentru accesul la date, analiza datelor, crearea de rapoarte etc. Base SAS beneficiaz i de suportul unui limbaj de programare proprietar de generaia a patra (Not: Limbajele de generaia a patra sunt orientate pe rezolvarea unei anumite clase de probleme. Exemple sunt SQL sau PL/SQL sau cele folosite de alte pachete software ca Matlab sau SPSS). Bibliotecile SAS/STAT, SAS/Graph i SAS/OR extind capabilitile motorului de baz Base SAS. SAS/STAT ofer o gam larg de instrumente pentru analiza statistic a datelor. SAS/Graph este modulul care permite vizualizarea datelor sub form de grafice sau hri. SAS/OR este o component care are ca scop susinerea procesului decizional prin intermediul unor tehnici de optimizare, simulare sau planificare a proiectelor. SAS Add-inn for MS Office permite utilizatorilor s beneficieze de facilitile analitice, de raportare i pentru accesul la date oferite de SAS direct din Microsoft Office prin intermediul unor meniuri i bare de instrumente integrate n produsele Office. SAS Enterprise Guide este o aplicaie client pentru Microsoft Windows care va fi prezentat pe larg n partea a doua a cursului. Prelucrri bazate pe date Accesarea datelor se refer la obinerea accesului la datele cerute de aplicaie. Managementul datelor presupune pregtirea datelor astfel nct acestea s aib forma cerut de aplicaie.
1

Analiza datelor rezum sau transform datele primare n informaii utile i care au o semnificaie pentru analist. Prezentarea datelor comunic informaiile ntr-o manier care demonstreaz clar semnificaia acestora. Transformarea datelor n informaii Produsul lucreaz prin intermediul programelor SAS (programe scrise ntr-un limbaj specific, aa cum aminteam i mai devreme) care definesc o succesiune de operaii ce trebuiesc efectuate asupra datelor stocate n tabele. Un program SAS este compus din trei pri majore, seciunea de DATE, seciunile de PROCEDURI, precum i un limbaj macro. Dei exist interfee grafice destinate utilizatorilor care nu dein cunotine de programare SAS (cum este SAS Enterprise Guide), de cele mai multe ori aceste interfee sunt doar un mijloc pentru a automatiza sau a facilita generarea de programe SAS. SAS Enterprise Guide SAS Enterprise Guide este o aplicaie Windows uor de utilizat care furnizeaz urmtoarele faciliti: o interfa vizual intuitiv acces la modulele SAS acces transparent la date prelucrri pentru analiz i raportare exportul facil al datelor i al rezultatelor n alte aplicaii faciliti de scripting i automatizare Utilizatorii avnd diverse niveluri de experien (de la nceptori pn la experi) pot utiliza SAS Enterprise Guide pentru a obine rapid rezultate semnificative. Interfaa de ultim generaie a SAS Enterprise Guide ofer: funcionalitate de tip drag-and-drop ferestre de dialog pentru introducerea parametrilor prelucrrilor i efectuarea de setri instrumente de tip wizard editor de sintax pentru scrierea programelor, cu evidenierea n culori diferite a elementelor codului faciliti de Help Online, help senzitiv la context i tutorial de iniiere Interfaa de programare Utiliznd SAS Enterprise Guide, se pot accesa modulele SAS fr s fie nevoie s se nvee limbajul de programare SAS. Dac utilizatorul este programator SAS, el poate utiliza editorul de cod al pachetului de programe pentru a crea cod nou sau pentru a modifica programe SAS existente.

Ceea ce nu se vede Pe msur pe accesai date i realizai prelucrri, SAS Enterprise Guide genereaz cod SAS. Atunci cnd rulai o prelucrare, codul generat este primis motorului SAS pentru procesare, iar rezultatele sunt returnate ctre SAS Enterprise Guide. Pachetul se poate conecta la motorul SAS pe calculatorul local, sau pe un alt calculator numit server SAS. Utilizatorul poate modifica codul SAS generat de pachet pentru a personaliza rezultatele i pentru a accesa facilitile SAS care nu sunt disponibile n cadrul interfeei grafice. De asemenea, utilizatorul poate salva codul i s l execute ntr-un mediu de tip batch. Zonele de lucru Implicit, SAS Enterprise Guide afieaz trei ferestre principale. Acestea sunt: fereastra arborelui proiectului (Project Tree), fereastra fluxului de proces (Process Flow) i fereastra prelucrrilor (Task Status). Ferestra Project Tree afieaz o structur ierarhic a proiectului activ. Atunci cnd creai un nou proiect, ferestra Project Tree este goal. Pe msur ce adugai date, rulai prelucrri sau generai rezultate, n aceast ferestr vor fi adugate iconie pentru fiecare dintre aceste obiecte. Ele sunt vzute ca obiecte ale unui proiect. Obiectele unui proiect SAS EG are la un moment dat un singur proiect activ. Fiecare proiect conine unul sau mai multe fluxuri de proces. Un flux de proces reprezint vizual relaiile dintre obiectele unui proiect. ntrun proiect se pot crea noi fluxuri pe proces i se pot muta sau copia obiecte ntre fluxurile de proces. De asemenea, se poate executa doar o poriune a unui flux de proces, sau ntregul flux. 2. Lucrul cu date ntr-un proiect nainte de a realiza orice n SAS EG este necesar s adugai datele pe care dorii s le analizai n proiect. Pe lng fiierele de date SAS, SAS EG poate citi majoritatea tipurilor de fiiere de date ca HTML, Microsoft Access, dBASE sau Microsoft Excel. Avei posibilitatea s deschidei date care se afl local pe calculatorul vostru sau pe orice alt server pe care suntei autorizat s l accesai. SAS Enterprise Guide poate citi i utiliza date dintr-o variatate de formate: Fiiere text cu laime fix i fiiere text delimitate Un fiier text cu lime fix are un format specific care permite salvarea datelor/informaiilor textuale ntr-o manier organizat. Este un tip special de fiier n care formatul este definit de limea coloanei, de caracterele folosite pentru spaiere i de alinierea la stnga sau dreapta. Limea coloanei este specificat sub forma unui numr de caractere. Spaierea datelor se face folosind caracterul spaiu (sau orice caracter se dorete) n cazul n care datele ocup mai puine caractele dect limea specificat pentru coloana respectiv.

Exemplu de fiier text n care limea primei coloane este de 25 de caractere, celei de-a doua de 10 caractere i cea de-a treia de 12 caractere. Nume Popescu Maria Ionescu Damian Diamandescu Victor Judet VL DJ DB Telefon 0250277189 0251767868 0245876590

ntr-un fiier text delimitat fiecare linie de text reprezint o nregistrare, iat cmpurile sunt separate prin caractere cunoscute. Delimitatori frecvent utilizai sunt caracterul tab (\t) sau diferite caractere de punctuaie. Delimitatorul trebuie ntotdeuna s fie un caracter care nu se regsete n date. Astfel de fiiere se pot crea facil folosind aplicaii de calcul tabelar sau pentru baze de date (ex. Microsoft Excel, Microsoft Access). Spre exemplu, n Excel: File > Save AS, Text (Tab delimited). Considerm un fiier text care conine numele, prenumele i vrsta persoanelor, delimitate prin simbolul linie vertical (|): Popescu|Maria|35 Ionescu|Damian|42 Diamandescu|Victor|29 Date compatibile cu standardul ODBC i OLE DB ODBC (Open DataBase Connectivity) este o metod standard de accesare a bazelor de date care permite accesul la orice date din cadrul oricrei aplicaii, indiferent de sistemul de gestiune a bazelor de date care gestioneaz datele. ODBC realizeaz acest lucru prin inserarea unui strat de mijloc (middle layer), numit driver de baze de date, ntre aplicaie i SGBD. Scopul acestui strat este de a transforma interogrile de date ale aplicaiei n comenzi pe care un SGBD le nelege. n acest sens, att aplicaia, ct i SGBD-ul trebuie s fie compatibile ODBC, adic aplicaia trebuie s fie capabil s genereze comenzi ODBC, iar SGBD-ul trebuie s fie capabil s rspund la acestea. OLE DB (Object Linking and Embedding, Database) este o intera API proiectat de Microsoft pentru accesarea diferitelor tipuri de date stocate ntr-o manier uniform. OLE DB include i capabilitile ODBC. Tabele SAS, Foi de calcul Microsoft Excel, Fiiere dBase, Tabele HTML, Tabele Microsoft Access Tabele de date SAS Pentru a putea fi accesate de SAS EG, datele trebuie s fie reprezentate n format tabelar (ca o mulime de linii i coloane). O linie reprezint o instan a unei entiti. Entitatea poate fi un produs, un client, o comand sau orice alt lucru. Fiecare coloan descrie caracteristicile entitii, cum ar fi codul de identificare a unui produs, numele clientului sau cantitatea vndut. Toate coloanele trebuie s aib un nume, un tip i o lungime. Numele pot avea o lungime de la 1 la 32 de caractere. Eticheta ataat unei coloane poate avea lungimea de maxim 265 de caractere.

Unul dintre cele mai importante lucruri pe care trebuie s le tii despre date este ce tip de date conine fiecare coloan (sau variabil). SAS privete datele ca fiind fie de tip caracter, fie de tip numeric. n cazul n care datele dintr-o coloan conin doar litere, aceasta are date de tip caracter. n cazul n care datele dintr-o coloan conin numere, aceasta poate fi de tip caracter sau numeric. Datele numerice sunt grupate n patru categorii de date, n funcie de modul n care acestea sunt afiate. Tabela arat ce simbol este asociat fiecrui tip de dat. Aceste pictograme apar n titlurile de coloan ale tabelei de date. De asemenea, aceste pictograme se pot vedea atunci cnd se ruleaz o prelucrare. Aceste simboluri constituie un indiciu despre modul n care pot fi folosite coloanele sau varibilele n prelucrri. Formate de afiare Un format de afiare (Format) este o instruciune care se aplic unei coloane, indicnd produsului SAS Enterprise Guide cum s afieze valorile datelor.

Formate de intrare Formatele de intrare (Informat) sunt, de obicei, folosite pentru a citi ntr-o variabil date din surse externe numite fiiere flat (fiiere text, fiiere ASCII sau fiiere secveniale). Not: Fiierele flat conin nregistrri ntre care nu exist nici o interrelaionare. Avantajul este acela c ocup mai mult spaiu dect fiierele structurate. Totui, necesit ca aplicaia care le folosete s cunoasc modul n care datele sunt orgaizate n fiier. Formatele de intrare instruiesc aplicaiile SAS despre modul n care trebuie s citeasc datele ntr-o variabil SAS. Sunt, de obicei, grupate n trei categorii: caracter, numeric i dat/timp. Formatele de intrare au urmtoarea sintax: Formate de intrare caracter: $INFORMATw. Formate de intrare numerice: INFORMATw.d Formate de intare dat/timp: INFORMATw. Semnificaia simbolurilor folosite de formatele de intrare: $ indic prezena unui caracter w semnific limea unei variabile (n octei sau numr de coloane) INFORMAT este un nume opional de format de intrare SAS d este folosit n cazul datelor numerice pentru a specifica numrul de cifre ale prii zecimale. Toate formatele de intare trebuie s conin punctul zecimal (.), astfel nct s se poat face diferena ntre un format de intrare i o variabil SAS. Valori lips n SAS Enterprise Guide sunt multe funcii care furnizeaz opiuni pentru modul de manipulare a valorilor lips, n scopul raportrii sau analizei.
5

Accesarea datelor locale Multe formate de fiiere care memoreaz date sub form tabelar includ metadate ca parte a tabelei. Metadatele reprezint informaii despre datele n sine, cum ar fi originea/sursa datelor, dimensiunea sau formatul lor. Tabelele SAS, MS Access sau dBASE sunt exemple de fiiere care conin metadate stocate n interiorul lor. Atunci cnd acceseaz un astfel de fiier, SAS EG poate accesa metadatele pentru a determina numele unei coloane, tipul (caracter sau numeric) i lungimea (dimensiunea). Exist i cteva formate de fiiere, cum ar fi foile de calcul, tabelele HTML sau fiierele text care nu conin metadate. Pentru aceste tipuri de fiiere, SAS EG trebuie s fac anumite deducii referitoare la atributele fiecrei coloane. Implicit, SAS EG caut numele coloanei n primul rnd al fiierului i analizeaz valorile stocate n cmpuri sau celule pentru a stabili dac o anumit coloan trebuie memorat ca ir de caractere sau ca numr. Dac se stabilete c o coloan este de tip caracter, atunci lungimea ei este setat n mod automat ca fiind 255 (octei), care este numrul maxim de caractere permis de motorul de baze de date Microsoft Jet

S-ar putea să vă placă și