Sunteți pe pagina 1din 6

Seminar 1 SAS

Important! Pentru a putea lucra cu pachetul de programe SAS trebuie parcuri urmtorii pai: 1. Pornii Vmware Player (Start -> Programs -> VMware -> VMware Player) 2. Selectai Open Virtual Machine i cutai maina virtual pe drive-ul D: sau E:, directorul sas-vm i selectai fiierul sas-vm.vmx 3. Apsai butonul Play Virtual Machine 4. Ateptai ncrcarea sistemului de operare 5. Parola pentru Administrator la login este stud

1.Navigarea prin Enterprise Guide


asupra datelor incluse n proiect.

spaiul

de

lucru

al

SAS

Scop: Crearea unui proiect SAS Enterprise Guide i efectuarea unui analize primare
Pe parcursul seminariilor vom lucra cu date referitoare la compania fictiv ABC, importator/distribuitor de produse alimentare. ABC ine evidena activitii sale prin intermediul datelor referitoare la: produse, comenzi, furnizori, clieni i campanii de publicitate.

Problem: S se realizeze o analiz statistic de baz asupra datelor referitoare la produsele companiei ABC. Pai de urmat:
1. Deschidei programul SAS Enterprise Guide. 2. Odat ce ai intrat n aplicaie, apare automat o fereastr de dialog numit Welcome to SAS Enterprise Guide, care v permite crearea unui nou proiect sau deschiderea unui proiect existent. Orice proiect listat n seciunea Open a project are extensia .egp.

3. Selectai New Project.Implicit, SAS Enterprise Guide afieaz trei ferestre principale. Acestea sunt: fereastra arborelui proiectului (Project Tree), fereastra fluxului de proces (Process Flow) i fereastra prelucrrilor (Task Status). Cele trei ferestre menionate anterior, dar i alte ferestre ale aplicaiei, pot fi deschise i din meniul View. Inserai o tabel SAS existent, selectnd File Open Data. 4. Vom cuta un fiier stocat pe calculatorul local, selectnd Local Computer. 5. Cutai locaia unde ai salvat fiierele de lucru i selectai products.sas7bdat Open pentru a aduga o surs de date la proiect. O referin la sursa de date este adugat automat n arborele proiectului i n fluxul de proces. Asftel, tabela de date products devine un obiect al proiectului. De asemenea, n mod implicit sursa de date este deschis pentru vizualizare n Grila de date. 6. Dup adugarea datelor la proiect, acestea pot fi folosite pentru analiz i raportare. Selectai sursa de date products n arborele proiectului, i apoi din meniul principal Tasks Describe Characterize Data Prelucrarea Characterize Data este un instrument de tip wizard i implic parcurgerea a trei pai, cu posibilitatea de a modifica opiunile setate implicit. 7. Pasul 1 permite selectarea sursei de date pe care dorii s o analizai. Selectai Next, deoarece sursa de date adaugat implicit, products, este cea care va fi analizat. Not: Pentru a afla mai multe informaii despre o anumit prelucrare, selectai butonul Help pe parcursul setrii opiunilor acesteia. 8. La pasul 2, putei personaliza opiunile raportului. Implicit, prelucrarea genereaz un raport preliminar (Summary Report), grafice, precum i serii de date coninnd distribuia de frecvene i principalii indicatori statistici. 9. Pentru a modifica numele setului de date care va include frecvenele de apariie pentru fiecare coloan de tip caracter, selectai Browse n seciunea Frequency Data. Tastai NumarProduse pentru a redenumi fiierul, apoi Save Next. 10.La pasul 3, limitai numrul de valori categorice unice care vor fi raportate pentru fiecare variabil la 15. Finish pentru a rula prelucrarea i a vizualiza rezultatele. Observai n fereastra Task Status evoluia executrii acestei prelucrri. 11.Rezultatele includ distribuia de frecvene pentru coloanele de tip caracter, un raport cu indicatorii statistici (summary statistics) pentru coloanele numerice i grafice de baz pentru reprezentarea vizual a acestor informaii. 12.Analizai rezultatele obinute i rspundei la urmtoarele ntrebri: a. Care este categoria care include cea mai mare varietate de produse? b. Care este procentul produselor oferite de companie care nu mai pot fi comandate la furnizori, deoarece au fost scoase din producie? (au valoarea coloanei Discontinued nenul) c. Care sunt preul mediu i cel maxim al produselor oferite de companie?

d. Care este nivelul mediu al stocului produselor la care trebuie s se iniieze o nou comand?( ReorderLevel) 13.O pictogram corespunztoare prelucrrii Characterize Data a fost adugat n arborele proiectului sub sursa de date products. Pentru a vizualiza obiectele care au fost create prin rularea acestei prelucrri, apasai n bara de meniu pe Process Flow sau pe tasta F4. 14.Se poate vizualiza codul asociat prelucrrii, prin selectarea tab-ului Code. Implicit, codul nu poate fi modificat, dar se poate salva i edita pentru a personaliza rezultatele i a folosi faciliti oferite de SAS care nu sunt disponibile prin intermediul acestui mediu vizual. 15.Fereastra Log afieaz mesaje provenite de la motorul SAS pentru fiecare prelucrare care se efectueaz. Ea poate fi accesat prin selectarea tab-ului Log. 16.Facei dublu click pe tabela Frequency Counts for PRODUCTS n fereastra Process Flow pentru a vizualiza tabela. 17.Rezultatele prelucrrii pot fi exportate ntr-o variatate de formate, inclusiv Microsoft Excel. Pentru a deschide datele n Excel, facei click drepta pe tabela Univariate Statistics for PRODUCTS n fereastra Process Flow i selectai Send To Microsoft Excel. nchidei produsul Excel fr a salva modificrile. 18.Pentru a salva prelucrrile, codul i rezultatele generate, trebuie s salvai proiectul. Selectai File Save Project As din bara de meniu, i spoi iconia Local Computer. Cutai locaia unve vrei s salvai proiectul.

2. Adugarea unei foi de calcul Excel la proiect


Scop: Importul unei foi de calcul Excel n proiectul creat anterior. Problem: S se importe ntreg coninutul de date din foaia de calcul Suppliers a fiierului SupplyInfo.xls. Primul rnd al fiierul Excel conine numele cmpurilor. Putei modifica numele tabelei de date SAS rezultate i locaia unde aceasta va fi memorat. Nu modificai atributele cmpurilor tabelei rezultate fa de cele generate automat. Codul SAS generat n urma procedurii de import trebuie s conin i datele propriu-zise. Pai de urmat:
File->Open ->Data Look In: cutai locaia unde ai salvat fiierele de lucru Se deschide fiierul: SupplyInfo.xls

Facilitatea de import a datelor este folosit pentru a converti date non-SAS n fiiere de date SAS, lucru care este cerut de anumite funcii care se ocup cu analiza i raportarea datelor. Procesul de import a datelor din fiierul Excel are patru pai. Citii nu atenie informaiile de mai jos pentru a importa fiierul conform enunului din problem.

Pasul 1: Specificarea sursei de date (fiierul Excel) i a destinaiei sub forma unui set de date SAS . Putei alege o alt locaie i un alt nume dect cele implicite pentru tabela destinaie.

Pasul 2: Selectarea sursei de date Se poate folosi o ntreag foaie de calcul Excel ( Use a worksheet) sau numai o parte din celulele acesteia (Use a specific range of cells within the worksheet ). n ultimul caz trebuie specificate celula din stnga sus i celula din dreapta jos a domeniului de celule care vor fi importate. Pentru a importa observaiile dintr-un domeniu de celule al crui nume l cunoatem, selectm Use a predefined named range . Opiunea se aplic numai pentru fiierele Microsoft Excel i Lotus 1-2-3. Dac se bifeaz csua First raw of range contains fileds names, atunci se specific faptul c primul rnd al domeniului de celule conine numele cmpurilor. Se poate bifa opiunea de a redenumi coloanele pentru a fi compatibile cu conveniile de nume ale SAS. Aceste convenii conin reguli ca: numele ncepe cu o liter sau cu caracterul _ underscore ; conine litere, cifre sau caracterul underscore, are o lungime de maxim 32 de caractere, nu poate fi inclus ntre ghilimele duble, nu este case sensitive nu face difereniere ntre litere mari i mici. Pasul 3: Selectarea coloanelor i definirea atributelor cmpurilor Implicit, toate coloanele sursei de date vor fin incluse n fiierul rezultat. Sunt permise mai multe operaii la acest nivel: a)deselectarea sau selectarea unei coloane, prin bifarea i respectiv debifarea opiunii Inc; b)nlturarea tuturor coloanelor din tabela rezultat prin apsarea butonului Clear All; c) includerea tuturor coloanelor n tabela rezultat prin apsarea butonului Select All. Pentru a defini atributele unei coloane, selectai cmpul ale crui atribute vrei s le editai. Atunci cnd un cmp este marcat, putei s i editai atributele. Acestea se pot modifica direct n grila de date afiat sau ntr-o fereastrde apare prin apsarea butonului Modify. Se pot specifica oricare din atributele de mai jos: Nume (Name) este numele coloanei . Dac ai importat i numele cmpurilor din fiierul surs, atunci numele coloanelor preiau numele cmpurilor. Dac nu ai importat numele cmpurilor, numele coloanelor sunt denumite Fn, unde n este o valoare ntreag. Eticheta (Label) specific textul care descrie coninutul coloanei. Implicit, este acelai ca i numele coloanei. Tip (Type) reprezint tipul coloanei. Formatul de intrare surs (Source Informat) folosit la citirea/importul datelor. Lime (Len) numrul de octei folosii pentru stocarea valorilor fiecrei coloane ntr-un set de date SAS. Implicit, pentru datele numerice limea este

de 8 octei, iar pentru datele caracter este determinat de limea maxim a datelor pentru fiecare cmp. Formatul de afiare (Output Format) folosit pentru afiarea datelor. Formatul de intrare destinaie (Output Informat) folosit pentru crearea setului de date destinaie.

Pasul 4: Opiuni Avansate 1. Pentru a include datele n codul SAS generat, ca parte a unei declaraii DATALINES, selectai opiunea Embed the data within the generated SAS code. Dac selectai aceast opiune, atunci rezultatul va include un program SAS care se poate rula din nou sau distribui altor utilizatori. 2. Selectai Import the data using SAS/ACCESS Interface to PC Files whenever possible pentru a importa datele folosind interfaa SAS/ACCESS to PC files. 3. Opiunea Remove characters that can cause transmission errors from text-based data files se folosete, spre exemplu, atunci cnd dorim s importm caractere speciale, caracteristice unei anumite limbi, care este posibil s nu fie recunoscute de server. Observai pictograma noului set de date care a fost adugat la proiect, precum i faptul c programul SAS generat include datele din fiier.