Sunteți pe pagina 1din 6

Seminar 1 SAS

Important!
Pentru a putea lucra cu pachetul de programe SAS trebuie parcuri urmtorii pai:
1. Pornii Vmware Player (Start -> Programs -> VMware -> VMware Player)
2. Selectai Open Virtual Machine i cutai maina virtual pe drive-ul D: sau E:, directorul
sas-vm i selectai fiierul sas-vm.vmx
3. Apsai butonul Play Virtual Machine
4. Ateptai ncrcarea sistemului de operare
5. Parola pentru Administrator la login este stud
6. Datele de lucru se copiaz din sistemul de operare gazd n maina virtual cu Copy/Paste
sau Drag&Drop, fr a fi necesare alte setri

1. Navigarea prin spaiul de lucru al SAS Enterprise Guide

Scop: Crearea unui proiect SAS Enterprise Guide i efectuarea unui analize primare asupra datelor
incluse n proiect.

Pe parcursul seminariilor vom lucra cu date referitoare la compania fictiv ABC, importator/distribuitor
de produse alimentare. ABC ine evidena activitii sale prin intermediul datelor referitoare la:
produse, comenzi, furnizori, clieni i campanii de publicitate.

Problem: S se realizeze o analiz statistic de baz asupra datelor referitoare la produsele


companiei ABC.

Pai de urmat:
1. Deschidei programul SAS Enterprise Guide.
2. Odat ce ai intrat n aplicaie, apare automat o fereastr de dialog numit Welcome to SAS
Enterprise Guide, care v permite crearea unui nou proiect sau deschiderea unui proiect existent.
Orice proiect listat n seciunea Open a project are extensia .egp.
3. Selectai New Project.Implicit, SAS Enterprise Guide afieaz trei ferestre principale. Acestea sunt:
fereastra arborelui proiectului (Project Tree), fereastra fluxului de proces (Process Flow) i fereastra
prelucrrilor (Task Status). Cele trei ferestre menionate anterior, dar i alte ferestre ale aplicaiei, pot
fi deschise i din meniul View. Inserai o tabel SAS existent, selectnd File Open Data.
4. Vom cuta un fiier stocat pe calculatorul local, selectnd Local Computer.
5. Cutai locaia unde ai salvat fiierele de lucru i selectai products.sas7bdat Open pentru a
aduga o surs de date la proiect.
O referin la sursa de date este adugat automat n arborele proiectului i n fluxul de proces.
Asftel, tabela de date products devine un obiect al proiectului. De asemenea, n mod implicit sursa
de date este deschis pentru vizualizare n Grila de date.
6. Dup adugarea datelor la proiect, acestea pot fi folosite pentru analiz i raportare. Selectai sursa
de date products n arborele proiectului, i apoi din meniul principal Tasks Describe
Characterize Data
Prelucrarea Characterize Data este un instrument de tip wizard i implic parcurgerea a trei pai, cu
posibilitatea de a modifica opiunile setate implicit.
7. Pasul 1 permite selectarea sursei de date pe care dorii s o analizai. Selectai Next, deoarece sursa
de date adaugat implicit, products, este cea care va fi analizat.
Not: Pentru a afla mai multe informaii despre o anumit prelucrare, selectai butonul Help pe
parcursul setrii opiunilor acesteia.
8. La pasul 2, putei personaliza opiunile raportului. Implicit, prelucrarea genereaz un raport
preliminar (Summary Report), grafice, precum i serii de date coninnd distribuia de frecvene i
principalii indicatori statistici.
9. Pentru a modifica numele setului de date care va include frecvenele de apariie pentru fiecare
coloan de tip caracter, selectai Browse n seciunea Frequency Data. Tastai NumarProduse
pentru a redenumi fiierul, apoi Save Next.
10. La pasul 3, limitai numrul de valori categorice unice care vor fi raportate pentru fiecare
variabil la 15. Finish pentru a rula prelucrarea i a vizualiza rezultatele. Observai n fereastra Task
Status evoluia executrii acestei prelucrri.
11. Rezultatele includ distribuia de frecvene pentru coloanele de tip caracter, un raport cu
indicatorii statistici (summary statistics) pentru coloanele numerice i grafice de baz pentru
reprezentarea vizual a acestor informaii.
12. Analizai rezultatele obinute i rspundei la urmtoarele ntrebri:
a. Care este categoria care include cea mai mare varietate de produse?
b. Care este procentul produselor oferite de companie care nu mai pot fi comandate la
furnizori, deoarece au fost scoase din producie? (au valoarea coloanei Discontinued nenul)
c. Care sunt preul mediu i cel maxim al produselor oferite de companie?
d. Care este nivelul mediu al stocului produselor la care trebuie s se iniieze o nou comand?
(ReorderLevel)
13. O pictogram corespunztoare prelucrrii Characterize Data a fost adugat n arborele
proiectului sub sursa de date products. Pentru a vizualiza obiectele care au fost create prin rularea
acestei prelucrri, apasai n bara de meniu pe Process Flow sau pe tasta F4.
14. Se poate vizualiza codul asociat prelucrrii, prin selectarea tab-ului Code. Implicit, codul nu
poate fi modificat, dar se poate salva i edita pentru a personaliza rezultatele i a folosi faciliti
oferite de SAS care nu sunt disponibile prin intermediul acestui mediu vizual.
15. Fereastra Log afieaz mesaje provenite de la motorul SAS pentru fiecare prelucrare care se
efectueaz. Ea poate fi accesat prin selectarea tab-ului Log.
16. Facei dublu click pe tabela Frequency Counts for PRODUCTS n fereastra Process Flow pentru a
vizualiza tabela.
17. Rezultatele prelucrrii pot fi exportate ntr-o variatate de formate, inclusiv Microsoft Excel.
Pentru a deschide datele n Excel, facei click drepta pe tabela Univariate Statistics for PRODUCTS n
fereastra Process Flow i selectai Send To Microsoft Excel. nchidei produsul Excel fr a salva
modificrile.
18. Pentru a salva prelucrrile, codul i rezultatele generate, trebuie s salvai proiectul. Selectai
File Save Project As din bara de meniu, i spoi iconia Local Computer. Cutai locaia unve vrei
s salvai proiectul.

2. Adugarea unei foi de calcul Excel la proiect


Scop: Importul unei foi de calcul Excel n proiectul creat anterior.

Problem: S se importe ntreg coninutul de date din foaia de calcul Suppliers a fiierului
SupplyInfo.xls. Primul rnd al fiierul Excel conine numele cmpurilor. Putei modifica numele
tabelei de date SAS rezultate i locaia unde aceasta va fi memorat. Nu modificai atributele
cmpurilor tabelei rezultate fa de cele generate automat. Codul SAS generat n urma
procedurii de import trebuie s conin i datele propriu-zise.

Pai de urmat:
File->Open ->Data
Look In: cutai locaia unde ai salvat fiierele de lucru
Se deschide fiierul: SupplyInfo.xls

Facilitatea de import a datelor este folosit pentru a converti date non-SAS n fiiere de date SAS, lucru
care este cerut de anumite funcii care se ocup cu analiza i raportarea datelor.
Procesul de import a datelor din fiierul Excel are patru pai. Citii nu atenie informaiile de mai jos
pentru a importa fiierul conform enunului din problem.

Pasul 1: Specificarea sursei de date (fiierul Excel) i a destinaiei sub forma unui set de date SAS . Putei
alege o alt locaie i un alt nume dect cele implicite pentru tabela destinaie.
Pasul 2: Selectarea sursei de date

Se poate folosi o ntreag foaie de calcul Excel (Use a worksheet) sau numai o parte din celulele acesteia
(Use a specific range of cells within the worksheet). n ultimul caz trebuie specificate celula din stnga sus
i celula din dreapta jos a domeniului de celule care vor fi importate.

Pentru a importa observaiile dintr-un domeniu de celule al crui nume l cunoatem, selectm Use a
predefined named range. Opiunea se aplic numai pentru fiierele Microsoft Excel i Lotus 1-2-3.

Dac se bifeaz csua First raw of range contains fileds names, atunci se specific faptul c primul rnd
al domeniului de celule conine numele cmpurilor.

Se poate bifa opiunea de a redenumi coloanele pentru a fi compatibile cu conveniile de nume ale SAS.
Aceste convenii conin reguli ca: numele ncepe cu o liter sau cu caracterul _ underscore ; conine
litere, cifre sau caracterul underscore, are o lungime de maxim 32 de caractere, nu poate fi inclus ntre
ghilimele duble, nu este case sensitive nu face difereniere ntre litere mari i mici.

Pasul 3: Selectarea coloanelor i definirea atributelor cmpurilor

Implicit, toate coloanele sursei de date vor fin incluse n fiierul rezultat. Sunt permise mai multe operaii
la acest nivel: a)deselectarea sau selectarea unei coloane, prin bifarea i respectiv debifarea opiunii Inc;
b)nlturarea tuturor coloanelor din tabela rezultat prin apsarea butonului Clear All; c) includerea
tuturor coloanelor n tabela rezultat prin apsarea butonului Select All.
Pentru a defini atributele unei coloane, selectai cmpul ale crui atribute vrei s le editai. Atunci cnd
un cmp este marcat, putei s i editai atributele. Acestea se pot modifica direct n grila de date afiat
sau ntr-o fereastrde apare prin apsarea butonului Modify.
Se pot specifica oricare din atributele de mai jos:
- Nume (Name) este numele coloanei . Dac ai importat i numele cmpurilor din fiierul surs,
atunci numele coloanelor preiau numele cmpurilor. Dac nu ai importat numele cmpurilor,
numele coloanelor sunt denumite Fn, unde n este o valoare ntreag.
- Eticheta (Label) specific textul care descrie coninutul coloanei. Implicit, este acelai ca i
numele coloanei.
- Tip (Type) reprezint tipul coloanei.
- Formatul de intrare surs (Source Informat) folosit la citirea/importul datelor.
- Lime (Len) numrul de octei folosii pentru stocarea valorilor fiecrei coloane ntr-un set de
date SAS. Implicit, pentru datele numerice limea este de 8 octei, iar pentru datele caracter
este determinat de limea maxim a datelor pentru fiecare cmp.
- Formatul de afiare (Output Format) folosit pentru afiarea datelor.
- Formatul de intrare destinaie (Output Informat) folosit pentru crearea setului de date
destinaie.

Pasul 4: Opiuni Avansate


1. Pentru a include datele n codul SAS generat, ca parte a unei declaraii DATALINES, selectai
opiunea Embed the data within the generated SAS code. Dac selectai aceast opiune, atunci
rezultatul va include un program SAS care se poate rula din nou sau distribui altor utilizatori.
2. Selectai Import the data using SAS/ACCESS Interface to PC Files whenever possible pentru a
importa datele folosind interfaa SAS/ACCESS to PC files.
3. Opiunea Remove characters that can cause transmission errors from text-based data files se
folosete, spre exemplu, atunci cnd dorim s importm caractere speciale, caracteristice unei
anumite limbi, care este posibil s nu fie recunoscute de server.

Observai pictograma noului set de date care a fost adugat la proiect, precum i faptul c programul SAS
generat include datele din fiier.

S-ar putea să vă placă și