Sunteți pe pagina 1din 6

Seminar 1 SAS

Important!
Pentru a putea lucra cu pachetul de programe SAS trebuie parcuri urmtorii
pai:
1. Pornii Vmware Player (Start -> Programs -> VMware -> VMware Player)
2. Selectai Open Virtual Machine i cutai maina virtual pe drive-ul D:
sau E:, directorul sas-vm i selectai fiierul sas-vm.vmx
3. Apsai butonul Play Virtual Machine
4. Ateptai ncrcarea sistemului de operare
5. Parola pentru Administrator la login este stud
6. Datele de lucru se copiaz din sistemul de operare gazd n maina
virtual cu Copy/Paste sau Drag&Drop, fr a fi necesare alte setri
1.

Navigarea prin
Enterprise Guide

spaiul

de

lucru

al

SAS

Scop: Crearea unui proiect SAS Enterprise Guide i efectuarea unui analize primare
asupra datelor incluse n proiect.

Pe parcursul seminariilor vom lucra cu date referitoare la compania fictiv ABC,


importator/distribuitor de produse alimentare. ABC ine evidena activitii sale prin
intermediul datelor referitoare la: produse, comenzi, furnizori, clieni i campanii de
publicitate.

Problem: S se realizeze o analiz statistic de baz asupra datelor


referitoare la produsele companiei ABC.
Pai de urmat:

1. Deschidei programul SAS Enterprise Guide.


2. Odat ce ai intrat n aplicaie, apare automat o fereastr de dialog numit
Welcome to SAS Enterprise Guide, care v permite crearea unui nou proiect sau
deschiderea unui proiect existent. Orice proiect listat n seciunea Open a
project are extensia .egp.

3. Selectai New Project.Implicit, SAS Enterprise Guide afieaz trei ferestre


principale. Acestea sunt: fereastra arborelui proiectului (Project Tree), fereastra
fluxului de proces (Process Flow) i fereastra prelucrrilor (Task Status). Cele trei
ferestre menionate anterior, dar i alte ferestre ale aplicaiei, pot fi deschise i
din meniul View. Inserai o tabel SAS existent, selectnd File Open
Data.
4. Vom cuta un fiier stocat pe calculatorul local, selectnd Local Computer.
5. Cutai locaia unde ai salvat fiierele de lucru i selectai products.sas7bdat
Open pentru a aduga o surs de date la proiect.
O referin la sursa de date este adugat automat n arborele proiectului i n
fluxul de proces. Asftel, tabela de date products devine un obiect al proiectului.
De asemenea, n mod implicit sursa de date este deschis pentru vizualizare n
Grila de date.
6. Dup adugarea datelor la proiect, acestea pot fi folosite pentru analiz i
raportare. Selectai sursa de date products n arborele proiectului, i apoi din
meniul principal Tasks Describe Characterize Data
Prelucrarea Characterize Data este un instrument de tip wizard i implic
parcurgerea a trei pai, cu posibilitatea de a modifica opiunile setate implicit.
7. Pasul 1 permite selectarea sursei de date pe care dorii s o analizai. Selectai
Next, deoarece sursa de date adaugat implicit, products, este cea care va fi
analizat.
Not: Pentru a afla mai multe informaii despre o anumit prelucrare, selectai
butonul Help pe parcursul setrii opiunilor acesteia.
8. La pasul 2, putei personaliza opiunile raportului. Implicit, prelucrarea
genereaz un raport preliminar (Summary Report), grafice, precum i serii de
date coninnd distribuia de frecvene i principalii indicatori statistici.
9. Pentru a modifica numele setului de date care va include frecvenele de apariie
pentru fiecare coloan de tip caracter, selectai Browse
n seciunea
Frequency Data. Tastai NumarProduse pentru a redenumi fiierul, apoi Save
Next.
10.La pasul 3, limitai numrul de valori categorice unice care vor fi raportate
pentru fiecare variabil la 15. Finish pentru a rula prelucrarea i a vizualiza
rezultatele. Observai n fereastra Task Status evoluia executrii acestei
prelucrri.
11.Rezultatele includ distribuia de frecvene pentru coloanele de tip caracter, un
raport cu indicatorii statistici (summary statistics) pentru coloanele numerice i
grafice de baz pentru reprezentarea vizual a acestor informaii.
12.Analizai rezultatele obinute i rspundei la urmtoarele ntrebri:
a. Care este categoria care include cea mai mare varietate de produse?
b. Care este procentul produselor oferite de companie care nu mai pot fi
comandate la furnizori, deoarece au fost scoase din producie? (au
valoarea coloanei Discontinued nenul)
c. Care sunt preul mediu i cel maxim al produselor oferite de companie?

d. Care este nivelul mediu al stocului produselor la care trebuie s se iniieze


o nou comand?(ReorderLevel)
13.O pictogram corespunztoare prelucrrii Characterize Data a fost adugat n
arborele proiectului sub sursa de date products. Pentru a vizualiza obiectele
care au fost create prin rularea acestei prelucrri, apasai n bara de meniu pe
Process Flow sau pe tasta F4.
14.Se poate vizualiza codul asociat prelucrrii, prin selectarea tab-ului Code.
Implicit, codul nu poate fi modificat, dar se poate salva i edita pentru a
personaliza rezultatele i a folosi faciliti oferite de SAS care nu sunt disponibile
prin intermediul acestui mediu vizual.
15.Fereastra Log afieaz mesaje provenite de la motorul SAS pentru fiecare
prelucrare care se efectueaz. Ea poate fi accesat prin selectarea tab-ului Log.
16.Facei dublu click pe tabela Frequency Counts for PRODUCTS n fereastra
Process Flow pentru a vizualiza tabela.
17.Rezultatele prelucrrii pot fi exportate ntr-o variatate de formate, inclusiv
Microsoft Excel. Pentru a deschide datele n Excel, facei click drepta pe tabela
Univariate Statistics for PRODUCTS n fereastra Process Flow i selectai
Send To Microsoft Excel. nchidei produsul Excel fr a salva modificrile.
18.Pentru a salva prelucrrile, codul i rezultatele generate, trebuie s salvai
proiectul. Selectai File Save Project As din bara de meniu, i spoi iconia
Local Computer. Cutai locaia unve vrei s salvai proiectul.

2. Adugarea unei foi de calcul Excel la proiect


Scop: Importul unei foi de calcul Excel n proiectul creat anterior.
Problem: S se importe ntreg coninutul de date din foaia de calcul
Suppliers a fiierului SupplyInfo.xls. Primul rnd al fiierul Excel conine
numele cmpurilor. Putei modifica numele tabelei de date SAS rezultate i
locaia unde aceasta va fi memorat. Nu modificai atributele cmpurilor
tabelei rezultate fa de cele generate automat. Codul SAS generat n urma
procedurii de import trebuie s conin i datele propriu-zise.
Pai de urmat:

File->Open ->Data
Look In: cutai locaia unde ai salvat fiierele de lucru
Se deschide fiierul: SupplyInfo.xls

Facilitatea de import a datelor este folosit pentru a converti date non-SAS n fiiere
de date SAS, lucru care este cerut de anumite funcii care se ocup cu analiza i
raportarea datelor.
Procesul de import a datelor din fiierul Excel are patru pai. Citii nu atenie
informaiile de mai jos pentru a importa fiierul conform enunului din problem.

Pasul 1: Specificarea sursei de date (fiierul Excel) i a destinaiei sub forma


unui set de date SAS . Putei alege o alt locaie i un alt nume dect cele implicite
pentru tabela destinaie.

Pasul 2: Selectarea sursei de date


Se poate folosi o ntreag foaie de calcul Excel (Use a worksheet) sau numai o parte
din celulele acesteia (Use a specific range of cells within the worksheet). n ultimul
caz trebuie specificate celula din stnga sus i celula din dreapta jos a domeniului
de celule care vor fi importate.
Pentru a importa observaiile dintr-un domeniu de celule al crui nume l
cunoatem, selectm Use a predefined named range. Opiunea se aplic numai
pentru fiierele Microsoft Excel i Lotus 1-2-3.
Dac se bifeaz csua First raw of range contains fileds names, atunci se specific
faptul c primul rnd al domeniului de celule conine numele cmpurilor.
Se poate bifa opiunea de a redenumi coloanele pentru a fi compatibile cu
conveniile de nume ale SAS. Aceste convenii conin reguli ca: numele ncepe cu o
liter sau cu caracterul _ underscore ; conine litere, cifre sau caracterul
underscore, are o lungime de maxim 32 de caractere, nu poate fi inclus ntre
ghilimele duble, nu este case sensitive nu face difereniere ntre litere mari i mici.
Pasul 3: Selectarea coloanelor i definirea atributelor cmpurilor
Implicit, toate coloanele sursei de date vor fin incluse n fiierul rezultat. Sunt
permise mai multe operaii la acest nivel: a)deselectarea sau selectarea unei
coloane, prin bifarea i respectiv debifarea opiunii Inc; b)nlturarea tuturor
coloanelor din tabela rezultat prin apsarea butonului Clear All; c) includerea
tuturor coloanelor n tabela rezultat prin apsarea butonului Select All.
Pentru a defini atributele unei coloane, selectai cmpul ale crui atribute vrei s le
editai. Atunci cnd un cmp este marcat, putei s i editai atributele. Acestea se
pot modifica direct n grila de date afiat sau ntr-o fereastrde apare prin
apsarea butonului Modify.
Se pot specifica oricare din atributele de mai jos:
-

Nume (Name) este numele coloanei . Dac ai importat i numele cmpurilor


din fiierul surs, atunci numele coloanelor preiau numele cmpurilor. Dac
nu ai importat numele cmpurilor, numele coloanelor sunt denumite Fn,
unde n este o valoare ntreag.
Eticheta (Label) specific textul care descrie coninutul coloanei. Implicit,
este acelai ca i numele coloanei.
Tip (Type) reprezint tipul coloanei.
Formatul de intrare surs (Source Informat) folosit la citirea/importul
datelor.
Lime (Len) numrul de octei folosii pentru stocarea valorilor fiecrei
coloane ntr-un set de date SAS. Implicit, pentru datele numerice limea este

de 8 octei, iar pentru datele caracter este determinat de limea maxim a


datelor pentru fiecare cmp.
Formatul de afiare (Output Format) folosit pentru afiarea datelor.
Formatul de intrare destinaie (Output Informat) folosit pentru crearea
setului de date destinaie.

Pasul 4: Opiuni Avansate


1. Pentru a include datele n codul SAS generat, ca parte a unei declaraii
DATALINES, selectai opiunea Embed the data within the generated SAS
code. Dac selectai aceast opiune, atunci rezultatul va include un
program SAS care se poate rula din nou sau distribui altor utilizatori.
2. Selectai Import the data using SAS/ACCESS Interface to PC Files
whenever possible pentru a importa datele folosind interfaa SAS/ACCESS
to PC files.
3. Opiunea Remove characters that can cause transmission errors from
text-based data files se folosete, spre exemplu, atunci cnd dorim s
importm caractere speciale, caracteristice unei anumite limbi, care este
posibil s nu fie recunoscute de server.
Observai pictograma noului set de date care a fost adugat la proiect, precum i
faptul c programul SAS generat include datele din fiier.

S-ar putea să vă placă și