Sunteți pe pagina 1din 7

Seminar 3 SAS

1. Transpunerea tabelelor de date


Problemă: Să se creeze în SAS Enterprise Guide o tabelă de date cu conţinutul de mai jos. Datele se
referă la măsurarea greutăţii unor persoane pe parcursul unui experiment. Coloana Cod reprezintă
identificatorul persoanei, Timp indică momentul la care s-a efectuat măsurarea greutăţii memorate în
coloane Greutate. Toate cele trei coloane au tipul numeric, fără zecimale.

Cod Timp Greutate


1 1 70
1 2 73
1 3 81
2 1 64
2 2 61
2 3 58
3 1 96
3 2 93
3 3 91
Să se transforme tabela de mai sus (care este o tabelă de tipul mai-multe-întegistrări-per-subiect)
într-o tabelă care să permită analiza facilă a datelor referitoare la evoluţia în greutate a fiecărei
persoane (tabelă de tipul o-singură-întegistrărare-per-subiect) şi care să aibă 4 câmpuri: Cod,
Greutate1, Greutate2 şi Greutate3. Să se determine variaţia de greutate a fiecărei persoane
înregistrată între prima şi ultima măsurătoare. Se va utiliza prelucrarea TasksDataTranspose…

Pentru rezolvarea problemei folosiţi Help-ul pachetului de programe.

Paşi de urmat:
1. În proiectul activ selectaţi din meniu opţiunea File  New  Data, iar în caseta de dialog apărută,
modificaţi numele fişierului ce urmează a se crea în Analiza_greutate după care selectaţi
directorul Work, unde acesta va fi salvat .
2. La cel de-al doilea pas, fiecare litera A, B, C etc. reprezintă numele unei coloane pentru datele ce
se vor introduce ulterior. Tabelul de mai sus este format din 3 coloane. Astfel, în caseta de dialog,
la pasul al doilea, se vor modifica proprietăţile aferente primelor 3 coloane, identificate inițial prin
literele A, B, şi C. Proprietăţile care se vor modifica pentru fiecare coloană în parte, în vederea
obţinerii structurii tabelare în SAS asemănătoare cu cea a tabelului de mai sus, sunt: numele
coloanei, eticheta acesteia, tipul date ce vor fi adăugate în coloană, formatul datelor şi
dimensiunea acestora.
3. Cu ajutorul săgeţilor ce despart denumirile coloanelor din stânga casetei de dialog de proprietățile
coloanelor, se poate modifica ordinea de apariţie in structura tabelară a coloanelor.
4. După ce au fost definite caracteristicile celor 3 coloane necesare realizării structurii tabelare de
mai sus, restul coloanelor, simbolizate prin litere (D, E, F etc.), se şterg cu ajutorul opţiunii DELETE,
simbolizată prin X. Aceasta opţiune se găseşte între zona ce conţine denumirile coloanelor din
stânga casetei de dialog si zona din dreapta a casetei de dialog, care conţine proprietățile
coloanelor.
5. Apăsaţi Finish, pentru a se crea structura tabelara în SAS.
6. În structura tabelară obţinută, introduceţi valorile numerice din tabelul de mai sus.
7. Pentru rezolvarea cerințelor problemei, selectaţi Task  Data  Transpose.
8. În caseta de dialog apărută optaţi pentru protejarea datelor (Yes).
În cea de-a doua casetă de dialog apărută, în secţiunea Data se utilizează opţiunea drag and drop,
pentru a muta fiecare variabilă din stânga în zona corespunzătoare din dreapta, astfel încât să fie
rezolvate cerinţele problemei. Se grupează după Cod (Group Analysis by), se alege variabila timp
pentru crearea de noi coloane (New column names), şi se alege variabila greutate pentru a fi
transpusă (Transpose Variable) în coloanele noi create.
9. În secţiunea Options modificaţi prefixul coloanelor noi ce se vor crea, din Columns în Greutate.
10. Utilizaţi Run pentru a se realiza transpunerea datelor.
11. Se poate opta pentru deprotejarea datelor (EditProtect Data ), pentru a fi permisă ştergerea
coloanelor inutile (coloanele cu numele variabilei transpuse şi cea cu eticheta acesteia).
12. Pentru a rezolva cerinţa problemei, referitoare la determinarea variaţiei de greutate a fiecărei
persoane înregistrată între prima şi ultima măsurătoare, trebuie să fie debifată opţiunea de
protejare a datelor.
13. Utilizaţi click dreapta in zona tabelară, acolo unde doriți sa adăugaţi o coloană nouă, în care se va
calcula diferența de greutate. În caseta de dialog apărută trebuie introduse caracteristicile noii
coloane: nume - vargreutate, etichetă - Variaţia de greutate, tipul - numeric. În secţiunea
Expression utilizaţi butonul aferent acestei opţiuni, extindeţi tabela în care se lucrează, din
directorul Tables şi tastaţi formula matematică, pentru calculul diferenţei de greutate între prima
şi ultima măsurătoare. Pentru a scrie expresia se realizează dublu-click pe numele variabilelor ce
trebuie utilizate, iar între acestea se folosesc simbolurile matematice corespunzătoare.
14. Utilizaţi Ok pentru a obţine rezultatele diferenţei de greutate într-o coloană nouă.

2. Crearea unui raport Listă


Problema 1: Compania ABC doreşte să posteze o listă a furnizorilor săi pe propriul intranet. Lista
trebuie să aibă următoarele caracteristici:

 Furnizorii din aceeaşi ţară trebuie să fie grupaţi împreună


 Numele ţarilor trebuie să apară doar o dată, la începutul unui grup
 CompanyNameLong trebuie să fie etichetat în raport sub denumirea de Company
Name
 Titlul raportului trebuie să fie Suppliers by Country
Paşi de urmat:
1. Se importă foia de calcul Suppliers a fişierului SupplyInfo.xls.
2. Se deschide prelucrarea Tasks  Describe  List Data…
3. Pentru fiecare funizor se vor afişa variabilele CompanyNameLong, Address şi City.
4. Asignaţi variabile la rolurile prelucrării în funcţie de cerinţele din enunţul problemei. Se
grupeaza dupa country si se afiseaza variabilele listei (countrynamelong, address si city).
5. Click dreapta pe variabila CompanyNameLong  Properties şi adăugăm noul Label: Company
Name
6. In Titles debifăm Use default text si adăugăm noul titlu Suppliers by Country
7. Exportaţi raportul generat în format HTML: Export  SAS Report

3. Tabele de frecvenţe unidimensionale


Problema 2: Creaţi o tabelă de frecvenţe unidimensionale pentru a determina numărul de comenzi
generate de produsele importate din fiecare ţară (Figura 1). Similar, să se determine numărul de
produse comandate din fiecare ţară (Figura 2).
Paşi de urmat:
1. Se creează o interogare care să realizeze o joncţiune între tabelele products, ordersFinal şi
tabela rezultată în urma importului foii de calcul Suppliers a fişierului SupplyInfo.xls.
2. Se adaugă la interogare câmpurile afişate în Figura 1.
3. Se foloseşte prelucrarea One-Way Frequencies pentru a crea tabelele de frecvenţe
unidimensionale ( Tasks  Describe  One-Way Frequencies… ) conform indicaţiilor din
Figurile 1 şi 2.
4. Denumiţi cele două tabele rezultate DistribOrdersCountry (numărul de comenzi din fiecare
ţară) şi respectiv, DistribNoProductsCountry (numărul de produse din fiecare ţară).
5. Afişaţi şi grafice care să reprezinte vizual distribuţiile din tabele.
Tasks  Graph  Bar Chart Wizard…

Frecvenţe unidimensionale: One-Way Frequencies


Crează o tabelă
de frecvenţe
unidimensionale
pentru fiecare
variabilă
specificată

14

Figura 1

Frecvenţe unidimensionale: One-Way Frequencies

Valoarea acestei
variabile arată de
câte ori trebuie
numărat fiecare rând.

15

Figura 2
4. Variabile parametru
Problema 3: Conform indicaţiilor din Figurile 3-5, creaţi o variabilă parametru care să permită
selectarea, la momentul rulării interogării, a varabilei de grupare în funcţie de care se generează tabela
de frecvenţe unidimensionale din Problema 2, Figura 1. Utilizatorul trebuie să poată să aleagă dintre
variabilele CategoryName şi Country.
Pornind de la tabela rezultată în urma jocţiunii tabelelor products, ordersFinal şi a tabelei rezultate în
urma importului foii de calcul Suppliers a fişierului SupplyInfo.xls, accesăm View  Prompt manager;
din fereastra din strânga (sub arborele proiectului) accesăm Add pentru a adăuga un nou prompt.

1) Crearea unei variabile parametru

Acest nume va fi folosit în codul SAS


pentru a referi parametrul.

Textul pe care îl vede utilizatorul atunci


când prelucrarea se execută.

Opţiuni suplimentare

20

Figura 3

1) Crearea unei variabile parametru

Tipul defineşte
modul în care
parametrul va
putea fi folosit.

Numele
variabilelor pot fi
încărcate în lista
valorilor din
sursele de date
existente.

21

Figura 4
Încărcăm lista de valori prin alegerea fişierului obţinut în urma joncţiunii celor trei tabele.
2) Folosirea parametrilor în prelucrări
Variabilele
parametru vor
putea fi
asignate la
rolurile unei
prelucrări.

Parametrii pot
fi referiţi şi în
titluri sau note
de subsol.

22

Figura 5

5. Formate definite de utilizator


Problema 4: Creaţi şi aplicaţi formate definite de utilizator pentru a personaliza afişarea datelor.
Paşi de urmat:
1. Pornind de la interogarea realizată pentru Problema 2, efectuaţi următoarele modificări şi salvaţi
retultatele ca o interogare nouă, numită Profit:
a. Adăugaţi în interogare numai coloanele CompanyName, Country şi CategoryName.
b. Calculaţi, folosind editorul avansat de expresii, o nouă coloană numită Profit, după formula
(SellPriceUnitCost)Quantity.
c. Stabiliţi pentru coloana Profit, tipul Currency, formatul de afişare DOLLARw.d cu lăţimea 8 şi
2 zecimale.
d. Ca rezultat al interogării, creaţi o tabelă SAS, numită Profit, pe care o salvaţi în librăria
SASUSER.
2. Creaţi două formate definite de utilizator (DataCreate format):
a. Region, de tip caracter şi care foloseşte valori discrete. Acesta va fi utilizat pentru afişarea
regiunii în care se găseşte fiecare ţară.
b. Money, de tip numeric şi care foloseşte intervale de valori. Acesta va fi utilizat pentru afişarea
unor intervale de valori pentru profit.
Crearea unui format: Opţiuni
Alocarea
Numele unui tip
formatului

Alocarea
unei lăţimi

Alegerea
unei locaţii

25

Figura 6

Definirea formatului - discret Defineşte o listă


de etichete

Tastaţi valorile
discrete
corespunzătoare
26

Figura 7
Definirea formatului - interval

Tastaţi valorile
maxime şi minime.

Selectaţi High sau Selectaţi inclusive


Low din listă. sau exclusive
pentru fiecare capăt
al intervalului.
27

Figura 8
3. Aplicaţi formatele definite de utilizator asupra variabilelor din interogare Country şi Profit, pentru
a afişa rezultatele sub forma unui raport SAS, similar celui din Figura 9. Atenţie!!! Pentru a păstra
tabela Profit, nu supracrieţi rezultatele interogării şi selectaţi NO în fereastra de dialog care apare!
Query_Join+profitModify Task. CountryPropertiesFormatChangeUser
Defined$Region
Query_Join+profitModify Task. ProfitPropertiesFormatChangeUser
Defined$Money

Figura 9

S-ar putea să vă placă și