Sunteți pe pagina 1din 4

Prelucrarea datelor i modele de analiz n SAS Studio

Proiect nr. 1
Semestrul I anul universitar 2014-2015
INSTRUCIUNI
1.

Creai pe hard-discul de lucru de pe calculatorul dumneavoastr un director cu numele SASWS


(spre exemplu, C:\SASWS)

2.
3.

PENTRU PREGTIREA DATELOR:

Copiai fiierele BANCA.xls i BANCA.csv n directorul C:\SASWS


Fiierul Excel conine date despre un numr de clieni ai unei bnci. Explorai fiierul Excel
pentru a v familiariza cu structura i coninutul acestuia. Structura fiierului este urmtoarea:

SALID: codul de identificare a clientului (numeric);

SALINCEP: salariul anual la angajare (numeric);

SEX: sexul clientului (0 masculin; 1 feminin) (numeric);

TIMP: vechimea n munc calculat n luni (numeric);

VARSTA: vrsta clientului (numeric);

SALPREZENT: salariul anual n present (numeric);

NIVELEDUC: cod de nivel de educaie (numeric);

MUNCA: coeficient de ierarhizare (numeric);

CATPOST: cod de categorie de post (numeric).

4.

Accesai
SAS
On
Demand
Control
Center
la
https://odamid.oda.sas.com/SASODAControlCenter i introducei UserID i parola de acces in
contul dumneavoastr1, dup care deschidei aplicaia SAS Studio din Dashboard.

5.

Selectai din folderul My Folders->my_content


Proiect_P01.sas i deschidei-l n fereastra editorului.

din

fereastra

Folders

programul

Salvai programul cu iconograma SAVE AS n folderul propriu saususer.v94.


Examinai programul. Secvena de program dintre liniile 1 i 24 conine programul de creare a
setului de date BANCA n biblioteca temporar WORK din setul de date STATA.BANCA i de
listare a setului de date cu ajutorul procedurii PROC PRINT. Nu modificai aceast secven de
program! Selectai secvena de program i rulai-o prin comanda Run din meniu sau cu tasta F3.
Consultai documentaia pentru a identifica semnificaia sintaxei folosite n procedura PROC
PRINT.
6.

Ai obinut un set de date SAS denumit BANCA n biblioteca temporar WORK. Alturi de
fereastra de rezultat (RESULTS) vei identifica tab-urile LOG i CODE. Pe msur ce lucrai,
verificai frecvent fereastra LOG i citii mesajele de eroare, avertizare i/sau notificare pentru a
identifica eventualele erori i coreciile pe care trebuie s le facei n program n fereastra CODE.
Citii notele NOTE: marcate n verde pentru a putea consemna rspunsurile la ntrebri.

Dac nu avei identificatorul de utilizator i parola, urmai paii indicai n mesajul de pe adresa de grup Google i creaiv contul.

7.

Procedura PROC PRINT afieaz n fereastra RESULTS coninutul setului de date BANCA.
Descrcai din fereastra RESULTS raportul ca fiier PDF selectnd a doua iconogram (Download
results as a PDF file) din bara de meniu. Arhivai raportul n directorul C:\SASWS pentru a-l
transmite la final prin e-mail cu celelalte rezultate (Rezultatul nr. 1).

8.

Salvai din fereastra LOG coninutul jurnalului sub numele Proiect_P01.log n folderul propriu
saususer.v94 selectnd inconograma SAVE AS. Descrcai fiierul creat cu iconograma
DOWNLOAD i arhivai fiierul n directorul C:\SASWS pentru a-l transmite la final prin e-mail
cu celelalte rezultate (Rezultatul nr. 2).

9.

Rulai procedura PROC CONTENTS pentru a afia informaiile despre setul de date BANCA.
Trecei n revist rezultatele i identificai variabilele din setul de date. Descrcai din fereastra
RESULTS raportul ca fiier PDF selectnd a doua iconogram (Download results as a PDF file)
din bara de meniu. Arhivai raportul n directorul C:\SASWS pentru a-l transmite la final prin email cu celelalte rezultate (Rezultatul nr. 3).

n continuare avei o serie de sarcini de ndeplinit, n urma crora trebuie s rspundei la o serie de
ntrebri, pe msur ce realizai sarcinile indicate. COMPLETAI RSPUNSURILE IN
DOCUMENTUL MS WORD sub denumirea nume_prenume.doc , PE CARE ULTERIOR IL VETI
TRIMITE PRIN E-MAIL CU CELELALTE REZULTATE.
SARCINI DE NDEPLINIT.
S1: Identificai cte observaii i variabile are setul de date BANCA creat n etapa DATA.
INSTRUCIUNI
I1: Utilizai fereastra Log ca s rspundei la urmtoarea ntrebare.
NTREBARE:
Q1: CTE OBSERVAII (OBSERVATIONS) I VARIABILE (VARIABLES) SUNT N SETUL DE DATE BANCA?
OBSERVAII:___________475__

VARIABILE:____9_________

S2: S presupunem c dorii s creai un raport n care s includei primele 25 de observaii din setul
de date BANCA. Variabilele care trebuie incluse sunt, n aceast ordine, SALID, SEX, categoria
postului (variabila CATPOST), salariul de nceput (variabila SALINCEP) i salariul prezent (variabila
SALPREZENT).
INSTRUCIUNI
I2: Modificai procedura PROC PRINT din liniile 35-41 ca s:
a) introducei opiunea prin care indicai numrul de observaii pe care le listai;
b) specificai n instruciunea VAR variabilele pe care le listai;
c) includei titlul Lista primelor 25 de observaii din setul de date &SYSDSN;
d) rulai secvena de program.
I3: Salvai programul cu iconograma SAVE n folderul propriu saususer.v94.

I4: Descrcai din fereastra RESULTS raportul ca fiier PDF selectnd a doua iconogram (Download
results as a PDF file) din bara de meniu. Arhivai raportul n directorul C:\SASWS pentru a-l transmite
la final prin e-mail cu celelalte rezultate (Rezultatul nr. 4).
NTREBARE:
Q2: CUM SE NUMETE OPIUNEA PRIN CARE INTRODUCEI NUMRUL DE RNDURI PE CARE DORII S
LE LISTAI (25 LA NUMR)?
______________________________
S3) Dorii s producei un tabel de frecvene ncruciate a variabilei SEX (ca variabil pe rnd) cu
variabila CATPOST (ca variabil pe coloan) pentru clienii n vrst de 50 ani i peste (vrsta este
specificat n variabila VARSTA).
INSTRUCIUNI
I5: Vei folosi secvena de program din liniile 44-51. Consultai n documentaia SAS sintaxa
procedurii PROC FREQ.
I6: Modificai procedura PROC FREQ ca s folosii ca variabil de subsetare n clauza WHERE
variabila VARSTA i ca s specificai ca variabile de analiz n instruciunea TABLES variabilele SEX
i CATPOST. nlocuii variabila1, variabila2 i variabila3 cu variabilele corespunztoare.
I7: Specificai titlul tabelului Distributia clientilor in functie de SEX si CATPOST. Rulai secvena
de program, dup care obinei raportul n fereastra RESULTS.
I8: Salvai programul cu iconograma SAVE n folderul propriu saususer.v94.
I9: Descrcai din fereastra RESULTS raportul ca fiier PDF selectnd a doua iconogram (Download
results as a PDF file) din bara de meniu. Arhivai raportul n directorul C:\SASWS pentru a-l transmite
la final prin e-mail cu celelalte rezultate (Rezultatul nr. 5).
NTREBARE:
Q3: Care este numrul i procentul femeilor (SEX=1) care sunt n categoria CATPOST=1?
Numr (N) = ____________

Procent (Percent) = ___________

Q4: Care este numrul i procentul brbailor (SEX=0) care sunt n categoria CATPOST=3?
Numr (N) = ____________

Procent (Percent) = ___________

S4) Dorii s obinei statistici simple asupra variabilelor SALINCEP i SALPREZENT separat pentru
femei (SEX=1) i brbai (SEX=0). Exemple de statistici simple sunt frecvena (N), media (MEAN),
abaterea standard (StdDev), valoarea modal (MODE), percentile etc. Procedura care calculeaz un
numr mare de statistici simple este PROC UNIVARIATE.
INSTRUCIUNI
I10: Vei folosi secvena de program din liniile 54-61. Consultai n documentaia SAS sintaxa
procedurii PROC UNIVARIATE.
I11: Modificai procedura PROC UNIVARIATE ca s s specificai ca variabile de analiz SALINCEP
i SALPREZENT, iar ca variabil de clasificare variabila SEX. Dup consultarea documentaiei
introducei opiunea prin care calculai valoarea modal.

I12: Specificai titlul tabelului Statistici simple ale variabilelor SALINCEP i SALPREZENT. Rulai
secvena de program, dup care obinei raportul n fereastra RESULTS.
I13: Salvai programul cu iconograma SAVE n folderul propriu saususer.v94.
I14: Descrcai din fereastra RESULTS raportul ca fiier PDF selectnd a doua iconogram
(Download results as a PDF file) din bara de meniu. Arhivai raportul n directorul C:\SASWS pentru
a-l transmite la final prin e-mail cu celelalte rezultate (Rezultatul nr. 6).
NTREBARE:
Q5: Completnd tabelul de mai jos, care sunt valorile aferente statisticilor indicate pentru cele dou
variabile SALINCEP i SALPREZENT, separat pentru brbai i femei?

Pentru brbai (SEX=0)

SALINCEP

___________

___________

Abaterea
standard
(StdDev)
___________

Pentru femei (SEX=1)

SALPREZENT

___________

___________

___________

Variabila

Frecvena
(N)

Media
(Mean)

INSTRUCIUNI FINALE:
-

Salvai documentul sub denumirea Proiect_P01_nume_prenume.doc;

Trimitei fiierul Proiect_P01_nume_prenume.doc i cele ase rezultate (fiierele salvate n


folderul C:\SASWS pe adresa dghergut.utm@gmail.com.

Termenul final este 6 decembrie !

SUCCES !

S-ar putea să vă placă și