Sunteți pe pagina 1din 30

Curs 4 - Introducere n SAS

4.1 Pachetul integrat SAS

4.2 Lucrul cu date ntr-un proiect

Curs 4 - Introducere n SAS

4.1 Pachetul integrat SAS

4.2 Lucrul cu date ntr-un proiect

Cuprins

Categorii de pachete software pentru


prelucrarea analitic a datelor
Pachetul software integrat SAS
Faciliti i caracteristici ale SAS Enterprise
Guide
Paii unei sesiuni tipice de lucru
Scopul diferitelor zone ale spaiului de lucru
Lucrul cu date n cadrul unui proiect
Definirea tabelelor de date SAS
Accesarea datelor locale

Categorii de pachete software pentru prelucrarea


analitic a datelor -1

Foi de calcul: sunt cele mai folosite instrumente


analitice datorit uurinei n utilizare i a faptului c
reflect modelele mentale ale utilizatorilor. Probleme:
introducerea greit a datelor datorit lipsei metodelor
de validare, erori n formulele de calcul.
Instrumente OLAP (Online Analytical Processors)
sunt proiectate pentru lucrul cu date multidimensionale
sau serii de timp. Organizeaz datele n cuburi de date
care permit analiza acestora n funcie de mai multe
dimensiuni cum ar fi timpul, aria geografic sau
categoria de produse. Cuburile de date sunt colecii de
date care conin 3 sau mai multe variabile care sunt
structurate i mpachetate n scopul efecturii de
rapoarte i analize.

Categorii de pachete software pentru prelucrarea


analitic a datelor -2

Instrumente pentru analize statistice i optimizare:


necesit cunotine analitice avansate i proceseaz
date cantitative pentru a realiza prelucrri statistice sau
a ajunge la un rezultat optim.
Instrumente pentru data mining: sunt aplicaii ale
unor tehnici avansate precum inteligena artificial,
statistic, arbori decizionali sau reele neuronale
pentru a identifica abloane n seturi de date complexe
sau slab structurate. Exemple de aplicaii: care clieni
vor renuna la abonament n urmtoarele x luni;
clasificarea clienilor pentru un marketing personalizat.

Categorii de pachete software pentru prelucrarea


analitic a datelor -3

Instrumente de text mining: sunt specializate n


identificarea unor trenduri sau relaii n datele n format
textual, mediul Web fiind sursa predilect de aplicaii.
Exemple de aplicaii: prin monitorizarea blogurilor cu
spacific tehnic, un productor poate identifica dac un
produs are defecte n cteva ore dup ce acesta a fost
livrat, n loc s atepte plngerile clienilor;
identificarea i stucturarea unor referine la persoane,
locuri sau subiecte de interes i folosirea acestor
informaii pentru a genera concluzii privind posibilul
comportament al competitorilor.
Alte categorii avansate: instrumente de simulare,
motoare de reguli de afacere, algoritmi genetici,
sisteme expert.

Pachetul software integrat SAS

Rapoarte i
Grafice

Analize

Vizualizare i
Descoperire

Accesarea i
managementul
datelor

Base SAS

Soluii de
business

Interfee
utilizator

Dezvoltare
de aplicaii

Capabiliti
Web

Componentele produsului SAS

Prelucrri bazate pe date


Funcionalitatea produsului este construit n jurul a patru
tipuri de prelucrri bazate pe date, prelucrri comune
pentru aproape toate tipurile de aplicaii software:
Accesarea date
Managementul datelor
Analiza datelor
Prezentarea datelor

Transformarea datelor n informaii

10

Structura SAS Enterprise Guide


Pentru a lucra cu SAS Enterprise Guide, trebuie parcuri
urmtorii pai:
1. crearea unui nou proiect
2. adugarea de date la proiect
3. executarea de prelucrri asupra datelor
Opional, se pot realiza:
4. personalizarea rezultatelor
5. automatizarea procesului

11

Ceea ce nu se vede
SAS Enterprise Guide poate utiliza puterea unui server SAS
pentru a accesa datele i a rula procedurile, urmnd ca
apoi rezultatele s fie returnate mainii client.
SAS
on Windows
SAS
on Mainframe

SAS Enterprise
Guide
12

SAS
on UNIX

Ceea ce nu se vede
SAS Enterprise Guide poate utiliza puterea unui server
SAS pentru a accesa datele i a rula procedurile,
urmnd ca apoi rezultatele s fie returnate mainii
client.
SAS
on Windows
SAS
on Mainframe

SAS Enterprise
Guide
13

SAS
on UNIX

Ceea ce nu se vede
Pe msur ce se efectueaz prelucrri, SAS Enterprise
Guide genereaz cod SAS.

14

Interfaa de programare

15

Zonele de lucru i ferestrele

Arborele
proiectului
Spaiul de lucru unde se
vizualizeaz Fluxul de proces

Zona de
resurse
Prelucrri n execuie
16

Ferestrele SAS Enterprise Guide


Fereastr
Project Tree

Task List

SAS Folders
Server List

Task Status

17

Descriere
Afieaz o structur ierarhic a obiectelor
proiectului
sub
forma
unei
diagrame
arborescente.
Listeaz toate prelucrrile i abloanele de
prelucrri disponibile. Se poate opta pentru a
ofiare a prelucrrilor n funcie de categorie, de
nume sau abloanelor de prelucrri.
Afieaz orice director care a fost definit n
metadate.
Listeaz serverele SAS disponibile, precum
i fiierele i librriile de date de pe aceste
servere.
Afieaz informaii despre prelucrrile care
se execut la un moment dat.

Obiectele unui proiect

18

Tipuri de obiecte
Pictogram

Descriere
Datele dintr-un proiect pot fi tabele de date SAS, fiiere flat care
conin date sau alte fiiere de date ale unor Sisteme de Gestiune a
Bazelor de Date sau aplicaii. Proiectele conin referine la date i nu
datele propriu-zise. Pictograma reprezint un set de date SAS.
Prelucrrile reprezint analize sau rapoarte specifice care pot fi
executate, cum ar fi rapoarte list (List Data) sau grafice cu bare verticale
(Bar Chart). Atunci cnd se ruleaz o prelucrare, SAS Enterprise Guide
adaug o pictogram reprezentnd prelucrarea respectiv n feresatra
fluxului de proces i a arborelui proiectului. Pictograma reprezint o
prelucrare de tip grafic cu bare verticale.
Rezultatele sunt rapoarte sau grafice produse n urma execuiei
prelucrrilor. Rezultatele sunt reprezentate prin pictograme diferite n
funcie de tipul fiierului rezultat (raport SAS, HTML, PDF, RTF sau text).
Pictograma reprezint un rezultat n formatul raport SAS.
Notele sunt fiiere text opionale folosite pentru documentarea unui
proiect sau pentru a consemna comentarii sau instruciuni pentru utilizrile
ulterioare.
Programele sunt fiiere care conin cod SAS. n SAS Enterprise
Guide se pot deschide programe existente sau se pot crea programe noi.

19

Curs 5 - Introducere n SAS

5.1 Pachetul integrat SAS

5.2 Lucrul cu date ntr-un proiect

20

Formate comune de date


SAS Enterprise Guide poate citi i utiliza date
dintr-o variatate de formate .
Fisiere text cu
lime fix i
delimitate
Date
compatibile
ODBC

Tabele SAS
21

Fiiere dBASE
Foi de calcul
Microsoft Excel
Tabele HTML
Fiiere ale
furnizorilor
OLE DB

Tabele
Microsoft
Access

Tabele de date SAS


O tabel de date SAS este o tabel rectangular format din
linii i coloane.

Rnduri
(observaii)

Coloane (variabile)
22

Tabele de date SAS


Toate coloanele trebuie s aiba un nume, tip i o lungime.

Numele
poate avea
lungimea
ntre
1 si 32
caractere

23

Tabele de date SAS


Coloana poate fi de tip caracter sau numeric. Tipul are i
rol n determinarea lungimii.

Valorile de tip
caracter pot avea
lungimea ntre
1 si 32,767
caractere (octei).
24

Valorile numerice sunt stocare pe 8 octei


n virgul mobil i pot fi de tip:
Numeric
Moned
Dat (zile de la 1 Ianuarie 1960)
Timp (secunde de al miezul nopii)

Formate de afiare
Formatul de afiare (Format) este folosit pentru a controla
modul n care sunt afiate valorile. Formatul de afiare nu
afecteaz modul de stocare a valorilor.

Format:
MMDDYY
Latime:
10
Valoare stocata:15060
25

Format:
DOLLAR
Latime:
10
Numar zeximale: 0
Valoare stocata:76806

Formate de afiare

26

Formate de intrare
Sunt folosite pentru a citi ntr-o variabil date din surse
externe. Sunt de trei tipuri:
caracter: $INFORMATw.
numeric: INFORMATw.d
dat/timp: INFORMATw.
semnific limea unei variabile (n octei sau numr de
coloane)
INFORMAT este un nume opional de format de intrare SAS
w

d
$

27

este folosit n cazul datelor numerice pentru a specifica


numrul de cifre ale prii zecimale
indic prezena unui caracter

Valori lips
Dac ntr-o coloan, valoarea unei date nu exist pentru
un anumit rnd, ea este considerat lips.
O valoare lips de tip caracter este afiat ca spaiu.
O valoare lips de tip numeric este afiat ca virgul
sau punct.

.
.

.
28

Accesarea datelor locale


Fiierul software
conine
metadate.

Fiierul software
nu conine
metadate.

29

Lucru la seminar
Crearea unui proiect nou i lucrul cu tabele SAS
Adugarea unei foi de calcul Excel ntr-un proiect
Adugarea unui fiier text ntr-un proiect

30