Sunteți pe pagina 1din 33

Curs 3

Pregtirea datelor pentru analiz n SAS

Procesul de analiz: de la datele de baz la


rezultate
Surse de date

Pregtirea datelor

Modelare analitic

Rezultate i Aciuni

Surse de date
diferite

Interclasare,
Denormalizare

Modelare,
Estimarea
parametrilor

Folosirea
rezultatelor

Modele
relaionale,
Scheme stea

Variabile
derivate

Predicii,
Clasificri,
Clusteri

Crearea de
profile

Transpuneri,
Agregregri
Disponibilitatea
datelor
2

Interpretare

Pregtire

adecvat

Modelare

eficient

Rezultate
bune

Sistemele software care proceseaz date


Sistemele operaionale

Sistemele pentru depozite


de date

Se adreseaz conducerii
departamentelor funcionale.

Constituie o baz pentru procesul


decizional de la diferite nivele ale
conducerii.

Conin date curente, primare


privind tranzaciile. Corectitudinea
acestor date este foarte
important.

Conine date istorice. Acestea pot


fi disponibile ca atare sau pot fi
create pornind de la fiierele
istorice de log asociate tabelelor.

Au o orientare tranzacional.

Furnizeaz date pentru raportare,


monitorizare i analiz.

Intrri pentru tabela analitic din perspectiv logic

Pregtirea datelor
Interogrile SAS pot fi folosite pentru:
Selectarea rndurilor pornind de la una sau mai multe
condiii
Selectarea, ordonarea i sortarea coloanelor
Definirea de variabile calculate
Jonciunea tabelelor prin diferite metode
nlocuirea valorilor datelor
Gruparea i agregarea datelor
Specificarea unui parametru pentru interogare

Instrumentul Query Builder


Query Builder este folosit pentru a extrage date din una sau
mai multe tabele, conform cerinelor utilizatorului.

Query Builder: Select Data


Tab-ul select este folosit pentru a selecta care coloane
sunt incluse i care vor fi rolurile lor n interogare.

Selectarea coloanelor
Implicit, interogarea este goal. Trebuie adugate coloane n
tab-ul Select Data.

Modificai
proprietile
unei coloane

Filtrarea cmpurilor
Procesul prin care se specific ce cmpuri s se regsesc
n interogare.

Setrile unui filtru


Atunci cnd o coloan este inclus n tab-ul Filter Data, se
deschide caseta de dialog New Filter.
Selectai
tipul de
comparaie

Introducei
valoarea sau
valorile de
comparat.

10

Editorul de expresii avansate: Funcii

Descrierea
funciei

Selectai tipul de
funcie, funcia i
coloanele
11

Editorul de expresii avansate: Operatori


Operator
In a list of values
Between
Is null | Is missing
Sounds like
Contains

Matches pattern

12

Exemplu
judet IN ("DB","IL")
venit BETWEEN 1200 2000
Realizeaz un test pentru valorile lips
nume =* "smith"
gsete "Smythe", "Smith"
tara contains "US"
gsete "USA", "RUSIA"
Semnul procent (%) nlocuiete oricte
caractere.
Semnul underscore (_) nlocuiete un caracter.
nume like R_D%"
gsete RADULESCU", RADU",
RODICA"

Editorul de expresii avansate: Date

2) Selectai
valorile care
trebuie incluse
n expresii

13

1) Selectai o
coloan pentru a
vizualiza valorile.

Combinarea filtrelor
Implicit, filtrele multiple sunt combinate folosind operatorul
AND. Aceste setri pot fi modificate.

14

Calcularea unei noi coloane


Exist trei modaliti de creare a unei coloane calculate
ntr-o interogare.

Selectai metoda
folosit pentru a
calcula coloana

15

Coloane agregate
Efectuarea unei funcii de agregare pe oricare dintre
coloanele interogrrii.

16

Recodificarea unei coloane

Coloana care este


recodificat
17

Specificarea valorilor care se nlocuiesc


Se pot nlocui valori punctuale, domenii de valori sau se
pot specifica condiii care vor fi transformate n clauze
CASE ale limbajului SQL.

18

Specificarea valorilor care se nlocuiesc

Asignarea
valorii pentru
celelalte
cazuri

Tipul de date
pentru noua
coloan

19

Folosirea noii coloane recodificate


Noua coloan recodificat este automat inclus n tab-ul
Select Data. Poate fi folosit n crearea de filtre sau
pentru sortarea datelor.

20

Crearea unei coloane calculate

Expresia de
calcul

21

Jonciunea tabelelor

23

Rndurile care au
corespondent

Tipuri de Jonciuni

Numai rndurile care au corespondent (implicit n SAS


Enterprise Guide)
A

inner join

Toate rndurile din una sau ambele tabele plus


rndurile care au corespondent
A

Toate rndurile din A


left outer join
24

Toate rndurile din A i B

Toate rndurile din B

full outer join

right outer join

Fereastra de Jonciuni
1) Selectai JoinTables
pentru a accesa fereastra n
care putem seta jonciunile

2) Specificai modul n care se


leag tabelele
25

Modificarea tipului de jonciune


Criteriul de jonciune poate
fi modificat pentru a include
i cmpurile care nu au
corespondent.

26

Recapitulare: Numai rndurile care au corespundent

27

Includerea rndurilor fr corespondent

28

Toate rndurile
referitoare la Clieni
i Comenzi

Includerea rndurilor fr corespondent

29

Toate rndurile din


tabela Clienilor

Includerea rndurilor fr corespondent

30

Toate rndurile din


tabela Comenzilor

Izolarea rndurilor care nu au corespondent


Interogarea pote include i un filtru pentru a izola cmpurile
care nu au corespondent din una sau ambele tabele.

Comenzi plasate de clieni care nu exist n


tabela Clienilor.
31

Folosirea rezultatelor interogrilor n prelucrri


Tabelele rezultate din
interogri pot folosi ca
surse de date pentru
prelucrri ulterioare.

32

Setarea opiunilor interogrilor

Selectai un tip de
rezultat

33

Formate de rezultate pentru interogri


Format de
rezultat

Caracteristici ale Rezultatele interogrii


datelor

Data table

poate fi utilizat n alte - tabel static


scopuri
- se pot realiza prelucrri
- rezultatele nu sunt
actualizate

Data view

ntotdeuna actualizat - viziune dinamic a datelor


- se pot realiza prelucrri
- rezultatele sunt actualizate

Raport

formatat pentru
prezentare

34

- raport n formatul HTML,


PDF, RTF text sau SAS
- rezultatele nu sunt
actualizate
- nu se pot realiza prelucrri

S-ar putea să vă placă și