Documente Academic
Documente Profesional
Documente Cultură
Fără declaraţia VAR, procedura va genera statistici pentru toate variabilele numerice ale setului de
date.
Opţiuni uzuale:
• DATA,
• NORMAL - prin opţiunea NORMAL sunt realizate teste de normalitate
• FREQ - generează tabele de frecvenţă ale variabilelor
• PLOT - produce trei tipuri de grafice:
– diagrama ramură-frunză (stem-leaf),
– diagrama box plot
– diagrama distribuţiei normale.
• BY - pentru a obţine analize separate pe grupe de valori.
• ID denumeşte variabila care identifică observaţiile în locul numărului observaţiei,
• HISTOGRAM construieşte un grafic de tip histogramă.
Implicit, procedura afişează cinci dintre valorile cele mai mici şi mai mari ale variabilei analizate şi
numărul observaţiei care are aceste valori extreme.
• NEXTROBS= pentru a afişa un alt număr de valori extreme
• NEXTRVAL= pentru a afişa cele mai mici şi mai mari valori distincte
• NEXTROBS=0 pentru a suprima afişarea tabelei cu observaţiile extreme
Procedura MEANS - crearea de rapoarte agregate
• Statisticile implicite
– N (numărul de valori care nu lipsesc),
– Mean (medie),
– Std Dev (deviaţia standard),
– Minimum
– Maximum.
• indicatori reprezintă tipuri de indicatori statistici (ex.: . MAX – valoarea maximă, MIN
– valoarea minimă, MEAN – media, N – numărul de valori nenule, NMISS – numărul
de valori lipsă, SUM – suma, MEDIAN – mediana, STD - deviatia standard, VAR –
dispersia)
• Declaraţii opţionale:
BY lista_variabile – realizează analize separate pentru fiecare nivel al variabilelor din
listă. Datele trebuie să fie în prealabil sortate în aceeaşi ordine în care apar
variabilele din lista_variabile.
CLASS lista_variabile – realizează tot analize separate pentru fiecare nivel al
variabilelor, însă rezultatele sunt prezentate mai compact faţă de declaraţia BY, iar
datele nu trebuie sortate. O caracteristică foarte utilă a utilizării unei instrucţiuni
CLASS (pe lângă faptul că nu trebuie ca datele să fie sortate ) este că SAS utilizează
valori formate ale variabilelor CLASS. Se poate adăuga o instrucţiune FORMAT la
procedură schimbând modul în care variabila CLASS grupează datele, fără a fi
nevoie să să se modifice setul de date original.
VAR lista_variabile – specifică variabile analizate.
MAXDEC = controlează numărul de locuri din dreapta punctului zecimal care sunt
tipărite în ieşire.
PROC FORMAT;
VALUE f_calitate_grup
LOW -< 10 = 'Scazuta'
10 - HIGH = 'Ridicata';
RUN;
PROC MEANS DATA=exemple.produse
N NMISS MEAN MEDIAN MIN MAX MAXDEC=1;
CLASS cal;
FORMAT cal f_calitate_grup
VAR cant pret;
RUN;
N N
Calitate Obs Variable N Miss Mean Median
Scazuta 384 cant 352 32 5.5 5.5
pret 351 33 6938.2 6910.0
Ridicata 411 cant 376 35 5.5 5.5
pret 374 37 7138.9 7130.0
Scrierea statisticilor agregate într-un set de date
– pentru analize ulterioare
– pentru combinarea cu alte date
OUTPUT OUT = set-date lista-statistici-iesire;
• set-date - setul de date care va conţine rezultatele;
• lista-statistici-iesire - conţine indicatorii statistici care se vor calcula şi
numele variabilelor asociate cu aceştia.
Un format posibil pentru această listă de ieşire este:
statistica (lista_variabile)=lista_nume
• statistica - unul dintre indicatorii statistici disponibili cu procedura MEANS;
• lista_variabile - pentru ce variabile se vor calcula indicatorii;
• lista_nume - noile nume de variabile asociate indicatorilor statistici.
• NOPRINT rezultatele nu se vor mai afişa pe ecran, ci vor fi direcţionate doar
către setul de date de ieşire.
Unde variabila MedieCant contine media valorilor din variariabila cant iar
variabila MediePreţ contine media valorilor din variariabila prêt.
Procedura FREQ – calcularea frecvenţelor
PROC FREQ DATA = date_intrare <optiuni>;
TABLES combinatii_variabile <optiuni>;
Declaraţiile care urmează după numele procedurii definesc tipul de grafic construit, astfel:
– HBAR – Grafic cu bare orizontale
– HBAR3D – Grafic cu bare orizontale 3D
– VBAR – Grafic cu bare verticale
– VBAR3D – Grafic cu bare verticale 3D
– PIE – Grafic de tip Pie
– PIE3D – Grafic de tip Pie 3D
– DONUT– Grafic de tip inel
– STAR– Grafic de tip stea
Opţiuni:
– SUMVAR – arată variabilele pentru care se calculează indicatorul statistic;
– TYPE – tipul de indicator statistic.
– GROUP grupează datele înfuncţie de valorile variabilei de clasificare pe care o referă
– SUBGROUP pentru a reprezenta valorile variabilei adăugate, foloseşte şabloane diferite în
cadrul fiecărei coloane
– NOHEADING elimină heading-ul implicit
Instrucţiunea PATTERN
PATTERN VALUE=EMPTY; cere ca barele din graficul vertical al barei să aibă doar contur (implicit sunt
pline) PATTERN VALUE = SOLID;.
PATTERN VALUE=EMPTY;
PROC GCHART DATA=exemple.produse;
VBAR pret;
RUN;
QUIT;
Procedura GPLOT se poate folosi pentru a construi un grafic care
arată legătura între două variabile.
SYMBOL VALUE=DOT;
PROC GPLOT DATA=exemplu.produse;
plot cant * pret / HAXIS=70 TO 120 BY 5
VAXIS=100 TO 220 BY 10;
RUN;
• Opţiunea VALUE = pentru simbol pentru plotare de va fi caracterul punct.
• Opţiunile HAXIS şi VAXIS controlează intervalele pe axele orizontale şi
verticale.
• La instrucţiunea SYMBOL se poate adăuga o opţiune de pentru a cere ca
punctele să fie îmbinate printr-o linie dreaptă sau curbă
• opţiunea INTERPOL = (sau doar I =) are numeroase opţiuni care
controlează aspectul plotului.
– Opţiunea JOIN conectează punctele cu linii drepte.
– Opţiunea WIDTH = controlează lăţimea valorilor liniei mai mari, dând astfel linii
mai întunecate.
– Opţiunea LINE = vă permite să selectaţi tipurile de linii (1 = 0, valoarea implicită).
TITLE "Titlu1";
TITLE2 h=1.2 " Titlu1";
SYMBOL VALUE=DOT INTERPOL=JOIN WIDTH=2;
PROC GPLOT DATA=exemplu.produse;
PLOT cant var;
RUN;