Sunteți pe pagina 1din 10

II.

Pachete software integrate –


SAS

Prof. Adina Uta


Importul datelor din fişiere text
cu delimitatori
• Declaraţia INFILE
• Declaraţia INPUT
• Directiva LENGTH
• Delimitator spatiu
– DATA produse;
– INFILE '/home/username/produse.txt';
– INPUT Denumire $ Cantitate Categorie $;
– RUN;
• Delimitator virgula
– INFILE '/home/username/produse.txt' dsd;
• Alte tipuri de delimitatori
– INFILE '/home/username/produse.txt' delimiter='/'; sau
– INFILE '/home/nume.prenume/produse4.txt' dlm='/'
Importul datelor din fişiere text
cu delimitatori
DATA produse;
INFILE '/home/username/produse.txt' dsd;
LENGTH Denumire $15;
LENGTH Categorie $12;
INPUT Denumire $ Cantitate Categorie $;
DATALINES;
banane,5,fructe
ciocolata,10,dulciuri
inghetata,11,dulciuri
paine,3,panificatie
coriandru,2,condimente
mere,4,fructe
RUN;
Importul datelor din fişiere text
cu coloane cu lăţime fixă
• declaraţia INPUT specificând pentru fiecare variabilă denumirea, semnul $
pentru variabilele de tip caracter, precum şi poziţia de început şi de
sfârşit a fiecărei variabile

DATA produse;
INFILE '/home/username/produse.txt';
INPUT Denumire $ 1-9
Cantitate 10-11
Categorie $ 12-22;
RUN;

DATA demografie;
INFILE "d:\datesas\date1.txt";
INPUT Sex $ Varsta Inaltime Greutate;
*Calculeaza indicele de masa corporala (IMC);
IMC = (Greutate / 2.2) / (Inaltime*.0254)**2;
RUN;
Definirea şi aplicarea de formate în
secţiunile de date şi de proceduri
• După numele variabilelor se găsesc formatele de
intrare, numite şi informate SAS
• Formatul w.d citeşte valori numerice standard – w indică
câte coloane vor fi citite iar d (care este opţional)
numărul de zecimale ale valorii
• Semnele @ din instrucţiunea INPUT se numesc pointeri
de coloană (“column pointers”). De exemplu, @ 4 indică
SAS, să meargă la coloana 4.
• Formatul de intrare $w. Indică citirea a w coloane de tip
caracter.
• Formatul de intrare MMDDYY10 importul datei în forma
mm/dd/yyyy
De exemplu dacă avem următorul fişier text:
00110/21/1955M 1145
00211/18/2001F 18722
00305/07/1944M 123.45
00407/25/1945F -12345
Programul de import al acestui fişier în maniera neformatată este:

DATA Angajati;
INFILE 'd:\exemple\Angajati.txt';
INPUT Id $ 1-3
DataNasterii $ 4-13
Sex $ 14
Salariu 15-21;
RUN;
TITLE "Situatie Angajati";
PROC PRINT data=financial;
RUN;

Listing of Situatie Angajati


Obs Id DataNasterii Sex Salariu
1 001 10/21/1955 M 1145.00
2 002 11/18/2001 F 18722.00
3 003 05/07/1944 M 123.45
4 004 07/25/1945 F -12345.00
Dacă se foloseşte citirea formatată,
De exemplu dacă avem următorul fişier text:
00110/21/1955M 1145
00211/18/2001F 18722
00305/07/1944M 123.45
00407/25/1945F -12345

DATA Angajati;
INFILE 'd:\exemple\Angajati.txt';
INPUT @1 Id $3.
@4DataNasterii mmddyy10.
@14 Sex $1.
@15 Salariu 7.;
RUN;
TITLE "Situatie Angajati";
PROC PRINT data=angajayi;
RUN;
Listing of Situatie Angajati
Obs Id DataNasterii Sex Salariu
1 001 -1533 M 1145.00
2 002 15297 F 18722.00
3 003 -5717 M 123.45
4 004 -5273 F -12345.00
format dorit în procedura PRINT se utilizează instrucţiunea FORMAT prin care se
defineşte un format de ieşire:

DATA Angajati;
INFILE 'd:\exemple\Angajati.txt';
INPUT @1 Id $3.
@4DataNasterii mmddyy10.
@14 Sex $1.
@15 Salariu 7.;
RUN;
TITLE "Situatie Angajati";
PROC PRINT data=angajati;
FORMAT DataNasterii mmddyy10.
Salariu dollar11.2;
RUN;

Listing of Situatie Angajati


Obs Id DataNasterii Sex Salariu
1 001 10/21/1955 M $1,145.00
2 002 11/18/2001 F $18,722.00
3 003 05/07/1944 M $123.45
4 004 07/25/1945 F $-12,345.00
Adăugarea de variabile la un set de date SAS - Crearea
şi utilizarea seturilor de date temporare

DATA note_test;
LENGTH ID $ 3 Nume $ 15;
INPUT ID $ Nota1-Nota3;
LABEL ID = NumarMatricol'
Nota1 = 'Matematica'
Nota2 = ‘Geografie'
Nota3 = 'Fizica';
RUN;

referă setul de date NOTE_TEST cu numele


compus WORK.NOTE_TEST
Crearea şi utilizarea seturilor de date permanente

LIBNAME libref ’your-data-library’;

unde
• libref
– este un nume de acces rapid către locaţia în care sunt stocate
fişierele SAS ale utilizatorului.
– Libref trebuie să fie un nume valid din punct de vedere al
sintaxei SAS (trebuie să înceapă cu o literă sau cu caracterul _
şi poate conţine atât litere mici cât şi majuscule sau cifre) şi
poate avea maxim 8 caractere.
• ’your-data-library’
– trebuie să fie numele fizic al bibliotecii dvs. de date SAS.
Numele fizic este numele recunoscut de mediul de operare.
libname produse '/home/nume.prenume';
data produse.date_test;

S-ar putea să vă placă și