Sunteți pe pagina 1din 7

Operaii cu nregistrri

Operaii cu nregistrri - Record Operations Nodes

Paleta Record Ops conine urmtoarele noduri:

Nodul Select genereaz un subset de nregistrri pe baza unei condiii (expresii)

Permite generarea unui eantion (mostre) din setul mare de date

Permite stabilirea proporiilor n subgrupurile de date

nlocuiete o secven de nregistrri de la intrare, prin agregare (nsumare), cu o nregistrare la ieire

Realizeaz sortarea nregistrrilor dup valorile unuia sau mai multor cmpuri

Concateneaz date din fiiere diferite

Concateneaz date cu aceeai structur dar valori diferite

Exemple n Stream1_Ex1 i Stream1_Merge. Multe din nodurile paletei Record Ops necesit scrierea expresiilor cu ajutorul limbajului CLEM (Clementine Language for Expression Manipulation), care poate fi accesat cu butonul

Select Node
Exemplu: a fost importat fiierul profit.sav din SPSS cu structura DIMENS, NR_ANG, PROFIT. Dorim s extragem numai societile care au 15<=PROFIT<=25. Mode Include. Selecteaz nregistrrile care ndeplinesc condiia Discard. Exclude nregistrrile care ndeplinesc condiia

Capitolul 2

Sample Node
Prin acest nod se poate specifica numrul de nregistrri ce vor fi selectate: First toate 1-in-n de exemplu, dac n = 5 va fi selectat tot a 5 a nregistrare Random % - de exemplu, dac se specific 10, vor fi selectate 10% din nregistrri

Balance Node
Se poate utiliza acest nod atunci cnd datele sunt disproporionate, de exmplu 90% dintre societi sunt mici i 10% sunt mijlocii. Pentru a avea reprezentativitate la nivelul eantionului se pot stabili procente de selecie cu ajutorul acestui nod.

Operaii cu nregistrri

Se observ din exemplul de mai sus c vor fi selectate 35% din societile mici, DIMENS = 1 i 40% din societile mijlocii, DIMENS = 2. Factor se precizeaz ponderea Condition condiia de selecie

Aggregate Node
Acest nod poate fi utilizat pentru reducerea dimensiunii datelor de intrare. De exemplu, dorim s obinem numrul total de angajai i profitul mediu pe tipuri de societi (DIMENS) Key fields lista cmpurilor utilizate drept chei de agregare Aggregate fields lista cmpurilor numerice i selectarea modului de agregare Selectarea cmpurilor se face cu ajutorul butonului Field Chooser plasat n dreapta (semnalat cu sgeat).

10

Capitolul 2

Efectul acestui nod se vede n imaginea de mai jos:

Sort Node
Permite sortarea nregistrrilor, ascendent sau descendent, dup unul sau mai multe cmpuri.

Operaii cu nregistrri

11

Merge Node
Concateneaz date din fiiere diferite. De exemplu, au fost create dou fiiere n Excel, Merge1 cu structura: marca, nume, profesia i Merge2 cu structura: marca, salar. Se dorete lipirea (concatenarea) datelor din cele dou fiiere folosind Merge Node.

12

Capitolul 2

Cu opiunea Inputs se indic cele dou fiiere, legtura fcndu-se dinspre Merge1 spre Merge2 prin cmpul cheie marca specificat n opiunea Merge. Tot cu aceast opiune se precizeaz tipul de legtur, n acest caz Inner Join.

Inner Join include numai nregistrrile pentru care o valoare a cmpului cheie este comun n toate fiierele de intrare. Efectul este:

Operaii cu nregistrri

13

Pentru opiunea Full outer join s-a realizat legtura dintre fiierele Merge1 (cu mrcile 101, 102, 103) i Merge3 care are structura: marca, asigurare (cu mrcile 102, 103) i care conine nregistrri numai pentru cei asigurai.

Se observ c apar toate valorile mrcilor din fiierul surs iar acolo unde nu se gsete valoarea n fiierul destinaie apare nregistrarea cu valoarea $null$. Anti-Join include n tabela rezultat nregistrrile pentru care valorile cheii se gsesc n primul fiier i nu apar n cel de-al doilea. Pentru exemplul de mai sus va aprea nregistrarea din fiierul Merge1 care are marca 101.

Append Node
Se utilizeaz pentru a combina dou fiiere cu aceeai structur dar cu valori diferite.

Distinct Node
Se utilizeaz pentru eliminarea nregistrrilor duplicate.

S-ar putea să vă placă și