Sunteți pe pagina 1din 21

14

Capitolul 3

Operaii cu atribute (cmpuri) Field Operations Nodes

Dup explorarea datelor iniiale ele trebuie pregtite pentru efectuarea diferitelor analize. Paleta Field Ops. conine urmtoarele noduri:

Type Node
Exemple n Stream1_Merge directorul Field Opt. Types Field numele cmpurilor Type tipul valorilor: Range o valoare de tip ntreg, real, dat/timp Discrete o valoare de tip ir de caractere Flag - o valoare din dou posibile (Da, Nu sau 0, 1) Set o valoare din mai multe posibile (mic, mediu, mare) Ordered Set valori pentru o variabil ordinal Values permite citirea automat a valorilor: Read datele sunt citite n momentul n care se execut nodul Read + - datele sunt citite i adugate la setul de date Pass datele nu sunt citite Current pstreaz datele curente Specify - declaneaz o caset de dialog n care se pot selecta diferite opiuni pentru date (valori, etichete, valori lips) Obs! Pentru setarea valorilor i a etichetelor se execut dublu-click pe numele variabilei.

Operaii cu atribute

15

Missing permite ataarea unui cod pentru valorile lips Check values corespunde funciilor de verificare a valorilor din punct de vedere al ncadrrii lor n limitele permise: None valorile nu sunt verificate (opiune implicit) Nulify dac valoarea se plaseaz nafara limitelor este nlocuit cu nul ($null$) Coerce: - pentru variabile binare (Flag) orice valoare diferit de adevrat sau fals este nlocuit cu Fals - pentru variabilele declarate Set o valoare necunoscut este nlocuit cu prima valoare din set - pentru variabilele declarate Range, dac valoarea este mai mare dact limita superioar este nlocuit cu aceasta - pentru variabilele declarate Range, dac valoarea este mai mic dact limita inferioar este nlocut cu aceasta Discard o valoare ilegal conduce la ndeprtarea nregistrrii Warn numrul ilegal de itemuri este raportat n Stream Properties Abort prima valoare ilegal ntlnit ntrerupe execuia streamului. Direction se precizeaz dac variabila este de intrare (predictor field) sau de ieire (target, predict): In pentru variabila de intrare Out pentru o variabil de ieire Both pentru o variabil ce poate fi att de intrare ct i de ieire Partition se indic pentru o variabil cu dou sau trei modaliti prin care se realizeaz separarea datelor n subeantioane: prima valoare reprezint eantionul de nvare, a doua valoare reprezint eantionul de testare, a treia valoare, dac exist, reprezint eantionul de validare.

16

Capitolul 3

Filter Node
Permite filtrarea variabilelor ce vor intra n analiz prin marcarea celor excluse, depistarea numelor de variabile duplicate i eventual redenumirea lor. Exemple n Stream1_Merge directorul Field Opt.

Derive Node
Permite modificarea valorilor existente sau crearea unor noi variabile (cmpuri). De exemplu, la fiierul Merge2 care conine variabilele marca, salar atam variabila impozit obinut cu formula salar*0,16 prin Derive Node. Exemple n Stream1_Merge directorul Field Opt.

Mode s-a ales opiunea Single deoarece avem o singur variabil de intrare Derive field se indic numele variabilei rezultante (out) Formula se indic formula de calcul Se poate alege opiunea Multiple dac se dorete efectuarea aceleeai operaii asupra mai multor variabile, de exemplu, dac dorim s logaritmm mai multe variabile. Am ales exemplul Stream1_Ex pentru fiierul profit.sav i am logaritmat cu formula log(@FIELD) variabilele NR_ANG i PROFIT .

Operaii cu atribute

17

Mode s-a ales opiunea Multiple Derive from se indic numele variabilelor de intrare Formula se indic formula de calcul log(@FIELD) Derive as Flag permite generarea unei variabile booleene cu numele Derive2 sau un nume indicat de utilizator, dac dorim s mprim colectivitatea n dou grupe n funcie de o condiie. Pentru exemplul de mai sus, societile care ndeplinesc condiia s aib numrul angajailor <= 15

18

Capitolul 3

Derive as Set - Recodificarea valorilor cu nodul Derive permite ataarea unor coduri numerice variantelor valorilor cmpului. De axemplu, plecnd de la fiierul Merge1.xls, se creeaz cmpul Cod_profesia de tip Set.

Derive as State

Operaii cu atribute

19

Derive as Count

Derive as Conditional

20

Capitolul 3

Filler Node nod de completare (umplere)


Exemple n Stream1_Merge directorul Field Opt. Permite nlocuirea spaiilor sau a valorilor nule cu o valoare specificat.

n exemplul de mai sus, s-a cosiderat c pot exista nregistrri n care cmpul salar nu are valori. Fill in fields cu butonul din dreapta se aleg cmpurile ce vor fi analizate i actualizate cu valori Repplace permite alegerea uneia dintre metodele: Based on condition cu ajutorul butonului din dreapta se pot crea condiii n funcie de care se face nlocuirea cu valorile specificate; Always se nlocuiesc toate valorile din cmpul selectat. De exemplu, conversii din ir de caractere n numr sau invers. Cu butonul din dreapta se alege o expresie CLEM; Blank values se nlocuiesc spaiile cu valoarea specificat; Null values - se nlocuiesc valorile nule cu valoarea specificat; Blank and null values - se nlocuiesc ambele cu valoarea specificat;

Reclassify Node
Nodul de reclasificare permite transformarea valorilor unei variabile de tip set sau discret ntr-o alt variabil care s permit regruparea datelor n vederea realizrii unor analize. Exemple n Stream Reclasificare directorul Field Opt. nainte de utilizarea nodului de reclasificare trebuie utilizate alte noduri: Derive, Set To Flag. Setarea opiunilor pentru nodul de reclasificare presupune:

Operaii cu atribute

21

alegerea modalitii single pentru un singur cmp sau multiple pentru mai multe cmpuri supuse reclasificrii; alegerea opiunii: n aceeai variabil sau ntr-o variabil diferit. De exemplu: pentru fiierul profit.sav, fiier SPSS, cu structura NR_ANG i PROFIT, ne propunem s grupm cele 50 de societi (n figur se vd doar 20) astfel:

codul 1 primesc societile care au numrul angajailor 9 codul 2 primesc societile care au 10 numrul angajailor 50 codul 3 - primesc societile care au 51 numrul angajailor

22

Capitolul 3

Pas 1. Se apeleaz nodul Derive prin care se creeaz o nou variabil Codang de tip set ce va conine codurile de mai sus. Pas 2. Se apeleaz nodul Reclassify prin care valorilor din variabila Codang li se ataeaz valori noi: pentru 1-mici, 2-mijlocii, 3-mari.

Opiunile acestui nod: Mode Single pentru un singur cmp, Multiple pentru mai multe cmpuri; Reclassify into: New field ntr-un cmp nou Existing field n acelai cmp Reclassify field: cu butonul din dreapta se alege cmpul supus reclasificrii New field name: se specific numele noii variabile Reclassify values: Get pentru citirea valorilor originale Copy pentru copierea valorilor originale n lista noilor valori Clear new pentru tergerea tuturor specificaiilor din coloana New value Auto pentru generarea valorilor ntregi consecutive pentru fiecare valoare original. Rezultatul executrii acestui nod este:

Operaii cu atribute

23

Binning Node
Permite crearea unei variabile de tip set plecnd de la variabile numerice de tip domeniu. Exemple n Stream Bin Node din directorul Field Opt. Pentru exemplificarea acestui nod a fost ncrcat fiierul Binning Node.xls care are o singur variabil Varsta de tip range.

Pentru a mpri cele 10 persoane n diferite grupe de vrst vom alege una din metodele: Fixed-Width Bins mprire n intervale de lungime fix.

24

Capitolul 3

Bin fields cu butonul din dreapta se alege variabila supus transformrii Binning method: - se alege metoda Name extension: se alege _BIN ca sufix i se genereaz variabila cu numele varsta_BIN sau ca prefix i se genereaz variabila cu numele _BIN varsta Bin width se precizeaz lungimea intervalului ( 6 ani n cazul nostru) Persoanele din exemplul de mai sus au vrsta cuprins 21 40 ani. Pentru primul interval, limita inferioar se obine astfel: 21 0,5*6 = 18 i atunci intervalele vor fi: [18 24), [24 30), [30 36), [36 42) ani. Dac dm clik pe butonul Generate se obine fereastra:

Efectul utilizrii acestei metode este:

Operaii cu atribute

25

Tiles (Equal Count or Sum) permite mprirea colectivitii n grupuri n funcie de: quartile (n 4, fiecare conine 25% din cazuri) decile (n 10, fiecare conine 10% din cazuri) quintile (n 5, fiecare conine 25% din cazuri) vingtile (n 20, fiecare conine 5% din cazuri) percentile (n 100, fiecare conine 1% din cazuri) Custom N se specific numrul de grupe, de exemplu 3 i atunci vor rezulta trei grupe fiecare reprezentnd 33,3% din cazuri

Pentru exemplul de mai sus am ales mprirea n 4 grupe n funcie de quartile. Valorile sortate cresctor sunt: 21 22 23 24 25 27 28 30 36 40. Q1 = 23, Q2 = (25+27)/2 = 26, Q3 = 30. Intervalele sunt: [21 23), [23 27), [27 30), [30 40] ani. Se pot vedea aceste intervale executnd butonul Generate.

26

Capitolul 3

Tiling methode. Se specific metoda de asignare a nregistrrilor la grup. Record count caut s asigneze unui grup un numr egal de nregistrri. Sum of values - caut s asigneze unui grup nregistrrile pentru care suma valorilor este egal. Ties exist situaia ca, dup punctul de tiere, s existe valori identice cu cele din faa acestuia. Putem alege: Add to next toate valorile identice s fac parte din grupul urmtor. Keep in current - toate valorile identice s fac parte din grupul anterior.

Rank Cases pentru acordarea rangurilor

Operaii cu atribute

27

Mean/Standard Deviation

Se poate alege una dintre opiunile: +/- 1 standard deviation se genereaz trei grupe; +/- 2 standard deviation se genereaz cinci grupe; +/- 3 standard deviation se genereaz apte grupe; Pentru prima opiune se stabilesc intervalele astfel: Grupul 1 Grupul 2 x < x x x x + n distribuia normal: 68% din cazuri se afl ntre x x x + 95% din cazuri se afl ntre x 2 x x + 2 99% din cazuri se afl ntre x 3 x x + 3

Grupul 3 x > x +

28

Capitolul 3

Partition Node
Acest nod permite mprirea colectivitii n dou sau trei grupe:

Operaii cu atribute

29

Se pot alege opiunile: nvare i testare sau nvare, testare i validare.

Set to Flag Node


Permite ataarea unei noi variabile, de tip flag (cu dou modaliti), la fiecare modalitate a unei variabile de tip set. Exemple n Stream Set Flag din directorul Field Opt. De exemplu, s-a ncrcat fiierul SetToFlag.xls care conine o singur variabil C1 (presiunea sngelui) care are modalitile: mic, normal, mare. Fiecrei modaliti i se poate ataa o nou variabil de tip flag, dac este mare valoarea n aceast variabil este T (true).

Efectul acestui nod este:

30

Capitolul 3

Restructure Node
S presupunem c un client al unei bnci poate avea mai multe conturi, CustID reprezint identificatorul clientului, Account tipul contului, Open_Bal balana la deschidere, Current_Bal balana curent. CustID 12701 12702 12703 12703 12703 Account Open_Bal Current_Bal Draft 1000 1005,32 Savings 100 144,51 Savings 300 321,20 Savings 150 204,51 Draft 1200 586,32

Tipul contului i balana curent vor fi variabilele dup care se face restructurarea.

Operaii cu atribute

31

CustID 12701 12702 12703 12703 12703

Account Draft Savings Savings Savings Draft

Open_Bal 1000 100 300 150 1200

Current_Bal 1005.32 144.51 321.20 204.51 586.32

Account_Draft Account_Savings _ Current_Bal _Current_Bal 1005.32 $null$ $null$ 144.51 $null$ 321.20 $null$ 204.51 586.32 $null$

Rezultatele acestui nod vor fi folosite ntr-un nod de agregare.

Transpose Node
Permite transpunerea datelor de pe linii pe coloane. Exemple n Stream Transpose din directorul Field Opt. De exemplu a fost creat fiierul TransposeNode.sav n SPSS cu structura de mai jos.

Efectul transpunerii este:

32

Capitolul 3

Time Intervals Node


Permite generarea variabilelor de timp pentru setul de date. Exemple n Stream Time Node din directorul Field Opt. De exemplu, s-a ncrcat fiierul TimeNode.sav creat n SPSS ce conine date referitoare la consumul de bere (mii hl) de-a lungul a trei ani i patru trimestre.

n Time interval s-a ales opiunea Quarters pentru a genera trimestrele fiecrui an, Year 2005.

Operaii cu atribute

33

History Node
Permite afiarea valorilor anterioare pentru fiecare valoare din irul analizat. Pentru exemplul de mai sus s-a ales variabila bere, generarea listei valorilor anterioare pleac de la prima valoare din variabila selectat, afind cte 5 valori anterioare, dac exist.

34

Capitolul 3

Field Reorder Node - Permite stabilirea ordinii de afiare a variabilelor din fiier. Exemple n Stream Reording Node din directorul Field Opt.

S-ar putea să vă placă și