Documente Academic
Documente Profesional
Documente Cultură
Valoare
continuous.
M, F.
f, t.
f, t.
f, t.
f, t.
f, t.
f, t.
f, t.
f, t.
f, t.
f, t.
f, t.
f, t.
f, t.
f, t.
f,t.
continuous.
f,t.
continuous.
f,t.
continuous.
f,t.
continuous.
f,t.
continuous.
f,t.
continuous.
WEST, STMW, SVHC,
SVI, SVHD, other
Fisierul conine
Num Instances: 3772
Num Attributes: 30
Num Continuous: 7 (Int 1 / Real 6)
Num Discrete:
23
Missing values: 6064 / 5.4
Preprocesare Date
Preprocesare
1. In setul de date exista atat date complectate incorrect
Pentru cazul in discutie avem de exemplu pentru varsta personae care au 1 an respective
455 ani. Daca varste de 1 an pot fi considerate corecte cele de 455 ani sunt sigur
incorecte:
Presupunem ca luam in considerare numai persoanele cu varsta cuprinsa intre [10, 100]
ani. Se va vizualiza modul in care se scriu expresiile care asigura filtrarea instantelor din
baza de date. Vezi optiunile More si Capabilities, inclusive modul in care se introduce
expresiile din figura de mai jos ( atributele se noteaza cu ATTI I=1,n:
Preprocesare Date
Exercitiu
Sa presupunem ca valoarea TSH poate fi maxim 150. Cele care depasesc aceasta valoare
sunt gresite. Inlaturati valorile gresite.
Salvati baza de date corepunzatoare acestei faze de prelucrare.
Preprocesare Date
Exercitiu
Selectati aceste attribute (inclusive atributul de clasa) si creati o noua baza de date pe care
o salvati