Documente Academic
Documente Profesional
Documente Cultură
Planificare
Proiectare
Execuie
(colectarea datelor)
Procesarea datelor
Analiza datelor
Prezentarea rezultatelor
Interpretarea rezultatelor
Publicarea
Atunci cnd vrem s studiem un anumit aspect al realitii
nconjurtoare, nu o putem face studiind toate obiectele sau subiecii
corespunztori. Dac vrem s studiem o anumit caracteristic a unei
populaii, nu vom analiza toat populaia, ci vom considera un anumit
eantion din ea. Dac, de exemplu, suntem interesai de efectele telefoniei
mobile asupra sntii celor care o folosesc, vom face o investigaie
printre utilizatori, considernd un anumit numr dintre acetia, luai la
ntmplare i innd seama de timpul pe care l consum vorbind de la un
mobil. Rezultatul unei asemenea cercetri se vrea extrapolat la toi
utilizatorii telefoniei mobile, deci eantionul ales trebuie s fie
reprezentativ pentru ntreaga populaie a utilizatorilor. Cu toate c, aa
cum am spus mai sus, subiecii supui testrii vor fi alei la ntmplare,
totui, din punct de vedere practic, exist o ntreag metodologie de a
recruta subiecii, despre care vom mai vorbi n aceast carte.
Atunci cnd se ncepe o cercetare statistic i se recruteaz subiecii,
este ndeobte obligatoriu s se precizeze criteriile dup care au fost inclui
sau exclui din studiu, precum i caracteristicile principale ale
eantionului. In acest mod cercetare este transparent i oricine poate s
evalueze ct de reprezentativ a fost lotul de subieci pentru scopul propus.
In cazul unui studiu comparativ, este necesar aceiai prezentare pentru
fiecare eantion i, n plus, trebuie verificat ca diferena dintre volumele
loturilor comparate s nu fie semnificativ, denaturnd rezultatele
comparaiei.
rezultatelor.
Singura
problem
rmne
compararea
2. Tipuri de date
Obiectele cu care lucreaz statistica sunt reprezentate de date, adic
acele
caracteristici
numerice
sau
nenumerice
care
descriu
1. brbat/femeie
2. cstorit/necstorit/vduv
3. fumtor/nefumtor
4. hipertensiv/hipotensiv
5. stadii n cancer: I, II, III, IV
6. existen simptoame: DA, NU
7. tip diagnostic: A, B, C, D, etc.
S observm c, dac datele numerice discrete sunt cteodat tratate
ca date categoriale, de exemplu numrul de copii nscui de o femeie, e.g.
0, 1, 2, 3, 4, mprind lotul mamelor n categoriile corespunztoare;
important n aceast situaie este s se ignore noiunile de ordine sau de
parametri numerici ca, de exemplu, media. Invers, nu este corect s
interpretm datele categoriale ca date numerice, de exemplu, la stadiile n
cancer stadiul IV nu este de dou ori mai ru dect stadiul II, .a.m.d.
Sintetic, putem afirm c datele sunt categoriale dac nu exist
pentru ele noiunea de medie, ca n cazul celor numerice.
Datele categoriale, calitative, sunt de dou tipuri: nominale i
ordinale:
Datele nominale sunt datele ce reprezint mai multe categorii, de
exemplu: grupa sanguin (A/B/AB/O) sau specia florilor de Iris din
baza de date Fisher (cele trei tipuri clasice: Iris Setosa, Virginica i
Versicolour)-http://en.wikipedia.org/wiki/Iris_flower_data_set.
Aceste date pot fi de tip logic, spre exemplu 0 sau 1; da/nu; adevrat
/fals. Datele nominale pentru care nu este definit o ordine se numesc
date de tip enumerativ, exemple n acest sens fiind categoriile
Exemplu.
1) Considernd ca populaie o clas de elevi, o dat (caracter)
referitoare la aceast populaie, notat X, poate fi reprezentat prin
nlimea elevilor, cu alte cuvinte prin variabila aleatoare X: R.
Pentru un elev A, avnd nlimea de 1, 75 cm, avem X (A) = 1, 75.
2) Considernd ca populaie pacienii dintr-o secie a unui spital, o dat
(caracter) referitoare la aceast populaie, notat X, poate fi reprezentat
prin glicemia pacienilor, adic variabila aleatoare X: R, astfel nct
pentru un pacient A avnd glicemia de 128, avem X (A) = 128.
n practic, de cele mai multe ori datele sunt stocate sub forma unei
matrice. Prin convenie, valorile variabilelor (atributelor/caracteristicilor)
sunt stocate pe coloan n timp ce observaiile (obiectele) sunt stocate pe
linii, crend astfel o baz de date.
x11
xi1
x1m
x1k
xik
xmk
x1n
xin
xmn
xk
xn
Datele din tabelul de mai sus pot fi reprezentate sub forma unei
matrice X, cu n linii i m coloane:
x11
...
X = x1k
...
xn
1
...
xi1
...
...
x1m
...
xmk .
...
x mn
Exemplu.
O baz de date medicale conine datele unor pacieni, atributele acestora
fiind: numrul de consultaii pe an la care a fost supus pacientul -nr. cons.
(dat numeric discret), sex -S (dat nominal), vrsta -V, indicele masei
nr. cons S
gr F
clasa
92 286 349
fost fumtor
79 180 145
nefumtor
F 60
F 40 23,2
M 65
29
fumtor nrit
F 58
27
95 260 230
fost fumtor
amator-2,
9
2
5
1
286 349 1 1
180 145 0 0
1 55 25.1 128 230 210 2 1
92
79