Sunteți pe pagina 1din 14

12/8/2013

Metodologia cercetarii
stiintifice
Curs 4

Statistica - definitie

• Statistica este disciplina care se ocupă cu


culegerea, înregistrarea, gruparea, analiza şi
interpretarea datelor referitoare la un anumit
fenomen, precum şi cu formularea unor previziuni
privind comportarea viitoare a acestui fenomen.

• Statistica este ştiinŃa care are ca obiect de studiu


fenomenele de masă - acele fenomene care se
produc într-un număr mare de cazuri.

1
12/8/2013

Statistica - obiective
Obiectivul fundamental al statisticii este de a rezuma
şi analiza datele statistice prin parcurgerea
următoarelor etape:
• observarea statistică, în care se culeg date şi informaŃii
statistice privind toate caracteristicile urmărite într-o
colectivitate definită;
• prelucrarea statistică, în care datele sunt sistematizate şi
se calculează indicatorii statistici ce caracterizează
fenomenul studiat;
• analiza, interpretarea şi prezentarea finală a rezultatelor,
în care sunt verificate ipotezele, formulate concluziile şi
fundamentate procesele decizionale.

Statistica - elemente
Datele statistice - reprezintă caracterizarea numerică pe care
statistica o face în legătură cu colectivitatea studiată.

Colectivitatea statistică - reprezentată de totalitatea


elementelor care au caracteristici comune şi care formează
obiectul analizei statistice (populaŃia unui oraş, bolnavii internaŃi în
spitalele din TM, cazurile de SIDA la nivel naŃional etc.).

Unitatea statistică este elementul component al unei


colectivităŃi statistice supuse observării şi cercetării. UnităŃi
statistice pot fi: persoana, născutul viu, decesul, familia, clubul sportiv,
centrul de sănătate, animalul de experienŃă, etc.

2
12/8/2013

Variabila
Caracteristica statistică sau variabila reprezintă
trăsătura, proprietatea sau însuşirea comună tuturor
unităŃilor unei colectivităŃi şi care variază de la o
unitate la alta.

• Caracteristica statistică reprezintă acea


proprietate care este comună tuturor unităŃilor
unei colectivităŃi statistice.
• Deoarece variază de la o unitate la alta, mai
poartă numele de variabilă statistică

Variabila cantitativa vs. calitativa


Variabilele pot fi cantitative sau calitative şi respectiv,
continue sau discontinue.

Variabilele cantitative sunt însuşiri ale unităŃii statistice care pot fi


exprimate numeric sau printr-o unitate de măsură (talie, greutate,
vârstă, tensiune arterială, etc.).
Prin prelucrare statistică, caracteristicile cantitative se transformă în
medii.

Variabilele calitative sunt însuşirile care nu se pot exprima prin


unităŃi de măsură, ci prin atribute (sex, rasă, religie, culoarea
ochilor, etc.).
Prin prelucrare statistică caracteristicile calitative se transformă în
frecvenŃe.

3
12/8/2013

Variabila calitativa
Variabilele calitative pot fi cu:
• două variante de expresie, numite şi variabile alternative, ca
de exemplu, sexul (masculin/feminin), grupa sanguină Rh
(Rh pozitiv /Rh negativ);
• trei variante de expresie, de exemplu, împărŃirea populaŃiei
în copii, adulŃi şi vârstnici;
• patru variante de expresie, de exemplu, grupele sanguine
în sistem ABO sau statusul marital în România (căsătorit,
necăsătorit, divorŃat, văduv) ;
• cinci sau mai multe variante de expresie, de exemplu,
starea pacienŃilor la externare din spital (vindecat,
ameliorat, staŃionar, agravat, decedat).

Variabila calitativa
Aceste variabile pot fi analizate cu ajutorul frecvenŃelor.

Un exemplu de variabilă calitativă este reprezentat de


exprimarea înălŃimii în termeni de: scund, mediu, înalt,
foarte înalt.

Deşi talia este o variabilă cantitativă, încadrarea unui


individ într-una din categoriile menŃionate exprimă un
aspect calitativ.

4
12/8/2013

Variabila continua / discontinua


Variabilele continue sunt cele pentru care există un
număr nelimitat de valori posibile (de exemplu, greutăŃile
a doi copii sunt de 20, 325 kg şi respectiv, 20,155 kg,
fiind raportate ca 20 kg).

Variabilele discontinue sau discrete sunt datele cu un


număr limitat de valori posibile reprezentate prin numere
întregi (de exemplu, cazurile de obezitate din UVT,
numărul de locuitori ai municipiului TM, etc.).

Valoarea reprezintă nivelul concret pe care îl poate lua o


variabilă în cazul unei unităŃi sau grup de unităŃi
statistice.

Exprimarea datelor statistice

• Mărimile absolute se utilizează pentru consemnarea ca


atare a unor evenimente sau cazuri.
• Numărul absolut este dependent de mărimea populaŃiei
de referinŃă.
Acest mod de exprimare nu permite compararea riguroasă a datelor
statistice. Astfel, dacă Albania şi China ar avea exact acelaşi număr de
cazuri de obezitate, nu s-ar putea spune că situaŃia epidemiei este la fel în
ambele Ńări.

Mărimile absolute se utilizează pentru a evidenŃia:


• numărul de locuitori dintr-o anumită regiune;
• incidenŃa anumitor afectiuni, cum ar fi lepra, SIDA, tetanos,
etc.
Cazurile se raportează şi apar în anuarele statistice ca atare,
fără a le raporta la 100, 1000 sau 100 000 de locuitori.

5
12/8/2013

Exprimarea datelor statistice


• Mărimile relative rezultă prin calcul şi au forma generală:

Acestea permit compararea fenomenelor.

Ca tipuri de mărimi relative se descriu:


• rata;
• proporŃia;
• raportul.

Rata

Rata exprimă numărul de evenimente care au loc într-o


populaŃie definită, pe durata unui anumit interval de timp sau
la un anumit moment; se mai numesc şi indicatori de
intensitate.

Distingem rate globale sau generale, care se referă la


întreaga populaŃie şi rate specifice unei anumite subpopulaŃii
(copii, femei, etnia rromă, etc.).

6
12/8/2013

Rata
Ratele se pot exprima în procente, promile, prodecimile,
procentimile sau părŃi per milion (ppm).
Ca exemple de rate avem:
1. PrevalenŃa de moment a tuturor cazurilor de boală:

2. Natalitatea pentru un an calendaristic într-o regiune definită

3. Centenarii din România:

In ultimul exemplu avem multipli mari de 10 (106) deoarece diferenŃa dintre


numitor şi numărător este foarte mare şi în cazul în care exprimarea s-ar
face procentual, s-ar obŃine valori subunitare.

Proportia / Raportul
ProporŃia se referă la relaŃia dintre o parte componentă şi
întreg.
• baza de raportare fie este egală cu 100 (cel mai frecvent), fie este
egală cu 1, în acest caz toate proporŃiile având valori subunitare.
• rezultatul se exprimă sub formă de fracŃie, număr zecimal sau
procente.
ProporŃia mai este cunoscută ca indicator de structură.
Ex. ponderea sexului feminin în România este de 51,2% faŃă de 48,8%
sexul masculin. Din punctul de vedere al naŃionalităŃii sau etniei,
aproximativ 90% sunt români.

Raportul arată relaŃia dintre două categorii de variabile


evaluate în acelaşi moment sau acelaşi interval de timp

Ex. în localitatea A raportul masculin/ feminin pentru cazurile de obezitate


este de 3/1.

7
12/8/2013

Indicatorii statistici

Indicatorii statistici reprezintă expresia numerică a unor


fenomene definite în timp şi spaŃiu.

Au o formă generală de exprimare relativă, fiind în majoritate


reprezentaŃi prin rate şi mult mai rar prin rapoarte sau medii.

Urmatoarele ratee sunt exemple de indicatori statistici sanitari de


intensitate: mortalitatea generală, mortalitatea specifică pe sexe, vârste,
cauze sau mediu de reşedinŃă, fertilitatea, etc.

Caracteristica statistică
Există două tipuri de caracteristici:

Caracteristici cantitative: se exprimă numeric, cifric


Ex. Greutatea, vârsta, durata pregătirii fizice (în ore, zile, ani), durata
expunerii la o noxă profesională etc.

Prin prelucrare, caracteristicile cantitative se transformă în medii.

Caracteristici calitative: care se exprimă printr-o însuşire, o calitate


a unităŃii statistice.
Ex. distribuŃia populaŃiei în funcŃie de caracteristica sex, tipul constituŃional,
modul de alimentare, profesia, starea civilă, mediul de reşedinŃă (urban,
rural) etc.

Prin prelucrare caracteristicile calitative se transformă în frecvenŃe.

8
12/8/2013

Caracteristici cantitative

• O caracteristică cantitativă se numeşte discontinuă sau


discretă dacă nu poate lua decât valori numerice întregi
(Ex: nr. copii, nr. decese, nr. căsătorii).
• O caracteristică cantitativă care poate lua orice valoare
dintr-un interval de lungime finită sau infinită se numeşte
caracteristică cantitativă continuă (Ex: înălŃimea, greutatea,
TA).
• Intervalele în care o caracteristica ia valori se numesc
grupe sau clase de valori (Ex: grupele de vârstă).

Caracteristici calitative

Exprimă o însuşire sau o calitate a unităŃii statistice.


Ex:
• masculin/feminin; urban/rural; bolnav/sănătos
• forma = alungită, rotundă, ovală - în descrierea unor obiecte
• caracterul = flegmatic, melancolic, sangvinic, coleric -în descrierea
unor persoane.

Se observă că setul valorilor posibile pentru caracteristicile


calitative este finit.

9
12/8/2013

Indicatori de tendinŃă centrală

• Caracteristicile cantitative (care se exprimă numeric, cifric)


se transformă în VALORI MEDII, prin prelucrare.
• Principalele mărimi medii utilizate în statistică sunt:media
aritmetică (simplă şi ponderată);
• se mai folosesc două mărimi medii, cu caracter orientativ,
care nu necesită calcule speciale, ele servind la
caracterizarea rapidă, dar aproximativă a fenomenului:
MEDIANA şi MODULUL

Indicatori de tendinŃă centrală


• Mediana - este acea valoare din şirul de date care împarte
în două părŃi egale şirul ordonat de valori (şirul este
ordonat crescător), situându-se la mijlocul seriei statistice
Ex1: 1 2 3 4 5 6 7 8 9
Ex2: 5, 5, 10, 10, 10, 15,15, 15, 20, 25

• poziŃia medianei, deci locul pe care-l ocupă aceasta în


cadrul unei serii de observaŃii ordonate se stabileşte cu
ajutorul formulei:

• Utilitatea practică a medianei: în caz de valori mari,


mediana arată mai bine tipicul seriei decat media

10
12/8/2013

Indicatori de tendinŃă centrală

• Modulul - constituie valoarea care apare cel mai des, deci


valoarea cu numărul cel mai mare de apariŃii (varianta cu
frecvenŃa cea mai mare)
Exemplu: 1 2 3 1 2 4 5 1 4 5 2 3 2

• Deci, modulul poate fi determinat prin simpla examinare a


valorilor unei serii (fără a fi necesare operaŃii de calcul).
• Prin stabilirea operativă a medianei şi modulului se poate
obŃine o orientare rapidă asupra zonei în care, cu
aproximaŃie, se va afla media autentică, valoarea lor fiind,
însă, doar orientativă.

Utilitatea practică a indicatorilor de


tendinŃă centrală
Mediana nu este influenŃată de valorile extreme ale seriei,
chiar dacă ele sunt mult diferite de celelalte, având un
caracter aberant.

Ex. observând greutatea la naştere pentru două loturi de noi născuŃi vii:
1) 2500 g 3000 g 3500 g
2) 2500 g 3000 g 5000 g

• Şi într-un caz şi în celălalt mediana este de 3000 g, deşi în a doua serie


a apărut o valoare atipică de 5000 g care este mai puŃin caracteristică
pentru serie.
• Ori de câte ori se înregistrează valori aberante foarte mari “tipicul”
seriei este mai bine evidenŃiat prin mediană decât prin medie.

11
12/8/2013

IncidenŃa

• Incidenta - măsoară frecvenŃa cu care apar cazurile noi


de boală într-o anumită populaŃie şi pe parcursul unui
interval definit de timp.
• IncidenŃa specifică se poate calcula pe: sexe, rase, grupe
de vârstă, medii de reşedinŃă, etc
• Ex. incidenŃa tuberculozei în anul 2002 este:

incidenŃa pe cauze se exprimă la 100 000 de locuitori

PrevalenŃa

• PrevalenŃa - măsoară numărul de cazuri existente de boală


dintr-o populaŃie definită, la un moment dat sau pe
parcursul unui anumit interval de timp.
• IncidenŃa se referă la apariŃia bolii, în timp ce prevalenŃa se
referă la prezenŃa bolii şi măsoară ponderea sau „povara”
acesteia în populaŃie.
• PrevalenŃa se calculează astfel:

Ratele de prevalenŃă se exprimă la 100 de indivizi

12
12/8/2013

Indicatori de variabilitate statistică

DeviaŃia standard (DS)


• Este o măsură a impreciziei unui set de date, exprimă cât
sunt de depărtate datele de media lor.
• Conform teoriei, 95% dintre valorile unei serii cad în
intervalul -2DS +2DS, iar între -3DS şi 3DS cad restul până
la 99%.
• DS se exprimă în unităŃile de măsură ale datelor.
• ÎmpărŃind procentual DS la medie obŃinem coeficientul de
variaŃie (CV) exprimat în procente.

Curba Gaussiana

media ± 2 deviatii standard

M-3DS M-2DS M-1DS M M+1DS M+2DS M+3DS


68%
95%

99%

13
12/8/2013

Indicatori de variabilitate statistică

Coeficientul de variaŃie (CV)


• reprezintă raportul procentual dintre deviaŃia standard
şi media aritmetică a seriei de observaŃii respective:

DS
CV = X100
media aritmetica a seriei

CV < 10% Dispersie mică Colectivitate omogenă

CV = 10-30% Dispersie medie

CV > 30% Dispersie mare Colectivitate eterogenă

14