Sunteți pe pagina 1din 43

Statistica

ramur a matematicii aplicate

ce se ocup cu:

culegerea organizarea gruparea analiza interpretarea

DATELOR

n scopul obinerii unor previziuni privind desfurarea lor ulterioar

PREVIZINE, (2) previziuni, s.f. 1. Facultatea, posibilitatea de a prevedea apariia sau evoluia evenimentelor viitoare din analiza anumitor date cunoscute n prezent. 2. Enunare a unei judeci, a unei teorii care se bazeaz pe previziune (1); ceea ce prevede cineva. PREVIZINE s.f. 1. Prevedere, anticipare asupra desfurrii evenimentelor viitoare, folosind analiza tiinific sau judecnd n baza unei experiene de via; prognoz. 2. Enunare a unei judeci, a unei teorii care se bazeaz pe previziune (1). PREVIZINE s. f. 1. prevedere, anticipare a evoluiei evenimentelor ce urmeaz s se produc, folosind analiza tiinific sau judecnd n baza unei experiene de via; prognoz. 2. enunare a unei judeci, a unei teorii care se bazeaz pe previziune (1).

STATISTICA
culegerea descrierea analizarea datelor
n vederea extragerii unor concluzii (inferene) pe baza acestora

Dezvoltarea statisticii ca tiin este strns legat de calculul PROBABILTILOR.

Statistica n tiinele medicale :


BIOSTATISTICA= statistica aplicat n biologie

CULEGEREA DATELOR (modul n care se face selecia observaiilor care urmeaz sa fie analizate) DESCRIEREA DATELOR culese EXPLICAREA i/sau PREDICIA unor fenomene studiate.

Statistica n tiinele medicale

BIOSTATISTICA a facilitat trecerea la o treapt superioar i anume aceea a generalizrii i abstractizrii, a dezvluirii esenei fenomenelor.

Aplicarea statisticii n cercetarea biologic, a permis depirea metodelor de analiz cantitativ rezumate iniial la msurtori i numrri.

I. STATISTICA DESCRIPTIV

descrierea sintetic a informaiei cuprinse ntr-un set de date

II. STATISTICA INFERENIAL

tehnici i proceduri folosite pentru a face generalizri despre caracteristicile unei populaii, pe baza informaiilor culese de la un eantion extras din acea populaie

NOIUNI DE BAZ 1. POPULAIE STATISTIC 2. VARIABILE 3. EANTION

POPULAIA STATISTIC
Definiie:
Orice mulime de elemente care prezint un interes la un moment dat, are un numr de nsuiri eseniale comune, este supus unei prelucrri statistice
este determinat i definit funcie de sfera de

interes poate fi finit sau infinit.

POPULAIA STATISTIC N BIOLOGIE Definiie:


Multimea pe care se realizeaza un studiu statistic se numeste populatie statistica.

O comunitate de indivizi care: 1. ocup acelai areal 2. au aceiai amplitudine de variaii ale ereditii 3. se reproduc n acelai mod 4. au suferit aceiai aciune a seleciei

VARIABILE
Observaiile fcute asupra unor fenomene (biologice) au ca rezultat stabilirea unor caracteristici care se urmresc i se constat c iau valori diferite. Aceste caracteristici se numesc variabile .
Prin variabila se nelege o anumit categorie care a fost cuantificat sau msurat.

CLASIFICAREA VARIABILELOR

nominale (categoriale); ordinale;


de tip interval; de tip raport.

Calitative

Cantitative
(numerice).

Scale nominale
Presupune o categorizare a variabilei fr a indica o anumita ordine ori cantitate.

Exemple:

Variabila sex: masculin vs. feminin; Starea de sntate: sntos, bolnav, decedat. Variabilele nominale pot fi notate cu cifre (0-feminin; 1-masculin) ns acestea nu pot fi procesate n termeni de cantitate sau ordine

Scale ordinale
Valorile sunt ierarhii si exprima locul sau ordinea ntr-un ir de date. Implic nu numai clasificarea elementelor n categorii ci i posibilitatea ordonrii acestora de la minim la maxim

EXEMPLE: gradul de mbolnvire (foarte

bolnav, bolnav, n curs de ameliorare, recuperat, sntos), gradul de contaminare

Scala interval

msurtoare permite comparaia dintre date ofer informaie referitoare la distana dintre valorile scalei i este caracterizat de existena unor intervale egale

EXEMPLE: TEMPERATURA masurat n grade Celsius (intervalele dintre valori sunt egale, dar punctul 0 este convenional ales ca fiind temperatura la care apa inghea),

COEFICIENTUL DE INTELIGEN - IQ - (daca dou persoane au scoruri de 100 i respectiv 150, putem spune ca diferena dintre cei doi este de 50 de puncte, dar nu putem spune c cel de-al doilea este cu 1/2 mai inteligent dect primul sau c scorul 0 semnific absena inteligenei).

Scale raport
Permite multiplicarea sau divizarea datelor indic de asemenea valoarea zero absolut, arata lipsa totala a cantittii msurate EXEMPLE: vrsta, greutatea, nlimea, distana, numrul de animale dintr-o ferm, etc.

VARIABILE
DISCRETE (prezint un numr finit de valori pe care le poate lua)

CONTINUE (ntre dou valori succesive ale variabilei pot exista o infinitate de valori)

VARIABILE

DEPENDENT (variaz n funcie de valorile altei sau altor variabile) face obiectul msurrii cu scopul de a fi supus unor concluzii. INDEPENDENT este utilizat ca variabil de influen, ale cror efecte posibile asupra variabilei dependente urmeaz s fie puse n eviden.

Populaie i eantion
n practica statistic nu se lucreaz direct cu populaia deoarece aceasta cuprinde un numr mare de indivizi (elemente). n anumite cercetri dispunem de o cantitate limitat de material de analiz.
Se extrage o subcolectivitate din populaie, ea este cunoscut sub urmtoarele denumiri: selecie, lot, prob sau eantion

Populaie
totalitatea unitilor de informaie care constituie obiectivul de interes al unei investigaii. populaie = extinderea maxim posibil, sub aspectul volumului, a respectivei uniti de informaie.

Eantion
unitile de informaie selecionate pentru a fi efectiv studiate.
Cercetrile bazate pe eantioane, permit aprecieri asupra unei ntregi populaii, n anumite condiii, doar pe baza caracteristicilor msurate pe o parte a acesteia.

Parametrii populatiei

Indicatorii eantionului estimeaz

A fundamenta un adevr statistic nseamn a trage o concluzie care descrie parametri unei populaii de valori, pe baza indicatorilor unui eantion din acea populaie

Selecia eantionului din populaie


METODA SELECIEI: indivizii ce alctuiesc selecia sunt extrai la ntmplare; indivizii au aceiai ans (probabilitate) de a face parte din selecie

Reprezentativitatea eantionului

STATISTICA DESCRIPTIV

Obiective: organizarea sintetizarea descrierea datelor

Rezultatele n urma observaiilor fcute asupra indivizilor unei selecii pot fi prezentate prin: Tabele Reprezentare grafic

Distribuia de frecvene simple


1. Tabel de eviden primar sau tabel de efective Valorile se pun n ordine cresctoare sau descresctoare: 1. 10, 10, 9, 9, 8, 8, 8, 8, 8, 7, 7, 7, 6, 6, 6, 6, 6, 6, 6, 5, 4, 4, 4, 4, 2 2. Se ntocmete un tabel cu dou colane (ni, fi)

Repartiie de frecven
xi x1 ni n1

x2 ...... xk

n2 ....... nk

xi - caracteristica observat ni - frecvena de apariiei a caracteristicii xi , n1+n2+ .....+nk=n n este numrul total al observaiilor

frecven absolut

Distribuia de frecvene
Distribuia de frecvene este o list a valorilor (categoriilor) posibile ale unei variabile, nsoite de numrul de observaii care iau respectivele valori (care se afl n fiecare din respectivele categorii).

Frecvene simple
Valoare 10 9 8 7 6 5 4 3 2 Total fa 2 2 5 3 7 1 4 0 1 fa=25

Frecvene cumulate
Valoare
10 9 8 7 6 5 4 3 2 Total

fa
2 2 5 3 7 1 4 0 1 fa=25

fc
25 23 21 16 13 6 5 1 1

xi EX: Analiza procentul de grsime n lapte pe un numr de 6850 de vaci 2,5 2,55 2,6

ni 1 1 1

xi 3,20 3,25 3,30

ni 235 337 373

xi 3,9 3,95 4,00

ni 198 104 85

2,65 2,7 2,75 2,8 2,85 2,9 2,95 3 3,05 3,10 3,15

1 4 6 10 12 20 35 80 90 115 172

3,35 3,40 3,45 3,5 3,55 3,6 3,65 3,7 3,75 3,8 3,85

451 497 534 547 563 571 462 425 317 260 258

4,05 4,10 4,15 4,20 4,25 4,30 4,35 4,40 4,45 total

25 20 18 16 10 3 2 2 2 6850

Analiznd nlimea la greabn a unui numr de 66 vaci s-a obinut urmtorul tabel de efective
xi 116 116,5 117 ni 1 1 1 xi 122 112,5 123 ni 4 5 6 xi 127 128 128,5 ni 3 1 1

118 119 119,5 120 120,5 121 121,5

1 2 1 2 2 2 2

123,5 124 124,5 125 125,5 126 126,5

4 4 3 4 2 3 3

129 129,5 130 131 133 136 total

2 2 1 1 1 1 66

mprirea pe clase
Dac numrul datelor este mare (n>50) atunci se recomand gruparea valori observate n clase Sunt necesare stabilirea urmtoarelor elemente: 1. numrul de clase; 2. lungimea sau mrimea intervalului de clas; 3. limitele claselor - inferioar; - superioar; - centru; 4. frecvena clasei.

NUMRUL DE CLASE. Teoria probabilitilor recomand ca numrul de clase K s se calculeze dup formula k= 5 lg n i funcie de n s se aleag k din tabelul:

n k

50 8

100 10

500 13

1000 15

10000 25

La mprirea datelor n clase se va avea n vedere c: - un numr prea mic de clase pierde trsturile eseniale ale fenomenelor studiate, iar un numr prea mare de clase pierde avantajele gruprii; - clasele trebuie s aibe aceiai lungime pentru a uura calculele; - alegerea numrului de clase trebuie astfel fcut nct repartiia de frecven s fie ct mai simetric.

Lungimea intervalului de clas.


Se calculeaz cu formula:

I=

X max X min n

Xmax este cea mai mare valoare pentru xi Xmin este cea mai mic valoare pentru xi

Limitele claselor
Limitele de clas 2,5 -2,69 2,7 - 2,89 2,9 - 3,09 3,10 - 3,29 3,30 - 3,49 3,5 - 3,69 3,70 - 3,89 3,90 - 4,09 4,10 - 4,29 4,30 - 4,49 TOTAL Centrul clasei 2,6 2,8 3,0 3,2 3,4 3,6 3,8 4,0 4,2 4,4 Frecvena absolut 4 32 225 856 1855 2143 1250 412 64 9 6850 Frecvena relativ 0,01 0,5 3,3 12,5 27,1 31,3 18,2 6,00 0,9 0,1 100%

Limitele clasei 116 -118 119 - 121 122 - 124 125 - 127 128 - 130 131 - 133

Centrul clase 117 120 123 126 129 132

Frecvena Frecvena absolut relativ

4 11 26 15 7 2

6,10 16,7 39,4 22,7 10,6 3,00

134 - 136 TOTAL

135

1 66

1,5 100%

Reprezentri grafice

graficul de tip bar histograma poligonul de frecvene graficul frecvenei cumulate graficul circular

Graficul de tip bar

Se utilizeaz atunci cnd dorim s reprezentm o variabil discret (care prezint valori ntregi, de exemplu, numrul de purceilor la o ftare).

Pe axa orizontal (Ox) sunt reprezentate valorile distribuiei Pe axa vertical (Oy) sunt reprezentate frecvenele fiecrei valori, sub forma unei bare rectangulare
Valoare caracter studiat Xi 2 3 4 5 6 7 8 9

Frecvena de apariie fa 1 0 4 1 7 3 5 2 2 fa=25

Graficul de tip bar


8 7 6 5 4 3 2 Axa Oy 1 0 2 Axa Ox 3 4 5 6 7 8 9 10

10 Total

Histograma

Ea este adecvat pentru situaiile cnd variabila pe care dorim s o reprezentm este de tip continuu (adic poate lua orice valoare pe o scal numeric, de ex., procentul de grsime n lapte) Frecvena Limitele de clas
Histogram

2500 2000 1500 1000 500 0

Clase

2,5 -2,69 2,7 - 2,89 2,9 - 3,09 3,10 - 3,29 3,30 - 3,49 3,5 - 3,69 3,70 - 3,89 3,90 - 4,09 4,10 - 4,29 4,30 - 4,49

absolut 4 32 225 856 1855 2143 1250 412 64 9

2,5 -2,69

3,10 - 3,29

3,30 - 3,49

3,70 - 3,89

3,90 - 4,09

4,10 - 4,29

4,30 - 4,49

2,7 - 2,89

2,9 - 3,09

3,5 - 3,69

Poligonul de frecvene

Este o reprezentare alternativ la histogram. Punctele centrale ale suprafeelor rectangulare care reprezint frecvena sunt unite cu o linie care delimiteaz suprafaa poligonului.
Poligonul de frecvene

Limitele de clas
2500 2000 1500 1000 500 0

Clase

2,5 -2,69 2,7 - 2,89 2,9 - 3,09 3,10 - 3,29 3,30 - 3,49 3,5 - 3,69 3,70 - 3,89 3,90 - 4,09 4,10 - 4,29 4,30 - 4,49

Frecvena absolut 4 32 225 856 1855 2143 1250 412 64 9

2,5 -2,69

3,10 - 3,29

3,30 - 3,49

3,70 - 3,89

3,90 - 4,09

4,10 - 4,29

4,30 - 4,49

2,7 - 2,89

2,9 - 3,09

3,5 - 3,69

Graficul frecvenei cumulate

Este un grafic de tip liniar care reprezint valorile frecvenei absolute cumulate
Graficul frecvenei cumulate

Limitele de clas 2,5 -2,69 2,7 - 2,89

Frecven cumulat 4 36 261 1117 2972 5115 6365 6777 6841 6850

8000 7000 6000 5000 4000 3000 2000 1000 0 2,6 Clase 2,8 3 3,2 3,4 3,6 3,8 4 4,2 4,4

2,9 - 3,09 3,10 - 3,29 3,30 - 3,49 3,5 - 3,69 3,70 - 3,89 3,90 - 4,09 4,10 - 4,29 4,30 - 4,49

Graficul circular

Este utilizat n situaiile n care valorile sunt parte a unui ntreg.

Graficul circular
18,25%

0,93%

0,13%

0,06% 0,47%

3,28%

6,01%

12,50%

31,28%

27,08%

Limitele de clas 2,5 -2,69 2,7 - 2,89 2,9 - 3,09 3,10 - 3,29 3,30 - 3,49 3,5 - 3,69 3,70 - 3,89 3,90 - 4,09 4,10 - 4,29 4,30 - 4,49

Frecvena relativ probabilitatea 0,01 0,5 3,3 12,5 27,1 31,3 18,2 6,00 0,9 0,1

Concluzii.

Utilizarea tabelelor de frecven i a reprezentrilor grafice aduce un important ctig n analiza datelor statistice. Tabele ct i reprezentrile grafice nu sunt dect nceputul analizei datelor nu i sfritul acesteia.

Nu se pot trage direct concluzii pe baza tabelelor de frecven i a reprezentrilor grafice.


Tabelele de frecven i reprezentrile grafice, sunt utilizate pentru a ilustra concluzii, care devin astfel mai uor de neles i de reinut.

S-ar putea să vă placă și